Nvidia、新AIモデル「Nemotron」をリリース
先週、Nvidiaは最新のAIモデル「Nemotron」を発表し、業界内で話題を呼んでいます。このモデルの正式名称は「Llama-3.1-Nemotron-70B-Instruct」で、Metaの「Llama 3.1 70B」モデルといくつかの類似点を持っています。AIプラットフォーム「HuggingFace」に静かに登場し、同プラットフォームは最近100万モデルを超える規模に成長しています。控えめなリリースにもかかわらず、Nemotronの性能はすぐに注目を集めています。
ベンチマークで競合を上回る性能を示す
Nvidiaの新モデルは、Arena Hardベンチマークで85.0、AlpacaEval 2 LCで57.6、GPT-4-Turbo MT-Benchで8.98といった優れたスコアを記録しています。これらの結果は、OpenAIの「ChatGPT-4o」やAnthropicの「Claude 3.5 Sonnet」などの既存の競合モデルを上回っており、Nemotronが70Bパラメーターという小規模な構成であるにもかかわらず、優れた性能を発揮しています。
AI業界への影響
Nemotronの高性能は、Nvidiaの評価を高めるだけでなく、ハードウェアにとどまらないAI分野での影響力の拡大を示しています。カリフォルニア州サンタクララに本社を置くNvidiaは、AIソフトウェアの分野でも大手に挑戦する存在となりつつあります。最近では、Nvidiaは台湾のFoxconnと協力し、メキシコに世界最大のスーパーシップ製造施設を建設することでも注目を集めています。
RLHFとオープンソーストレーニングによる改良
NvidiaのNemotronプロジェクトは、Metaの「Llama 3.1」から影響を受けており、強化学習(RLHF)などの高度な技術を使って既存モデルを改良しました。このオープンソースのリワードモデルは、HuggingFace上でそのトレーニングデータセットと共に公開されており、市場に出回っている他の主要なAIソリューションに比べて、コストパフォーマンスの高い選択肢を提供します。