投稿

記事を共有する:

アリババ、新世代AIモデル「Qwen3-Next-80B」を発表 – 高効率で低コスト

Alibaba Marketplace のロゴ。(画像ソース: Wikimedia Commons)
Alibaba Marketplace のロゴ。(画像ソース: Wikimedia Commons)

アリババ、効率性を追求した次世代AI基盤モデルを発表

中国の人工知能分野を牽引するアリババグループは、大規模モデルの性能を維持しながらも大幅に小型化・低コスト化した次世代基盤モデルを開発しました。サウスチャイナ・モーニング・ポストによると、アリババクラウドは新たな大規模言語モデル「Qwen3-Next-80B-A3B」を公開し、「効率的なLLMの未来」を掲げています。

小型化とコスト削減を実現

新モデルは、1週間前に発表されたアリババ最大のAIモデルと比べて約13分の1のサイズでありながら、同社の歴代最高水準の性能を発揮するとされています。開発者によれば、このモデルは一部のタスクで従来モデル「Qwen3-32B」より10倍高速に動作し、学習コストを90%削減することに成功しました。

Stability AIの共同創業者Emad Mostaque氏はX(旧Twitter)で「昨年のほとんどのモデルを凌駕している」とコメント。しかも学習コストは50万ドル(約7,300万円)未満と推定されています。比較として、Googleの「Gemini Ultra」(2024年2月発表)は約1億9,100万ドル(約280億円)のコストがかかっています。

ライバルを凌ぐ性能

AIベンチマーク企業Artificial Analysisによると、「Qwen3-Next-80B-A3B」は最新版のDeepSeek R1や、アリババ支援のスタートアップMoonshot AIによるKimi-K2を上回る結果を示しました。

複数の研究者は成功要因として「ハイブリッドアテンション」と呼ばれる新手法を挙げています。特にMITとNvidiaが提案した「Gated DeltaNet」を活用し、重要な情報を選別することで効率的かつ精度の高い注意機構を実現しました。

Mixture-of-Expertsによる効率化

新モデルは「Mixture-of-Experts(MoE)」アーキテクチャも採用。512人の「専門家(エキスパート)」ネットワークを持ちながら、同時に稼働するのはわずか10個に制限されています。これにより、DeepSeek-V3.1と同等の性能を、わずか30億のアクティブパラメータで達成しました。

その結果、アリババのクラウド上での運用コストも大幅に削減され、より現実的な運用が可能になったとしています。

小型モデルへのシフト

AI業界では、コスト増大への懸念から「より小さく効率的なモデル」への関心が高まっています。Nvidiaの研究者は小型モデルを「エージェントAIの未来」と位置づけ、Tencentや北京のスタートアップZ.aiも数十億パラメータ規模の軽量モデルを公開しています。

新モデルは単一のNvidia H200 GPUで稼働可能であり、オープンソースプラットフォーム「Hugging Face」では公開から24時間以内に2万件近いダウンロードを記録しました。アリババは「次世代モデルの方向性を示すもの」と強調しています。


出典: Yahoo! Finance

こちらもお読みください:  ドイツのプールでAI救助技術が安全性向上のためにテスト中

この記事をメールまたはお気に入りのソーシャル メディア サイトを通じて共有してください:

フェイスブック
X
リンクトイン
ピンタレスト
メール

コメントする

最新のテクノロジーニュースを受け取る!

無料登録で新しいニュースをメールで受け取ることができます。

カテゴリー

IG Drones、ドローン技術開発のために100万ドルを調達

IG Dronesは、インディア・アクセラレーターが主導する資金調達ラウンドで100万ドルを獲得し、防衛用途向けの研究開発に大部分を充てる計画です。電子情報技術省の支援を受けた同社は、今後6か月でさらに300万ドルを調達し、事業を拡大することを目指しています。創業者兼CEOのボディサットワ・サンガプリヤ氏は、イノベーションとグローバルな成長に焦点を当てていると強調し、インド軍や100社以上の企業とのパートナーシップが、ドローン製造および研究開発の使命において重要であると述べています。

続きを読む »
上部へスクロール