Googleは最新のAIモデル「Gemini 2.5 Pro」を全ユーザー向けに無料開放し、AI業界を驚かせた。当初、Gemini Advancedの有料プラン限定の機能として提供予定だったが、OpenAIのChatGPTやAnthropicのClaudeとの競争が激化する中、戦略を変更したと見られる。
Gemini 2.5 Proの特徴と競争環境
Gemini 2.5 Proは、OpenAIのGPT-4o miniやDeepSeek R1に匹敵する高度な推論モデルだ。Googleは数学、科学、推論、コーディング能力において大幅な向上を実現し、UCバークレーの研究者による「Humanity’s Final Exam」や「LMArena」といった主要なAIベンチマークでも高評価を得ていると主張している。
しかし、GPT-4oがマルチモーダル機能を活かし、テキストや画像をシームレスに生成できるのに対し、GoogleのGemini 2.5 Proはネイティブな画像生成機能を持たない点が注目されている。
Ghibliスタイル画像生成は可能なのか?
Gemini 2.5 Proはテキスト、画像、音声、動画、コードベースの処理・解釈能力を備えているとされるが、Googleは独自の画像生成機能について詳細を明らかにしていない。このため、スタジオジブリ風のアートを作成したいユーザーにとって、Gemini 2.5 Proは満足のいく選択肢とはならない可能性がある。
特に、OpenAIのGPT-4oがサードパーティのツールを必要とせずにジブリ風のアートを生成できるのに対し、Gemini 2.5 Proは画像生成に外部AIツールを利用する必要があると推測されている。これは、Geminiの画像生成機能を担う「Imagen 3」モデルが、OpenAIの技術ほど柔軟な芸術的表現を持たない可能性を示唆している。
Googleの今後の展望
今回の無料開放により、Googleはより多くのユーザーにGemini 2.5 Proを試してもらい、市場シェアを拡大する狙いがあると考えられる。しかし、画像生成機能の不足は、クリエイティブ用途での利用を考えているユーザーにとっては課題となるかもしれない。Googleが今後どのようにこの問題を克服し、Geminiシリーズを進化させるのか、引き続き注目される。