Anthropic、Claude AIにコンピュータ操作機能を訓練

Anthropicは、Claude AIモデルにプロンプトを基に一般的なコンピュータ操作を行う能力を訓練しています。デモ動画では、AIがカーソルを操作して、街での外出のためのリサーチを行ったり、自宅近くの訪問先をウェブ検索したり、予定をデスクトップカレンダーに追加したりする様子が紹介されています。この機能は現在開発者向けにのみ提供されており、価格設定や技術の精度についてはまだ明確ではありません。

開発初期段階での課題

Anthropicはツイートで、テスト中にClaudeがコーディングの課題から脱線し、Googleでイエローストーン国立公園の画像を検索し始めたことを明かしています。まだ解決すべき課題があることがわかります。技術的には、Claudeはスクリーンショットを解析し、画面上の要素を確認し、カーソルとクリックすべきボタンとの距離などを考慮して、作業を進めるためのコマンドを返しています。

公開ベータとその可能性

AnthropicはAmazonやGoogleからの支援を受けており、Claudeを「コンピュータ操作を提供する初のフロンティアAIモデル」として公開ベータ版で提供しています。実際の用途はまだ不明ですが、Anthropicは反復作業やオープンエンドのリサーチに利用できると示唆しています。もし新しい活用法が見つかるとすれば、Redditの/r/overemployedコミュニティが最初に共有するかもしれません。最低限、古いソーシャルメディアの投稿を削除するためのデジタルツールや、職場での「マウスジグラー」のような用途には使えるかもしれません。

競争と市場の状況

AI分野には多額の投資がされており、特にチャットボットの開発に力が入れられていますが、収益の大部分はGPUを提供するNvidiaのような企業が主導しています。Anthropic自身も最近で70億ドル以上の資金を調達しました。現在の技術業界の話題は「エージェント」と呼ばれる、自律的にタスクを遂行するプログラムです。たとえば、Microsoftは最近、新しいCopilotの機能を発表し、販売プロセスやサプライチェーン管理の自動化が可能であるとしています。一方、SalesforceのCEO、マーク・ベニオフ氏はMicrosoftのCopilotを批判し、精度の低さから「Clippy 2.0」と揶揄しましたが、同時に自社のAI製品を宣伝しています。Salesforceは、顧客がカスタムエージェントを作成して、カスタマーサポートのメール対応や新規顧客の獲得に活用できるようにすることを目指しています。

AIアシスタントの普及における課題

AIツールに対する熱狂にもかかわらず、ChatGPTやClaudeのようなツールはオフィスワーカーの間でまだ広く採用されていません。MicrosoftのCopilotに対する反応も賛否両論で、わずか一部のMicrosoft 365ユーザーが月額30ドルのAI機能を利用しています。それでもMicrosoftはAIに大きく賭けており、このAIブームを通じて投資家に成果を示すことを期待しています。

精度と実用性の問題

最大の課題は、AIが生成するアウトプットの信頼性です。ChatGPTやGoogleのGeminiのようなチャットボットは、しばしば不正確な情報や、人間が書いたとは思えない内容を生成します。そのため、修正に時間がかかり、効率化の効果が薄れてしまうことがあります。カジュアルな調査には問題ありませんが、仕事の場では誤りの多いアウトプットは許容されません。Claudeを使ってメールを自動処理させた結果、意味不明な内容が送られたり、他の作業でミスをして修正が必要になったりするリスクもあります。OpenAI自身も大部分のアクティブユーザーが学生であることを認めており、これは状況をよく表しています。Anthropicも新機能についてのツイートで、「低リスクのタスク」でのテストを推奨しています。

投稿ビュー: 387