投稿

記事を共有する:

Apple、オープンソースの単眼深度推定AIモデル「Depth Pro」を発表

Apple の Depth Pro テクノロジーの例。

Appleは新たに「Depth Pro」という単眼深度推定用のオープンソースAIモデルを発表し、今年リリースした人工知能技術のポートフォリオを拡大しました。これまでのモデルは主に特定のタスクに特化した小型の言語モデルでしたが、Depth Proは単一の画像から深度マップを生成できるビジョンモデルです。この技術は3Dテクスチャ生成や拡張現実(AR)などの応用を強化でき、研究者たちはこの深度マップが複数のカメラを使用して生成されたものよりも優れていると主張しています。

開発と技術

Depth Proの開発には、Vision Transformer(ViT)アーキテクチャが利用されており、出力解像度は384 x 384に設定されていますが、入力解像度は1536 x 1536のままにされています。この構成により、モデルは画像内の詳細をよりよく分析できるようになります。

深度推定の重要性

深度推定は、3Dモデリングや拡張現実、自動運転、ロボティクスなどのさまざまな技術において重要です。人間の目は単一の視点から深度を正確に把握できますが、従来のカメラはこのタスクに苦労し、しばしば平面的な2次元画像を生成します。そのため、通常は複数のカメラが使用されますが、これには資源が多くかかり、時間もかかる場合があります。

革新的なアプローチ

Appleは、「Depth Pro: Sharp Monocular Metric Depth in Less Than a Second」という研究論文の中で、ビジョンベースのAIモデルが単眼画像から効率的に深度マップを生成できることを示しています。このアプローチは、広範なリソースを必要とせずに行われます。

こちらもお読みください:  高度な光子カメラの開発

この記事をメールまたはお気に入りのソーシャル メディア サイトを通じて共有してください:

フェイスブック
X
リンクトイン
ピンタレスト
メール

コメントする

ニュースレターを購読してください!

ニュースレターのコンテンツを受信ボックスに受け取るにはサインアップしてください

アストロボティック、アームストロングトレイルでLiDARシステムをテスト

アストロボティックは、ペンシルバニア州のアームストロングトレイルで光検出と測距(LiDAR)システムのテストを行い、宇宙用途の技術を洗練させる重要なステップを踏みました。アームストロングトレイルは52.5マイルのレクリエーションパスで、テストでは最大1マイル離れたターゲットを設置し、システムの精度を評価しました。アストロボティックは、今後カリフォルニア州モハーヴェの月面試験場でさらなるテストを行う予定です。また、NASAのディープスペースネットワークとの通信テストも成功し、グリフィン月面着陸機が今後のミッションでの通信能力を確認しました。

続きを読む »
上部へスクロール