投稿

記事を共有する:

Apple、オープンソースの単眼深度推定AIモデル「Depth Pro」を発表

Apple の Depth Pro テクノロジーの例。

Appleは新たに「Depth Pro」という単眼深度推定用のオープンソースAIモデルを発表し、今年リリースした人工知能技術のポートフォリオを拡大しました。これまでのモデルは主に特定のタスクに特化した小型の言語モデルでしたが、Depth Proは単一の画像から深度マップを生成できるビジョンモデルです。この技術は3Dテクスチャ生成や拡張現実(AR)などの応用を強化でき、研究者たちはこの深度マップが複数のカメラを使用して生成されたものよりも優れていると主張しています。

開発と技術

Depth Proの開発には、Vision Transformer(ViT)アーキテクチャが利用されており、出力解像度は384 x 384に設定されていますが、入力解像度は1536 x 1536のままにされています。この構成により、モデルは画像内の詳細をよりよく分析できるようになります。

深度推定の重要性

深度推定は、3Dモデリングや拡張現実、自動運転、ロボティクスなどのさまざまな技術において重要です。人間の目は単一の視点から深度を正確に把握できますが、従来のカメラはこのタスクに苦労し、しばしば平面的な2次元画像を生成します。そのため、通常は複数のカメラが使用されますが、これには資源が多くかかり、時間もかかる場合があります。

革新的なアプローチ

Appleは、「Depth Pro: Sharp Monocular Metric Depth in Less Than a Second」という研究論文の中で、ビジョンベースのAIモデルが単眼画像から効率的に深度マップを生成できることを示しています。このアプローチは、広範なリソースを必要とせずに行われます。

こちらもお読みください:  iOS 26登場:新デザイン「Liquid Glass」とiOS 18の違いを徹底比較

この記事をメールまたはお気に入りのソーシャル メディア サイトを通じて共有してください:

フェイスブック
X
リンクトイン
ピンタレスト
メール

コメントする

最新のテクノロジーニュースを受け取る!

無料登録で新しいニュースをメールで受け取ることができます。

カテゴリー

iPhone 17 Pro。(画像提供:Apple)

iPhone 17 Pro、前後カメラ同時撮影に対応か? クリエイター向けの革新的機能がリーク

Appleの次期iPhone 17 Proでは、前後カメラの同時録画機能が搭載され、クリエイター向けの革新が期待されています。新たに進化した24MPのフロントカメラと、3つの48MPセンサーを搭載した背面カメラが性能を大幅に向上させ、さらに機械式絞りで撮影の自由度も向上。

続きを読む »
上部へスクロール