AI市場の次の分岐点は、単なる「省電力化」ではありません。重要になるのは、AIの推論をクラウドで行うのか、端末側で行うのかという設計思想です。
これまで多くのAIサービスは、スマートフォン、PC、カメラ、車載機器、産業機器からデータをクラウドへ送り、クラウド側で推論して結果を返す構造を前提にしてきました。しかし、生成AIや画像認識AIが日常機能として組み込まれるほど、クラウド依存には限界が出てきます。
その理由は明確です。クラウドへ送ればレイテンシが発生し、通信費がかかり、ネットワーク障害時には使えず、個人情報や現場データの流出リスクも高まります。これに対して、端末上でAI推論を行うオンデバイス推論は、低遅延、低通信コスト、プライバシー保護、オフライン動作を実現しやすい方式です。
Apple は Apple Intelligence のプライバシー設計 で、ユーザーの個人情報を収集せずにパーソナルなAIを実現する中核としてオンデバイス処理を位置づけ、より複雑な処理では Private Cloud Compute を使うと説明しています。一方、Qualcomm も オンデバイス推論に関する資料 で、端末内で推論を実行することがレイテンシ低減、プライバシー向上、継続的なAI機能、クラウド推論コスト削減につながると整理しています。
オンデバイス推論とは何か
オンデバイス推論とは、AIモデルをクラウドサーバーではなく、スマートフォン、PC、カメラ、車載ECU、家電、ロボット、産業機器、マイコンなどの端末側で動かす仕組みです。
ここで重要なのは、AIの「学習」と「推論」を分けて考えることです。大規模な学習は依然としてクラウドやデータセンターで行われることが多い一方、学習済みモデルを使って判断する推論は、端末側へ移りつつあります。
たとえば、次のような処理はオンデバイス推論と相性が良い領域です。
- カメラ映像から人物や物体を検出する
- 車内カメラでドライバーの眠気や視線を検知する
- 工場設備の振動や音から異常を検知する
- 家電が利用状況を学習して運転を最適化する
- スマートフォンが音声、画像、文章をローカルで要約する
- セキュリティカメラが映像全体ではなくメタデータだけを出力する
Qualcomm は、生成AIをスケールさせるにはクラウドと端末のハイブリッド構成が重要であり、処理をどこで行うかはデバイス性能、プライバシー、セキュリティ、性能要件、ビジネスモデルによって変わると説明しています。つまり、これからのAI製品は「AIを使うかどうか」ではなく、「どの処理を端末に置くか」で差がつくようになります。
なぜクラウド前提から端末側へ移るのか
クラウドAIは強力です。大規模モデルを動かし、常にアップデートでき、複数ユーザーの処理を集中管理できます。しかし、すべてをクラウドに送る設計は、現場AIや組込みAIでは不利になる場面があります。
特に問題になるのは、次の4点です。
- レイテンシ
車載AI、ロボット、産業機器、監視カメラでは、数百ミリ秒の遅れが安全性や品質に影響します。人や機械が動く現場では、クラウド往復を待てない処理があります。 - 通信費
カメラ映像、音声、センサーデータを常時クラウドへ送ると、回線費用とクラウド処理費用が増えます。多数の店舗、工場、車両、家電にAIを入れるほど、通信コストは無視できません。 - プライバシー
顔、音声、車内映像、家庭内行動、工場ノウハウ、設備データは、できるだけ外に出さない方が安全です。端末側で処理して、必要な結果だけを送る設計が重要になります。 - オフライン耐性
工場、山間部、地下、車両、災害時、建設現場では、ネットワークが常に安定しているとは限りません。端末側で判断できれば、通信が切れても機能を維持できます。
Microsoft が提唱する Copilot+ PC は、40 TOPS以上のNPUを持つAI PCとして発表され、Windows PC上でAI処理を行う流れを象徴しています。PCの世界でも、AIはクラウドサービスだけでなく、端末に搭載される標準機能へ移り始めています。
市場は「クラウドAI型」と「製品内蔵AI型」に分かれる
今後のAI市場は、大きく2つに分かれていきます。
ひとつは、クラウド上の大規模AIを使うサービス型AIです。検索、文書生成、業務チャット、開発支援、分析支援など、計算量が大きく、モデル更新が頻繁で、複雑な知識を扱う用途に向いています。
もうひとつは、製品そのものにAI推論を組み込む製品内蔵AIです。こちらは、家電、車載機器、カメラ、ロボット、センサー、産業機器、医療機器、店舗端末などにAIが入り、ユーザーが意識しなくても機能として動く世界です。
日本企業が強みを持つのは、後者の領域です。
日本には、家電、車載、FA機器、センサー、カメラ、半導体、ロボティクス、産業機器、医療機器など、リアルな製品にAIを組み込む産業基盤があります。AIを単独のアプリとして売るのではなく、冷蔵庫、エアコン、自動車、監視カメラ、工作機械、搬送ロボット、検査装置の中に“機能”として入れることが、日本企業にとって大きなチャンスになります。
経済産業省も AI・半導体産業基盤強化フレーム の中で、AI・半導体分野への投資促進を掲げており、次世代エッジAI半導体研究開発事業などを関連予算に含めています。オンデバイスAIは、AIと半導体とものづくりが交差する領域として、日本の産業政策とも接続しやすいテーマです。
家電:AIが“クラウド機能”ではなく“製品機能”になる
家電におけるオンデバイスAIの価値は、ユーザーの生活データを外に出しすぎず、端末の中で快適性や省エネを高められる点にあります。
たとえば、エアコンなら在室状況、温度変化、湿度、日射、利用時間帯をもとに運転を最適化できます。冷蔵庫なら開閉パターンや庫内カメラから食品管理を支援できます。洗濯機なら衣類の量、汚れ、振動、音をもとに洗浄や脱水を調整できます。ロボット掃除機なら部屋の形状や障害物を認識し、クラウドに映像を送らずに経路を判断できます。
この領域では、AIの価値は「賢いチャット」ではありません。ユーザーが意識しないところで、以下のような体験を実現することです。
- 起動が速い
- 通信がなくても動く
- 電気代を抑える
- 個人の生活パターンを外に出さない
- 誤作動が少ない
- 長期間安定して使える
- 製品価格に見合うAI機能を提供する
家電AIでは、クラウドに送る前に端末側で判断し、必要な情報だけを送る設計が重要になります。AI機能が増えるほど、製品企画では「この処理はクラウドでよいのか、それとも端末側で動かすべきか」を最初から決める必要があります。
AIカメラ:映像を送らず、メタデータだけを出す
オンデバイス推論の分かりやすい例が、AIカメラです。従来の監視カメラや分析カメラは、映像をクラウドやサーバーへ送り、そこで人物検出や行動分析を行う構成が一般的でした。しかし、映像には顔、服装、行動、居場所などの個人情報が含まれます。
Sony Semiconductor Solutions の IMX500 は、画像処理とAI処理を同一チップ上に組み合わせたインテリジェントビジョンセンサーです。同社は、IMX500がサーバー側処理を不要にし、低レイテンシ、帯域削減、電力効率向上を実現すると説明しています。さらに、プライバシー面では、処理済み画像のメタデータのみを出力し、画像データをチップ外へ出す必要がないとしています。
これは、店舗、工場、駅、オフィス、介護施設、スマートシティで重要な設計思想です。たとえば、人数カウント、混雑度、転倒検知、危険エリア侵入検知、棚前行動分析などでは、必ずしも生映像をクラウドに保存する必要はありません。端末側で推論し、「人数」「異常あり」「侵入あり」といった結果だけを送ることで、プライバシーと業務価値を両立しやすくなります。
車載:AIは通信機能ではなく安全機能になる
車載領域では、オンデバイス推論はさらに重要です。自動車は常に通信できるとは限らず、判断の遅れが安全に直結します。ドライバーモニタリング、歩行者検知、車線認識、駐車支援、車内音声操作、異常検知などは、端末側で即時に推論する必要があります。
車載AIでは、次のような処理がオンデバイス化しやすい領域です。
- カメラ、レーダー、LiDARのセンサーフュージョン
- ドライバーの視線、眠気、注意散漫の検知
- 車内音声コマンドのローカル処理
- 乗員検知、忘れ物検知、子ども置き去り検知
- 周辺歩行者や自転車の認識
- 低速域での接触リスク検知
- 車両状態や故障予兆の推論
MediaTek と DENSO は、次世代ADASやコックピットシステム向けの車載SoC開発で協業しており、発表ではDENSOの車載安全・統合技術と、MediaTekのAI/NPUアクセラレータや高性能SoCを組み合わせると説明しています。車載AIでは、クラウドに頼る前に、車両内で低遅延かつ安全に処理するためのAI半導体が競争軸になります。
産業機器:AIはクラウド分析から“装置内の判断”へ移る
産業機器では、オンデバイス推論の価値は非常に大きくなります。工場、物流倉庫、建設現場、インフラ設備では、AIが検知すべき対象がリアルタイムに変化し、通信環境も一定ではありません。
たとえば、次のような用途があります。
- モーターやポンプの振動から異常を検知する
- 工作機械の音や電流から摩耗を推定する
- 外観検査カメラで傷や汚れを検出する
- ロボットが人や障害物を認識して停止する
- 搬送装置が荷物の位置ずれを検知する
- 作業者の接近や危険区域侵入を検出する
- 建設機械が周囲の人や資材を認識する
この領域では、クラウドに全データを送るよりも、装置内で推論し、異常時だけログやイベントを送る方が合理的です。通信費を抑えられるだけでなく、工場ノウハウや製造条件を外部に出しにくくなります。
Renesas の RA8P1 は、同社初のAIアクセラレーション搭載32ビットMCUとして、Cortex-M85とEthos-U55 NPUを備え、ビジョンAI、音声AI、リアルタイム分析などを想定しています。製品ページでは、マシンビジョン、ロボティクス、スマート家電、交通・歩行者・ドライバーモニタリング、予知保全などの用途が挙げられています。
より高い演算性能が必要な産業ロボットや自律機械では、NVIDIA の Jetson Orin のようなエッジAIコンピュータが使われます。NVIDIAはJetson Orinファミリーについて、生成AI、コンピュータビジョン、高度なロボティクス向けの組込みAIコンピュータとして、最大275 TOPSのAI性能を提供すると説明しています。
“省電力AI”の本質は、電力だけではない
オンデバイスAIでは、電力効率が重要です。しかし、「省電力AI」を消費電力だけで見ると、本質を見誤ります。
重要なのは、性能、電力、レイテンシ、プライバシー、通信費、製品寿命のバランスです。
たとえば、バッテリー駆動のカメラやセンサーでは、数ワットどころかミリワット単位の電力が問題になります。一方、産業ロボットや車載ECUでは、より高い消費電力を許容しても、リアルタイム性と安全性が優先されます。家電では、製品価格、騒音、発熱、長期供給、ファームウェア更新性も重要です。
オンデバイスAIの設計では、次のような問いが必要になります。
- 推論は何ミリ秒以内に終わる必要があるか
- 常時推論か、イベント発生時だけ推論か
- カメラ映像を保存する必要があるか
- 個人情報を端末外に出してよいか
- モデル更新はOTAで可能か
- 通信が切れても安全に動くか
- 誤検知時のフェイルセーフはあるか
- 5年、10年運用する製品でAIモデルをどう保守するか
クラウドAIでは「モデルの性能」が主役になりがちですが、オンデバイスAIでは「製品として安全に動き続けること」が主役になります。
実装パターン:完全オンデバイス、ハイブリッド、エッジゲートウェイ
企業がオンデバイス推論を導入する際は、すべてを端末に載せる必要はありません。実務では、次の3つのパターンを使い分けるのが現実的です。
完全オンデバイス型
推論をすべて端末内で完結させる方式です。顔や音声、車内映像、家庭内データ、工場の機密データなど、外部送信を避けたい用途に向いています。
向いている用途は以下です。
- ウェイクワード検出
- 異常音検知
- 人物・物体検出
- ドライバーモニタリング
- 転倒検知
- 予知保全の簡易推論
- センサー異常検知
- ローカル音声コマンド
ハイブリッド型
端末側で一次判断し、必要な場合だけクラウドへ送る方式です。軽い推論やプライバシーに関わる処理は端末で行い、複雑な生成AI処理や長期分析はクラウドで行います。
Apple Intelligence のように、まず端末上で処理できるかを判断し、より複雑な処理ではクラウドを使う設計は、今後の一般的なアーキテクチャになる可能性があります。
エッジゲートウェイ型
工場、店舗、倉庫、建設現場などで、複数のカメラやセンサーを近くのエッジ端末に集約し、そこで推論する方式です。端末ごとにAIを載せるより管理しやすく、クラウドへ送るデータ量も減らせます。
向いている用途は以下です。
- 工場ラインの外観検査
- 複数カメラの人物検知
- 物流倉庫の危険接近検知
- 店舗の混雑分析
- 建設現場の安全監視
- 設備群の異常検知
- ロボット群の状態監視
製品企画で見るべきチェックリスト
オンデバイスAIを製品に入れる場合、企画段階で確認すべき項目は多くあります。AI機能を後付けすると、チップ性能、メモリ、電源、放熱、通信、セキュリティが足りなくなるためです。
- AI推論を端末側で行う理由が明確か
- クラウド推論と比べたレイテンシ要件を定義しているか
- 通信費削減効果を試算しているか
- 個人情報や機密情報を端末外へ送らない設計になっているか
- NPU、DSP、GPU、MCU、CPUの役割分担を決めているか
- モデルサイズ、メモリ、ストレージ、消費電力を見積もっているか
- オフライン時の動作を定義しているか
- 誤検知・見逃し時のフェイルセーフを設計しているか
- モデル更新、ファームウェア更新、セキュリティパッチの方法があるか
- 製品寿命中にAIモデルを保守できるか
- ログ取得とプライバシー保護のバランスを決めているか
- AI機能が停止した場合でも基本機能が安全に動くか
このチェックリストは、AI開発部門だけでなく、製品企画、法務、情報セキュリティ、品質保証、調達、保守部門が一緒に見るべきです。
ベンダー選定で聞くべき質問
オンデバイスAIは、クラウドAIよりもハードウェア依存が強い領域です。チップ、OS、SDK、モデル変換、量子化、セキュリティ、長期供給がすべて関係します。
ベンダー選定では、次の質問が重要になります。
- 対応するAIモデル形式は何か
- TensorFlow Lite、ONNX、PyTorchなどから変換できるか
- INT8、INT4、FP16などの量子化に対応しているか
- NPU、GPU、DSP、CPUのどこで推論されるか確認できるか
- 実効レイテンシと消費電力を測定できるか
- モデル更新をOTAで安全に配信できるか
- セキュアブート、暗号化、改ざん検知に対応しているか
- 個人情報や映像データを端末外に出さない構成が可能か
- 量産時の長期供給と保守期間は十分か
- AIモデルの性能劣化を現場で監視できるか
- SDKや開発環境が量産後も継続サポートされるか
- 国内の法規制、業界規格、品質保証プロセスに対応できるか
オンデバイスAIでは、デモが動くだけでは不十分です。量産後に何年も安全に動き、更新でき、故障時に説明できることが求められます。
日本企業が勝ちやすい領域
オンデバイスAIは、日本企業にとって相性の良い市場です。理由は、AI単体のソフトウェア競争ではなく、ハードウェア、センサー、品質保証、量産、保守、業界知識を組み合わせる競争になるからです。
特に有望なのは、次の領域です。
- 家電
省エネ、快適制御、生活パターン学習、異常検知、音声操作、カメラ制御。 - 車載
ADAS、ドライバーモニタリング、車内AI、センサーフュージョン、予防安全。 - 産業機器
外観検査、予知保全、ロボット制御、作業者安全、設備異常検知。 - カメラ・センサー
メタデータ出力、プライバシー保護、低帯域AI、スマートシティ、店舗分析。 - 医療・介護周辺機器
見守り、転倒検知、離床検知、呼吸・姿勢推定、プライバシー配慮型センシング。 - 建設・インフラ
重機接近検知、危険区域侵入、設備点検、遠隔監視、災害時の現場判断。
これらの分野では、AIは派手なチャット機能ではなく、製品の信頼性、安全性、省エネ性、使いやすさを高める機能として入っていきます。
まとめ
“省電力AI”の次に来る競争軸は、単に少ない電力でAIを動かすことではありません。どのAI推論を端末側に置き、どのデータを外に出さず、どの機能をリアルタイムに動かすかです。
クラウドAIは今後も重要です。しかし、家電、車載、産業機器、カメラ、ロボット、医療・介護周辺機器では、クラウドに毎回問い合わせるAIよりも、端末の中で即時に判断するAIの価値が高まります。
オンデバイス推論は、レイテンシを下げ、通信費を抑え、プライバシーを守り、オフラインでも機能を維持するための設計です。そして日本企業が強いリアルな製品領域では、AIは“追加サービス”ではなく“標準機能”として組み込まれていきます。
これからのAI市場は、クラウド上の大規模モデルだけで決まりません。ユーザーの手元、車の中、工場のライン、家電の内部、カメラのセンサー上で動くAIが、次の競争力になります。





