マイコンがエッジAIへのアクセスを民主化する方法および理由
DigiKeyの北米担当編集者の提供
2025-02-18
ここ数年、エッジAIの人気が高まっています。関連する世界市場は、2035年まで年平均27.8%の成長率で成長し、3,568億4,000万ドルの純増になると予想されています。
さまざまな要因がこの需要を後押ししています。エッジでのデータ処理は、企業の機密情報や独自情報をクラウドに転送することに対する企業のセキュリティ上の懸念に対処します。また、エッジ処理はレイテンシを低減します。これは、一瞬の判断が求められるリアルタイムのアプリケーションでは重要な要素となる可能性があります。産業用IoT(IIoT)デバイスはデータ駆動型の運用を実現し、それによりエッジAIのユースケースが増加します。ポータブル医療機器からウェアラブル、IIoTに至るまで、急速に拡大する実装がエッジAIの市場を後押ししています。
この技術の普及に伴い、組み込みシステムにおけるデータ処理ニーズに対応できるコンポーネントの需要も高まっています。
コンピューティング処理の選択肢:マイクロコントローラまたはマイクロプロセッサ
現在、産業用機器およびその他の組み込み機器に導入されているIoTデバイスの大半は、メモリ容量が非常に少ない低消費電力デバイスです。これらのデバイスの処理能力は、小型の組み込み型マイクロコントローラ(MCU)によって実現されています。これらのMCUは低消費電力アーキテクチャを採用しており、組み込みシステムはマイクロプロセッサを使用するシステムよりもはるかにコスト効率の高いものとなっております。
エッジAIが登場するまでは、MCUはIoTデバイスの処理ニーズに十分に応えていました。しかし、従来のMCUでは、通常エッジAIアプリケーションの特徴である、より複雑な機械学習アルゴリズムに必要な処理能力を提供することはできません。このようなアルゴリズムは通常、より高い演算能力を持つグラフィック処理ユニット(GPU)やマイクロプロセッサ上で実行されます。しかし、これらのコンポーネントを使用すると、消費電力などの独自の欠点が生じます。マイクロプロセッサやGPUは、最もエネルギー効率の高いソリューションではありません。結果として、マイクロプロセッサ駆動のエッジコンピューティングは、すべてのエッジAIアプリケーションに最適とは言えないため、ベンダーは代わりにMCUを選択することになります。
スタンドアロンMCUはGPUやマイクロプロセッサよりも低コストです。エッジAIを拡張するためには、MCUの利点である低コストと低消費電力を活用しながら、演算能力を向上させる必要性が高まっています。
実際、長年にわたり、いくつかの要因が重なり、エッジにおけるMCUの能力が向上してきました。
エッジにおけるMCUの使用を促進している要因
従来のMCUはAI関連のデータ処理には能力不足というのが一般的な見方でしたが、MCUの設計と、より広範なテクノロジーエコシステムの両方に変化が起こり、エッジAIのユースケースにおけるMCUの採用が拡大しています。
それらの要因には、以下のようなものがあります。
MCUへのAIアクセラレータの統合:MCU単体ではエッジコンピューティングの要求を満たすのが難しい場合、ニューラル処理ユニット(NPU)やデジタルシグナルプロセッサ(DSP)などのAI/MLアクセラレータと統合することでパフォーマンスが向上します。
たとえば、STMicroelectronicsのSTM32N6シリーズCPU (図1)は、800MHzで動作するArm Cortex-M55をベースにしています。Arm Heliumベクトル処理技術により、標準的なCPUにDSP処理能力をもたらします。STM32N6は、強力なエッジAIアプリケーション向けに設計された自社開発のNPUであるST Neural-ART Acceleratorを内蔵した初のSTM32 MCUです。
図1:STM32N6は、電力効率に優れたエッジAIアプリケーション向けに設計された自社開発のニューラル処理ユニット(NPU)であるST Neural-ART Acceleratorを搭載した初のSTM32 MCUです。(画像提供:STMicroelectronics)
- エッジ向けに最適化されたAIモデル:高負荷のAIおよび機械学習アルゴリズムをMCUに単純に転用することはできません。それらは、制約のあるコンピューティングリソース向けに最適化する必要があります。TinyMLやMobileNetのようなコンパクトなAIアーキテクチャは、最適化技術と併用することで、エッジのMCUでもAIアルゴリズムを実行できるようにします。STMicroelectronicsは、ニューラルネットワークをSTM32 MCU向けに最適化されたCコードに変換するソフトウェアソリューション、STM32Cube.AIを発表しました。このソリューションをSTM32N6と併用することで、処理能力やメモリの制約がある場合でもエッジAIアプリケーションに必要なパフォーマンスを確保することができます。
AIエコシステムの台頭:エッジでAI関連の処理が可能なハードウェアコンポーネントを単に備えているだけでは十分ではありません。エッジでAIアルゴリズムを実行するには、AIの導入を容易にする開発者向けのエコシステムが必要です。TensorFlow Lite for Microcontrollersのような特定のツールは、このようなソリューションの提供に役立ちます。Hugging Faceのようなオープンソースのコミュニティやその他のプラットフォームは、開発者がテストし、特定のユースケースに合わせて調整できる学習済みのモデルやコードライブラリを提供しています。このようなAIエコシステムにより、技術導入の障壁が下がり、独自のAIモデルをゼロから開発できないリソース不足の企業でも容易に利用できるようになります。
STMicroelectronicsは、最適化されたエッジAIソリューション向けに、特にカスタマイズされたハードウェアとソフトウェアのエコシステム「ST Edge AI Suite」を提供しています。このスイートは、STのAIライブラリやツールが多数統合されており、開発者はモデル、データソース、ツール、およびマイクロコントローラ用のコードを生成できるコンパイラを簡単に見つけることができます。
Model zooで学習済みモデルは、開発者に出発点を提供します。これらのモデルは、コンピュータビジョン(CV)、自然言語処理(NLP)、生成AI(GenAI)、グラフ機械学習などの分野で機械学習モデルを表現するためのオープンスタンダードであるONNX(Open Neural Network Exchange)フォーマットを使用しています。
- 標準化と相互運用のためのコード:AIエコシステムは、企業がエッジAIのユースケースをテストするのに役立っていますが、オープンで標準化されたモデルフォーマットは、ハードウェアシステム間のシームレスな統合を支援してきました。ソフトウェアツールとMCU間の互換性は、エッジAI実装の障害を減らすのに役立っています。
- エッジにおけるセキュリティへの配慮:MCUはデータのクラウド処理の必要性をなくすか、少なくとも減らせる一方で、ハードウェアコンポーネントはさらなるセキュリティ層を提供します。通常、ハードウェア暗号化やセキュアブートなどの機能が搭載されており、悪意のあるアクターからデータとAIモデルの両方を保護します。
STM32N6ハードウェアの特筆すべき機能
STM32N6シリーズには、NPUを搭載した高性能MCU、カメラモジュールバンドル、Discoveryキットが含まれます。このシリーズは、一般的なARM Cortex-Mアーキテクチャを採用しており、これらのデバイスをエッジでのAIに適したものにするいくつかの重要な機能を備えています。これには次のようなものが含まれます。
- ニューラルネットワークモデルを実行できるNeural ART Accelerator。集中的なAIアルゴリズム向けに最適化され、クロックは1GHz、平均3TOPS/Wのエネルギー効率で600GOPSを提供します。
- 強力なニューラルネットワークおよびDSP機能を実現するARM命令セットである 「Helium」 M-profile Vector Extension(MPVE)命令をサポートします。これらの命令は、たとえば16ビットや32ビットの浮動小数点数で動作するように設計されており、低精度数を効率的に操作することができます。これらはMLモデルを処理する上で重要です。
- ST Edge AI Suiteは、あらゆる経験レベルの開発者がインテリジェントエッジ向けのAIを作成できるようにする、無償のソフトウェアツール、ユースケース、およびドキュメントのリポジトリです。このスイートには、ST Edge AI Developer Cloudのようなツールも含まれています。このクラウドには、STM32 model zoo内の専用ニューラルネットワーク、実際のベンチマーク用のボードファームなどがあります。
- 約300の構成可能な乗算ユニットと2つの64ビットAXIメモリバスにより、600GOPSのスループットを実現します。
- 複数の500万画素カメラと直接インターフェースできる専用イメージシグナルプロセッサ(ISP)を内蔵しています。カメラを組み込んだシステムを構築する場合、開発者は特定のCMOSカメラセンサとそのレンズに合わせてISPを調整する必要があります。チューニングには通常、専門的な知識やサードパーティの助けが必要です。STはこの目的のために、iQTuneと呼ばれる特別なデスクトップソフトウェアを開発者に提供しています。Linuxワークステーション上で動作するこのソフトウェアは、STM32上の組み込みコードと通信し、色精度、画質、および統計を分析し、ISPのレジスタを適切に設定します。
- モバイルアプリケーションで最も一般的なカメラインターフェースであるMIPI CSI-2をサポートます。この特定のカメラシリアルインターフェースと互換性のある外部ISPは必要ありません。
- 1つのデバイスに多くの機能が追加されたことで、開発者は複数のMCUを使用することなく、ニューラルネットワークをGUIと組み合わせて実行できるようになりました。
- SESIPレベル3およびPSAレベル3の認証をターゲットにすることで、強固なセキュリティを実現します。
まとめ
エッジで実行される機械学習アプリケーションは、複雑なアルゴリズムを実行する負担に耐えるため、従来は組み込みシステム用のヘビーデューティなマイクロプロセッサを必要としていました。STMicroelectronicsのSTM33N6シリーズCPUのような強力なMCUのおかげで、企業はエッジでAIを実現できるようになりました。STMicroelectronicsは、推論用のソフトウェアおよびハードウェアコンポーネントを含む、エッジでのAI展開のためのエコシステム全体を提供します。

免責条項:このウェブサイト上で、さまざまな著者および/またはフォーラム参加者によって表明された意見、信念や視点は、DigiKeyの意見、信念および視点またはDigiKeyの公式な方針を必ずしも反映するものではありません。