Articles & Blogs > 大量の生センサデータは本当に必要ですか？いいえ、より優れた方法があります

大量の生センサデータは本当に必要ですか？いいえ、より優れた方法があります

筆者： Stephen Evanczuk 2021-09-09

タグ

センサデータの流れを利用したアプリケーションを構築している方は、私のようなデータジャンキーである可能性が高いでしょう。センサデバイスがアプリケーションにデータを流してくれるというのは、ある種の満足感がありますし、豊富な種類のセンサを使えば、データストリームを増やすのも簡単です。

センサシステムでは、驚異的な詳細さで、マクロなイベントを一連の測定値に分解して捉えることができます。どんなに熱心なデータジャンキーでも、大量の生データだけではアプリケーションの目的を達成できないことを認めざるを得ないでしょう。各イベントを細かく切り刻んで計測することではなく、イベントそのものが重要なのです。幸いなことに、スマートセンサの出現により、アプリケーションとそのユーザーにとって重要なイベントに焦点を当てることができるようになりました。

より多くのセンサデータを簡単に生成できるようになると、データストリームは生の測定値の洪水のようになり、すべてのデータから有用なものを作り出そうとする組み込みハードウェアやソフトウェアを圧倒してしまいます。それは、データが処理装置や通信装置の能力を超えてしまうという問題だけではありません。詳細な測定値によって、アプリケーションの開発者やユーザーは、意思決定に必要な高レベルの抽象化ではなく小さなディテールにこだわり、気が散ってしまいます。

抽象化への対応

抽象化とは、定義上、詳細情報が多少失われることを意味します。データ中心のアプリケーションでは、複数の生の測定値から抽象化された派生データを扱うため、後に重要となる可能性のある細部の見落としを心配するエンジニアがいるのは当然です。交通機関やセキュリティ用のデータレコーダのように、なにか新しいイベントを特定したり、根本的な原因を解明したりする必要があるアプリケーションでは、確かにそのような懸念があります。

しかし、多くの民生用アプリケーションや産業用アプリケーションでは、対象となるイベントの具体的な特性がよく知られています。人や物が急に倒れると特有のモーションアーティファクトが発生しますし、産業用モータの故障では予測可能な振動パターンが生じます。このような特性の詳細は、一般的に、多くの高レベルアプリケーションにとって重要ではありません。アプリケーションは、転倒や故障のイベントが発生したときにアラートを出すだけでよいのです。もちろん、アラートの状態を検出するための仕組みには、センサの詳細な測定値が必要です。

私は、高レベルイベントを扱うアプリケーションに対して大量のデータを生成するプロジェクトで、同じ問題に直面しました。高レベルイベントの情報を生成するためには詳細なデータが必要ですが、短時間のアクティビティを超えて測定データをアーカイブしようとすると、ストレージが足りなくなってしまいます。ここで、機械学習などの分析手法を用いた抽象化手法が役立ちました。

たくさんのテストを行った結果、その場で抽象化されたデータを生成し、古い測定データを書き換えるだけで済むと確信しました。

イベントに焦点を当てる

STMicroelectronicsが提供するiNEMO慣性計測ユニット（IMU）のような最先端のセンサは、常時オンのアプリケーションに対してこのような機能を提供します。低消費電力IMUには、電池駆動の民生用アプリケーション向けのLSM6DSOX、高精度アプリケーション向けのLSM6DSRX、産業用アプリケーション向けのISM330DHCXなどがあります。これらのIMUには、プログラム可能な有限状態機械（FSM）と機械学習コア（MLC）が組み込まれており、独自のトレーニングデータセットを使用してトレーニングすることができます（「スマートセンサに内蔵される機械学習コアを使用して「常時オン」モーショントラッキングを最適化」を参照）。

これらのデバイスは、関心のあるイベントに関連するパターンを検出すると、ホストプロセッサに対して割り込みを生成することができます。その後、ホストプロセッサは、適切なアプリケーションロジックを実行することができます。実際、生のモーションデータだけが欲しい場合や、イベント割り込みと組み合わせて欲しい場合は、他のモーションセンサと同様に、生の測定データを読み取ることができます（図1）。

図1：STMicroelectronicsのiNEMO IMUは、統合されたFSMおよびMLC用の条件付きデータを生成し、IMUの先入れ先出し（FIFO）バッファを介してホストがアクセスするための完全なデジタルチェーンを統合します。（画像提供：STMicroelectronics）

センサが自らの測定値を監視し、より抽象的なイベントを特定できることで、プロセッサや通信チャンネルの負荷が軽減され、新世代のスマートセンサへの道が開かれます。さらに重要なことは、生のデータを内部で分析して有用な情報を生成できるセンサは、生の測定値よりもより多くの派生データを供給する、より効率的なML設計への道を示しているということです。

まとめ

生の測定値ではなく、派生データにアプリケーションソリューションを集中させるために、ML対応のセンサは必要ありません。比較的単純なデータセットの場合、センサシステムのホストプロセッサは、イベントを特定するために決定木を実行するのに十分なサイクルを持っています。しかし、大規模なデプロイメントでは、センサとアップストリームホストの間にエッジコンピューティングリソースを使用して抽象化変換を行うことができます。どのような方法であっても、データを減らして有用な抽象概念にすることは、少ない方が良い場合もある応用分野に役立つのです。

リファレンス：

スマートセンサに内蔵される機械学習コアを使用して「常時オン」モーショントラッキングを最適化

1 – https://www.digikey.jp/ja/articles/use-a-smart-sensors-built-in-machine-learning-core-to-optimize-always-on-motion-tracking

著者について

Stephen Evanczuk氏は、IoTを含むハードウェア、ソフトウェア、システム、アプリケーションなど幅広いトピックについて、20年以上にわたってエレクトロニクス業界および電子業界に関する記事を書いたり経験を積んできました。彼はニューロンネットワークで神経科学のPh.Dを受け、大規模に分散された安全システムとアルゴリズム加速法に関して航空宇宙産業に従事しました。現在、彼は技術や工学に関する記事を書いていないときに、認知と推薦システムへの深い学びの応用に取り組んでいます。