Amazon AVS用VocalFusionステレオ開発キット

Amazon AVS用のXMOS VocalFusionステレオ開発キット(DigiKey品番:880-1130-ND)は、Amazonが提供するAlexa Voice Service(AVS)の「遠距離音声キャプチャと処理」アプリケーションの開発を支援する、Raspberry Pi専用の開発キットです。「遠距離音声キャプチャ」技術は、「スマートデバイスに遠くの人間の音声(通常1m~10mの距離)を認識させることを目的としています。」Amazon AVSの技術により、音声認識システムを 「トレーニングする」必要はありません。このシステムは、すぐに使用できます。

図1:Amazon AVS用のXMOS VocalFusionステレオ開発キット。(画像提供:XMOS)

キット内容:

  • 4個の無指向性マイクロフォンのリニアアレイ:最大180°キャプチャ、「部屋の端」での使用に最適
  • 低ジッタオーディオクロック
  • 設定可能なユーザー入力ボタンとLED
  • I2SオーディオおよびI2C制御コネクティビティ
  • USB電源(オプションでUSB2.0デバイスのオーディオおよび制御コネクティビティ)
  • 40ピンRaspberry Piインターフェースケーブル(ピン配列については図3を参照)

キットに含まれていないが必要なもの:

  • Raspberry Pi – DigiKey品番:1690-1025-ND
  • 電源アダプタ(最小2A推奨) – DigiKey品番:1690-1022-ND
  • SDカード(最小16GB推奨) – DigiKey品番:1582-1004-ND
  • スピーカ
  • USBキーボード
  • USBマウス – DigiKey品番:CH969-ND
  • HDMI入力付きモニタまたはRaspberry Piタッチスクリーン – DigiKey品番:1690-1007-ND
  • HDMIケーブル – DigiKey品番:Q396-ND(1690-1007-NDを使用する場合は不要)
  • インターネットに接続可能なEthernet接続

VocalFusionステレオ開発キットのブロック図を、図2に示します。以下を含みます:

  • VocalFusion XVF3500ボイスプロセッサ
  • 別基板上の4個のMEMSマイクロフォン
  • 電源供給用のマイクロUSBコネクタ(オプションでUSB2.0デバイスの接続も可能)。
  • I2SおよびI2C制御コネクティビティ用の拡張ヘッダ
  • 4個の汎用押ボタンスイッチ
  • 13個のユーザー制御LED
  • 低ジッタクロック源
  • xTAGデバッグアダプタ用のxSYSコネクタ

図2:VocalFusionステレオ開発キットのブロック図。(画像提供:XMOS)

XMOSは、わかりやすいセットアップガイドを提供しています。注意点として、40ピンのPiコネクタにはキーが付いていないため、コネクタが正しく配置されているかどうか、もう一度確認する価値があります(図3参照)。

図3:RPiの40ピンコネクタ。(画像提供:XMOS)

Raspberry Piのピン配列の詳細については、図4を参照してください。

図4:Raspberry Piケーブルのピン配列。(画像提供:XMOS)

Raspbianのインストール

こちらのリンクから、Raspbian Stretchをダウンロードしてください。

SDカードスロットまたはUSBアダプタを介して、SDカードをコンピュータに挿入します。

以下の手順に従って、ダウンロードした画像をSDカードにインストールしてください(使用しているOSに応じて):

Linuxターミナル

  1. Ctrl-Alt-Tで、新しいターミナルウィンドウが開きます。
  2. コマンドプロンプトでlsblkと入力して、SDカードのアドレス(/dev/mmcblk0、/dev/sdb、または類似のアドレス)を取得します。
  3. sudo dd if=/dev/zero of=/dev/mmcblk0 bs=1M count=10と入力します。
  4. unzip -p 2018-06-27-raspbian-stretch.zip | sudo dd of=/dev/mmcblk0 bs=4M conv=fsyncと入力します。
    • 注意:2018-06-27という日付は異なる可能性があるため、自身のダウンロードに適した日付を入力してください。
  5. 画像が書き込まれるまで待ってから、ディスクを取り出します。

Mac OS

  1. ターミナルを開きます。
  2. diskutil listと入力して、SDカードのディスク(disk3やdisk4など)を探します。
  3. sudo diskutil eraseDisk FAT32 Raspbian /dev/disk3と入力します(ディスク番号が正しいことを確認してください)。
  4. sudo dd bs=1m if=2018-06-27-raspbian-stretch.img of=/dev/disk3 conv=syncと入力します。
  5. 画像が書き込まれるまで待ってから、ディスクを取り出します。

Windows

  1. Windowsインストールetcher.ioをダウンロードします。
  2. Etcherを実行して、2018-06-27-raspbian-stretch.zipを選択します。
  3. SDカードドライブを選択します。
  4. 「Flash」をクリックします。
  5. 画像が書き込まれるまで待ってから、ディスクを取り出します。

Amazon AVSのインストールと設定

こちらのリンクからRaspberry Piクイックスタートガイドにアクセスして、必要な依存関係をインストールし、Amazon AVSを稼働させるまでの手順をご確認ください。この作業が終わったら、sudo reboot と入力してください。

Amazon AVSの実行

  1. avsrunと入力します。
  2. テストするには、「アレクサ、今何時ですか?」と言ってみてください。

 

リファレンス:

1 –https://www.xmos.com/published/vocalfusion-stereo-dev-kit-for-amazon-avs-getting-started-guide?version=latest

2 –http://www.xmos.com/download/private/VocalFusion-Stereo-Dev-Kit-for-Amazon-AVS-Hardware-Setup-Guide%281.0%29.pdf

3 –https://www.xmos.com/download/private/VocalFusion-Stereo-Dev-Kit-for-Amazon-AVS-Hardware-Manual%281.0%29.pdf

4 –https://medium.com/@Alibaba_Cloud/interspeech-2017-far-field-speech-recognition-technology-a5f554772db9

著者について

Image of Curtis Johnson

DigiKeyのアソシエートアプリケーションエンジニアリングテクニシャンであるCurtis Johnsonは、2017年以来、技術的な質問を持つお客様を支援してきました。また15年間、銀行家として勤めた後、2015年以来、DigiKeyで仕事を続けています。Curtisは、Electronics Technology Automated SystemsでのAAS、(銀行やエレクトロニクスとは関係ありませんが)心理学の学士号、会計学に重点を置いたMBA、経済学と金融学での大学院の研究を修了し、2018年秋にはコンピュータサイエンスの学士号プログラムに入学することになっています。Curtisは、組み込みシステム、RF、セルラー通信、その他の分野でより多くの理解を得ることに取り組んでいます。Curtisは自由な時間には、家族、読書、学習に時間を費やしています。

More posts by Curtis Johnson
 TechForum

Have questions or comments? Continue the conversation on TechForum, Digi-Key's online community and technical resource.

Visit TechForum