プロセッサはさらに増大するビジュアルワールドに精緻なグラフィックサポートを提供

著者 Jon Gabay

Electronic Products の提供


単なるテキストを伝達することは、今日では十分ではありません。 過度に刺激された感覚の世界で私たちを誘惑し、注意を保つためには、すべてのデータの表示は私たちの美的感覚にアピールする必要があります。 その結果、基本的な情報であっても、複雑なシェーディング、アニメーション、そしてビデオで鮮やかにレンダリングされた色で提示されなければなりません。

しかし、高解像度、ディープカラーパレット、リアルタイムアニメーション、およびビデオのすべては、構築、レンダリング、およびページへの表示に関するプロセッサの能力にしわ寄せが行きます。 私たちは、きれいで、ちらつきやアーティファクトのないページを見ることを期待しています。 しかしながら、ディスプレイの解像度が高くなるにつれて、コンテンツの量、バックグラウンド処理、および各ページのデータ移動、そしてそれらをレンダリングする能力は、プロセッサのリソース、特に時間とメモリをより多く必要とします。

この記事では、ハイエンドグラフィックスをサポートするのに十分な馬力、リソース、およびアーキテクチャのストリームライン化を備えた、ハイエンドのプロセッサを見ます。 これらは一般的に、内部で32ビット以上の幅のデータパスを採用し、高速クロックを使用します。 内部の高速キャッシュRAMと同様に、インターリーブされたDMAも重要です。 ここで参照されるすべての部品、データシート、チュートリアル、および開発キットは、DigiKeyのウェブサイトに掲載されています。

要件と選択肢

私たちのほとんどは、設計が何百万も生産されるほど幸運ではありません。 その結果、ASICは多くの場合、コスト、時間、またはリスク対効果のオプションではなく、結果としてより高コストのFPGA、または他のシステム機能を実行しながら、グラフィックを扱うことができる十分な能力を持つプロセッサを指定することになります。

今日のビデオは簡単な作業ではありません。 データをフォーマットし、スプライトを解決し、オーバーレイを実行し、スクロール、カラーブレンディングや、その他を実行するためには、プロセスとデータパスを多用するタスクが関与します。 3次元(3D)レンダリングやシェーディングは、プロセッサリソースと時間を消費する期待される機能の別のレイヤを追加します。

いくつかの高性能プロセッサは、専用のグラフィックス周辺プロセッサとしてプログラムすることができますが、これらの部品は一般的に多くの追加タスクを処理することができます。 しかも、それらに含まれるハイエンドの周辺機器には、投影型静電容量タッチインターフェースのほか、ステレオサウンドおよびEthernetと、アプリケーションプロセッサが最も少ない中断で処理することを可能にする他の通信プロトコルを含めることができます。 それはほぼもう一つのコアを持っているようなものです。 高性能DMAおよび外部バスインタフェースロジックはまた、多くの汎用I/Oと同様に通常存在します。

典型的なタブレットは、TFTディスプレイに1024 x 600から2,560 x 1,600ピクセルを持つことができます。 この広い範囲は、システムの性能、特に必要なメモリソースの量にに厳しい制約を課します(表1)。 フル24ビットのカラーパレットを使用すると、SamsungのGalaxy、AmazonのKindle、および東芝のタブレットなどで使用されている2,560×1,600ディスプレイは、単一ページ用に12Mバイトを超えるRAMを消費することになります。

典型的なタブレットディスプレイ対ページメモリ

表1: 典型的なタブレットディスプレイ対ページメモリ

32ビット幅のデータバスであっても、368,640,000シングルサイクル24ビットメモリ転送を、毎秒30フレーム(fps)ビデオストリームの完全な再描画のために、毎秒実行する必要があります。 つまり、転送あたり2.7nsは、レンダリングやデータを移動しているプロセスに大きな負担をかけます。 MPEGなどの圧縮されたビデオフォーマットのリアルタイムデコードを行っていない場合でも、レンダリングはお客様が考えるかもしれないような単純なタスクではありません。

別の要因は、内部高速キャッシュRAMおよび外部バスインタフェース速度です。 高クロック速度、外部バスRAM上の待ち状態は、プロセッサを飢えさせ性能を低下させます。 お使いのプロセッサの外部バスインタフェース上の良好なSDRAMインタフェースは、ページがバックグラウンドでリフレッシュすることができることを意味し、プロセッサはレンダリングに完全に集中することができます。

高性能プロセッサは、非常に迅速にデータを移動することができる場合は特に、グラフィック制御専用にすることができます。 よく実装された高速SDRAMインタフェースの一例は、パワーPCのMPC603eコアを中心とし、MPC82xxシリーズの一部であるFreescaleのMPC8245LVV333Dに見つけることができます。 この32ビット、352ピンのプロセッサは333MHzでクロックし、一部のファミリメンバはさらに速く実行することができます。 このプロセッサは、2、1.8および1.5Vバージョンで入手可能で、この450万トランジスタデバイスにおいて電力を減らすことに役立ちます。

MPC8245は、パワーPCアーキテクチャをPCIブリッジと組み合わせており、設計者はPCI用に設計された周辺機器やその他の標準的なインターフェースを使用して、迅速にシステムを設計することができます。 そのコアは様々な周波数で動作することができ、設計者は消費電力のために性能をトレードオフすることができます。 SDRAMの同期および駆動は周辺制御ユニットによって独立して処理され、それらはまた外部バスインタフェースロジックにDMA機能をインターリーブし、ディスプレイへの自律的高速データ転送を可能にし、プロセッサの馬力をバックグラウンドでレンダリングするために自由にします(図1)。

高度な高速外部メモリインタフェースに結合されたストリームライン化されたプロセッサブロック

図1: 高度な高速外部メモリインタフェースに結合されたストリームライン化されたプロセッサブロックは、専用のグラフィックスプロセッサのための良い候補であり、ハイエンドの半自律ペリフェラルとして機能することができます。 これは、いくつかのアプリケーションに必要とされるすべてである可能性があります。

SDRAMインタフェースは、最大2GバイトまでのSDRAMをサポートすることに注目してください。 高帯域幅バスは、32または64ビットの転送サイクルを使用することができます。 統合されたDMAコントローラは、スキャッタギャザー操作を可能にし、自動的にDMAバッファにリンクするDMAチェーンをサポートします。 これはまたメインマイコンの課題から別のタスクを排除します。

デジタル画像やグラフィックスの長年の開発者でパイオニアであるTexas Instrumentsは、そのOMAP35xプロセッサおよびツールで深刻な競争相手を提供します。 OMAPプラットフォームは、4つの可能なOMAPアプリケーションプロセッサを統合した強力な600MHzのスーパースカラARM® Cortex™-A8コアを組み合わせます。

特に興味深いのは、クラス最高のビデオ、画像、グラフィックス処理を有し、ストリーミングビデオ、2D/3Dモバイルゲーム、およびビデオキャプチャの直接サポートを提供するものとして、もてはやさされるOMAP3530です。 OMAP3530には、グラフィックスアクセラレータと専用のビデオ入力およびビデオ出力ポートが含まれます。

特に注目すべきは、64チャネルのDMAサポートと低消費電力DDRインタフェースです。 他のプロセッサと同様に、RAMはダイ面積の多くを占めており、この場合は64Kの汎用RAMは通常、一度に走査線の1つまたは2つを保持します。 また、役立つことは、テンプレートやいくつかの背景となるグラフィックス情報を保持することができる、最大256Kバイトのオンチップのレベル2キャッシュRAMが利用可能だということです。 また、別の96KバイトのRAMが、DSPレンダリングおよび使用のために利用可能であるという事実に注目してください。 ハードウェアベースのグラフィックスアクセラレータもまた、3530に含まれています。

TIおよびサードパーティの開発ツールメーカーの両方が、これらの部品をサポートしています。 Circuitco ElectronicsのBeagleBoardはOMAP3530をサポートし、SDRAM、Sビデオ、およびDVI-Dインタフェースへの接続ならびにすべてのLCDインタフェース信号(図2)を示します。 BeagleBoardプロダクトトレーニングモジュールはDigiKeyでオンラインで入手でき、また興味のあるビデオインターフェースであるピコプロジェクターを駆動するために、Linuxを実行するBeagleBoardsの使用方法のビデオ画像があります。

BeagleBoardはOMAPプロセッサアーキテクチャを利用

図2: BeagleBoardはOMAPプロセッサアーキテクチャを利用し、特に組込みLinux設計向けに、強力なテストおよび開発プラットフォームとして機能します。 これはディスプレイ駆動およびピコプロジェクター向けに好適です。

ロジックPDSOMOMAP3530-11-1782JFIRを開発および評価プラットフォームとし、OMAP3530をサポートし、ARM Cortex-M8プロセッサをTMS320C64x DSPプロセッサと組み合わせます。 これはより多く信号処理の開発を対象としていますが、また、利用可能なプラットフォーム開発ツールでもあります。

マルチコアの選択肢

マルチプロセッサチップは、マルチプロセッサボードを実装するための良い代替の可能性があります。 同じメモリまたは周辺バスを共有する場合、いくつかの帯域幅の制限の可能性がある一方で、マルチコアプロセッサは、タスクが効率的に分配されている場合、それらを実行する能力を実証しています。

広く知られており、サポートされている技術ファミリには、Freescaleの1.2GHzで64ビットDDR3と2つの32ビットDDR2インターフェイスを備えた最大クアッドコア部品にスケールされるプロセッサの、ARM 8~ARM 11ベースi.MX 6シリーズの強力なファミリがあります。

2Dおよび3Dグラフィックスに適したFreescaleのi.MX6sololite部品であるMCIMX6L3DVN10AAは、単一の1GHzのコアを持つ432ピンのROMレスプロセッサです。 注目すべきは、256KバイトのオンチップRAMおよび最小0.95Vまで動作する電源です。

これらの部品はスケーラブルであり、マルチメディアやグラフィックスを念頭に置いて作られています。 専用のハードウェアグラフィックアクセラレータブロックは、ベクトル、2Dおよび3Dグラフィックスを実行し、これらのデータ集約型の作業からプロセッサを開放します。 画像処理用に指定された別の専用ブロックは、強調、反転、回転、スクロール、サイズ変更、ブレンディングなど多くの機能を処理します。 更に他の専用ハードウェアブロックはカメラやディスプレイとインタフェースします(図3)。

洗練された専用ハードウェアブロックは、高速バスと深いメモリプールを利用することができる場合に、最高の性能を発揮

図3: 洗練された専用ハードウェアブロックは、高速バスと深いメモリプールを利用することができる場合に、最高の性能を発揮できます。 これは、より統合された周辺機器での低コストで、ASICのようなレベルの性能を提供することができます。

Freescaleのより大きい624ピンMCIMX6S5DVM10ABはまた、専用のグラフィックスハードウェアとARM Cortex-A9を備えたROMレス設計です。 デュアルおよびクワッドコアは、食物連鎖の上位にあり、単一のコアがリアルタイムで処理できない機能を吸収します。 例えば、i.MX6ファミリにはまた、MCIMX6Q5EYM10ACなど、クアッドコア1.2GHzの部品が含まれます。 これらの部品はまた、デュアル2Dグラフィックスエンジンや、4つの追加のシェーダを備えた3Dサポートを特長とします。

要約すると、ASICは洗練されたグラフィックスやビデオを提供する効果的な解決策になるかもしれませんが、ほとんどの設計者は、それを指定するコストや時間を持つ余裕がありません。 幸いなことに、この記事が実証したように、よく考え抜かれたビデオ機能と作業をするための機能を備えた様々な優れたハイエンドプロセッサが利用可能です。

この記事で扱っている部品の詳細については、このページにあるリンクを使用して、DigiKeyウェブサイトの製品ページにアクセスしてください。
 

免責条項:このウェブサイト上で、さまざまな著者および/またはフォーラム参加者によって表明された意見、信念や視点は、DigiKeyの意見、信念および視点またはDigiKeyの公式な方針を必ずしも反映するものではありません。

著者について

Jon Gabay

出版者について

Electronic Products

雑誌『Electronic Products』とElectronicProducts.comは、電子機器およびシステム設計の責任を持つ技術者や技術管理者に関連情報を提供しています。