データセンターにおける電力効率の重要性
AIの台頭により、データセンターの計算能力は高価値かつエネルギー集約的なリソースとなっています。製品チームは、インフラ、規制、政治的制約を考慮しつつ、急増する需要に対応しながら、効率性、高密度化、信頼性を確保しなければなりません。このバランスを実現するには、高速かつ効率的な電力変換技術と、重要な低電圧レールとシステムレベルの補助レールの両方を保護するための、階層化されたハードウェアタイミング制御による監視技術における革新が必要です。
最新のデータセンター、特にAIに特化したデータセンターでは、単にサーバの台数だけでなく、電力密度や総エネルギー容量を重視した設計がますます一般的になっています。かつてはサーバが計画の主要な単位でしたが、最新のデータセンターでは、個々のマシンではなく、ラック全体やポッド単位で規模を決定し、メガワットの電力と冷却を軸に構成されています。
AIに最適化されたラックは、多くの場合30kW以上を消費し、従来のサーバラックの一般的な5~15kWの数倍に達します。これにより、ラック1台のピーク消費電力は、小規模住宅地に匹敵するレベルになっています。このような環境で運用には、厳密に割り当てられた電力を管理しつつ、急激な電力サージが発生してもシステムの安定性を維持できるアプリケーションが必要です。Texas Instrumentsのコンポーネントは、最新の設計がいかにしてこれらの新たな電力および信頼性を満たせるかを実証しています。
制約への対応
この変化により、設計者は機能が自動的に拡張されるとはもはや想定できなくなりました。あらゆるインタラクション、計算、あるいはデータ集約型体験が、基盤となるシステムに具体的な影響を与えるようになったのです。大規模かつ突発的なワークロードの引き金となる機能は、遅延の発生や速度制限を招く可能性があり、システム内の他の部分でスケーリングのトレードオフを必要とする場合があります。
最も効果的な設計とは、制約を無視するのではなく、それを予測し、負荷がかかった状態でも応答性を維持しながら価値を提供し、計算リソースのあらゆる部分を有効活用するものです。設計者は、速度、機能、効率の間のトレードオフを慎重に検討し、ユーザー体験と計算能力およびエネルギーに関する物理的な制限とのバランスを取らなければなりません。
ハードウェアに効率性、精度、そして耐障害性を組み込むことは、システムに過負荷をかけることなく価値を提供するデータセンター向けアプリケーションを設計する上で鍵となります。アプリケーションは、負荷がかかっている状況下でも応答性を維持し、1ワットあたりの計算能力を最大限に活用しなければなりません。その第一歩は、電力を管理し、電圧を監視し、急激なサージ発生時にもパフォーマンスを保護するコンポーネントから始まります。
以下では、TIのコンポーネントがこうしたアプリケーションをどのように強化できるかを説明します。
変換層
窒化ガリウム(GaN)電源技術は、データセンターの効率を最適化する上で、ますます不可欠になっています。NVIDIAのグラフィックプロセッシングユニット(GPU)を搭載したAIサーバは、大量の電力を消費するため、その電力を迅速かつ正確に下げなければなりません。高速ゲートドライバとGaN電界効果トランジスタ(FET)を統合することで、従来のシリコン製ソリューションと比較して、より高いスイッチング周波数とスイッチング損失の低減が可能になります。これにより、基板レベルおよびラックレベルの両方で電力変換効率が向上し、熱として失われるエネルギーが減少するほか、冷却需要の減少や、より小型の電力供給回路の実現につながります。データセンターは、より高い計算密度と、全体的なエネルギー性能の向上という恩恵を受けることができます。
TIのLMG3100R017VBER(図1)は、高周波ゲートドライバを内蔵した100V GaN FETで、小型パッケージに収められています。このデバイスは、GaN FETと内部のハイサイドレベルシフタおよびブートストラップ回路を含むドライバを組み合わせたもので、外部のレベルシフタを必要とせずに2つのデバイスでハーフブリッジを構成できます。
図1:LMG3100R017VBERは、ゲートドライバを内蔵した100V、1.7mΩのGaN FETです。(画像提供:Texas Instruments)
システムの概要
GaNデバイスは非常に高速にスイッチングし、高電圧で動作します。高密度のデータセンターサーバでよく見られる急速かつ大きな変動は、電圧低下やスパイクを引き起こし、動作の不安定、GPUやその他のコンポーネントへの負荷の増加、さらにはダウンタイムにつながる可能性があります。適切な監視が行われない場合、電圧が安全範囲外にあるときにGaN FETパワー段がスイッチングを試みることがあります。
重要な高電圧レールには高速な監視機能が必要ですが、補助レールについては、システム全体の安定性を維持するために、電源システムロジック、I/O、および冷却回路のより広範な監視とシーケンス制御が必要となります。
TIのTPS3760スーパーバイザICの製品ライン(図2)は、ハードウェアによるタイミング制御と最小限のオーバーヘッドで単一の高電圧レールを監視します。メーカーは車載用アプリケーション向けのモデルを提供していますが、データセンター向けアプリケーションをターゲットとする設計者は、TPS3760A015DYYRなどの標準的な民生用製品を選択することができます。これらのデバイスは、高精度な内部電圧コンパレータを使用して、レール電圧を設定された閾値に対して常時チェックし、電圧が設定範囲外になった場合にリセット信号を出力します。
図2:TPS3760デバイスは、SENSE入力、超低静止電流、およびプログラム可能な遅延機能を備えた65V過電圧/低電圧スーパーバイザICです。(画像提供:Texas Instruments)
TIのTPS389006ファミリは、GPU、CPU、メモリに電力を供給する低電圧レールを高速かつ高精度の監視機能を提供します。たとえば、TPS389006007RTERデバイス(図3)は、これらのレールをリアルタイムで監視し、電圧が厳しい許容範囲から外れた際に即座にリセット信号を出力します。負荷点近くに配置することで、過渡的な障害から高感度で大電流のデバイスを保護し、急激な負荷変動時にも安定した動作を保証します。
図3:TPS3896007RTERのようなTPS389600コンポーネントは、低電圧電源レールで動作し、許容誤差が狭いシステム向けに、高精度なマルチチャネル電圧監視を提供します。(画像提供:Texas Instruments)
これら2種類のスーパーバイザICは、階層型監視スキームにおいて、システムレベルのシーケンスと高速な負荷点保護を組み合わせることで、GaN FETを補完します。TPS3760デバイスはハードウェアによるタイミング制御のリセット機能を備え、高電圧レールを監視します。一方、TPS389006デバイスは重要な低電圧レールの低遅延監視を行い、動的な負荷条件下でも安全かつ信頼性の高い動作を実現します。
まとめ
TIのLMG3100R017VBERなどの高速GaNパワー段は、安全なハイサイドスイッチングにより、小型で低損失の電力変換を実現します。TPS389006やTPS3760のようなスーパーバイザICは、重要な低電圧レールから高電圧システムレールへの階層化されたハードウェアタイミングによる監視を可能にし、適切なシーケンスと迅速な障害対応を実現します。高速で効率的な電力変換と階層化された監視機能を組み合わせることで、設計者はシステム密度を高め、発熱やエネルギーの無駄を削減し、変動するワークロード下でも安定した性能を維持することができます。
Have questions or comments? Continue the conversation on TechForum, Digi-Key's online community and technical resource.
Visit TechForum