テスラのウエハープロセッサー「DOJO」が生産に移行
2024 年 5 月 2 日
Tesla の Dojo プロセッサは量産段階に移行しており、間もなく導入される予定です。 Dojo は、キャリア ウェーハと呼ばれる別のウェーハ上に固定された 5 行 5 列の一連の個別プロセッサ チップで構成されるウェーハ プロセッサ上のシステムで、台湾セミコンダクターのウェーハ相互接続用の InFo テクノロジーによって相互接続されています。 複雑そうですか? 単純化してみましょう。
Tesla’s Dojo が間もなく展開されます
Tesla Dojo Training Tile (同社はこれをトレーニング タイルと呼んでいます) は、実際には 25 個の強力なプロセッサーのパックであり、特に高速接続用に設計された TSMC の接続テクノロジーを利用して、1 つの超強力なプロセッサーとして機能するように結合されています。 これで少し意味が分かり始めましたが、まず、Nvidia、IBM、Intel などの半導体大手がすでにコンピューターや AI 用のハードウェアを製造しているのに、なぜ Tesla が独自のプロセッサーを必要としたのかについて背景を少し説明します。
AI、チップ設計、スーパーコンピューティングへの参入というテスラの決定は、同社、特にイーロン・マスク氏がイノベーションを単なる企業の事業拡大以上のものとして捉えていることを示している。 テスラは当初から自動運転機能を備えた車の開発を目指しており、販売したすべての車はデータをテスラに送信して、同社のシステム構築を支援している。 したがって、Dojo もその垂直統合の一部です。
Dojo は、他の利用可能な AI アクセラレータやスーパー コンピューティング用のツールとはまったく異なります。 たとえば、 Nvidia の A100または A200 GPU は世界中の多くのスーパー コンピューターに組み込まれていますが、これらの GPU やその他のコンピューターは主に、研究、ビッグ データ処理、複雑なシミュレーションなどを含む幅広いタスクに対応するように設計されています。 しかし、Dojo は、実世界のデータによって駆動される AI コンピューター ビジョンのような特定のタスク向けに設計されています。 同社は多くを明らかにしていないため、Dojo で他に何ができるかは不明です。
ウェーハベースのシステムはより効率的です
上で述べたように、Dojo は 25 個の個別の高性能プロセッサーで構成されているため、電力に対する貪欲さがあり、効果的で洗練された冷却システムが必要です。 トムのハードウェアによると、テスラは電力を供給するために電圧調整システム、それ自体がプロセッサに 18,000 アンペアの電力を供給する複雑なモジュールです。 このような高レベルの電力により、システムは 15,000 ワットの熱を放散し、効率的に動作するには液体冷却システムが必要です。
Tesla の Dojo などのウェーハベースのアクセラレータは、他のマルチプロセッサ システムよりも大幅に効果的であり、優れたパフォーマンスを提供します。 システムのウェーハ技術による、通信コア間の低遅延、高帯域幅、エネルギー効率の向上というメリットが得られます。
これまでのところ、システム・オン・ウェーハ設計を持っているのは Tesla と Cerebras だけですが、効率が高く遅延が少ないため、他の業界プレーヤーも参入すると予想されています。 ただし、これらのアクセラレータにもいくつかの制限があります。 現在、ウェハ システムはオンチップ メモリに依存する必要がありますが、通常、メモリは固定されており、さまざまな種類の使用例には不十分な場合があります。 しかし、次世代のオンザウェーハプラットフォームでアクセラレータタイル上に HBM4 メモリチップを 3D スタッキングできるようになれば、この問題は克服されると期待されています。
ソース:Tesla のウェーハ プロセッサ上の Dojo が生産に移行 | クリプトポリタン (cryptopolitan.com)