ユニバーサルプロセッサ設計を特徴とするTachyumのProdigyCPUを説明する言葉が1つあるとしたら、それは狂気です。 当初は2018年に発表されましたが、CPUは現在、同社のように発売に近づいています。 いくつかのProdigySKUをリストしました 評価キットの予約注文を開始します。
TachyumのProdigyCPUはすべてを実行し、最大128コア、5.7 GHzクロック、16チャネルDDR5メモリ、950WTDPを備えた非常識な仕様を備えています
Tachyum Prodigy CPUは、ユニバーサルプロセッサ設計を利用しています。つまり、CPU、GPU、およびTPUタスクを同じチップ上で実行できるため、競合製品よりもコストを節約でき、非常に高性能です。
同社は、AMD、Intel、NVIDIAの3つのチップ大手すべてに、Prodigyのラインナップで取り組むことを目指しており、そのプレゼンテーションでは、Tachyumは、HPCの面でIntelのXeon CPUの4倍のパフォーマンス向上、NVIDIAのH100の3倍のパフォーマンス向上、6倍のパフォーマンス向上を見積もっています。 AIおよび推論ワークロードの生のパフォーマンスの向上。 チップはまた、同じ電力で競合他社のシステムの10倍以上のパフォーマンスを提供すると言われています。 CPUの主な機能には次のものがあります。
- 最大5.7GHzで動作する128個の高性能ユニファイド64ビットコア
- 16個のDDR5メモリコントローラー
- 64PCIe5.0レーン
- 4ソケットおよび2ソケットプラットフォームのマルチプロセッササポート
- 空冷式と液冷式の両方のデータセンター向けのラックソリューション
- SPECrate2017整数パフォーマンスは約4倍のIntel8380と約3倍のAMD7763HPC
- 倍精度浮動小数点のパフォーマンスはNVIDIAH100の3倍です
- AIFP8のパフォーマンスはNVIDIAH100の6倍です
Tachyumは、Prodigyラインナップの初期仕様をリリースしました。これは、180WTDPの低電力T8232-LP32コアCPUから、合計128コアを備えたフラッグシップT16128-AIXまで拡張できます。 フラッグシップCPUの128コアすべてが5.7GHzプラスでクロックされ、AIのお客様は最大16のメモリチャネルを取得し、最大32 TB(64 DIMM)のDDR5-7200をサポートします。 プロセッサは64のPCIeGen5.0レーンもロックし、950WTDPパッケージで提供されます。
Tachyumが提供する残りのCPUは、以下のスペックシートにリストされています。
コア | 時計 | メモリー | PCIe | TDP | 市場セグメント | |
---|---|---|---|---|---|---|
プロディジーT16128-AIX | 128 | 5,7 GHz | 16x DDR5-7200 | Gen5 x64 | 950W | ハイエンドAI/HPC |
プロディジーT16128-AIM | 128 | 4,5 GHz | 16x DDR5-7200 | Gen5 x64 | 700W | ミッドレンジAI/HPC |
プロディジーT16128-AIE | 128 | 4,0 GHz | 16x DDR5-7200 | Gen5 x64 | 600W | エントリーAI/HPC |
プロディジーT16128-HT | 128 | 4,5 GHz | 16x DDR5-6400 | Gen5 x64 | 300W | スループット |
プロディジーT864-HS | 64 | 5,7 GHz | 8x DDR5-6400 | Gen5 x32 | 300W | スピード |
プロディジーT864-HT | 64 | 4,5 GHz | 8x DDR5-6400 | Gen5 x32 | 300W | 効率 |
プロディジーT832-HS | 32 | 5,7 GHz | 8x DDR5-6400 | Gen5 x32 | 300W | 入門レベル |
Prodigy T832-LP | 32 | 3.2 GHz | 8x DDR5-4800 | Gen5 x32 | 180W | 低電力 |
これはたった1つのチップであり、Tachyumは2および4ソケットシステムをサポートする完全なハードウェアコヒーレンシーを可能にします。 つまり、4つのProgidyT16128-AIX層プロセッサから最大512コアと3600Wの電力になります。 すべてのチップは、TSMCの5nm(N5P)プロセスノードで製造されます。これは、標準の5nm(N5)ノードのわずかに最適化されたバリアントであり、ネイティブおよびx86、Arm、およびRISC-Vバイナリを実行します。 HPCおよびAI固有の機能に関しては、TachyumProdigyのラインナップには次のものが含まれます。
- コアあたり2×1024ビットベクトル単位
- コアあたり4096ビットのマトリックスプロセッサ
- FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型
- スパースデータ型は効率を最適化します
- 低精度データ型を使用した量子化サポート
- 行列を効率的に保存およびロードするためのスキャッター/ギャザー
Tachyumは、Intel Ice Lake、NVIDIA Hopper / Grace HPCチップ、およびAMDMilanCPUに対するいくつかの予備的なパフォーマンス見積もりも提供します。 同社は、競合他社と比較して、最大4倍のSPECrate 2017整数および30倍のRaw浮動小数点パフォーマンス(FP64)の向上を主張しています。 NVIDIAのHopperH100は、いくつかの比較テストで使用されているため、Tachyumが注目しているように見えるメインチップです。
Prodigy T16128-AIXは、約90 TFLOPのFP64パフォーマンス(スパース性付き)を提供します。 同社は、最大6.2ペタフロップスのHPC FP64馬力を提供すると推定される空冷Prodigyラックと、960TFLOPのFP64HPCパフォーマンスを提供するNVIDIAH100DGXPODラックを使用しています。 ハイエンドチップを維持できる液冷プロディジーは、12.9ペタフロップスで2倍以上のパフォーマンスを提供するはずです。
Tachyumは、最初のProdigy船が今年後半にサンプリングを開始し、2023年前半に大量生産が予定されていると予想しています。Prodigy2として知られるProdigyの次世代アップグレードも、Tachyumのロードマップに記載されており、さらに多くのコア、より高いメモリ帯域幅、PCIe 6.0 + CXLのサポート、および強化された接続。 そのサンプリングは、2024年の後半までに開始する必要があります。
ニュースソース: Golem.de