最大128コア、5.7 GHzクロック、16チャネルDDR5-7200メモリサポートおよび950WTDPを備えた5nmユニバーサルプロセッサ

ユニバーサルプロセッサ設計を特徴とするTachyumのProdigyCPUを説明する言葉が1つあるとしたら、それは狂気です。当初は2018年に発表されましたが、CPUは現在、同社のように発売に近づいています。いくつかのProdigySKUをリストしました評価キットの予約注文を開始します。

TachyumのProdigyCPUはすべてを実行し、最大128コア、5.7 GHzクロック、16チャネルDDR5メモリ、950WTDPを備えた非常識な仕様を備えています

Tachyum Prodigy CPUは、ユニバーサルプロセッサ設計を利用しています。つまり、CPU、GPU、およびTPUタスクを同じチップ上で実行できるため、競合製品よりもコストを節約でき、非常に高性能です。

噂：AMD Zen3ベースの次世代Ryzen4000「フェルメール」デスクトップCPUがTSMCの5nmプロセスノードを利用し、CES2021で発売

同社は、AMD、Intel、NVIDIAの3つのチップ大手すべてに、Prodigyのラインナップで取り組むことを目指しており、そのプレゼンテーションでは、Tachyumは、HPCの面でIntelのXeon CPUの4倍のパフォーマンス向上、NVIDIAのH100の3倍のパフォーマンス向上、6倍のパフォーマンス向上を見積もっています。 AIおよび推論ワークロードの生のパフォーマンスの向上。チップはまた、同じ電力で競合他社のシステムの10倍以上のパフォーマンスを提供すると言われています。 CPUの主な機能には次のものがあります。

最大5.7GHzで動作する128個の高性能ユニファイド64ビットコア
16個のDDR5メモリコントローラー
64PCIe5.0レーン
4ソケットおよび2ソケットプラットフォームのマルチプロセッササポート
空冷式と液冷式の両方のデータセンター向けのラックソリューション
SPECrate2017整数パフォーマンスは約4倍のIntel8380と約3倍のAMD7763HPC
倍精度浮動小数点のパフォーマンスはNVIDIAH100の3倍です
AIFP8のパフォーマンスはNVIDIAH100の6倍です

Tachyumは、Prodigyラインナップの初期仕様をリリースしました。これは、180WTDPの低電力T8232-LP32コアCPUから、合計128コアを備えたフラッグシップT16128-AIXまで拡張できます。フラッグシップCPUの128コアすべてが5.7GHzプラスでクロックされ、AIのお客様は最大16のメモリチャネルを取得し、最大32 TB（64 DIMM）のDDR5-7200をサポートします。プロセッサは64のPCIeGen5.0レーンもロックし、950WTDPパッケージで提供されます。

Tachyumが提供する残りのCPUは、以下のスペックシートにリストされています。

TachyumのProdigyCPU仕様が発表されました：最大128コア、5.7 GHzクロック、16チャネルDDR5-7200メモリサポートおよび950WTDPを備えた5nmユニバーサルプロセッサ

	コア	時計	メモリー	PCIe	TDP	市場セグメント
プロディジーT16128-AIX	128	5,7 GHz	16x DDR5-7200	Gen5 x64	950W	ハイエンドAI/HPC
プロディジーT16128-AIM	128	4,5 GHz	16x DDR5-7200	Gen5 x64	700W	ミッドレンジAI/HPC
プロディジーT16128-AIE	128	4,0 GHz	16x DDR5-7200	Gen5 x64	600W	エントリーAI/HPC
プロディジーT16128-HT	128	4,5 GHz	16x DDR5-6400	Gen5 x64	300W	スループット
プロディジーT864-HS	64	5,7 GHz	8x DDR5-6400	Gen5 x32	300W	スピード
プロディジーT864-HT	64	4,5 GHz	8x DDR5-6400	Gen5 x32	300W	効率
プロディジーT832-HS	32	5,7 GHz	8x DDR5-6400	Gen5 x32	300W	入門レベル
Prodigy T832-LP	32	3.2 GHz	8x DDR5-4800	Gen5 x32	180W	低電力

これはたった1つのチップであり、Tachyumは2および4ソケットシステムをサポートする完全なハードウェアコヒーレンシーを可能にします。つまり、4つのProgidyT16128-AIX層プロセッサから最大512コアと3600Wの電力になります。すべてのチップは、TSMCの5nm（N5P）プロセスノードで製造されます。これは、標準の5nm（N5）ノードのわずかに最適化されたバリアントであり、ネイティブおよびx86、Arm、およびRISC-Vバイナリを実行します。 HPCおよびAI固有の機能に関しては、TachyumProdigyのラインナップには次のものが含まれます。

コアあたり2×1024ビットベクトル単位
コアあたり4096ビットのマトリックスプロセッサ
FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型
スパースデータ型は効率を最適化します
低精度データ型を使用した量子化サポート
行列を効率的に保存およびロードするためのスキャッター/ギャザー

Tachyumは、Intel Ice Lake、NVIDIA Hopper / Grace HPCチップ、およびAMDMilanCPUに対するいくつかの予備的なパフォーマンス見積もりも提供します。同社は、競合他社と比較して、最大4倍のSPECrate 2017整数および30倍のRaw浮動小数点パフォーマンス（FP64）の向上を主張しています。 NVIDIAのHopperH100は、いくつかの比較テストで使用されているため、Tachyumが注目しているように見えるメインチップです。

Prodigy T16128-AIXは、約90 TFLOPのFP64パフォーマンス（スパース性付き）を提供します。同社は、最大6.2ペタフロップスのHPC FP64馬力を提供すると推定される空冷Prodigyラックと、960TFLOPのFP64HPCパフォーマンスを提供するNVIDIAH100DGXPODラックを使用しています。ハイエンドチップを維持できる液冷プロディジーは、12.9ペタフロップスで2倍以上のパフォーマンスを提供するはずです。

Tachyumは、最初のProdigy船が今年後半にサンプリングを開始し、2023年前半に大量生産が予定されていると予想しています。Prodigy2として知られるProdigyの次世代アップグレードも、Tachyumのロードマップに記載されており、さらに多くのコア、より高いメモリ帯域幅、PCIe 6.0 + CXLのサポート、および強化された接続。そのサンプリングは、2024年の後半までに開始する必要があります。

ニュースソース： Golem.de