AMDの次世代データセンターの巨人であるInstinctMI300 MCM’GFX940’GPUは、Linuxパッチ – JA Atsit

Tech News


AMDの次世代InstinctMI300GPUアクセラレータが最新の登場を可能にしたようですLinuxパッチ。

AMD Instinct MI300’GFX940’GPU、次世代データセンターMCMアクセラレータ、Linuxパッチでの初登場を可能にする

最新のLinuxパッチには、 Aldebaran’GFX90a’GPUと同様のISAを備えた未リリースのAMD’GFX940’GP。このチップは、AMDの次世代Instinct MI300 GPUアクセラレーターに電力を供給し、MFMA(Matrix-Fused-Multiply-Add)、フルレートFP64、パックドFP32操作などのすべてのデータ中心機能をサポートしていると推測されます。その他の機能には、 Coelacanth-Dream はそれを述べています。

AMDEPYCはLinux5.18でパフォーマンスを向上させ、Scheduler/NUMAベンチマークの改善

出典によると、GPU ISA同様に、GFX940は、以下にリストされているAldebaranの「CDNA2」GPUと比較すると、いくつかの違いがあります。

次世代Instinctアクセラレータ用のAMDGFX90aおよびGFX940GPU機能の比較。 (画像クレジット:Coelacanth-Dream)

以前の噂によると、AMD InstinctMI300は新しいCDNA3アーキテクチャに基づく4-GCDデザインを備えています。今後のInstinctMI200は、ダイごとに128の計算ユニットを搭載する予定でしたが、先週の噂から110の計算ユニットに変更されました。合計220のコンピューティングユニットは14,080コアをネットし、正確な数を取得して4(Instinct MI300のGCDの数)を掛けると、440のコンピューティングユニットまたは非常識な28,160コアになります。

MI300😍 https://t.co/B3qlnQBbVG

—ケプラー(@ Kepler_L2)2022年3月1日

MI300の機能4つのGCD🧐

—ケプラー(@ Kepler_L2) 2021年9月7日

最近のAMD ROCm Komachi によって発見された開発者ツールの更新は最大4MCMを確認しましたGPUですが、それらは単に「アルデバラン」SKUです。少なくとも4つのCDNA2を搭載したInstinctアクセラレーターがあり、それぞれの(一意のID)を以下に示します。この数は、各デバイスのダイの数ではなく、デバイス自体を表すことに注意してください。

AMD Ryzen 5000デスクトップCPUが主要な小売業者固有の値下げを取得:Ryzen 95950Xが599ドル、5900Xが449ドル、299ドルで5800X、229ドルで5600X

0x7408 0x740C 0x740F 0x7410

AMDがCDNA2からCDNA3に移行するときに何も変更を加えなければ、それは真実ですが、そうではありません。 CDNA 3は、ArcturusやAldebaranのような別のVega派生物ではない改訂された新しいアーキテクチャを提供することが期待されており、この噂をより信頼できるものにします。

GPUアーキテクチャは、見た目になる可能性のあるレイアウトを使用する場合もあります。新しいRDNA3チップ上の新しいWGP/SE配置、またはHPCセグメント向けに調整されたまったく新しい設計に似ています。ただし、確かに、これらのクアッドMCM GPUは、実際に動作するのを待ちきれません!

AMD Radeon Instinct Accelerators 2020

アクセラレータ名AMDInstinct MI300AMD Instinct MI250XAMD Instinct MI250AMD Instinct MI210AMD Instinct MI100AMD Radeon Instinct MI60AMD Radeon Instinct MI50AMD Radeon Instinct MI25AMD Radeon Instinct MI8AMD Radeon Instinct MI6 GPU ArchitectureTBA(CDNA 3)Aldebaran(C 20Vega 10Fiji XTPolaris 10GPUプロセスノード高度なプロセスノード6nm6nm6nm7nmFinFET7nm FinFET7nm FinFET14nm FinFET28nm14nm FinFET GPU Dies4(MCM)?2(MCM)2(MCM)1(MCM)1(モノリシック)1(モノリシック)1(モノリシック)1(モノリシック)モノリシック)1(モノリシック)GPUコア28,160?14,08013,3126656768040963840409640962304GPUクロック速度TBA1700MHz1700 MHz〜1700 MHz?〜1500 MHz1800 MHz1725 MHz1500 MHz1000 MHz1237 MHz FP16 ComputeTBA383 TOPs362 TOPs〜176 TOPs185 TFLOPs29.5 TFLOPs26.5.2 TFL OPs5.7 TFLOPs FP32 ComputeTBA95.7 TFLOPs90.5 TFLOPs〜44 TFLOPs23.1 TFLOPs14.7 TFLOPs13.3 TFLOPs12.3 TFLOPs8.2 TFLOPs5.7 TFLOPs FP64 ComputeTBA47.9 TFLOPs45.3 TFLOPs〜22 TFLOPs11.5 TFLOPs7.4.6 TFLOPs768 GFLOPs512 GFLOPs384 GFLOPs VRAMTBA128 GB HBM2e128 GB HBM2e64 GB HBM2e32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GBGDDR5メモリクロックTBA3.2Gbps3.2 Gbps3.2 Gbps?1200 MHz1000 MHz1000 MHz945 MHz500 MHz1750 MHz-bit4096ビットbus4096ビットbus4096ビットbus2048ビットbus4096ビットbus256ビットバスメモリ帯域幅TBA3.2TB/s3.2 TB/s1.6 TB/s1.23 TB/s1 TB/s1 TB/s484 GB/s512 GB/s224 GB/sフォームファクタTBAOAMOAMデュアルスロットカードデュアルスロット、フルレングスデュアルスロット、フルレングスデュアルスロット、フルレングスデュアルスロット、フルレングスデュアルスロット、ハーフレングスシングルスロット、フルレングス冷却TBAパッシブ冷却パッシブ冷却パッシブ冷却パッシブ冷却300W300W



Sharing is caring!

Leave a Reply