Zen4CPUコアとCDNA3GPUコアを搭載して高速HPCパフォーマンスを実現

Zen4CPUコアとCDNA3GPUコアを搭載して高速HPCパフォーマンスを実現

wccftech


AMDはまた、Zen4CPUおよびCDNA3GPUコアを搭載した第1世代のExascaleAPU製品であるInstinctMI300にも取り組んでいるようです。 このHPCチップの詳細は、最新のビデオでもリークされています。 AdoredTV

AMDInstinctMI300がZen4CPU、CDNA 3 GPUコア、HBM3メモリを搭載したレッドチーム初のエクサスケールAPU製品になる

AMDのExascaleAPUへの最初の言及は、2013年までさかのぼり、来年にはさらに多くの断片が明らかになります。 2015年に、同社は、2.5DインターポーザーにHBM2メモリを搭載した次期Zenx86コアとGreenlandGPUに基づいて、Exascale異質プロセッサであるEHPを提供する計画を明らかにしました。 当初の計画は最終的に破棄され、AMDは独自のCPUおよびGPUサーバーセグメントでEPYCおよびInstinctのラインナップをリリースしました。 現在、AMDはEHPまたはExascaleAPUを次世代のInstinctMI300の形で復活させています。

AMD EPYCサーバーのロードマップがリーク:EPYC Genoa-X with Zen 4&3D-V-Cache in 1H 2023、Genoa、Bergamo&Turin With SP6 Support

AMDの最初のエクサスケールAPUであるInstinctMI300がリークされ、詳細に説明されています。 (画像クレジット:AdoredTV)

繰り返しになりますが、AMD Exascale APUは、最新のZen4CPUコアと最新のCDNA3GPUコアを組み合わせて、同社のCPUとGPUIPの間に調和を形成します。 これは、第一世代のExascale&InstinctAPUであると言われています。 AdoredTVによって投稿されたスライドでは、APUは今月末までにテープアウトされると述べられています。これは、2023年に発売される可能性があることを意味し、同時に同社はCDNA3GPUアーキテクチャを発表する予定です。 HPCセグメント。

最初のシリコンは、2022年第3四半期までにAMDのラボに搭載される予定です。プラットフォーム自体はMDCと見なされており、マルチダイチップを意味する可能性があります。 以前のレポートでは、APUは新しい「エクサスケールAPUモード」を搭載し、BGAフォームファクターで提供される可能性が高いSH5ソケットで機能をサポートすると述べられていました。

CPUとGPUIPに加えて、Instinct MI300 APUの背後にあるもう1つの重要なドライバーは、HBM3メモリのサポートです。 EHP APUに搭載されているダイの正確な数はまだわかりませんが、ムーアの法則は、2、4、および8個のHBM3ダイの構成を以前に明らかにしています。 ダイショットは、最新のリークのスライドに示されています。また、少なくとも6つのダイが示されています。これは、まったく新しい構成である必要があります。 いくつかのInstinctMI300構成が作業中であり、CDNA 3 GPUダイと、Zen4およびCDNA3IPの両方を備えたAPU設計のみを備えたものもある可能性があります。

したがって、ほぼ10年待った後、ExascaleAPUが実際に動作するのを確実に確認できるようです。 Instinct MI300は、これまでにない驚異的なパフォーマンスと、テクノロジー業界の革命となるコアおよびパッケージングテクノロジーによって、HPCスペースに革命を起こすことを確実に目指しています。

AMD Radeon Instinct Accelerators 2020

アクセラレータ名AMD Instinct MI300AMD Instinct MI250XAMD Instinct MI250AMD Instinct MI210AMD Instinct MI100AMD Radeon Instinct MI60AMD Radeon Instinct MI50AMD Radeon Instinct MI25AMD Radeon Instinct MI8AMD Radeon Instinct MI6
CPUアーキテクチャZen 4(Exascale APU)該当なし該当なし該当なし該当なし該当なし該当なし該当なし該当なし該当なし
GPUアーキテクチャTBA(CDNA 3)アルデバラン(CDNA 2)アルデバラン(CDNA 2)アルデバラン(CDNA 2)アークトゥルス(CDNA 1)ベガ20ベガ20ベガ10フィジーXTポラリス10
GPUプロセスノード5nm + 6nm6nm6nm6nm7nm FinFET7nm FinFET7nm FinFET14nm FinFET28nm14nm FinFET
GPUチップレット4(MCM / 3Dスタック)
1(ダイごと)
2(MCM)
1(ダイごと)
2(MCM)
1(ダイごと)
2(MCM)
1(ダイごと)
1(モノリシック)1(モノリシック)1(モノリシック)1(モノリシック)1(モノリシック)1(モノリシック)
GPUコア28,160?14,08013,3126656768040963840409640962304
GPUクロック速度TBA1700 MHz1700 MHz1700 MHz1500 MHz1800 MHz1725 MHz1500 MHz1000 MHz1237 MHz
FP16コンピュートTBA383トップス362トップス181トップス185TFLOP29.5TFLOP26.5TFLOP24.6TFLOP8.2TFLOP5.7TFLOP
FP32コンピュートTBA95.7TFLOP90.5 TFLOP45.3TFLOP23.1TFLOP14.7TFLOP13.3TFLOP12.3TFLOP8.2TFLOP5.7TFLOP
FP64コンピュートTBA47.9TFLOP45.3TFLOP22.6TFLOP11.5TFLOP7.4TFLOP6.6TFLOP768 GFLOP512GFLOP384 GFLOP
VRAM192 GB HBM3?128 GB HBM2e128 GB HBM2e64 GB HBM2e32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GB GDDR5
メモリクロックTBA3.2 Gbps3.2 Gbps3.2 Gbps1200 MHz1000 MHz1000 MHz945 MHz500 MHz1750 MHz
メモリバス8192ビット8192ビット8192ビット4096ビット4096ビットバス4096ビットバス4096ビットバス2048ビットバス4096ビットバス256ビットバス
メモリ帯域幅TBA3.2 TB / s3.2 TB / s1.6 TB / s1.23 TB / s1 TB / s1 TB / s484GB/秒512 GB / s224 GB / s
フォームファクタOAMOAMOAMデュアルスロットカードデュアルスロット、フルレングスデュアルスロット、フルレングスデュアルスロット、フルレングスデュアルスロット、フルレングスデュアルスロット、ハーフレングスシングルスロット、全長
冷却パッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリングパッシブクーリング
TDP〜600W560W500W300W300W300W300W300W175W150W



Sharing is caring!

Leave a Reply