AMDはまた、Zen4CPUおよびCDNA3GPUコアを搭載した第1世代のExascaleAPU製品であるInstinctMI300にも取り組んでいるようです。 このHPCチップの詳細は、最新のビデオでもリークされています。 AdoredTV。
AMDInstinctMI300がZen4CPU、CDNA 3 GPUコア、HBM3メモリを搭載したレッドチーム初のエクサスケールAPU製品になる
AMDのExascaleAPUへの最初の言及は、2013年までさかのぼり、来年にはさらに多くの断片が明らかになります。 2015年に、同社は、2.5DインターポーザーにHBM2メモリを搭載した次期Zenx86コアとGreenlandGPUに基づいて、Exascale異質プロセッサであるEHPを提供する計画を明らかにしました。 当初の計画は最終的に破棄され、AMDは独自のCPUおよびGPUサーバーセグメントでEPYCおよびInstinctのラインナップをリリースしました。 現在、AMDはEHPまたはExascaleAPUを次世代のInstinctMI300の形で復活させています。
繰り返しになりますが、AMD Exascale APUは、最新のZen4CPUコアと最新のCDNA3GPUコアを組み合わせて、同社のCPUとGPUIPの間に調和を形成します。 これは、第一世代のExascale&InstinctAPUであると言われています。 AdoredTVによって投稿されたスライドでは、APUは今月末までにテープアウトされると述べられています。これは、2023年に発売される可能性があることを意味し、同時に同社はCDNA3GPUアーキテクチャを発表する予定です。 HPCセグメント。
最初のシリコンは、2022年第3四半期までにAMDのラボに搭載される予定です。プラットフォーム自体はMDCと見なされており、マルチダイチップを意味する可能性があります。 以前のレポートでは、APUは新しい「エクサスケールAPUモード」を搭載し、BGAフォームファクターで提供される可能性が高いSH5ソケットで機能をサポートすると述べられていました。
CPUとGPUIPに加えて、Instinct MI300 APUの背後にあるもう1つの重要なドライバーは、HBM3メモリのサポートです。 EHP APUに搭載されているダイの正確な数はまだわかりませんが、ムーアの法則は、2、4、および8個のHBM3ダイの構成を以前に明らかにしています。 ダイショットは、最新のリークのスライドに示されています。また、少なくとも6つのダイが示されています。これは、まったく新しい構成である必要があります。 いくつかのInstinctMI300構成が作業中であり、CDNA 3 GPUダイと、Zen4およびCDNA3IPの両方を備えたAPU設計のみを備えたものもある可能性があります。
したがって、ほぼ10年待った後、ExascaleAPUが実際に動作するのを確実に確認できるようです。 Instinct MI300は、これまでにない驚異的なパフォーマンスと、テクノロジー業界の革命となるコアおよびパッケージングテクノロジーによって、HPCスペースに革命を起こすことを確実に目指しています。
AMD Radeon Instinct Accelerators 2020
アクセラレータ名 | AMD Instinct MI300 | AMD Instinct MI250X | AMD Instinct MI250 | AMD Instinct MI210 | AMD Instinct MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
---|---|---|---|---|---|---|---|---|---|---|
CPUアーキテクチャ | Zen 4(Exascale APU) | 該当なし | 該当なし | 該当なし | 該当なし | 該当なし | 該当なし | 該当なし | 該当なし | 該当なし |
GPUアーキテクチャ | TBA(CDNA 3) | アルデバラン(CDNA 2) | アルデバラン(CDNA 2) | アルデバラン(CDNA 2) | アークトゥルス(CDNA 1) | ベガ20 | ベガ20 | ベガ10 | フィジーXT | ポラリス10 |
GPUプロセスノード | 5nm + 6nm | 6nm | 6nm | 6nm | 7nm FinFET | 7nm FinFET | 7nm FinFET | 14nm FinFET | 28nm | 14nm FinFET |
GPUチップレット | 4(MCM / 3Dスタック) 1(ダイごと) | 2(MCM) 1(ダイごと) | 2(MCM) 1(ダイごと) | 2(MCM) 1(ダイごと) | 1(モノリシック) | 1(モノリシック) | 1(モノリシック) | 1(モノリシック) | 1(モノリシック) | 1(モノリシック) |
GPUコア | 28,160? | 14,080 | 13,312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
GPUクロック速度 | TBA | 1700 MHz | 1700 MHz | 1700 MHz | 1500 MHz | 1800 MHz | 1725 MHz | 1500 MHz | 1000 MHz | 1237 MHz |
FP16コンピュート | TBA | 383トップス | 362トップス | 181トップス | 185TFLOP | 29.5TFLOP | 26.5TFLOP | 24.6TFLOP | 8.2TFLOP | 5.7TFLOP |
FP32コンピュート | TBA | 95.7TFLOP | 90.5 TFLOP | 45.3TFLOP | 23.1TFLOP | 14.7TFLOP | 13.3TFLOP | 12.3TFLOP | 8.2TFLOP | 5.7TFLOP |
FP64コンピュート | TBA | 47.9TFLOP | 45.3TFLOP | 22.6TFLOP | 11.5TFLOP | 7.4TFLOP | 6.6TFLOP | 768 GFLOP | 512GFLOP | 384 GFLOP |
VRAM | 192 GB HBM3? | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
メモリクロック | TBA | 3.2 Gbps | 3.2 Gbps | 3.2 Gbps | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
メモリバス | 8192ビット | 8192ビット | 8192ビット | 4096ビット | 4096ビットバス | 4096ビットバス | 4096ビットバス | 2048ビットバス | 4096ビットバス | 256ビットバス |
メモリ帯域幅 | TBA | 3.2 TB / s | 3.2 TB / s | 1.6 TB / s | 1.23 TB / s | 1 TB / s | 1 TB / s | 484GB/秒 | 512 GB / s | 224 GB / s |
フォームファクタ | OAM | OAM | OAM | デュアルスロットカード | デュアルスロット、フルレングス | デュアルスロット、フルレングス | デュアルスロット、フルレングス | デュアルスロット、フルレングス | デュアルスロット、ハーフレングス | シングルスロット、全長 |
冷却 | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング | パッシブクーリング |
TDP | 〜600W | 560W | 500W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |