Intelは、さまざまなワークロードで最大64GBのHBM2eメモリを搭載したSapphireRapidsHBMXeonスケーラブルCPUを再び実証しました。
Intelは、次世代のSapphireRapidsHBM「XeonScalable」CPUラインナップで3倍のパフォーマンス向上を約束します
Intelによると、Sapphire Rapids-SPには、標準構成とHBM構成の2つのパッケージバリエーションがあります。 標準バリアントは、約400mm2のダイサイズを特徴とする4つのXCCダイで構成されるチップレット設計を特徴とします。 これは、単一のXCCダイのダイサイズであり、上部のSapphireRapids-SPXeonチップには合計4つあります。 各ダイは、55uのピッチサイズと100uのコアピッチを持つEMIBを介して相互接続されます。
IntelXeonプロセッサコード名のSapphireRapidswith High Bandwidth Memory(HBM)は、高度なパッケージングテクノロジとシリコンの革新を活用して、HPCのパフォーマンス、帯域幅、および省電力を大幅に改善する方法の好例です。 パッケージに最大64ギガバイトの高帯域幅HBM2eメモリが搭載され、CPUにアクセラレータが統合されているため、主要なHPCユースケース全体でパフォーマンスを大幅に向上させながら、メモリ帯域幅に制限のあるワークロードを解放できます。
第3世代IntelXeonスケーラブルプロセッサを今後のSapphireRapidsHBMプロセッサと比較すると、気象研究、エネルギー、製造、および物理学のワークロード全体で2〜3倍のパフォーマンスの向上が見られます2。 基調講演で、Ansys CTO Prith Banerjeeは、SapphireRapidsHBMがAnsysFluentおよびParSeNetの実際のワークロードで最大2倍のパフォーマンス向上を実現することも示しています。
標準のSapphireRapids-SPXeonチップは10個のEMIB相互接続を備えており、パッケージ全体のサイズは4446mm2です。 HBMバリアントに移行すると、14に位置し、HBM2Eメモリをコアに相互接続するために必要な相互接続の数が増えています。
4つのHBM2Eメモリパッケージは8-Hiスタックを備えているため、Intelはスタックごとに少なくとも16 GBのHBM2Eメモリを使用し、SapphireRapids-SPパッケージ全体で合計64GBを使用します。 パッケージについて言えば、HBMバリアントは非常識な5700mm2、つまり標準バリアントより28%大きいサイズで測定されます。 最近リークされたEPYCGenoa番号と比較すると、Sapphire Rapids-SPのHBM2Eパッケージは5%大きくなり、標準パッケージは22%小さくなります。
- Intel Sapphire Rapids-SP Xeon(標準パッケージ)- 4446mm2
- Intel Sapphire Rapids-SP Xeon(HBM2Eパッケージ)- 5700mm2
- AMD EPYC Genoa(12 CCDパッケージ)- 5428mm2
Intelはまた、EMIBリンクは、標準のパッケージ設計と比較して、帯域幅密度が2倍向上し、電力効率が4倍向上すると述べています。 興味深いことに、Intelは最新のXeonラインナップを論理的にモノリシックと呼んでいます。つまり、シングルダイと同じ機能を提供する相互接続を指しますが、技術的には、相互接続される4つのチップレットがあります。 標準の56コアおよび112スレッドのSapphireRapids-SPXeon CPUに関する詳細については、こちらをご覧ください。
Intel Xeon SPファミリ(暫定版):
ファミリーブランディング | Skylake-SP | カスケードレイク-SP/AP | クーパーレイク-SP | Ice Lake-SP | サファイアラピッズ | エメラルドラピッズ | 花崗岩の急流 | ダイヤモンドラピッズ |
---|---|---|---|---|---|---|---|---|
プロセスノード | 14nm以上 | 14nm ++ | 14nm ++ | 10nm以上 | Intel 7 | Intel 7 | Intel 3 | Intel 3? |
プラットフォーム名 | Intel Purley | Intel Purley | インテルシーダーアイランド | Intel Whitley | インテルイーグルストリーム | インテルイーグルストリーム | インテルマウンテンストリーム インテルバーチストリーム | インテルマウンテンストリーム インテルバーチストリーム |
コアアーキテクチャ | Skylake | カスケード湖 | カスケード湖 | サニーコーブ | ゴールデンコーブ | ラプターコーブ | レッドウッドコーブ? | ライオンコーブ? |
IPCの改善(Vs Prev Gen) | 10% | 0% | 0% | 20% | 19% | 8%? | 35%? | 39%? |
MCP(マルチチップパッケージ)SKU | いいえ | はい | いいえ | いいえ | はい | はい | 未定(おそらくはい) | 未定(おそらくはい) |
ソケット | LGA 3647 | LGA 3647 | LGA 4189 | LGA 4189 | LGA 4677 | LGA 4677 | 未定 | 未定 |
最大コア数 | 28まで | 28まで | 28まで | 40まで | 56まで | 64まで? | 120まで? | 144まで? |
最大スレッド数 | 56まで | 56まで | 56まで | 80まで | 112まで | 128まで? | 240まで? | 288まで? |
最大L3キャッシュ | 38.5 MB L3 | 38.5 MB L3 | 38.5 MB L3 | 60 MB L3 | 105 MB L3 | 120 MB L3? | 240 MB L3? | 288 MB L3? |
ベクトルエンジン | AVX-512 / FMA2 | AVX-512 / FMA2 | AVX-512 / FMA2 | AVX-512 / FMA2 | AVX-512 / FMA2 | AVX-512 / FMA2 | AVX-1024 / FMA3? | AVX-1024 / FMA3? |
メモリサポート | DDR4-26666チャンネル | DDR4-29336チャンネル | 最大6チャンネルDDR4-3200 | 最大8チャンネルDDR4-3200 | 最大8チャンネルDDR5-4800 | 最大8チャンネルDDR5-5600? | 最大12チャネルDDR5-6400? | 最大12チャネルのDDR6-7200? |
PCIeGenサポート | PCIe 3.0(48レーン) | PCIe 3.0(48レーン) | PCIe 3.0(48レーン) | PCIe 4.0(64レーン) | PCIe 5.0(80レーン) | PCIe 5.0(80レーン) | PCIe 6.0(128レーン)? | PCIe 6.0(128レーン)? |
TDP範囲(PL1) | 140W-205W | 165W-205W | 150W-250W | 105-270W | 350Wまで | 375Wまで? | 最大400W? | 425Wまで? |
3D Xpoint Optane DIMM | 該当なし | アパッチパス | バーロウパス | バーロウパス | クロウパス | クロウパス? | ドノヒューパス? | ドノヒューパス? |
コンペ | AMDEPYCナポリ14nm | AMDEPYCローマ7nm | AMDEPYCローマ7nm | AMDEPYCミラノ7nm+ | AMD EPYC Genoa〜5nm | AMD Next-Gen EPYC(ポストジェノア) | AMD Next-Gen EPYC(ポストジェノア) | AMD Next-Gen EPYC(ポストジェノア) |
発売 | 2017年 | 2018年 | 2020 | 2021年 | 2022年 | 2023年? | 2024年? | 2025年? |
Intel Sapphire Rapids HBMの「XeonScalable」CPUパフォーマンスの脚注については、以下で確認できます。
クローバーリーフ
- 2022年4月26日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8360Y CPU、72コア、HTオン、ターボオン、合計メモリ256GB(16x16GB DDR4 3200 MT / s)、SE5C6200.86B.0021.D40.2101090208、Ubuntu 20.04、カーネル5.10、 0xd0002a0、ifort 2021.5、Intel MPI 2021.5.1、ビルドノブ:-xCORE-AVX512 –qopt-zmm-usage = high
- 04/19/22現在のIntelによるテスト。 1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコードネームSapphire Rapids Plus HBM、> 40コア、HT ON、Turbo ON、トータルメモリ128 GB(3200 MHzのHBM2e)、BIOSバージョンEGSDCRB1.86B.0077.D11 .2203281354、ucodeリビジョン= 0x83000200、CentOS Stream 8、Linuxバージョン5.16、ifort 2021.5、Intel MPI 2021.5.1、ビルドノブ:-xCORE-AVX512 –qopt-zmm-usage = high
OpenFOAM
- 2022年1月26日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8380 CPU)、80コア、HTオン、ターボオン、合計メモリ256 GB(16x16GB 3200MT / s、デュアルランク)、BIOSバージョンSE5C6200.86B.0020.P23.2103261309、 0xd000270、Rocky Linux 8.5、Linuxバージョン4.18、OpenFOAM®v1912、Motorbike 28M@250反復。 ビルドノート:ツール:Intel Parallel Studio 2020u4、ビルドノブ:-O3 -ip -xCORE-AVX512
- 2022年1月26日現在のIntelによるテスト1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids Plus HBM、> 40コア、HTオフ、ターボオフ、合計メモリ128 GB(3200 MHzのHBM2e) 、プレプロダクションプラットフォームおよびBIOS、CentOS 8、Linuxバージョン5.12、OpenFOAM®v1912、Motorbike 28M@250反復。 ビルドノート:ツール:Intel Parallel Studio 2020u4、ビルドノブ:-O3 -ip -xCORE-AVX512
WRF
- 2022年5月3日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®8380CPU、80コア、HTオン、ターボオン、合計メモリ256 GB(16x16GB 3200MT / s、デュアルランク)、BIOSバージョンSE5C6200.86B.0020.P23.2103261309、ucodeリビジョン= 0xd000270、Rocky Linux 8.5、Linuxバージョン4.18、WRF v4.2.2
- 2022年5月3日現在のIntelによるテスト。 1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids Plus HBM、> 40コア、HT ON、Turbo ON、トータルメモリ128 GB(3200 MHzのHBM2e)、BIOSバージョンEGSDCRB1.86B.0077.D11 .2203281354、ucodeリビジョン= 0x83000200、CentOS Stream 8、Linuxバージョン5.16、WRF v4.2.2
YASK
- 2022年5月9日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8360Y CPU、72コア、HTオン、ターボオン、合計メモリ256GB(16x16GB DDR4 3200 MT / s)、SE5C6200.86B.0021.D40.2101090208、Rocky linux 8.5、カーネル4.18 .0、0xd000270、ビルドノブ:make -j YK_CXX =’mpiicpc -cxx = icpx’ arch = avx2 stencil = iso3dfd radius = 8、
- 05/03/22現在のIntelによるテスト。 1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコードネームSapphire Rapids Plus HBM、> 40コア、HT ON、Turbo ON、トータルメモリ128 GB(3200 MHzのHBM2e)、BIOSバージョンEGSDCRB1.86B.0077.D11 .2203281354、ucodeリビジョン= 0x83000200、CentOS Stream 8、Linuxバージョン5.16、ビルドノブ:make -j YK_CXX =’mpiicpc -cxx = icpx’ arch = avx2 stencil = iso3dfd radius = 8、
Ansys Fluent
- 2/2022 1ノード、2xIntel®Xeon®Platinum8380 CPU、80コア、HTオン、ターボオン、合計メモリ256 GB(16x16GB 3200MT / s、デュアルランク)、BIOSバージョンSE5C6200.86Bの時点でのIntelによるテスト.0020.P23.2103261309、ucodeリビジョン= 0xd000270、Rocky Linux 8.5、Linuxバージョン4.18、Ansys Fluent 2021 R2 Aircraft_wing_14m; ビルドノート:Intel19.3コンパイラとIntelMPI2019uを使用した商用リリース
- 2/2022現在のIntelによるテスト1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids、HBM、> 40コア、HTオフ、ターボオフ、合計メモリ128 GB(3200 MHzのHBM2e)、プレプロダクションプラットフォームおよびBIOS、CentOS 8、Linuxバージョン5.12、Ansys Fluent 2021 R2 Aircraft_wing_14m; ビルドノート:Intel19.3コンパイラとIntelMPI2019u8を使用した商用リリース
Ansys ParSeNet
- 2022年5月24日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8380 CPU、80コア、HTオン、ターボオン、合計メモリ256GB(16x16GB DDR4 3200MT / s [3200 MT/s])、SE5C6200.86B.0021.D40.2101090208、Ubuntu 20.04.1 LTS、5.10、ParSeNet(SplineNet)、PyTorch 1.11.0、Torch-CCL 1.2.0、IPEX 1.10.0、MKL(2021.4-製品ビルド20210904) 、oneDNN(v2.5.0)
- 2022年4月18日現在のIntelによるテスト。 1ノード、2xプリプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids Plus HBM、112コア、HTオン、ターボオン、トータルメモリ128GB(HBM2e 3200 MT / s)、EGSDCRB1.86B.0077.D11.2203281354、 CentOS Stream 8、5.16、ParSeNet(SplineNet)、PyTorch 1.11.0、Torch-CCL 1.2.0、IPEX 1.10.0、MKL(2021.4-製品ビルド20210904)、oneDNN(v2.5.0)