64GBのHBM2eメモリを搭載したIntelのSapphireRapidsHBM「XeonScalable」CPUは、IceLakeXeonの最大3倍のパフォーマンス向上を実現します。

64GBのHBM2eメモリを搭載したIntelのSapphireRapidsHBM「XeonScalable」CPUは、IceLakeXeonの最大3倍のパフォーマンス向上を実現します。

wccftech


Intelは、さまざまなワークロードで最大64GBのHBM2eメモリを搭載したSapphireRapidsHBMXeonスケーラブルCPUを再び実証しました。

Intelは、次世代のSapphireRapidsHBM「XeonScalable」CPUラインナップで3倍のパフォーマンス向上を約束します

Intelによると、Sapphire Rapids-SPには、標準構成とHBM構成の2つのパッケージバリエーションがあります。 標準バリアントは、約400mm2のダイサイズを特徴とする4つのXCCダイで構成されるチップレット設計を特徴とします。 これは、単一のXCCダイのダイサイズであり、上部のSapphireRapids-SPXeonチップには合計4つあります。 各ダイは、55uのピッチサイズと100uのコアピッチを持つEMIBを介して相互接続されます。

NRELのKestrelスーパーコンピューターの仕様は、Intel Sapphire RapidsXeonとAMDGenoaデュアルソケットCPU、528 NVIDIAH100GPUの組み合わせを明らかにしています

IntelXeonプロセッサコード名のSapphireRapidswith High Bandwidth Memory(HBM)は、高度なパッケージングテクノロジとシリコンの革新を活用して、HPCのパフォーマンス、帯域幅、および省電力を大幅に改善する方法の好例です。 パッケージに最大64ギガバイトの高帯域幅HBM2eメモリが搭載され、CPUにアクセラレータが統合されているため、主要なHPCユースケース全体でパフォーマンスを大幅に向上させながら、メモリ帯域幅に制限のあるワークロードを解放できます。

第3世代IntelXeonスケーラブルプロセッサを今後のSapphireRapidsHBMプロセッサと比較すると、気象研究、エネルギー、製造、および物理学のワークロード全体で2〜3倍のパフォーマンスの向上が見られます2。 基調講演で、Ansys CTO Prith Banerjeeは、SapphireRapidsHBMがAnsysFluentおよびParSeNetの実際のワークロードで最大2倍のパフォーマンス向上を実現することも示しています。

標準のSapphireRapids-SPXeonチップは10個のEMIB相互接続を備えており、パッケージ全体のサイズは4446mm2です。 HBMバリアントに移行すると、14に位置し、HBM2Eメモリをコアに相互接続するために必要な相互接続の数が増えています。

4つのHBM2Eメモリパッケージは8-Hiスタックを備えているため、Intelはスタックごとに少なくとも16 GBのHBM2Eメモリを使用し、SapphireRapids-SPパッケージ全体で合計64GBを使用します。 パッケージについて言えば、HBMバリアントは非常識な5700mm2、つまり標準バリアントより28%大きいサイズで測定されます。 最近リークされたEPYCGenoa番号と比較すると、Sapphire Rapids-SPのHBM2Eパッケージは5%大きくなり、標準パッケージは22%小さくなります。

  • Intel Sapphire Rapids-SP Xeon(標準パッケージ)- 4446mm2
  • Intel Sapphire Rapids-SP Xeon(HBM2Eパッケージ)- 5700mm2
  • AMD EPYC Genoa(12 CCDパッケージ)- 5428mm2

AMD Ryzen 7000 CPUは、第13世代にリストされている5200Mbpsの「ネイティブ」速度としてIntelのRaptorLakeDDR5メモリ機能よりも有利である可能性があります

Intelはまた、EMIBリンクは、標準のパッケージ設計と比較して、帯域幅密度が2倍向上し、電力効率が4倍向上すると述べています。 興味深いことに、Intelは最新のXeonラインナップを論理的にモノリシックと呼んでいます。つまり、シングルダイと同じ機能を提供する相互接続を指しますが、技術的には、相互接続される4つのチップレットがあります。 標準の56コアおよび112スレッドのSapphireRapids-SPXeon CPUに関する詳細については、こちらをご覧ください。

Intel Xeon SPファミリ(暫定版):

ファミリーブランディングSkylake-SPカスケードレイク-SP/APクーパーレイク-SPIce Lake-SPサファイアラピッズエメラルドラピッズ花崗岩の急流ダイヤモンドラピッズ
プロセスノード14nm以上14nm ++14nm ++10nm以上Intel 7Intel 7Intel 3Intel 3?
プラットフォーム名Intel PurleyIntel PurleyインテルシーダーアイランドIntel Whitleyインテルイーグルストリームインテルイーグルストリームインテルマウンテンストリーム
インテルバーチストリーム
インテルマウンテンストリーム
インテルバーチストリーム
コアアーキテクチャSkylakeカスケード湖カスケード湖サニーコーブゴールデンコーブラプターコーブレッドウッドコーブ?ライオンコーブ?
IPCの改善(Vs Prev Gen)10%0%0%20%19%8%?35%?39%?
MCP(マルチチップパッケージ)SKUいいえはいいいえいいえはいはい未定(おそらくはい)未定(おそらくはい)
ソケットLGA 3647LGA 3647LGA 4189LGA 4189LGA 4677LGA 4677未定未定
最大コア数28まで28まで28まで40まで56まで64まで?120まで?144まで?
最大スレッド数56まで56まで56まで80まで112まで128まで?240まで?288まで?
最大L3キャッシュ38.5 MB L338.5 MB L338.5 MB L360 MB L3105 MB L3120 MB L3?240 MB L3?288 MB L3?
ベクトルエンジンAVX-512 / FMA2AVX-512 / FMA2AVX-512 / FMA2AVX-512 / FMA2AVX-512 / FMA2AVX-512 / FMA2AVX-1024 / FMA3?AVX-1024 / FMA3?
メモリサポートDDR4-26666チャンネルDDR4-29336チャンネル最大6チャンネルDDR4-3200最大8チャンネルDDR4-3200最大8チャンネルDDR5-4800最大8チャンネルDDR5-5600?最大12チャネルDDR5-6400?最大12チャネルのDDR6-7200?
PCIeGenサポートPCIe 3.0(48レーン)PCIe 3.0(48レーン)PCIe 3.0(48レーン)PCIe 4.0(64レーン)PCIe 5.0(80レーン)PCIe 5.0(80レーン)PCIe 6.0(128レーン)?PCIe 6.0(128レーン)?
TDP範囲(PL1)140W-205W165W-205W150W-250W105-270W350Wまで375Wまで?最大400W?425Wまで?
3D Xpoint Optane DIMM該当なしアパッチパスバーロウパスバーロウパスクロウパスクロウパス?ドノヒューパス?ドノヒューパス?
コンペAMDEPYCナポリ14nmAMDEPYCローマ7nmAMDEPYCローマ7nmAMDEPYCミラノ7nm+AMD EPYC Genoa〜5nmAMD Next-Gen EPYC(ポストジェノア)AMD Next-Gen EPYC(ポストジェノア)AMD Next-Gen EPYC(ポストジェノア)
発売2017年2018年20202021年2022年2023年?2024年?2025年?

Intel Sapphire Rapids HBMの「XeonScalable」CPUパフォーマンスの脚注については、以下で確認できます。

クローバーリーフ

  • 2022年4月26日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8360Y CPU、72コア、HTオン、ターボオン、合計メモリ256GB(16x16GB DDR4 3200 MT / s)、SE5C6200.86B.0021.D40.2101090208、Ubuntu 20.04、カーネル5.10、 0xd0002a0、ifort 2021.5、Intel MPI 2021.5.1、ビルドノブ:-xCORE-AVX512 –qopt-zmm-usage = high
  • 04/19/22現在のIntelによるテスト。 1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコードネームSapphire Rapids Plus HBM、> 40コア、HT ON、Turbo ON、トータルメモリ128 GB(3200 MHzのHBM2e)、BIOSバージョンEGSDCRB1.86B.0077.D11 .2203281354、ucodeリビジョン= 0x83000200、CentOS Stream 8、Linuxバージョン5.16、ifort 2021.5、Intel MPI 2021.5.1、ビルドノブ:-xCORE-AVX512 –qopt-zmm-usage = high

OpenFOAM

  • 2022年1月26日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8380 CPU)、80コア、HTオン、ターボオン、合計メモリ256 GB(16x16GB 3200MT / s、デュアルランク)、BIOSバージョンSE5C6200.86B.0020.P23.2103261309、 0xd000270、Rocky Linux 8.5、Linuxバージョン4.18、OpenFOAM®v1912、Motorbike 28M@250反復。 ビルドノート:ツール:Intel Parallel Studio 2020u4、ビルドノブ:-O3 -ip -xCORE-AVX512
  • 2022年1月26日現在のIntelによるテスト1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids Plus HBM、> 40コア、HTオフ、ターボオフ、合計メモリ128 GB(3200 MHzのHBM2e) 、プレプロダクションプラットフォームおよびBIOS、CentOS 8、Linuxバージョン5.12、OpenFOAM®v1912、Motorbike 28M@250反復。 ビルドノート:ツール:Intel Parallel Studio 2020u4、ビルドノブ:-O3 -ip -xCORE-AVX512

WRF

  • 2022年5月3日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®8380CPU、80コア、HTオン、ターボオン、合計メモリ256 GB(16x16GB 3200MT / s、デュアルランク)、BIOSバージョンSE5C6200.86B.0020.P23.2103261309、ucodeリビジョン= 0xd000270、Rocky Linux 8.5、Linuxバージョン4.18、WRF v4.2.2
  • 2022年5月3日現在のIntelによるテスト。 1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids Plus HBM、> 40コア、HT ON、Turbo ON、トータルメモリ128 GB(3200 MHzのHBM2e)、BIOSバージョンEGSDCRB1.86B.0077.D11 .2203281354、ucodeリビジョン= 0x83000200、CentOS Stream 8、Linuxバージョン5.16、WRF v4.2.2

YASK

  • 2022年5月9日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8360Y CPU、72コア、HTオン、ターボオン、合計メモリ256GB(16x16GB DDR4 3200 MT / s)、SE5C6200.86B.0021.D40.2101090208、Rocky linux 8.5、カーネル4.18 .0、0xd000270、ビルドノブ:make -j YK_CXX =’mpiicpc -cxx = icpx’ arch = avx2 stencil = iso3dfd radius = 8、
  • 05/03/22現在のIntelによるテスト。 1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコードネームSapphire Rapids Plus HBM、> 40コア、HT ON、Turbo ON、トータルメモリ128 GB(3200 MHzのHBM2e)、BIOSバージョンEGSDCRB1.86B.0077.D11 .2203281354、ucodeリビジョン= 0x83000200、CentOS Stream 8、Linuxバージョン5.16、ビルドノブ:make -j YK_CXX =’mpiicpc -cxx = icpx’ arch = avx2 stencil = iso3dfd radius = 8、

Ansys Fluent

  • 2/2022 1ノード、2xIntel®Xeon®Platinum8380 CPU、80コア、HTオン、ターボオン、合計メモリ256 GB(16x16GB 3200MT / s、デュアルランク)、BIOSバージョンSE5C6200.86Bの時点でのIntelによるテスト.0020.P23.2103261309、ucodeリビジョン= 0xd000270、Rocky Linux 8.5、Linuxバージョン4.18、Ansys Fluent 2021 R2 Aircraft_wing_14m; ビルドノート:Intel19.3コンパイラとIntelMPI2019uを使用した商用リリース
  • 2/2022現在のIntelによるテスト1ノード、2xプレプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids、HBM、> 40コア、HTオフ、ターボオフ、合計メモリ128 GB(3200 MHzのHBM2e)、プレプロダクションプラットフォームおよびBIOS、CentOS 8、Linuxバージョン5.12、Ansys Fluent 2021 R2 Aircraft_wing_14m; ビルドノート:Intel19.3コンパイラとIntelMPI2019u8を使用した商用リリース

Ansys ParSeNet

  • 2022年5月24日現在のIntelによるテスト。 1ノード、2xIntel®Xeon®Platinum8380 CPU、80コア、HTオン、ターボオン、合計メモリ256GB(16x16GB DDR4 3200MT / s [3200 MT/s])、SE5C6200.86B.0021.D40.2101090208、Ubuntu 20.04.1 LTS、5.10、ParSeNet(SplineNet)、PyTorch 1.11.0、Torch-CCL 1.2.0、IPEX 1.10.0、MKL(2021.4-製品ビルド20210904) 、oneDNN(v2.5.0)
  • 2022年4月18日現在のIntelによるテスト。 1ノード、2xプリプロダクションIntel®Xeon®スケーラブルプロセッサコード名Sapphire Rapids Plus HBM、112コア、HTオン、ターボオン、トータルメモリ128GB(HBM2e 3200 MT / s)、EGSDCRB1.86B.0077.D11.2203281354、 CentOS Stream 8、5.16、ParSeNet(SplineNet)、PyTorch 1.11.0、Torch-CCL 1.2.0、IPEX 1.10.0、MKL(2021.4-製品ビルド20210904)、oneDNN(v2.5.0)



Sharing is caring!

Leave a Reply