11
牧野先生による評
Jun Makino @jun_makino
http://t.co/1kiXRRqd60 NEC 、スパコンのニューモデル「 SX-ACE 」を発表
リンク ITmedia エンタープライズ NEC、スパコンのニューモデル「SX-ACE」を発表 ベクトル型スーパーコンピュータ「SXシリーズ」の最新モデルは、世界最高クラスのプロセッサコア性能を達成すると同時に、消費電力と設置面積の大幅な削減を実現させた。
Jun Makino @jun_makino
引用 : NEC は 11 月 15 日、スーパーコンピュータの新モデル「 SX-ACE 」を発表した。プロセッサコアあたりの性能とメモリ帯域で世界最高値を達成しつつ、消費電力および設置面積の大幅な削減を実現させたベクトル型マシンの新世代機となる。
Jun Makino @jun_makino
引用 : 従来機種と比べて同一性能あたりでの消費電力は 10 分の 1 に、設置面積では 5 分の 1 と、省エネルギー・省スペースを実現している。
Jun Makino @jun_makino
前のは SX-9 なので、 1TF あたり 30kW 、 1.6TF で特大のラック 1 つ。
Jun Makino @jun_makino
つまり、 1W あたり 30Mflops 。これが 300Mflops/W くらいまで上がると 思われるので、 BG/L (360Mflops/W) よりちょっと悪いあたり。
Jun Makino @jun_makino
B/F は 1 なので、「京」の倍しかない。電力あたりのメモリバンド幅で 「京」より悪いことになる。
Jun Makino @jun_makino
まあ、元々「京」のベクトル部だったのが 2 年遅れてでてきた、というスペック。
h r k 先生によるコメント
hrk先生 @Prof_hrk
@jun_makino 汎用プロセッサではコアあたり性能が高い物が結局は勝者になるという経験則がありますが、数値計算は演算器とメモリI/Fをふやすことが中心なので別世界ということでしょうか。これの整数性能には非常に興味があります。
Jun Makino @jun_makino
@Prof_hrk まあ、SX-9 の段階で(浮動小数点演算性能では)コアあたり世界最高でしたが、特に勝者になったようにも見えないので。
松岡先生による評とTSUBAME-KFC(TSUBAME3.0のプロトタイプ)との比較
Satoshi Matsuoka @ProfMatsuoka
NECがSC13に向けてSX-ACEを発表した。http://t.co/CmdCPOtCSE スペックは関係者の間では既知、ただプレスリリースで「世界一のコア性能とコアメモリ帯域」としてるが、これは間違いで、コア性能世界一はNVIDIA Keplerで、約90GFlopsである。
リンク t.co 世界最速のコア性能を実現した新型ベクトルスーパーコンピュータ「SX-ACE」を発売 (2013年11月15日):プレスリリース | NEC NECは、世界最速のプロセッサコア性能を有するベクトル型スーパーコンピュータ「SXシリーズ」における最新モデル「SX-ACE」を本日より日本国内および海外向けに販売開始します。
Satoshi Matsuoka @ProfMatsuoka
SX-ACEチップあたりの帯域は256GBと、Intel PhiやKeplerなどと同等である。ただ、Kepler K40 が12GBなのに対し、64GBと容量を稼ぐために、DDR3-2000 x 16枚という超コスト高の力技で、HMCやオンダイパッケージ時代にかなり古い実装だ。
Satoshi Matsuoka @ProfMatsuoka
SX-ACEのネットワークは4GB又は8GBx2のfattreeで、メモリ帯域に対するバランスは地球シミュレータとほぼ同じだが、最大ノード数が512と大変少ない。IB-EDRが10GB/s以上、Intelの新ネットワークが噂ではそれを上回る中、性能・スケーラビリティ共寂しい。
Satoshi Matsuoka @ProfMatsuoka
SX-ACEの性質は「スパコン」よりも「高性能演算サーバー」だ。GPU並の広帯域メモリが数倍の容量ある所にメリットがあり、それは並列・分散メモリ化では失われてしまうからである。ただ、多くの実アプリはメモリ容量は必要なので、HMCマシンが登場するまでの1年半位はニッチ需要があろう。
Satoshi Matsuoka @ProfMatsuoka
ではSX-ACE1ラックと、来週話題になるであろうTSUBAME3.0のプロトタイプたるTSUBAME-KFCのK40仕様1ラックと比較してみよう(実際のKFCはKepler K20X)。どちらも消費電力が約30KW近辺とほぼ等しいはずである。
Satoshi Matsuoka @ProfMatsuoka
TSUBAME-KFCは40ノード160GPUで、総FLOPS、総メモリバンド幅 = 220TFlops, 46TByte/s、SX-ACEは64ノード256CPU = 16TFlops, 16TByte/sとKFCの圧勝である。一方高速メモリ容量は2TB 対 4TBでSXが倍。
Satoshi Matsuoka @ProfMatsuoka
TSUBAME-KFCはsingle rail IBだが、Dual IBにすると12GB/s程度になるので、バイセクションバンド幅はKFC, SX-ACE両方ともほぼ0.5TB/sと同等である。以上から、きちんとベクトル化してあるアプリでは、メモリに入ればKFCの圧勝であろう。

コメント

ログインして広告を非表示にする
ログインして広告を非表示にする