NECの新型スパコンSX-ACEに関する牧野先生と松岡先生の評
- CordwainersCat
- 15735
- 4
- 6
- 17
牧野先生による評
引用 : NEC は 11 月 15 日、スーパーコンピュータの新モデル「 SX-ACE 」を発表した。プロセッサコアあたりの性能とメモリ帯域で世界最高値を達成しつつ、消費電力および設置面積の大幅な削減を実現させたベクトル型マシンの新世代機となる。
2013-11-15 17:33:13引用 : 従来機種と比べて同一性能あたりでの消費電力は 10 分の 1 に、設置面積では 5 分の 1 と、省エネルギー・省スペースを実現している。
2013-11-15 17:33:20つまり、 1W あたり 30Mflops 。これが 300Mflops/W くらいまで上がると 思われるので、 BG/L (360Mflops/W) よりちょっと悪いあたり。
2013-11-15 17:33:34h r k 先生によるコメント
@jun_makino 汎用プロセッサではコアあたり性能が高い物が結局は勝者になるという経験則がありますが、数値計算は演算器とメモリI/Fをふやすことが中心なので別世界ということでしょうか。これの整数性能には非常に興味があります。
2013-11-15 18:46:37@Prof_hrk まあ、SX-9 の段階で(浮動小数点演算性能では)コアあたり世界最高でしたが、特に勝者になったようにも見えないので。
2013-11-15 18:49:17松岡先生による評とTSUBAME-KFC(TSUBAME3.0のプロトタイプ)との比較
NECがSC13に向けてSX-ACEを発表した。http://t.co/CmdCPOtCSE スペックは関係者の間では既知、ただプレスリリースで「世界一のコア性能とコアメモリ帯域」としてるが、これは間違いで、コア性能世界一はNVIDIA Keplerで、約90GFlopsである。
2013-11-15 20:09:14SX-ACEチップあたりの帯域は256GBと、Intel PhiやKeplerなどと同等である。ただ、Kepler K40 が12GBなのに対し、64GBと容量を稼ぐために、DDR3-2000 x 16枚という超コスト高の力技で、HMCやオンダイパッケージ時代にかなり古い実装だ。
2013-11-15 20:14:33SX-ACEのネットワークは4GB又は8GBx2のfattreeで、メモリ帯域に対するバランスは地球シミュレータとほぼ同じだが、最大ノード数が512と大変少ない。IB-EDRが10GB/s以上、Intelの新ネットワークが噂ではそれを上回る中、性能・スケーラビリティ共寂しい。
2013-11-15 20:20:43SX-ACEの性質は「スパコン」よりも「高性能演算サーバー」だ。GPU並の広帯域メモリが数倍の容量ある所にメリットがあり、それは並列・分散メモリ化では失われてしまうからである。ただ、多くの実アプリはメモリ容量は必要なので、HMCマシンが登場するまでの1年半位はニッチ需要があろう。
2013-11-15 20:35:54ではSX-ACE1ラックと、来週話題になるであろうTSUBAME3.0のプロトタイプたるTSUBAME-KFCのK40仕様1ラックと比較してみよう(実際のKFCはKepler K20X)。どちらも消費電力が約30KW近辺とほぼ等しいはずである。
2013-11-15 22:12:27TSUBAME-KFCは40ノード160GPUで、総FLOPS、総メモリバンド幅 = 220TFlops, 46TByte/s、SX-ACEは64ノード256CPU = 16TFlops, 16TByte/sとKFCの圧勝である。一方高速メモリ容量は2TB 対 4TBでSXが倍。
2013-11-15 22:15:37TSUBAME-KFCはsingle rail IBだが、Dual IBにすると12GB/s程度になるので、バイセクションバンド幅はKFC, SX-ACE両方ともほぼ0.5TB/sと同等である。以上から、きちんとベクトル化してあるアプリでは、メモリに入ればKFCの圧勝であろう。
2013-11-15 22:20:11