2011年3月5日

ProfMatsuokaのVax11/730から超並列スパコンへの系譜

何かVax11/730からSunからSparcStationから何故か話がAP1000から現代の超並列機まで次々と歴史と現状の問題とエクサへの展望をつぶやいてしましました。せっかくなので自分でトギャッておきます。

スパコン

というか遅くて…@okabe_ VAX730の頃はemacs禁止とか言うてたなぁ RT @yamaki3634: 昔の評判のせいで割食ってるものって結構ありますよね。Lispとか。RT @koyama41: いまどきのブラウザに比べると MS Office って何て省メモリな…

2011-03-04 15:12:03

Satoshi Matsuoka @ProfMatsuoka

冷蔵庫と呼んでました。マイクロコードエミュ全開で遅かったねえ。“@kenji_rikitake: VAX-11/730 http://t.co/lOE5YeJ”

2011-03-04 23:29:05

Satoshi Matsuoka @ProfMatsuoka

でも東大情報科学専攻とHAL研では主力マシンだったんだな。岩田氏(今N社社長)も使ってた。松岡は遅さに耐えられなくて大学では貰い物のNEWS, HAL分室ではSun3ばかり使用。“@kenji_rikitake: VAX-11/730 http://t.co/lOE5YeJ””

2011-03-05 12:30:22

Satoshi Matsuoka @ProfMatsuoka

D~助手の頃は東大大型計算機センターに8600がありましたが、既に爆速RISC時代が始まリ松岡は主にSS1一人使いで下剋上してました。RT @kenji_rikitake 私の時代だともうVAX8600ぐらいが普通になっていました．DEC時代は最速のVAXである6000シリーズ

2011-03-05 14:48:29

Satoshi Matsuoka @ProfMatsuoka

暫くしたSuperSPARC時代の1992年に富士通がそれを512個使用した、「京」の直系の祖先である並列型スパコンAP1000を開発し、松岡らは早速使ってたわけです。素晴らしい使い易さと安定性でしたが、NWT⇒VPPとの勢力争いに敗れ、NEC Cenjuと共に窓際状態に。

2011-03-05 13:29:14

Satoshi Matsuoka @ProfMatsuoka

なので日本の近代型の汎用プロセッサ利用の超並列機は1996年の日立/筑波大のSR2201まで待たなくてはならず、NECは2001年のRWCP SCoreクラスタまで、富士通はAP3000が亡くなってから2004年の理研の初代RICCまで運用超並列スパコンがなかったわけです。

2011-03-05 13:38:25

Satoshi Matsuoka @ProfMatsuoka

日立は後継機SR8000では再び(汎用プロセッサ使うも)ベクトル型に後退。NECも地球シミュの「成功」で超並列化の移行を遅らせた。富士通はVPP捨てるもPrimePowerの大型高額共有メモリサーバの結合が主。この状態が2000年代後半まで続き日本の超並列処理技術が遅れたのです。

2011-03-05 13:52:54

Satoshi Matsuoka @ProfMatsuoka

日本のスパコンの超並列処理は、千プロセッサ超はRWC SCore-1(2001)⇒産総研クラスタ(2003)⇒理研RICC1(2004)⇒東工大TSUBAME1(2006)⇒KEK&CBRC BG/L(2005-6)⇒東大京大筑波大T2K(2008)でようやくメインストリームに。

2011-03-05 14:02:04

Satoshi Matsuoka @ProfMatsuoka

地球とかでも並列化してたという声もありますが、現代の超並列スパコンとはその難易度が全く違うのです。例えば並列化のためには多くの場合データ領域の分割を行いますが、地球はノードが大きいし実運用では細切れで皆使ってたから、(羊羹を切るような)一次元方向の易しい分割で良かったのです。

2011-03-05 14:09:03

Satoshi Matsuoka @ProfMatsuoka

ところが万オーダーの超並列ではそれは薄い羊羹のような分割になり美味しくない。なので二・三次元分割や、時にはヒルベルト曲線を使った分割とか行いますすが、これはプログラミングが難しい。で、アプリ側の実力も上がり、又それらを隠蔽するライブラリ・言語・ツールが多々米国を中心に進化したと。

2011-03-05 14:14:18

Satoshi Matsuoka @ProfMatsuoka

米国・欧州ではハイエンドのアプリでは万単位のコアで超並列が常識ですが、日本では汎用CPUで万単位で使えるスパコンセンターはない。GPUコア入れてもTSUBAME2だけ。ペタフロップスでは最低10万コア弱、エクサでは1~10億コアとか言われ、質的転換を要請されているのにです。

2011-03-05 14:20:04

Satoshi Matsuoka @ProfMatsuoka

従来のアプリ⇒地球とかでは単純な並列化で良かった。しかし数万コアのペタフロップスを駆使するには、多次元領域分割・負荷分散・通信隠蔽のテクニックは元より、さらに根本的な数値解法のアルゴリズム改変(直接法やクリロフ法への回帰)まで要請してて、実は後者の方がハードルが高かったが現状で。

2011-03-05 14:25:26

Satoshi Matsuoka @ProfMatsuoka

エクサへは超並列化の欧米に比較しての10年近い遅れを京・TSUBAME2・次期東大筑波大等のスパコンで取り戻せるか第一ステップです。その点若手が万・ペタの並列化を目指すのは、単なる速度向上だけでなく、質的転換を意味しているので、それらのスパコンでの多くのチャレンジを期待してます。

2011-03-05 14:31:00