Matsuoka教授 on スパコン

4
Satoshi Matsuoka @ProfMatsuoka

それが基盤センターのそもそもであります。でも2010年TSUBAMEが2-3PF達成するとして、他7大学がどうする計画か・ユーザが何人か鑑みる必要があると。最も一般に情報が公開されてない。。@akibeat こういうデカいのが国内に数個あれば地方大学全部に計算センタ置かなくても

2010-02-09 15:09:34
Satoshi Matsuoka @ProfMatsuoka

はい、大学は「直利用」ではないでしょう。結局可能なのは、現在実マシンをsubsidizeしているように、クラウドの課金をsubsidizeした場合のみでしょう。@masanork パブリッククラウドの対象顧客は主にWeb系サービスで、科学技術計算に使って割に合うかは疑問ですね。

2010-02-09 15:16:41
Satoshi Matsuoka @ProfMatsuoka

では神戸ペタコンは1200億ならば俺は千円だけど使えんぞ、という話になるが、無論科学研究の最先端を切り開くハイエンドの設備は必要で、それはスパコンには限らない。しかしながら、それらの利用は厳格な審査があり、神戸の場合は法律まである。実績で競争を勝ち抜いたという正当性があるわけだ。

2010-02-09 16:15:49
Satoshi Matsuoka @ProfMatsuoka

しかしながら、一部の基盤センターのスパコンはマジョリティは課金制で、かつ小中規模ユーザの掘り出しも役目なので、いわば「金さえ払えば使える」状況だ。言わばクラウドと同一なわけあるが、少数既存のハイエンドユーザのサポートのために非汎用のコスト高のマシンを入れている。これでは矛盾だ。

2010-02-09 16:19:17
Satoshi Matsuoka @ProfMatsuoka

つまり、少数のハイエンドユーザしか使えないならば、神戸のように全て審査制にして、かつマシンのコスト負担を公的に行う。これは地球もそうだったし、欧米のほとんどのセンターはこのモデルだ。NSFなどは単一ではなく、TeraGrid全体の資源への配分審査として行われる。

2010-02-09 16:20:40
Satoshi Matsuoka @ProfMatsuoka

一方課金にして多くのユーザが使うのならば、クラウド的に標準化・汎用化・低コスト化を目指し、さらに多くの、できればコスト負担している機関のマジョリティのユーザを獲得しつつ、同時にハイエンドの人が使いたい場合は何らかの審査制・補助を行うしかない。これはTSUBAMEのモデルである。

2010-02-09 16:22:31
Satoshi Matsuoka @ProfMatsuoka

つまり、一部のセンターは少数の既得権ユーザに無審査で大量のしかも運営費交付金がベースの補助金を出していることに等しいのである。これは年額十億から三十億にも達する。実質ユーザが50人しかいなければ、年間2000-6000万円の学内研究費を無審査で渡しているに等しいわけだ。

2010-02-09 16:25:38
Satoshi Matsuoka @ProfMatsuoka

これでノーベル賞でもとってくれればだが、そのようなことはまだ聞いていない。なので、なぜこの様な茶番をこの厳しいご時世に大学の執行部が許しているのか、理解に苦しむ。少なくとも東工大では許されないので、後者の「クラウド型の」運用モデルを採用しているわけだ。(TSUBAMEが先だけど)

2010-02-09 16:27:14
Satoshi Matsuoka @ProfMatsuoka

日本のスパコンインフラの世界的な競争力が地に落ちつつあるのに神戸ペタコンがプロジェクトとして成立したことはプラスであるが、そもそもこういう所にメスを入れるのが先だ。仕分けは神戸ではなく、競争力がないのに経済モデルとして整理しない運用をしているセンター群ではないか。

2010-02-09 16:34:47
Satoshi Matsuoka @ProfMatsuoka

松岡が大学の学長か経営担当の役員だったら、10億~30億/年も使うようなインフラは大学のかなりの%が直接恩恵を受けるか、あるいはそれに見合った収入や名声を得ない限り廃止するであろう。逆にいつもそのような心づもりでTSUBAMEは運用・計画・開発されているのである。

2010-02-09 16:40:45
Satoshi Matsuoka @ProfMatsuoka

ISSCCで注目はPower7だが、次世代SPARC(次期Niagara?)が実は面白い。メモリバンド幅がわからないが、スレッド数は128とちょっと前のGPU並みだ。まさか1 clockでFMAを全スレッドでissueできるとは思えないが。http://bit.ly/aIWOdF

2010-02-09 20:57:07
Satoshi Matsuoka @ProfMatsuoka

J. Shin et. al. 5.2 A 40nm 16-Core 128-Thread CMT SPARC SoC Processor.

2010-02-09 20:58:32
Satoshi Matsuoka @ProfMatsuoka

ちなみに内部クロスバーは490GB/s, 外部は2.4Tb/s ~=240GB/sと、Power7とタメをはっている。Venusと違いちゃんと4チップ共有メモリ構成(この場合は512MIMDスレッド(!))も可能だ(もっとも本当にMIMDにするとI$がすぐ飛ぶが)。

2010-02-09 22:36:55
Satoshi Matsuoka @ProfMatsuoka

というわけでFP性能が気になるが。。。SunのVPに聞いてみよう。もしこれが8 issue/coreだとなかなかすごいが、さすがにメモリバンド幅を考えると難しいだろうか。でも4 issueでもVenusとほぼ一緒になるわけであるが http://bit.ly/aQu4Ze

2010-02-09 22:52:39
Satoshi Matsuoka @ProfMatsuoka

もっともUltraSPARC T2から考えると2 issueか。だとすると2Ghzで64GFlopsだからフツーとなる。もっともT2は60GB/s以上メモリバンド幅があったわけだが。Uhttp://bit.ly/dr7hiy

2010-02-09 22:59:02
Satoshi Matsuoka @ProfMatsuoka

クラウドでe-Scienceの話をしていたが、NSFがMSとクラウド上でe-Scienceを行うプロジェクトで合意したというアナウンス。MSがタダでAzure資源とサポートを3年間提供し、NSFが研究費を提供するという仕組みだ。 http://bit.ly/beQsdy

2010-02-10 01:43:44
Satoshi Matsuoka @ProfMatsuoka

勿論3年たったらカネをとるわけであるが:-)当然研究者ユーザがそのままAzureに対価を払うのは高すぎる。本当の狙いは、NSFがスパコンセンターに資金を投じてスパコンのHWを買って管理する代わりに、Azureから買って審査されたユーザに提供するというモデルだ。

2010-02-10 01:49:53
Satoshi Matsuoka @ProfMatsuoka

これを我国の大学基盤センタに写像すれば、同様にスパコンハードを買うのではなく、計算・ストレージ資源をクラウドから買うことになる。その場合、勿論コストを現状と同じ割合(90%以上)補助しなくてはならない。しかし少なくとも国際的市場価格で、かつ広いユーザに提供できる資源が入手できる。

2010-02-10 02:06:10
Satoshi Matsuoka @ProfMatsuoka

この場合、自分でスパコンを持つのか、あるいはクラウドでホストされるのかは、スパコンに必要な性能要件をクラウドが満たすか、どちらがコストが低いか、大規模システムに対する人材育成の必要性、さらにはそのセンターがHPCで最先端を走る研究体制があるか、などの点に依存しよう。

2010-02-10 02:12:30
Satoshi Matsuoka @ProfMatsuoka

この場合、東工大GSICのように、人材や研究がセンターにもアプリにも豊富な基盤センターは当分自前だろうが、逆にそれが存在意義だろう。一方、先述のように少数のユーザに対しメーカーにオンブするだけで運用した気になっているセンターはクラウド化した方がユーザも組織も幸せだろう。

2010-02-10 02:17:55
Satoshi Matsuoka @ProfMatsuoka

無論希望はそのようなセンターが多くない;つまり、クラウド化はそのセンターの消滅を意味するから、存亡の危機に立たされたセンターは奮起して自前でスパコンを持っても意味があるだけの先進性や人材があることを示すわけだ。ただし、専用マシンへの少数ユーザのロックインで達成しては意味がない。

2010-02-10 02:32:51
Satoshi Matsuoka @ProfMatsuoka

例えば、クラウドにベクトル機がなくてうちはベクトル機があるから意味がありますよ、というのでは、今度は別途先に述べた、組織の(結局は税金の)年間10億を50人に無審査にばら撒くという組織や国民に対する正当性が欠如したモデルから抜け出ていない。つまり、別な理由で存在理由がなくなる。

2010-02-10 02:40:40
Satoshi Matsuoka @ProfMatsuoka

実際、05-06年のTSUBAME1実現の際に役員会から「他基盤センターを使えば十分では」と聞かれ、当時は「日本一のスパコンを作るのであり得ない」という単純な回答をしたが、今やTSUBAME2は商用クラウドと戦っても勝てるとしている。これは全てのセンターに今後問われるべきことだ。

2010-02-10 02:50:44
Satoshi Matsuoka @ProfMatsuoka

一つはクラウドではバンド幅の欠落などで全く効率がでない密結合アプリや並列ファイルシステムを要求する大規模データ処理アプリなどです。RT@smectic_g どんなアプリケーションを想定しているのだろうか。。。いわゆるクラウドと比較するとかなりオーバースペックな訳で。

2010-02-10 18:57:43
Satoshi Matsuoka @ProfMatsuoka

もちろんGaussianなどの共有メモリ並列型や、GPUアプリ等もです。逆にクラウドでそこそこ動くようなのは単一CPU中心であまりI/Oヘビーではないパラメタサーベイ的なアプリなわけですが、そのようなアプリの性質の種別を無視して「クラウドで動かせば良い」という話になりがちなので。

2010-02-10 19:00:23