Matsuoka教授 on スパコン

4
Satoshi Matsuoka @ProfMatsuoka

同時にPSP2がARM+PowerVRだという話に言及しているが、ここで用いられるPowerVR SGX543は大変興味深い。GPGPUは消費電力が問題になっているが、少なくとも組み込みグラフィックス系はかなり省電力・高性能なものが可能で、将来のスパコン像にも影響を与えるかも。

2010-02-09 09:24:23
Satoshi Matsuoka @ProfMatsuoka

例えば http://bit.ly/dqjLgW http://bit.ly/9BjAWx によれば、SGX543のoctcore版400Mhz版はpolygon/pixel fill rateだけに限ればGTX260並みの性能を発揮する。消費電力はわからないが、数十分の1だろう

2010-02-09 09:33:15
Satoshi Matsuoka @ProfMatsuoka

Tegraなども同じような性能電力費を発揮してくると考えられ、低電力ARMとの組み合わせはかなり面白い。アプリがCUDA/OpenCL化してあればCPU側のFP性能はいらないし、ARMコアベースならば高速インタコネクトなどのIPもSoCやIPコアとして組み合わせやすいからだ。

2010-02-09 09:35:54
Satoshi Matsuoka @ProfMatsuoka

無論倍精度は、ECC等信頼性は、とか、PowerVRだとTiling rendererだからメモリバンド幅がなくてそもそも松岡が主張しているようなGPUの汎用ベクトルエンジンとしての用途が限られるよとかの他他の問題がある。でもこれらの多くは高性能GPUがたどってきた道だ。

2010-02-09 09:38:20
Satoshi Matsuoka @ProfMatsuoka

組込系のHPC応用は数年前から種々の試みがあったが、最も成功したIBM Blue Geneも大成功とは言い難い。確かに世界一はとったが、継続性や普及という意味ではクラスタやCrayXTなど高性能プロセッサに凌駕されている。SciCortexやOrionなどは例によって累々の屍だ。

2010-02-09 09:41:41
Satoshi Matsuoka @ProfMatsuoka

このあたり、事情は地球シミュレータ/NEC-SXに状況が似ている;ハードだけでなくソフトウェアが開発ツールを含めproprietaryで、最低システム構成がそれなりに大きく導入コストが高い上にデスクトップWSとの連携性がなく、結局高C/PのPCクラスタに凌駕されてしまう。

2010-02-09 09:46:14
Satoshi Matsuoka @ProfMatsuoka

しかしながらARM+組込GPUは事情が違う。ARMは100億個以上も売れて開発ツールはPCと変わらないし、GPUはCUDAやOpenCLのエコシステムがあるし、何よりもTSUBAME2.0を含め今後のGPUクラスタスパコンと高い親和性があり、再コンパイルだけで動いたりするだろう。

2010-02-09 09:51:16
Satoshi Matsuoka @ProfMatsuoka

しかもコモディティでかつ数十万円レベルのエントリ機も簡単に作れる。ここでノードあたりの性能が高性能GPUクラスタの数分の1でも、消費電力が数十分の1ならば、10倍の性能電力費を発揮する。もちろんBGの時と同様、実際は他の多くのパラメタが関与するが、可能性は高い。

2010-02-09 09:54:12
Satoshi Matsuoka @ProfMatsuoka

一つ有利に働きそうなのは、メモリ系のCPU+GPU+ネットワークの融合が、ディスクリート中心の高性能CPU+GPU系と比較して容易・早く起こる可能性があることだ。無論高性能GPUがQPIやHTとインテグレーションされていくだろうが、まだ先のことし、二つの規格は問題を複雑化する。

2010-02-09 09:57:03
Satoshi Matsuoka @ProfMatsuoka

つまり高性能GPUだとQPI/HTどちらかを選ぶと他方のマーケットを捨てることになるし、何よりIntelはQPIのバスライセンスはまず外部には出さない。なのでCPUと一体化できない高性能GPUは当分PCI-eである。一方組込み系はそのような制限はなくワンチップ化は容易だ。

2010-02-09 09:59:29
Satoshi Matsuoka @ProfMatsuoka

組込み系が得意で産業としても重視している我が国の将来のHPCの道は、特にIntelの「支配から逃れる」ならばこれだろう。SXや国産ペタコンのレガシからの決別にはなるが、どのみちそれらは急速にGPUクラスタに凌駕される運命だ。日米共同開発となるが、逆にそれなら念願の米国にも売れる。

2010-02-09 10:05:28
Satoshi Matsuoka @ProfMatsuoka

それにも関わらず、NECが独自開発のSXを復活させたというアナウンスは全く短期的な効能や消えゆく顧客層しか見ていない拙速な判断で大変ガックリきた。原発や新幹線ならまだしも、毎年数十億程度で他に全く技術レバレジが効かないマーケットは十万人企業が追うべきではなく、巨大な機会損失だ。

2010-02-09 10:10:11
Satoshi Matsuoka @ProfMatsuoka

実はこの話は世界一になったRoadrunnerの時にチャンスはあった;CellはIBM/東芝/ソニーだからである。しかし、日本の二社はHPCに興味はなく、日本のメーカーはレガシに勤しんでおり、半分日本の技術が世界一になったのにマスコミも冷たく、そのうちCellが凋んでしまった。

2010-02-09 10:18:42
Satoshi Matsuoka @ProfMatsuoka

DARPA-HPCSの所謂Koggeレポートでもexaの道は組込系が最も有望であるとしている。それとGPUの強力なマルチコアベクトル処理と高バンド幅メモリ及びSoCかオンチップ結合網が密結合すればなおさらだ。チャンスは今だ。 http://bit.ly/afALLa (297頁)

2010-02-09 10:28:35
Satoshi Matsuoka @ProfMatsuoka

Azureの公式サービスが開始された。http://bit.ly/aEfxml ところでよくe-Scienceの計算ホスティングをコマーシャルクラウドで、という話があるが、それが本当は幾らかかるか、また現状の大学の基盤センターと比較してコストがどうなのか分かっての発言だろうか?

2010-02-09 14:19:51
Satoshi Matsuoka @ProfMatsuoka

例えば記事の中ではCPU時間は約1時間10円ぐらいだが、TSUBAMEのもっとも安いサービスだと一時間0.17円と50倍も違う。しかもスパコンのCPUサイクルだ。無論即時性や占有性を要求したり、外部の企業利用とかは高くなるが、高々0.5~2円だ。しかもストレージ課金は今はない。

2010-02-09 14:40:46
Satoshi Matsuoka @ProfMatsuoka

なぜこんなに違うの、というのは種々の理由があるが、少なくともTSUBAMEユーザが、よほど補助金が出ない限りAzureやEC2ユーザになることはコスト的には全く無意味だ。これは東工大だけでなく、多少料金体系が違うが東大でも多少高いが似たような値段なので、状況は同じだ。

2010-02-09 14:42:46
Satoshi Matsuoka @ProfMatsuoka

しかもCPU速度はそれほど変わらないが、I/Oやネットワーク速度や共有メモリの性能キャパが全く違い、さらに大メモリのTeslaなどがある。この差はTSUBAME2で広がるわけだ。

2010-02-09 14:45:23
Satoshi Matsuoka @ProfMatsuoka

問題は、これでも1000CPU並列で数日動かす、などという需要がある研究者にはそれなりの出費になることだ・例えばTSUBAMEの予約制のHPCキューは1024CPU+62GPUを3-4日専有できるが、3万円かかる。途中でバグって動かなくても、これだけの金額がかかってしまうわけだ。

2010-02-09 14:47:14
Satoshi Matsuoka @ProfMatsuoka

我国の研究者は何百~千万のお金を研究室からシミュレーションに拠出する文化がまだ出来上がっていない。ゆえに圧倒的な「補助金」で支えられている各センターのスパコンを経済原則を無視した破格の値段で使うことを享受し、それによってセンターは少数ユーザを囲い込んで延命を図るという構図である。

2010-02-09 14:51:54
Satoshi Matsuoka @ProfMatsuoka

このような構図が崩れない限り我国における研究者のクラウド利用はほとんどないであろう。あるいは使っている人は試していて後で料金請求が来てびっくりするのか、基盤センターのスパコンを食わず嫌いしているだけか、よほど技術的な事情がある場合である。

2010-02-09 14:55:05
Satoshi Matsuoka @ProfMatsuoka

でもTSUBAME自身圧倒的に安いではないか、というご指摘が勿論ありそうだが、それは東工大の運営費交付金の中で予算をいただいているわけで、その点から学内全体から利用料とは別に実質的に「税金」を取っていることになり、それゆえ特に学内にちゃんと還元することが必要だからである。

2010-02-09 14:57:57
Satoshi Matsuoka @ProfMatsuoka

それゆえTSUBAMEは「みんなのスパコン」であり、学内で千数百人をサポートし、かつ教育用や他のクラウドサービスも行うのである。また、リーダーシップスパコンとして利用されることにより、それ自身の名声と、その結果の名声により東工大の名声があがり、ひいては研究資金獲得につながる。

2010-02-09 15:00:20
Satoshi Matsuoka @ProfMatsuoka

これがTSUBAMEの経済モデルであり、TSUBAME2.0ではさらに強化される。それゆえ、松岡自身は高いproprietaryなマシンで少数ユーザを囲っている一部の大学の基盤センターの姿は信じられない。よく学内から刺されないなと思うばかりである(しかも経済学部あたりから)。

2010-02-09 15:01:56
Satoshi Matsuoka @ProfMatsuoka

比喩ではないですが、そのような現象はありました。それを打ち崩したWideの人たちの功績は大きかったと思っています。@kenji_rikitake かつて学術関係者だけにインターネットの国際接続を学術情報センター(当時)が囲い込んでいた時代がありましたが。。。?

2010-02-09 15:03:26