「ポストムーアに向けた計算機科学・計算科学の新展開」シンポジウム

3
前へ 1 ・・ 12 13
t3840 @t3840

Q:Fortran屋さんはポストムーア時代にどうすれば? 市村先生:高位の記述を変換する形になってほしい 石井さん:HWではどうしようもない 近藤先生:どうせ大変だから、どっちでもよくね?

2015-12-22 18:11:58
おもち @OmochiStrike

Q. Approximate Computing について。Oil & Gas の需要は国内であんまなくて今後の必要性が感じられないし、次世代京にが微妙じゃないかと思うんだけどどうか。 A. 丸山先生。必要性の主張は人による。駆動電圧0.4V以下の世界だとエラー率だってほげほげー

2015-12-22 18:14:28
おもち @OmochiStrike

質問が矢継ぎ早になってきてつらみ。

2015-12-22 18:15:15
koumei tomida @koumeitomida

B/F=7はどの世界?、DRAM+TSV 近藤先生。

2015-12-22 18:16:51
おもち @OmochiStrike

あ、終わった。会場が帰り支度を始める中、松岡先生がクロージングの挨拶。

2015-12-22 18:18:12
おもち @OmochiStrike

悲観的な話もあったが、我々は今後20年間続く仕事のスタート地点に立っている。その間ファンキーなアーキテクチャとか色々出てくると思うが、なんだかんだ楽しく明るい未来が待ってると思う、と。

2015-12-22 18:20:24
おもち @OmochiStrike

まあ20年後俺は現役じゃないけどな。じゃあ、懇親会で会おうぜ。これにて終了。

2015-12-22 18:21:05
おもち @OmochiStrike

ということで現場からは以上です。

2015-12-22 18:21:46
神楽 @llV0_0Vll

ポストムーアシンポジウム終わった。ムーア終焉はIT業界全ての問題だけど、HPC界隈の人がメインで話もそっち系。

2015-12-22 20:27:46
koumei tomida @koumeitomida

今日のポストムーアのシンポジウムを私の関心範囲でまとめると、(1)発熱で演算器の集積に限界が来る、(2)メモリ・通信ともにバンド幅は増える、(3)エネルギー効率のよい専用HWが登場(FPGAが大注目を浴びていた)、(4)メモリ階層は深くなる。

2015-12-22 20:32:14
神楽 @llV0_0Vll

要約 ムーア終焉でFLOPS向上が止まる 一方でTCI,TSVなど3次元集積技術によりバンド幅は伸びる そのため今後はB/Fが上がる方向に ネットワークもWDMなどを使うことで広帯域に 一方でメモリ/ネットワーク階層は増えるためレイテンシ増 電力性能から専用化 FPGA化が有望

2015-12-22 20:33:06
神楽 @llV0_0Vll

ムーア終焉は2029年と予測がある 理由は製造コストの高騰 電力の壁ダークシリコン問題

2015-12-22 20:36:22
神楽 @llV0_0Vll

システム的には様々な専用ハードをヘテロな構成でつなぐ技術 電力バジェットの分配方法 アプリ的には高B/Fの利用法 陰解法の見直し ブロック化しないという方法 メモリ/ネットワーク階層は深くなるのでレイテンシ隠蔽手法

2015-12-22 20:40:16
神楽 @llV0_0Vll

つい先日、ポストエクサを考えるパネルで牧野先生は陰解法諦めて陽解法にすべきと言ってたのと真逆。あぁでも今日のはポストムーアだからポストエクサの次の姿とみるべきかな?

2015-12-22 20:46:39
miya @parallellafan

「ポストムーアに向けた計算機科学・計算科学の新展開」シンポジウム 2015/12/22 OmochiStrikeさん実況 まとめ twitter.com/search?f=tweet…

2015-12-22 22:12:28
片桐 孝洋 @Taka_Katagiri

「ポストムーアに向けた計算機科学・計算科学の新展開」シンポジウムへご参加ありがとうございました。200名近い参加者があり、盛会となりました。 cspp.cc.u-tokyo.ac.jp/p-moore-201512/

2015-12-23 09:20:01
片桐 孝洋 @Taka_Katagiri

ポストムーアでメモリバンド幅が増えると、密行列のブロック化が不要になりアルゴリズムを変える必要がある、と言ったのですが、実例があります。HITACHI SR2201では、固有値ソルバでは、ブロック化したアルゴリズムより、非ブロック化アルゴリズムのほうが速かった。

2015-12-23 10:19:44
片桐 孝洋 @Taka_Katagiri

で通常、密行列分解ではB/Fが4以上になると非ブロック化アルゴリズムでも高効率で実行できるようになる(全てキャッシュミスしてもB/Fが4程度のカーネル)のですが、SR2201のB/Fは4であったとのこと(T大のD先生が覚えていた)。どうりでである。ちなみにES1もB/F=4。

2015-12-23 10:22:56
片桐 孝洋 @Taka_Katagiri

B/Fが上がってもレイテンシの問題はあるが、疑似ベクトル化とカーネルアンローリングで、レイテンシは見えなくすることができる。逆にBLASを使って、演算カーネル部分をDGEMMで呼ぶと、手続き間にまたがる最適化がいるので、逆に最適化が難しくなる例だったと思う。

2015-12-23 10:25:09
片桐 孝洋 @Taka_Katagiri

でも、B/Fの高いベクトル機の時代に戻れば良いと言うことではなくて、今後も、超並列性の抽出や、階層メモリ向けの最適化は必須なので、新しい技術開発が(ますます)必要になります。

2015-12-23 10:27:54
前へ 1 ・・ 12 13