prof_hrkさんとshtaxxxさんによるISCA 2015のFPGA関連つぶやきまとめ

計算機アーキテクチャの学会ISCAに参加されてるお二人のFPGAまわりのツイートが熱すぎるのでまとめました。
8
hrk先生 @Prof_hrk

ISCA Workshop he Intersections of Computer Architecture and Reconfigurable Logic. James HoeとDerek Chiouが主催だ。出し物はIntel, Convey, IBM, MS。

2015-06-15 00:58:05
hrk先生 @Prof_hrk

最初のTalkはXeon+FPGA Platform for the Data Center, Intel PK Gupta. Altera 買ったからかな?

2015-06-15 01:00:57
Shinya T-Y @shtaxxx

IntelのXeon+FPGAの話を聞いている

2015-06-15 01:10:37
Shinya T-Y @shtaxxx

データセンターの30%のコストは電力と冷却に消費

2015-06-15 01:12:10
hrk先生 @Prof_hrk

DCでは一つのキラーアプリはない、電気代が運用費で大きい。XeonのSlowdownでヘテロジニアスコンピューティングが必然になる⇒FPGA。 接続はPCIEより近い⇒QPI。SVMによりメモリPinningを不必要に。 ⇒ FPGAをCCかつ低遅延につなぐ。

2015-06-15 01:24:57
Shinya T-Y @shtaxxx

旧型のxeon-FPGA、QPIのレイテンシが200nsくらい。大体がトランシーバーのせい

2015-06-15 01:35:28
hrk先生 @Prof_hrk

Intelでの開発プラットフォームは、Xeon E5-2600V2+Stratix VでQPI接続。メモリ(FPGA)は2チャネルDDR3, 64GB.FPGAにPCIE V3x8でNIC接続。QPIはソフト・コア。QPIでCCが特徴。Conveyが最初のカスタマー。

2015-06-15 01:38:48
hrk先生 @Prof_hrk

プログラムI/FはOpenCL。FPGA設計が最適化すればするほどFPGAは100W近くくう。クラウドに組み込んでSDIとRSAを融合。IP Storeを作りFPGAの中身を作りこむ(by User) まだユーザが自由につかうという感じじゃないな。CPUを簡単に落とせそう。

2015-06-15 01:56:18
Shinya T-Y @shtaxxx

やっぱりディープラーニング

2015-06-15 01:59:02
hrk先生 @Prof_hrk

APP例1はDeep Learning.例2はOpen VSwitch w/DPDK. 例3は高速トレーディング。FPGAが直にEthernetにつながる。例4は、Intel-Altera Academic Program. うーん、危険なシステムになりそう。質問した。

2015-06-15 02:06:12
Shinya T-Y @shtaxxx

メモリのプロテクションばどうするんだ?の議論。新しいプログラミングインターフェースが必要では?と

2015-06-15 02:08:19
Shinya T-Y @shtaxxx

ただロジックが書けるだけの高位合成じゃダメだよなーと常々思っている

2015-06-15 02:09:17
hrk先生 @Prof_hrk

Xeonと直接接続するために必要な仮想化・プロテクションをFPGAチップ自身に組み込まないと、FPGAをユーザに開放できない。これがIntel Altera買収の目的の一つ(と質問に答えた)

2015-06-15 02:10:19
hrk先生 @Prof_hrk

つぎはMicron-Convey.Tony Brewer.私たちはConveyの日本最初のユーザだ。 私の席の周りは旧DF屋で占められている。2種のカード。V7 690と、Altera Arria101150.後者はHMC使う。前者はPCIEx16、後者はX8.

2015-06-15 02:18:18
Shinya T-Y @shtaxxx

FPGAの利用率を最大化するための祖粒度のタスクスケジューラーも必要

2015-06-15 02:29:58
hrk先生 @Prof_hrk

例1.画像のリサイズ⇒48倍スピードアップ。カスタマーは中国。SNSでの画像マッチ検出用?Upload時に同時にResizeしてストレージ容量も切る。方法は自明。これは作り込み的。6スレッドくらいの同時実行がFPGAを常に使うことに必要。Baiduのようだ。

2015-06-15 02:33:12
hrk先生 @Prof_hrk

実際にやっていることは、ImageMagickの計算部分をスレッド化してFPGAに投げる。FPGAはPCIE用の小さいものと、計算用のV7 690.FPGAとはSendとRecvでつながる感じ。

2015-06-15 02:41:40
Shinya T-Y @shtaxxx

こりゃ解析はしてないな

2015-06-15 02:56:34
hrk先生 @Prof_hrk

例2はMemcached。Web Page用のKey Value Storeの高速化。これは結構流行っている応用。FPGAがHash Table部分を担当。ただし、Conveyの方法はNICがホストについているのでRTTはあまり稼げない。

2015-06-15 02:57:30
Shinya T-Y @shtaxxx

IBM ResearchのHW-assisted regex の話

2015-06-15 03:35:51
hrk先生 @Prof_hrk

つぎはIBM チューリヒのKubilay Atasu.Text analytics, System TへのFPGA適用。Machine GeneratedなFinancial Dataと、Machineが出すLog,それとSNS(Twitter)のData。

2015-06-15 03:36:42
Shinya T-Y @shtaxxx

テキスト解析のハードウェア支援、楽しそう

2015-06-15 03:40:05
Shinya T-Y @shtaxxx

FPGAからCAPIへのアクセス、ロードストアベースなんだけど、バンド幅使いきれるのかな?

2015-06-15 03:55:20
残りを読む(66)

コメント

koji anzai @kanzmrsw 2015年6月16日
高前田くんが活躍してた。
0