prof_hrkさんとshtaxxxさんによるISCA 2015のFPGA関連つぶやきまとめ
- kazunori_279
- 7901
- 1
- 6
- 43
ISCA Workshop he Intersections of Computer Architecture and Reconfigurable Logic. James HoeとDerek Chiouが主催だ。出し物はIntel, Convey, IBM, MS。
2015-06-15 00:58:05最初のTalkはXeon+FPGA Platform for the Data Center, Intel PK Gupta. Altera 買ったからかな?
2015-06-15 01:00:57DCでは一つのキラーアプリはない、電気代が運用費で大きい。XeonのSlowdownでヘテロジニアスコンピューティングが必然になる⇒FPGA。 接続はPCIEより近い⇒QPI。SVMによりメモリPinningを不必要に。 ⇒ FPGAをCCかつ低遅延につなぐ。
2015-06-15 01:24:57Intelでの開発プラットフォームは、Xeon E5-2600V2+Stratix VでQPI接続。メモリ(FPGA)は2チャネルDDR3, 64GB.FPGAにPCIE V3x8でNIC接続。QPIはソフト・コア。QPIでCCが特徴。Conveyが最初のカスタマー。
2015-06-15 01:38:48プログラムI/FはOpenCL。FPGA設計が最適化すればするほどFPGAは100W近くくう。クラウドに組み込んでSDIとRSAを融合。IP Storeを作りFPGAの中身を作りこむ(by User) まだユーザが自由につかうという感じじゃないな。CPUを簡単に落とせそう。
2015-06-15 01:56:18APP例1はDeep Learning.例2はOpen VSwitch w/DPDK. 例3は高速トレーディング。FPGAが直にEthernetにつながる。例4は、Intel-Altera Academic Program. うーん、危険なシステムになりそう。質問した。
2015-06-15 02:06:12Xeonと直接接続するために必要な仮想化・プロテクションをFPGAチップ自身に組み込まないと、FPGAをユーザに開放できない。これがIntel Altera買収の目的の一つ(と質問に答えた)
2015-06-15 02:10:19つぎはMicron-Convey.Tony Brewer.私たちはConveyの日本最初のユーザだ。 私の席の周りは旧DF屋で占められている。2種のカード。V7 690と、Altera Arria101150.後者はHMC使う。前者はPCIEx16、後者はX8.
2015-06-15 02:18:18例1.画像のリサイズ⇒48倍スピードアップ。カスタマーは中国。SNSでの画像マッチ検出用?Upload時に同時にResizeしてストレージ容量も切る。方法は自明。これは作り込み的。6スレッドくらいの同時実行がFPGAを常に使うことに必要。Baiduのようだ。
2015-06-15 02:33:12実際にやっていることは、ImageMagickの計算部分をスレッド化してFPGAに投げる。FPGAはPCIE用の小さいものと、計算用のV7 690.FPGAとはSendとRecvでつながる感じ。
2015-06-15 02:41:40例2はMemcached。Web Page用のKey Value Storeの高速化。これは結構流行っている応用。FPGAがHash Table部分を担当。ただし、Conveyの方法はNICがホストについているのでRTTはあまり稼げない。
2015-06-15 02:57:30つぎはIBM チューリヒのKubilay Atasu.Text analytics, System TへのFPGA適用。Machine GeneratedなFinancial Dataと、Machineが出すLog,それとSNS(Twitter)のData。
2015-06-15 03:36:42