Hadoopソースコードリーディング 第12回 まとめ

2012/8/28の『Hadoopソースコードリーディング 第12回』http://hadoop-scr12th.eventbrite.com/ のまとめです。 1. Using Standard File-Based Applications and SQL-Based Tools with Hadoop(Tomer Shiran , Director of Product Management, MapR Technologies) http://www.slideshare.net/MapRTechnologies/nfs-and-odbc 2. Sqoopコネクタを書いてみた(NTTデータ 岩崎 正剛 氏) 続きを読む
2
前へ 1 2 ・・ 5 次へ
Sho Shimauchi @shiumachi

あきらめて大人しく仕事に戻ります\(^o^)/ #hadoopreading

2012-08-28 19:25:00
草薙 昭彦 @nagix

NFSプロトコルとは。ランダムリードライトをサポートしなければならぬ。 #hadoopreading

2012-08-28 19:31:22
草薙 昭彦 @nagix

HadoopはそもそもHDFSだけでなくさまざまなファイルシステムをサポートするようにデザインされています。MapR Storage Layerはそのうちのひとつという位置づけ。 #hadoopreading

2012-08-28 19:33:28
草薙 昭彦 @nagix

NFSクライアントはLinux, Mac, Windows, ...なんでもOK。MapRのNFSゲートウェイにアクセスするだけ。 #hadoopreading

2012-08-28 19:34:34
草薙 昭彦 @nagix

MapR M5では複数NFSゲートウェイをサポートする。どのゲートウェイに接続しても、ファイルシステム全体が同じように見える。NFSはステートレス。#hadoopreading

2012-08-28 19:35:36
草薙 昭彦 @nagix

ロードバランサを介して、複数のNFSゲートウェイに負荷分散してあげてもよいよ。#hadoopreading

2012-08-28 19:36:33
草薙 昭彦 @nagix

ノードがクラッシュした場合はどうするか。MapRはVIPをNFSゲートウェイの物理IPのグループに割り当てることができるので、クライアントは接続を維持することが可能。複数VIPを使ってロードバランスと併用することもできる #hadoopreading

2012-08-28 19:39:09
草薙 昭彦 @nagix

ネットワークセキュリティベンダーはNFSを使ってパケットキャプチャデータをクラスタに流し込んでいる。オンライン測定会社はクリックストリームデータをアプリケーションから直接クラスタに流し込んでいる。SaaS企業はDBデータのやりとりをNFS経由で。 #hadoopreading

2012-08-28 19:41:15
草薙 昭彦 @nagix

小売業企業はNFSを介してchmod,chown,grep,make,tab補完などを直接Hadoopファイルシステム上のファイルに対して実行している。Emailマーケティング会社は小さいデータはHBase、大きいデータはNFSと使い分けている。 #hadoopreading

2012-08-28 19:43:21
草薙 昭彦 @nagix

MacのFinderでMapRのファイルシステムにNFS経由でアクセスして、データをいじくるデモ。 #hadoopreading

2012-08-28 19:44:25
Takashi Shitamichi @shita

TL上は #hadoopreading#technight が競っている。 #hadoopreading の方が優勢だぞ>厨

2012-08-28 19:44:36
草薙 昭彦 @nagix

MapRのロードマップ。バッチはMapReduce。フェイルベースアプリケーションはNFSアクセス。アドホッククエリはApache Drill。 #hadoopreading

2012-08-28 19:45:33
草薙 昭彦 @nagix

次はODBCについて。ODBCとはなにか。 #hadoopreading

2012-08-28 19:46:11
Sho Shimauchi @shiumachi

あ、ust復活してた。ありがとうございます #hadoopreading

2012-08-28 19:47:32
草薙 昭彦 @nagix

MapRはHive ODBC 3.52ドライバを提供しています。実装はSimba Technologiesのもの。32bit/64bit両方サポート。Windows/Linuxサポート。 #hadoopreading

2012-08-28 19:47:42
Ryu Kobayashi @ryu_kobayashi

@shiumachi ネットワーク絶不調なので未だにブツブツ切れます

2012-08-28 19:48:23
草薙 昭彦 @nagix

このODBCドライバは、SQL標準に完全準拠。つまりSQL構文をHiveQLにすべて変換します。 #hadoopreading

2012-08-28 19:48:51
Sho Shimauchi @shiumachi

Tableau って「たぶろー」って発音するのか。知らなかった #hadoopreading

2012-08-28 19:49:34
草薙 昭彦 @nagix

Tableau, Kaimon, MS ExcelでODBC接続をする例。 #hadoopreading

2012-08-28 19:50:16
Tatsuo Kawasαki @kernel023

Drillについて興味があればApacheのMLを読むこと、だそうです。

2012-08-28 19:55:23
oza @oza_x86

Apache Drill の ML,もうできてたのか http://t.co/SVQan8ve

2012-08-28 20:00:11
前へ 1 2 ・・ 5 次へ