2013/02/14 デブサミ2013【14-D-1】600億件を数十秒で検索するクラウド規模クエリサービスBigQuery #devsumiD
Developers Summit 2013 Action!
http://event.shoeisha.jp/detail/1/
<講演概要>
Google BigQueryは、クラウド上の数千台というサーバーを利用した大規模並列クエリサービスです。Google社内では2006年から利用されている「Dremel」と呼ばれるインフラを社外向けサービスとして公開したもので、600億件のデータに対する検索を、インデックスをまったく利用しないフルスキャンで数十秒という圧倒的なパフォーマンスで実行可能です。このDremelで利用されているカラム型ストレージのテクノロジーの解説をはじめ、BigQueryとMapReduce/Hadoopの違いと使い分け方について掘り下げます。
続きを読む
Engineer
@shirara1
「BigQueryはなぜ早いか」 •カラム指向ストレージ →行単位ではなくカラム単位で保存 •数万台で並列処理 →ディスクI/Oの限界まで •階層アーキテクチャ →クエリの分配 #devsumiD 14-D-1
2013-02-14 10:54:04
nyamairi
@nyamairi
MapReduceとBigQueryの使い分け。MapReduce:バッチ処理向け。高度なロジック。BigQueryの前処理。 BigQuery:大規模データの生成ができない。アドホッククエリ向け 。トライ&エラーな分析。 #devsumiD
2013-02-14 10:55:44
Ryo Yamasaki
@vierjp
セッションが終わったところで自分が以前にBigQueryについて書いたブログ記事を晒してみる。 前の会社のブログだけど。 http://t.co/O1A4jBEA #devsumiD
2013-02-14 10:57:01