Masaru Dobashi
@masaru_dobashi
はい、大規模なシャッフルを行うときには、SparkといえどもDiskIOが生じるのでインフラなどの面でも一応気を付けないといけないですね。(Spark1.0.2の場合) #sparkmeetup
2014-09-08 20:01:45
Kenji Yoshida
@xuwei_k
ソースだとこのあたりとかかなー github.com/apache/spark/b… 普通にScala標準のparserつかってSQLをparseしてんのか #sparkmeetup
2014-09-08 20:07:30
御徒町@MultiVersionConcurrentClimber(MVCC)
@okachimachiorz1
structuredが使えるのはうれしい。#sparkmeetup
2014-09-08 20:08:19
Kenji Yoshida
@xuwei_k
話してるdata typeのあたりのソースみると、普通にueshinさんが最終コミット者で貢献しててすごい github.com/apache/spark/b… #sparkmeetup
2014-09-08 20:09:30
Toshiyuki Takahashi
@tototoshi
github.com/apache/spark/b… spark の sql parser、parser combinator のサンプルとして良さげなかんじだ
2014-09-08 20:09:54
Kenji Yoshida
@xuwei_k
.@taroleo まぁでもparseはボトルネックにならない?(よくわかってない) そこ頑張るなら、もうparserから全部自作になるんですかね? #sparkmeetup
2014-09-08 20:10:54
御徒町@MultiVersionConcurrentClimber(MVCC)
@okachimachiorz1
なんど見ても・・・Logical Planを直接いじる時代か的な。#sparkmeetup
2014-09-08 20:11:41
Taro L. Saito
@taroleo
@xuwei_k そうですね。普通のDBトランザクション用途には遅すぎると思いますが、SparkSQLでの用途なら。。。 #sparkmeetup
2014-09-08 20:12:18