Repro Tech Meetup #9 実践・並列分散処理基盤
- threetreeslight
- 2206
- 1
- 0
- 57
Arabikiさんの発表はじまったー! #reprotech pic.twitter.com/eBK5mnumfm
2019-06-04 19:41:57#reprotech 「Repro における Presto の安定化・パフォーマンス改善の歩み」 by Takeshi Arabiki pic.twitter.com/FxwW3xGowV
2019-06-04 19:42:37#reprotech 狙った時間に出したいから処理時間を短くしたいし、最新のデータを使いたいとゆーのがユーザーの願いで、実現するの大変とゆー話
2019-06-04 19:46:03「adhockな分析ではなく、プッシュ配信などのユーザーのセグメントという過酷な環境で #presto を利用」 #reprotech
2019-06-04 19:46:10「prestoは1 workerおちるだけでQuery全体が失敗する。」 本当にこれに悩まされる問題。 #reprotech
2019-06-04 19:49:26#reprotech Repro の守護神 @a_bicky さんの登壇。#presto の活用やチューニングについてのお話し。 pic.twitter.com/L0YlE1JnWa
2019-06-04 19:49:55「bucketed tableはprestoだと気を使う。同じtableの同じbucket番号のファイルは全部同じworkerが処理してしまう。bucket execution enabled=falseを設定するとその動きをoffにできる」 #reprotech
2019-06-04 19:55:27#reprotech bucketed table の処理ワーカーがかたよるの、ジョインで使うときとかに局所性がきくから、とかなんだろか
2019-06-04 19:55:29テーブル、bucket、ファイルが同じだと同じworkerでしか処理しないのがデフォルトなの完全に罠や... #reprotech
2019-06-04 19:55:50「ドキュメントには書いてないんですが、bucket_execution_enabledを falseにすると並列処理されます(キリ」 github.com/prestodb/prest… #reprotech
2019-06-04 19:56:41