「分散システム処理モデルに関する動向について」に対する感想ツイート
こないだCTOが、日本で採用するときの基準上げすぎるのマジやめてくれない? って言ってたのを思い出したので、今夜はこれくらいにしようかと思います。でもマジ楽しいですよ。
2015-06-12 00:22:51SQLなどで宣言的に書かれることが多いデータパイプラインを、手続き型のDSLでインクリメンタルかつインタラクティブに作成しながらも、最終的な成果物として宣言的なSQLの列からなるワークフローを生成できるツールを書いたのだけども、もちっと使い所の模索が必要。
2015-06-12 00:24:23@tagomoris まぁ最近の皆の発言を聞いてると、Googlerでも入れなさそうなので確かに基準上げすぎですw
2015-06-12 00:24:48どちらかというと副産物として出来上がった、PythonのクラスとJSONやMessagePackにマッピングするするライブラリの方が便利でイケてた。あとReact.JSが楽しい感じ。Dropwizardは、Railsと比較するとシンプルなアプリケーション向きという印象を得た感じ。
2015-06-12 00:25:42@taroleo ちょっと自粛が必要ですかね……でもハイスキルエンジニアを雇いたければこういう空気を見せるのが得策なはず。なやましい。
2015-06-12 00:26:34Arelみたいのだけども、構築途中の実行計画をJSONにシリアライズできるのがポイントで、実行計画の中に含まれる、他の実行計画に対する依存関係とか、プレースホルダに埋める値(のファクトリ)とかを永続化できて、それらを後で実体化して繰り返し実行できる感じ。
2015-06-12 00:27:53でもまあTDにはいわゆるWebメディア的なWebアプリを無限に作るみたいな仕事は皆無なので、真ん中に対して求める基準もちょっと違う気はする
2015-06-12 00:28:35で、こないだ(昨日か)してた議論は、宣言的DSLにブレイクダウンするワークフローを手続き的DSLで書くアプローチと、手続き的DSLをベースに構成された分散処理プラットフォームの上に宣言的DSLのレイヤを被せるアプローチがあるよね、さて功罪は、というやつでしたね
2015-06-12 00:31:39実行計画からの実体化は、SQL文(PostgreSQL, SQLite, Presto, HiveQL, etc.)へのコンパイルが基本なのだけども、プラグイン可能で、結果として複数のデータソースにまたがる複雑なワークフローを構築するDSLとして使用できるという目論見。
2015-06-12 00:32:23ワークフローを手続き的DSLで書くとしたら、少なくとも複数の処理をマージして最終的な結果に落としこむための機能が必要だと思うんだけど、得てしてひとつの前処理(というかstage-1)は複数の処理のデータソースになるので、分岐するワークフローをどう書くんだろうというのを疑問には思う
2015-06-12 00:34:09まーこのへんに唯一絶対の解はたぶん無いので、現実的なワークロードのどこにフィットするものを作りたいかという問題意識の差になるだろうと思う
2015-06-12 00:35:07