2017/04/26 データ分析基盤Night #2 #データ分析基盤Night

データ分析基盤Night #2 - connpass https://data-platform.connpass.com/event/53430/ ハッシュタグ:#データ分析基盤Night
1
this is matsuu speaking @matsuu

#データ分析基盤Night freee で使用しているミドルウェア/サービス MySQL, Rails, Redshift, Elasticsearch, Kibana, EMR, Spark, Firebase, Kissmetrics, JIRA

2017-04-26 20:10:56
ariarijp / Takuya Arita @ariarijp

#データ分析基盤Night でfreeeさんの分析基盤の話聞いてる。面白そう

2017-04-26 20:12:08
this is matsuu speaking @matsuu

#データ分析基盤Night freeeで利用しているクラウドサービス(一部) Marketo, salesforce, zendesk, zuora, LiveChat, New Relic, bugsnag, mackerel, Google Analytics, JIRA

2017-04-26 20:14:02
Yoshiaki Itakura @ita_3y

事業内容的にセンシティブなデータ多くて管理に気を使いそうなイメージ。 #データ分析基盤Night

2017-04-26 20:15:56
this is matsuu speaking @matsuu

#データ分析基盤Night re:dashの導入でデータ利用が加速した。が、ダッシュボード多すぎ問題とクソクエリー再利用されまくり問題。re:dash警察が活躍してクソクエリーを潰してまわってる。

2017-04-26 20:18:29
ゆべし @yubessy

re:dash警察、エクセル管理の営業台帳、あるあるだ... #データ分析基盤Night

2017-04-26 20:20:27
this is matsuu speaking @matsuu

#データ分析基盤Night freee 分析基盤のつらみ Salesforce/marketoとの連携がつらい。Rate LimitなどのAPICAL制限がきつい。外部サービス故にbulk apiで取得する際のIOPSに気をつける必要がある

2017-04-26 20:20:34
this is matsuu speaking @matsuu

#データ分析基盤Night Redshiftのチューニングは結構コツが必要。Redshift SpectrumがTokyoリージョンに早く来て欲しい

2017-04-26 20:21:19
prototechno @prototechno

freeeさん AI Labに優秀な人材がいる! 😻 #データ分析基盤Night

2017-04-26 20:22:20
ゆべし @yubessy

Redshift Spectrumすごい便利そうだけどクエリ課金なのでBigQueryと同じ怖さある #データ分析基盤Night

2017-04-26 20:23:00
this is matsuu speaking @matsuu

#データ分析基盤Night メルカリのデータ分析基盤 アプリからfluentdで集約サーバに、そこからbatchサーバ→BigQueryや、NorikraからmackerelとSlackへ

2017-04-26 20:34:34
this is matsuu speaking @matsuu

#データ分析基盤Night メルカリ、BigQueryへはバッチで流し込み。GCSやS3にバックアップを保存。BigQueryには定額プランがあってクエリの料金を気にしなくていいようにしてる。ただしスロットは有限なのでクエリを投げすぎると大幅に遅延。

2017-04-26 20:36:46
アルフォートおじさん @joker1007

メルカリ、Bigqueryの定額プランを利用って、弊社と経済規模が違い過ぎるぞ……。 #データ分析基盤Night

2017-04-26 20:37:50
this is matsuu speaking @matsuu

#データ分析基盤Night メルカリ、ダッシュボードにはChartioを利用。 BigQueryからデータをGoogle Spread Sheetへダウンロードして集計、グラフ化。Excel形式は慣れている人が多いので、非エンジニアとの共有が捗る。

2017-04-26 20:38:40
this is matsuu speaking @matsuu

#データ分析基盤Night メルカリ、イベント収集はcookpad/puree-(ios|android)からOpenRestyを経由、fluent-agent-hydraでfluentdを経由してBigQueryに。

2017-04-26 20:44:09
prototechno @prototechno

#データ分析基盤Night / “モバイルアプリのログ収集ライブラリ「Puree」をリリースしました - クックパッド開発者ブログ” htn.to/YNDMmfZrUd

2017-04-26 20:44:59
アルフォートおじさん @joker1007

イベントログ分析基盤の名前がPascalなのはややこしいから止めるべきだったなw #データ分析基盤Night

2017-04-26 20:45:42
this is matsuu speaking @matsuu

#データ分析基盤Night A/Bテストは数十件単位で同時進行。A/Bテストの副産物として段階的リリースができるようになった。feature flag driven developmentだ。A/Bテストの結果分析はBigQuery。

2017-04-26 20:48:33
this is matsuu speaking @matsuu

#データ分析基盤Night 機械学習を元にした分析基盤、メモれませんでした。ごめん

2017-04-26 20:49:25
prototechno @prototechno

ユーザー体験。。。の質問しました。ここが一番難しいと思うのです #データ分析基盤Night

2017-04-26 20:53:15
あきら @akr_tk

#データ分析基盤Night azkabanなりrundeckなりairflowなり使ってるのかと思いきや皆さんcronなんですね

2017-04-26 21:00:00
prototechno @prototechno

基盤エンジニアの方々なので、どうデーター分析してるか?の話しは聴けないのね #データ分析基盤Night

2017-04-26 21:01:23