[まとめ] トレジャーデータ事例活用セミナー
-
doryokujin
- 7010
- 0
- 7
- 22
![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
RFM分析。アクセス情報、訪問頻度、購入額の2つを選択してテーブルとして閲覧。サンプル数が少ないとゼロが入ってしまい、正しい評価がしにくい場合があった #treasuredata
2014-06-12 17:34:26![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
たくさんお金を払ってくれるお客さん(ホエールユーザー)を分析したり。条件が違うセグメントのそれぞれに名前を付けてやる。たくさん来てくれるがお金を払ってくれない、頻繁にお金を払ってくれるセグメントなど。 #treasuredata
2014-06-12 17:36:24![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
頻繁にお金を払ってくれるセグメントのユーザー数の増減を見て、なぜ減ったのか、増やすにはどうするか?を考えたり。 #treasuredata
2014-06-12 17:36:58![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
あるセグメントに属するユーザーが買った商品を、同じセグメントに属する人に向けたレコメンデーションすることで購買率が上る可能性。 #treasuredata
2014-06-12 17:39:13![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
Q: インタラクションがある中でのセグメンテーションの決め方、どのくらいの期間で判断や意思決定していく時間軸はどうなのでしょう? #treasuredata
2014-06-12 17:41:10![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A: いきなり全部が見えることはなく、後から見えることもある。データの収集・分析をイテレーションすることで見えてくる。例えばテレマティクス。飛ばすデータから何ができるのか?まだ見えきれていない #treasuredata
2014-06-12 17:42:14![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A(続き): トライアンドエラーの分析。一度目のイテレーションでカタログ値では燃費を取ってみる。次のイテレーション。運転の荒い人、そうじゃない人で違いは?改めて確認。データが足りなかったら、データを出してもらう。そして分析。 #treasuredata
2014-06-12 17:43:52![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A(続き): 1ヶ月とか2週間とか(ごめんうろ覚え)、5回、10回、20回のイテレーション繰り返す。いろいろな指標を元に見てみる。そこからようやくゴールが見えてくる #treasuredata
2014-06-12 17:44:54![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A(続き): じゃあ、判断期間は?には答えがない。イテレーションが重要。サーバとかログサイズとかそんなの気にしない。そこはTDにおまかせ #treasuredata
2014-06-12 17:45:51![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
Q: 貯めるところ。データが混ざらないのか?どうやって保証しているの?物理的にサーバインスタンス分けてるの? #treasuredata
2014-06-12 17:46:39![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A: データをクラウド上に保存。アカウントごとにストレージが分かれているわけではない。ユーザーの個人情報などは上げるべきではない。クラウド上に上げて分析するデータとプライバシーデータは分けて考える #treasuredata
2014-06-12 17:48:36![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A: アドテク業界。外部にあるオーディエンスデータとプライベートデータを組み合わせて最適な広告を出せるような分析をしている例はある。 #treasuredata
2014-06-12 17:50:23![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A(続き): カーセンサー。データがオープンになっている。TDブログでも紹介。車の相場と言っても、ヤフオクのユーザーからユーザーのデータ。業者からユーザーへのデータなど。(うまくまとめられん) #treasuredata
2014-06-12 17:52:02![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
Q: 統合分析の例。何かしらのキーがあれば分析との話。キーはないけど、時系列での分析はサポートされてないのか? #treasuredata
2014-06-12 17:53:18![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
A: Hive のほか Pig エンジンを使えば機械学習が可能になる。LinkedIn は Pig で大規模データに対して機械学習している。Pig で機械学習をする UDF を TD でも提供。 #treasuredata
2014-06-12 17:55:59