[まとめ] トレジャーデータ事例活用セミナー

2014年06月13日に開催したトレジャーデータ事例活用セミナーのまとめです。詳細な内容をツイートして頂いた @suzuki さんに大変感謝しております。 資料公開中: トレジャーデータ事例集 1.「オンラインゲームソリューション」 - トレジャーデータ(Treasure Data)公式ブログ http://t.co/JZmNW4hf7F
5
前へ 1 ・・ 3 4 ・・ 7 次へ
suzuki @suzuki

RFM分析。アクセス情報、訪問頻度、購入額の2つを選択してテーブルとして閲覧。サンプル数が少ないとゼロが入ってしまい、正しい評価がしにくい場合があった #treasuredata

2014-06-12 17:34:26
suzuki @suzuki

ベースが大量になると、細かなセグメントでも数値が出てきて正しく分析しやすくなる #treasuredata

2014-06-12 17:34:53
suzuki @suzuki

たくさんお金を払ってくれるお客さん(ホエールユーザー)を分析したり。条件が違うセグメントのそれぞれに名前を付けてやる。たくさん来てくれるがお金を払ってくれない、頻繁にお金を払ってくれるセグメントなど。 #treasuredata

2014-06-12 17:36:24
suzuki @suzuki

頻繁にお金を払ってくれるセグメントのユーザー数の増減を見て、なぜ減ったのか、増やすにはどうするか?を考えたり。 #treasuredata

2014-06-12 17:36:58
suzuki @suzuki

各セグメントごとに分析する。 #treasuredata

2014-06-12 17:37:05
suzuki @suzuki

セグメントを活かしたリコメンデーション。 #treasuredata

2014-06-12 17:37:34
suzuki @suzuki

あるセグメントに属するユーザーが買った商品を、同じセグメントに属する人に向けたレコメンデーションすることで購買率が上る可能性。 #treasuredata

2014-06-12 17:39:13
suzuki @suzuki

Q: インタラクションがある中でのセグメンテーションの決め方、どのくらいの期間で判断や意思決定していく時間軸はどうなのでしょう? #treasuredata

2014-06-12 17:41:10
suzuki @suzuki

A: いきなり全部が見えることはなく、後から見えることもある。データの収集・分析をイテレーションすることで見えてくる。例えばテレマティクス。飛ばすデータから何ができるのか?まだ見えきれていない #treasuredata

2014-06-12 17:42:14
suzuki @suzuki

A(続き): トライアンドエラーの分析。一度目のイテレーションでカタログ値では燃費を取ってみる。次のイテレーション。運転の荒い人、そうじゃない人で違いは?改めて確認。データが足りなかったら、データを出してもらう。そして分析。 #treasuredata

2014-06-12 17:43:52
suzuki @suzuki

A(続き): 1ヶ月とか2週間とか(ごめんうろ覚え)、5回、10回、20回のイテレーション繰り返す。いろいろな指標を元に見てみる。そこからようやくゴールが見えてくる #treasuredata

2014-06-12 17:44:54
suzuki @suzuki

A(続き): じゃあ、判断期間は?には答えがない。イテレーションが重要。サーバとかログサイズとかそんなの気にしない。そこはTDにおまかせ #treasuredata

2014-06-12 17:45:51
suzuki @suzuki

Q: 貯めるところ。データが混ざらないのか?どうやって保証しているの?物理的にサーバインスタンス分けてるの? #treasuredata

2014-06-12 17:46:39
suzuki @suzuki

A: データをクラウド上に保存。アカウントごとにストレージが分かれているわけではない。ユーザーの個人情報などは上げるべきではない。クラウド上に上げて分析するデータとプライバシーデータは分けて考える #treasuredata

2014-06-12 17:48:36
suzuki @suzuki

Q: 広告データやポイントカードデータを統合した事例があるか? #treasuredata

2014-06-12 17:49:28
suzuki @suzuki

A: アドテク業界。外部にあるオーディエンスデータとプライベートデータを組み合わせて最適な広告を出せるような分析をしている例はある。 #treasuredata

2014-06-12 17:50:23
suzuki @suzuki

A(続き): カーセンサー。データがオープンになっている。TDブログでも紹介。車の相場と言っても、ヤフオクのユーザーからユーザーのデータ。業者からユーザーへのデータなど。(うまくまとめられん) #treasuredata

2014-06-12 17:52:02
suzuki @suzuki

Q: サードパーティデータの提供をしてもらえるのか? #treasuredata

2014-06-12 17:52:16
suzuki @suzuki

A: データ提供は今のところしていない。あくまでも分析基板の提供 #treasuredata

2014-06-12 17:52:46
suzuki @suzuki

Q: 統合分析の例。何かしらのキーがあれば分析との話。キーはないけど、時系列での分析はサポートされてないのか? #treasuredata

2014-06-12 17:53:18
suzuki @suzuki

A: データ分析を統合で行なうには、必ずキーがひつよう。 #treasuredata

2014-06-12 17:53:38
芝尾幸一郎 @shibacow

Treasuredataのセミナーに来ています。

2014-06-12 17:53:57
suzuki @suzuki

A: Hive のほか Pig エンジンを使えば機械学習が可能になる。LinkedIn は Pig で大規模データに対して機械学習している。Pig で機械学習をする UDF を TD でも提供。 #treasuredata

2014-06-12 17:55:59
前へ 1 ・・ 3 4 ・・ 7 次へ