- understeer
- 3076
- 0
- 5
- 3
「データ分析とは?」という本質的なことについて説明。重要ですねー #gumistudy ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 19:18:07データマイニングの2つのアプローチ。1.砂漠から砂金を探す。2.金鉱から探す。 ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 19:19:26鉱山を掘りたいですねー #gumistudy ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 19:20:07Gabege in gabage out ゴミのようなデータを使っていくら解析しても出てくるのはゴミばかり #ptevent
2011-10-24 19:21:11Inputがゴミなら、Outputもゴミ。S/N比が低いですからね。 #gumistudy ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 18:31:51"Gabage in gabage out". ゴミのようなデータを扱っても、往々にして出てくるものはゴミばかりになるとのこと。広大な砂漠から探すのではなく、金鉱から金を掘り出す。costとbenefitを考える。 #ptEvent #gumistudy
2011-10-24 19:23:29Apacheのログはユーザ行動分析に使えるログではなく、画像やCSS情報などノイズになる情報が圧倒的に多い。ユーザ情報を得るのに、膨大な量のログを裁かなくてはいけない。非効率 #ptEvent #gumistudy
2011-10-24 19:25:26"Strategic Logging":きちんとプランニングした上で、分析に使えるデータを生成・収集できるように実装する。 #ptEvent #gumistudy
2011-10-24 19:27:51Strategic Logging 重要ですな。無計画なログはゴミ。#gumistudy ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 19:29:59テクノロジーを使って処理をするのも大事だけど、そもそもの目的を明確にすることがもっと重要。 #gumistudy ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 19:30:55ログ分析後に出た結果は、ただの数字の羅列のままではなく、「誰が見ても分かる」ように作成することが大事。 #ptevent #gumistudy
2011-10-24 19:31:10#ptevent 「エンジニアカフェ×gumiStudy #9」なう。データ解析はソーシャルサービスの要!
2011-10-24 19:31:21NoSQLにも色いろあるよ、というお話。 #gumistudy ( #ptEvent live at http://t.co/eS1lFUoy)
2011-10-24 19:32:21