エンジニアサポート新年会2013 CROSS A会場 第1セッション 『今日から始まるデータサイエンティスト』 #cross2013 #cross2013a
クリーニングが8割って、低い印象が。下手すると9割オーバーな。濱田さんのように、問題設定から絡めると、随分楽で、分析に集中出来そうでいいなぁ、とか。 #cross2013a
2013-01-18 14:31:29戦略的にデータを解析するためには,戦略的にデータを取得することが必要.#CROSS2013 #CROSS2013a
2013-01-18 14:32:12より具体的な分析実務の中身に興味お持ちの方は、DeNA濱田さんのスライドがオススメですよ。個人的に、とても参考にさせていただきました。 http://t.co/6XVNyGNI #CROSS2013A
2013-01-18 14:32:38データ分析には目的設定とアウトプットの認識擦り合わせが大事。今朝社内セミナーで話して来たのと同じ。。。#cross2013a
2013-01-18 14:38:59ツール使ってデータマイニングアルゴリズムにかけても、知識不足で結果の解釈が難しい・・・ぐぬぬ #cross2013a
2013-01-18 14:44:46精度に着目するとアルゴリズム自体より、設定、設計やチューニングの方が差がでる。ただ、目的に沿ったアルゴリズム選定も重要ですね。#cross2013a
2013-01-18 14:47:55まとめると、占いや勘まかせよりもっとロジカルな手法で出した確率と見込んでいる費用を秤にかけて、見あってるか確認や意思決定するために根拠を意思決定者に提供するお仕事。だから意思決定者の近くじゃないと機能させにくいって事ですね #CROSS2013A
2013-01-18 14:51:56データを操るスキルセットをもった人たちが行っているという業界で、そのスキルセットは果たして現実に活かされているのかが大きな問題だと思うんですが。 #cross2013a
2013-01-18 14:55:36多くの人々に解析の結果を届けやすいから解析の人がソーシャルに集まるというのは確かに納得。さっきの「データの結果を見れば見るほどデータサイエンティストとしての能力が上がる」という話とも繋がる。 #cross #cross2013a
2013-01-18 14:55:41前処理→解析→解釈という流れで、機械的にできるのは真ん中だけでその前後はコンサル的な力が必要みたいな話ですが、例えば画像処理の文脈だと特徴量から学習させるDeepLearningみたいなのが流行りっぽいけどビジネス領域だとそういう話にはならないんですかね。 #cross2013a
2013-01-18 14:56:13