第16回R勉強会@東京(Tokyo.R#15) まとめ
k-近傍法=k-NN (k-Nearest Neighbor) ( #TokyoR live at http://t.co/q5p6poE)
2011-08-27 14:21:04Class パッケージの knn() を使う ( #TokyoR live at http://t.co/q5p6poE)
2011-08-27 14:22:02データセット: Vehicle (mlbench パッケージ) ( #TokyoR live at http://t.co/q5p6poE)
2011-08-27 14:22:48SOM=自己組織化マップ(Self Organizing Map) ( #TokyoR live at http://t.co/q5p6poE)
2011-08-27 14:28:12参考:T.Kohonen, "Self-Organizing Maps", Springer (1995) ( #TokyoR live at http://t.co/q5p6poE)
2011-08-27 14:37:25逐次学習、安定しないのは当然で、最新のデータ、つまり後の方のデータ程分析結果に大きく利いてくるので、それを馴らす工夫が必要 #TokyoR
2011-08-27 14:40:02Q: LVQ を使うメリットは? A. オヌヌメできない ( #TokyoR live at http://t.co/q5p6poE)
2011-08-27 14:40:04LVQ、逐次学習なので、どんどんオンラインでデータが連続で入ってくる時に使う。Kmeansだとデータ入ってくる度、全データを計算し直す。 LVQならこれまでの計算結果と入ってきたデータを計算するだけで良い。 (一部訂正) #TokyoR
2011-08-27 14:47:28たしかに、LVQは使いどころが難しい。。。 RT @AntiBayes LVQ、逐次学習なので、どんどんオンラインでデータが連続で入ってくる時に使う。Kmeansだと全データ保持して一気に計算必要。LVQなら計算結果と入ってきたデータ食わせればいい #TokyoR
2011-08-27 14:48:34@AntiBayes @dichika ですね、言い忘れてました。LVQは本質的にはオンライン学習で答えが正しいモデルに収束していくべきもの、KNNはデータが増えると、計算量が増えていく。似ているけど、対応すべき問題はぜんぜん異なりますね。#TokyoR
2011-08-27 14:50:48本日の発表資料です。Rで学ぶデータサイエンス 5パターン認識 第8章 k-近傍法 第9章 学習ベクトル量子化 http://t.co/sopRbPD #TokyoR
2011-08-27 14:52:31今日の発表資料(Rデバッグあれこれ)変換中です。後で参考文献追加します。 http://j.mp/nLmbsw #TokyoR
2011-08-27 15:19:17