第3回「データ解析のための統計モデリング入門」 読書会まとめ

2
shuyo @shuyo

β3 が負になる事について本の中に考察ないのかな……定番の問題だからそこを知りたい人は多いと思うんだけど #みどりぼん

2014-06-10 20:28:30
tokada @tokada

p.61 図3.9のLM(線形モデル)とGLM(一般化線形モデル)の比較図はわかりやすい。GLMはポアソン分布を使うことによりyのばらつきが平均とともに増大している。 #みどりぼん

2014-06-10 20:31:42
tokada @tokada

openfootball github.com/openfootball/w… のデータを用いて、一試合のゴール数とFIFAランキングのポイント差の関係を統計モデル化。LMでは予測の仕方がおかしくなったが、GLMではよりあてはまりのよいモデルとなった。 #みどりぼん

2014-06-10 20:34:38
tokada @tokada

プロっぽい人による解説。後半の章では高度な分布を使うことになるけど、ポアソン分布でもこれくらいはできるよというのを示したのが3章。 #みどりぼん

2014-06-10 20:51:06
tokada @tokada

質問「最初に分布を選ぶときのやり方は?」→「経験と勘」 #みどりぼん

2014-06-10 20:54:06
tokada @tokada

いろいろな分布を知っていること。例えばポアソン分布はカウントに対するモデル。事故の数とか行列に並ぶ人の数とか。逆に上限がある場合だと二項分布。 #みどりぼん

2014-06-10 20:55:23
tokada @tokada

確率分布の選び方って、p.34の第2章2.6節にありますね。 #みどりぼん

2014-06-10 20:56:03
琵琶湖マッサージ @statsbeginner

正規線形の教科書で重回帰分析を習うときにでてくる多重共線性の話ですよね #みどりぼん

2014-06-10 21:01:00

LT 猫に教えてもらうルベーグ可測

tokada @tokada

@shuyo 氏によるLT。さっきの質疑応答でプロっぽい人だった #みどりぼん

2014-06-10 21:07:23
もっちぃ @tanimocchi

ルベーグ積分で、超分かり易い本といえば、これです つ amazon.co.jp/dp/4254114842 この著者の方の本は、この30講シリーズだけが分かり易いのでご注意を。念の為。 #みどりぼん

2014-06-10 21:16:17

ドキュメントのWebを泳ぐ。Rで始めるBADデータ・ダイビング!

tokada @tokada

Releniumを使うと、ブラウザを操作してゲットしたHTMLから、Rにデータを返すことができると。 #みどりぼん

2014-06-10 21:14:56
tokada @tokada

参考の発表資料>"ドキュメントのWebを泳ぐ。Rで始めるBADデータ・ダイビング!" nbviewer.ipython.org/gist/nezuQ/318… #みどりぼん

2014-06-10 21:16:00
tokada @tokada

この発表に入ってるコマンドでRをクローラーにしましょう。 nbviewer.ipython.org/gist/nezuQ/318… #みどりぼん

2014-06-10 21:18:56
tokada @tokada

Rでクローリング。FirefoxをR経由で自動操作する。 by @nezuq on @Qiita qiita.com/nezuq/items/55… #みどりぼん

2014-06-10 21:19:08
松浦 健太郎 @hankagosa

確率分布ならこの方のappletがパラメータもいじれて秀逸です。 homepage.stat.uiowa.edu/~mbognar/ #みどりぼん

2014-06-10 21:31:07
h_tee @h_tee

今日の「直感に反する結果」の件て、「体重の大きい女性ほど、背の高い男性と結婚している率が高い」という、例のアレだろうか?擬似相関。 #みどりぼん

2014-06-10 21:51:13
ZAORIKU, D.M @zaoriku0

なんか聞き覚えのある声と思ったら、やはりshuyo さんでござった。解説に安定感があっていいですね^^ #みどりぼん

2014-06-10 22:41:32