NaITE #14「メトリクス解析(データ解析)の初歩 まとめ

長崎IT技術者会(NaITE)主催の勉強会のまとめです。
1
あさこ @acha_821

明日開催です!現在、補欠の方も、当日にはキャンセル何人か出ると思うので、是非足をお運びください🎵よろしくお願いします。 内容は、かなり簡単なものです。 NaITE #14「メトリクス解析(データ解析)の初歩」 nagasaki-it-engineers.connpass.com/event/31354/ #NaITE14

2016-05-28 14:14:16
t.matsuyama @takumat_

あぶねー余裕こきすぎてギリギリになってしまった #NaITE14

2016-05-29 14:05:57
ふじふじ @fuji_fuji_test

初めのセッションはデータ解析入門です。 #NaITE14

2016-05-29 14:11:45
ふじふじ @fuji_fuji_test

これか。統計学入門。amazon.co.jp統計学入門-基礎統計学-東京大学教養学部統計学教室/dp/4130420658 #NaITE14

2016-05-29 14:14:59
ふじふじ @fuji_fuji_test

デート本はとても良いです。データ指向のソフトウェア品質マネジメント。#NaITE14

2016-05-29 14:15:43
つのだ @imtnd

統計学入門の本持っている気がする。大学の時買ったけど、今どこに有るんだろ。。#NaITE14

2016-05-29 14:16:32
ふじふじ @fuji_fuji_test

目的が「データ分析」にならないように。大事です。#NaITE14

2016-05-29 14:21:20
ふじふじ @fuji_fuji_test

「母集団」の中の、ひとつの「標本」にすぎない。なんとも統計っぽくて素敵な表現。#NaITE14

2016-05-29 14:22:35
リリカル @mhlyc

組み合わせのメトリクスはデート本だと派生マトリクスと表現されていました。 #NaITE14

2016-05-29 14:25:57
リリカル @mhlyc

箱ひげ図:データの散らばりを表す。 回帰分析:独立変数と従属変数の間の関係を推定するための統計的手法。散布図と一緒に使われる。 #NaITE14

2016-05-29 14:28:23
リリカル @mhlyc

箱ひげ図を見ることで、集団を代表するデータの集まりを認識することができるのね。#NaITE14

2016-05-29 14:30:15
リリカル @mhlyc

箱ひげ図についてのサイト。高校数学でやるらしい… kou.benesse.co.jp/nigate/math/a1… #NaITE14

2016-05-29 14:30:53
ふじふじ @fuji_fuji_test

平均値は外れ値に大きく影響されるよね。一時期ゲームのレビューサイト見てた時に、平均点高いのにクソゲーじゃん!ということがあった。なので中央値も一緒に見るようにしていました。#NaITE14

2016-05-29 14:33:00
ふじふじ @fuji_fuji_test

??「あの人のルックスは第3四分位だよね〜」#NaITE14

2016-05-29 14:34:07
ふじふじ @fuji_fuji_test

はずれ値:箱ひげ図の両端から四分位範囲の1.5倍以上離れたデータ(データ指向のソフトウェア品質マネジメント)#NaITE14

2016-05-29 14:36:23
ふじふじ @fuji_fuji_test

分析するデータは、ばらつきの小さいデータが良い。#NaITE14

2016-05-29 14:36:29
ふじふじ @fuji_fuji_test

地味に余談のレベルが高い気がするんですが… #NaITE14

2016-05-29 14:37:06
ふじふじ @fuji_fuji_test

実力を上げるよりもまずはばらつきを小さくするというのは、そうなんだなーという印象。とにかく実力をあげよう!ってなりがちな気がする #NaITE14

2016-05-29 14:38:15
t.matsuyama @takumat_

プロジェクトごとの集計とかだと,平均とか標準偏差使うよりも4分位点とかのほうが実用的(正規分布を期待できないようなサンプルサイズ)ってことなのかな #NaITE14

2016-05-29 14:38:16
ふじふじ @fuji_fuji_test

回帰分析:メトリクス同士の関係性を求める #NaITE14

2016-05-29 14:38:46
t.matsuyama @takumat_

例えばRubyのLOCとCのLOCだったら重みが全然違う気がするんだけど,そのへんどう取り扱うのか,そのへんがノウハウなのかな? #NaITE14

2016-05-29 14:40:47