フィギュアスケート【バイアス論文について】

フィギュアスケートのジャッジには自国バイアスが存在する事を統計から導き出したとされる論文について徒然なるままに書いてみましたー。
3
前へ 1 ・・ 3 4
゜えむ 🐼🍢🗼🍥駆け出しエンジニア⚙ @MOLP895

しかしバイアスが拡大したから2002年のように紐付けしたものに戻せという論理はおかしい。表に示されたようにバイアスは少なくとも論文発表時までは年々縮小されてきたわけで、これは新採点システム移行でのある種の混乱があったことを説明していない。

2014-01-24 10:44:31
゜えむ 🐼🍢🗼🍥駆け出しエンジニア⚙ @MOLP895

なので、この2年くらいで統計をとるとおそらくまったく別の論文になるんじゃなかろうかと思う。

2014-01-24 10:44:56
゜えむ 🐼🍢🗼🍥駆け出しエンジニア⚙ @MOLP895

私がこの論文に対して結論付けるとしたら、「片手落ち」の一言。バイアスが年々減少してきたことに対して言及してもアプローチがない。

2014-01-24 10:47:01
小高 あたる @ataru_kodaka

バイアス論文ちょっと読んでみましたが(主に IV result (cont) http://t.co/jASdNdzMmn

2014-05-10 00:43:58

バイアス論文ちょっと読んでみましたが(主に IV result と結果のtable)、多分尺度データを用いた重回帰分析をやってるんだと思います。自国ジャッジか否かがどのくらいスコアに影響を与えるのか(バイアス係数)を調べる:

ものすごく簡単にすると、

  スコア(s) = バイアス係数(b) x 自国ジャッジかどうか(j) + 選手・ラウンド固定値(a + n) + 誤差

とおいて回帰分析する。説明変数jは、その演技の時自国ジャッジがいれば1、いなければ0となります(ダミー変数)。

例えばある選手が自国ジャッジの時は(ObOで)5.0, 5.0, 5.0 なのに、自国ジャッジがいない時は 4.0, 4.0, 4.0 だとすると、バイアス係数は 1.0、固定値は4.0になりますね。他の選手についても、自国ジャッジがいれば4.0、いなければ3.0ならやっぱりバイアス係数は1.0になります。

選手・ラウンド固定値のおきかたですが、(推測ですが)同じくダミー変数を置いて重回帰させてるのかも。

c1: その演技が選手1のなら1、でなければ0
c2: その演技が選手2のなら1、でなければ0
....
r1: その演技がラウンド1のなら1、でなければ0
r2: その演技がラウンド2のなら1、でなければ0
....

とおいてあげて、選手・ラウンドに対して係数 a1, a2,,,,、n1, n2.....を置いてあげる:

  s = bj + a1c1+a2c2.......+ n1r1+n2r2+.....+ ε

その上で変数j, c1...r1...について重回帰すると、係数b, a1...., n1.... が得られます。bがバイアス係数、a_iが選手iについての係数、n_iがラウンドiについての係数になりますね。切片は0に固定してるかと。

Winter @Winter026

@ataru_kodaka 苦節ウン年、やっとバイアス値の出し方を説明してくださる偉人登場!!!感涙……しかーし。一読しただけじゃ、理解不能でございます。という事でがんばって読みこなしてどこがわからないのかを絞ってから質問攻撃するかもしれませんが、走って逃げないで下さいませ。

2014-05-11 02:34:57
小高 あたる @ataru_kodaka

@Winter026 ある程度統計の知識が必要かもですね。回帰分析の基本的なところを抑えるとよいかも。excelでも簡単なデータを置いて試せますし。

2014-05-11 02:45:07

【重回帰分析】以下すべてグロービスのMBA経営辞書より
ある変数の動きが、別のいくつかの変数の動きによって左右されているとき、その関係を具体的な数式で表すとどういう式になるかを導き出すの分析。
回帰分析は大きく単回帰分析と重回帰分析に分けられる。

重回帰分析では、変数yの動きを、2つの以上の変数x1、x2、・・・の動きで説明できないか検討する。すなわち、

y = a1x1 + a2x2 + ・・・ + b

という式を想定し、実際のデータから係数a1、a2、・・・、bを導こうと試みる。
このときyを被説明変数または従属変数、x1、x2・・・を説明変数と呼ぶ。

なお、一般には上記のように線形の式(一次関数)を想定するが、二次関数や指数関数を交える場合もある。

うまく実際のデータを説明できる変数と式が見つけられれば、将来の予測など、ビジネスにおいて大いに効果を発揮するが、実際にはある変数に影響を与える要素は無数にあり、またその影響の強弱は複雑に絡み合っているケースが多いため、的確に当てはまる式を導き出すのは容易ではない。

【回帰分析】
・回帰分析 regression analysis
・説明変数と目的変数の関係を回帰式で表し、目的変数が説明変数によってどの程度
説明できるかを定量的に分析することである。
・回帰式は、y=ax+b(x:説明変数、y:目的変数)で表される。
・目的変数とは予測や要因分析を行う変数のことで、説明変数とは目的変数に影響を
与えると考えられる変数のことである。
・回帰式を求めるのに変数a、切片bを推定する。推定には最小二乗法を用いる。最小
二乗法は、観察された各点(x,y)と回帰線上の各点(x,yi)との残差dの平方和が最小
となる直線を求める方法である。
・回帰分析は、予測・要因分析等に用いられる。例えば、過去の生産量と製造費用の
データから回帰式を求め、将来の生産量に対する製造費用の予測に活用される。この
場合、生産量(x)に対する製造費用(y)の過去のデータから回帰式を推定する。生産
量(x)1単位当りの製造費用(y)がどれ程増加するかを示す傾きaは変動費、切片bは
固定費となる。将来の生産量(x1)を回帰式に代入すると将来の製造費用(y1)が導
かれる。
・予測をする際には、回帰式の精度の良さの尺度となる決定係数(0〜1の値)が1に
近い(当てはまりが良い)のが望ましい。
・また回帰分析は、因果関係が想像される2つの変数の関係を調べるのに用いられる
が、''回帰式は、ある変数が増加(減少)すれば、もう一方の変数が増加(減少)する
という関係性を示しているだけで、変数間に因果関係が本当に存在するかは注意して
判断しなければならない。''

【説明変数と目的変数】
●説明変数
目的変数を説明する変数のこと。
「独立変数」とも呼びます。物事の原因ととらえることもできます。 下図のXにあたります。

●目的変数
予測したい変数のこと。
「従属変数」「外的基準」とも呼びます。物事の結果ととらえることもできます。 下図のYにあたります。

説明変数と目的変数
変数のイメージ
例えば、
①「身長・体重・年齢・摂取カロリー」などを説明変数とし 「血清コレステロール値」を目的変数とする
②「筋肉量・体脂肪率・身長」などを説明変数とし 「男であるか女であるか」を目的変数とする
②「白血球数の度合い(多いか少ないか) ・赤血球数の度合い(多いか少ないか)・年齢(幼年か青年か中年か)」などを説明変数とし 「ある病気の発症の有無」を目的変数とする
のような場合を指します。

【ダミー変数 dummy variable】

擬変数と訳されることもある。計量経済学では,生産量のような定量的に測定された値を示す〈実変数〉のほかに,大規模なストライキの有無や従業員の性別のような数量的に表現できない定性的,属性的なものを分析する必要がある。定性的,属性的な要因を計量経済モデルに取り入れる目的で作られた特別な変数がダミー変数で,通常0または1の値をとる。たとえば,戦時と平和時の消費関数を Ct=α1+β1Yt+εt ……戦時  Ct=α2+β2Yt+εt ……平和時 とする。

小高 あたる @ataru_kodaka

そういえば自国ジャッジの有無でt検定 してたんかな

2014-05-11 02:58:07
小高 あたる @ataru_kodaka

つか分散分析のしかたとか忘れた

2014-05-11 03:01:38

【t検定・分散分析】
http://www.geisya.or.jp/~mwm48961/statistics/bunsan1.htm

(I) 分散分析
 2つのグループの平均の差を比較する場合も含めて,複数個(2以上,3,4,5・・・)のグル-プの平均の差の検定は分散分析で行うことができる.
(したがって,実際上は分散分析ができれば以下に述べるt検定は不要となるが,分散分析は理屈が難しい・・・ただし何を求めているのかが分かっていれば,Excel上の操作は簡単.)
(II) t検定
 t検定は2つのグループの平均の差が偶然誤差の範囲内にあるかどうかを調べるものである.

小高 あたる @ataru_kodaka

つか回帰分析してんだから寄与率と残差見ればいいのか。うむ、忘れた。

2014-05-11 03:06:15
小高 あたる @ataru_kodaka

そもそも選手のスコアが正規分布にしたがう、って仮定も打倒なよかもよく分からんが。

2014-05-11 03:11:55

【寄与率】:coeffient of determination
http://www.weblio.jp/content/寄与率
モデルのデータへのあてはまり具合を示す指標であり, 最小二乗法などにおいて, そのデータの持つ全変動のうち, モデルをあてはめることによりその変動のどれくらい記述できるようになったかを示す量である. それは,全変動をR_t^2, モデルによって記述できなかった変動をR_e^2としたとき, 1- R_e^2/R_t^2で与えられる.

【残差】
http://web.kyoto-inet.or.jp/people/kenneth/ProbTheory/JPYResiduals.htm
残差(residuals)とは、観測値と予測値との差で、
残差 = 観測値 - 予測値
と定義される。

前へ 1 ・・ 3 4