2022阪神の陽川選手の左右別打率が統計学の教材になる話

A選手のほうがB選手よりも打率がいいが、対左右別打率でいうと左も右もB選手のほうがいい。そんなことある?あるんです。実際に。2022年の日本プロ野球のデータでも。それでは見ていきましょう。(この記事は一度大きく編集されています。追記の部分です。)
31
もりふじ @疫学トーク @morifuji_eki

皆さんに問題です。 関野(仮)の打率は.254 田中(仮)の打率は.269 しかし 対左投手打率も 対右投手打率も 関野のほうが田中より上だった。 そんなことはあり得ますか?

2022-11-27 23:06:16
もりふじ @疫学トーク @morifuji_eki

(誤記のため再投稿) 投票ありがとうございます。 問題: 田中は 関野より打率が高いが、 対左打率も対右打率も 関野より低い。 そんなことある? 答えは 皆さんに最も選ばれた「閲覧用」 ではありません。 正解は 「あり得る」です。40%の方おめでとう。 今からその例を見せます。スレで。 twitter.com/morifuji_eki/s…

2022-11-29 00:10:16
もりふじ @疫学トーク @morifuji_eki

これが、 田中は関野より打率が高いが、 対左投手の打率も 対右投手の打率も 関野より低い の例です。 両方とも左が得意ですが、田中は左と対戦が多いため通算打率が高く、 関野は左との対戦が少ないため通算打率が低くなっています。 pic.twitter.com/ugnBfk9ON2

2022-11-29 00:13:05
拡大
もりふじ @疫学トーク @morifuji_eki

けど 「こんな極端な例、現実にあるわけないよねー」 って思いましたよね? ええ、私も思いましたよ。 そこで私は2022年の日本プロ野球のデータを眺めてみました。 そしたら、それっぽい例を発見したんです。 続く

2022-11-29 00:15:54
もりふじ @疫学トーク @morifuji_eki

ベイスターズ関根選手とジャイアンツ中田選手の 左右別成績比較。 関根選手 .333 / .224 通算.254 中田選手 .308 / .193 通算 .269 左右別だと関根選手が良さそう (2人の左右を逆にしてるのは許して…打席と同じ/逆の投手 という比較と考える) だが通算は中田選手のほうが打率がいい。 なぜ? pic.twitter.com/G0RyroovP7

2022-11-29 00:30:37
拡大
もりふじ @疫学トーク @morifuji_eki

よく見ると、 関根選手は得意な左投手との対戦が少なく、 中田選手は得意な右投手との対戦が多いことが分かります。 対戦は自チームの起用法、 そして相手チームの起用法によって決まります。 つまり打率には本人の左右の実力もさることながら、 采配や運などの要素が影響していることがわかります。

2022-11-29 00:35:27
もりふじ @疫学トーク @morifuji_eki

もちろん左右別の打率も 実際どんな投手に当たったかで成績は左右されるので、 これも実力だけの値ではないでしょう。 ただある程度の打席数があれば、 起用法や運の要素は薄くなり、 実力を反映しやすくなります。 だからこそ、 規定打席数に到達した選手のなかで首位打者を決めるんですね。

2022-11-29 00:42:02
もりふじ @疫学トーク @morifuji_eki

さて、今回は 「左右別打率と通算の打率で結果が逆になる」 という例を紹介しました。 この例のように 「全体と部分で結果が逆になる」ことを 疫学・統計学の用語で 「シンプソンのパラドックス」 と言います。 この詳しく面白い説明に関しては、以下の動画をご覧あれ。 youtu.be/1gKf_lX0-ek

2022-11-29 00:46:22
拡大
もりふじ @疫学トーク @morifuji_eki

ただ今回の関根選手と中田選手の例は、 やはり完璧とはいえません。 それは 関根選手の対右と中田選手の対左 関根選手の対左と中田選手の対右 を比較しているからです。 中田選手と左右の成績が逆の選手がいたらいいのですが、 データをみると、そんな選手はいそうにないことも言えます。 なぜ?

2022-11-29 00:57:39
もりふじ @疫学トーク @morifuji_eki

それは、 右投手のほうが左投手より多いからです。 中田選手の左右成績逆バージョンということは、 左投手との対戦のほうが2倍も多い選手が必要ですが、 これは今のNPBでは極端な起用をしない限り 実現は難しいと考えられます。 ということでプロ野球ファンの方に聞きたいのですが… 続く

2022-11-29 01:01:54
もりふじ @疫学トーク @morifuji_eki

プロ野球ファンの方に聞きたいのですが、 2022シーズンで、 対左投手に積極的に起用された選手はいませんか? その選手を軸にすれば、 シンプソンのパラドックスの例が発見できるかもしれない。

2022-11-29 01:03:48
もりふじ @疫学トーク @morifuji_eki

関根選手と中田選手の例はたまたま、 代打打席や安打が多い選手とかから辿って発見しました。 スクレイピングとかしてないです。 なのでまだ2022シーズンの2人の選手間に シンプソンのパラドックスの例が成立する可能性は あるかもしれないんです。 だから、左投手と多く対戦した選手求む。

2022-11-29 01:06:56
もりふじ @疫学トーク @morifuji_eki

ちなみにこの打率とシンプソンのパラドックスの話は、以下の本から学んだんです。 「入門 統計的因果推論」 朝倉書店さん(なんか前回リツイートしてくれたから今回も頼む!) amzn.asia/d/0DLrwmw

2022-11-29 01:24:45

追記

読者の報告により、ガチのシンプソンのパラドックスが次々発見される。

山田 隼哉@データスタジアム @ds_yamada_j

@morifuji_eki タイガース陽川選手を軸に、ベイスターズ伊藤選手、バファローズ若月選手などはいかがでしょうか。 baseball.yahoo.co.jp/npb/player/130… baseball.yahoo.co.jp/npb/player/800… baseball.yahoo.co.jp/npb/player/130…

2022-11-29 02:45:24
林 伯文 @borshch77

横浜の藤田が対右34打数8安打で.235、対左2打数1安打で.500、通算.250で陽川の通算.294よりも低いけど、対右、対左はどちらも上回っている。面白いな。 togetter.com/li/1979661#c11… 「YB関根選手とG中田選手の対左右別打率が統計学の教材になりかねない話」togetter.com/li/1979661 にコメントしました。

2022-11-29 12:03:00
もりふじ @疫学トーク @morifuji_eki

【速報】 2022日本プロ野球界に「シンプソンのパラドックス」発見される。 twitter.com/ds_yamada_j/st…

2022-11-29 23:15:23
もりふじ @疫学トーク @morifuji_eki

本日11月29日、 全体の結果と部分の結果が逆になる「シンプソンのパラドックス」の関係が2022年の日本プロ野球の2人の選手の間で見られたことを報告いたします。@ds_yamada_j さんが発見してくれました。 陽川選手 対左 .357, 対右 .192, 通算 .294 若月選手 対左 .412, 対右 .248, 通算 .281 pic.twitter.com/YlsJrDVGVd

2022-11-29 23:23:56
拡大
もりふじ @疫学トーク @morifuji_eki

どうやら陽川選手は対左投手に強いことで知られており、 左投手の際によく起用されるのだそうだ。 その結果、得意な対左の打席が対右の打席を大幅に上回り、 通算打率も良くなっている。 一方若月選手はさらに対左の打率は良かったが、対右の打席のほうが多く、結果として陽川選手より打率が低かった。

2022-11-29 23:31:03
もりふじ @疫学トーク @morifuji_eki

なお、藤田選手も、若月選手と同じ立場に該当するようです!皆さんすごい発見。 やはり左とよく対戦する陽川選手が軸になってますね。 (ちなみ私は09年からの藤田選手ファンでタオルも持ってた。暗黒時代のなか、石川選手との二遊間を忘れない。) twitter.com/borshch77/stat…

2022-11-29 23:38:16