「確率変数」の定義に関するおはなし

@kenmatsu4が夜中にもかかわらず、もやもやしていた「確率変数」の定義に対して @oshokawa さんと @teramonagi さん、さらには @ibaibabaibai 先生にアドバイスをもらうという、稀に見る貴重なツイート群をまとめました。
3
まつけん @Kenmatsu4

@oshokawa @teramonagi 自分は数学をプログラムと思って理解するクセがあるので、そこにはまってしまった感じですね。とても良い勉強になりました!

2015-11-18 12:38:21
まつけん @Kenmatsu4

@oshokawa @teramonagi 同じ関数でも、プログラムの場合な内部に偶然性(擬似乱数による)を持たせることができますからね。それこそセンサーの入力を使った戻り値の関数だと擬似でもない乱数になる可能性もあり、数学と違うところですね。

2015-11-18 12:39:31
テラモナギ @teramonagi

@Kenmatsu4 数学はだいたい集合と写像に別名つけてつらつら論じてる感がありまして、特に確率の話はそう強く感じます。なので、何(集合)がどうなる(写像される)のかを意識すればよいかなと!

2015-11-18 16:35:53
baibai @ibaibabaibai

確率変数X(ω)は,一様乱数生成ルーチンの出力する値ωを引数にとるサブルーチンだと思えばいいのでは.それ単体では「ランダムに変動」しないけど,ωに「乱数とみなせる数列」を代入するとランダムな振る舞いをする twitter.com/Kenmatsu4/stat…

2015-11-19 11:59:22
まつけん @Kenmatsu4

Togetterデビューしてみました! 「確率変数」の定義に関するおはなし - Togetterまとめ togetter.com/li/901999 @togetter_jpさんから

2015-11-19 00:49:13
baibai @ibaibabaibai

@ibaibabaibai もともと数学の確率論には「ランダムに変動するモノ」なんてないんです.「もし一様乱数ωという謎のものが天から降ってきたら,ランダムな変動がおきて,その結果はこうなります」って話だと思えばいい.その「もし」をうまく表現したのが確率変数X(ω)という概念.

2015-11-19 12:03:12
baibai @ibaibabaibai

@ibaibabaibai 正確にいえばωは確率測度が定義されている集合ならなんでもいい.なので,ωの測度のほうに面白みがあって,X(ω)はωの特徴量みたいなものだという場合もある.しかし,多くの例ではX(ω)のωの分布は一様分布などで,本体は「変換プログラム」Xのほうなのね

2015-11-19 12:06:26
baibai @ibaibabaibai

@ibaibabaibai 「攻殻機動隊」でいえば,Xというのが義体でωというのがゴーストなわけ,ゴーストinシエルの確率論.

2015-11-19 12:08:40
baibai @ibaibabaibai

@ibaibabaibai というような説明がしてある確率の入門書をいま書いてるので,買ってね.

2015-11-19 12:09:41
baibai @ibaibabaibai

@ibaibabaibai 「ωは確率測度が定義されている集合」→「ωは確率測度が定義されている集合の元」 例のやばい本の説明になっちゃったw

2015-11-19 12:11:41
まつけん @Kenmatsu4

@ibaibabaibai 一連のツイート拝見して、非常に理解が進みました!ωの列がすでに乱数列と見れば良いのですね!確率変数側はそれを淡々と処理して行くと。ありがとうございます!

2015-11-19 12:18:28
baibai @ibaibabaibai

@Kenmatsu4 それで「乱数をどうやってつくるのか」は通常は数学の確率論ではブラックボックスであると.逆にそこだけ未知にしておけば,あとは数学的に証明できるわけですね.「Xは理想的な乱数列を供給すればこういう結果を出すはずのサブルーチンである」みたいに.

2015-11-19 12:22:15
まつけん @Kenmatsu4

@ibaibabaibai 乱数生成(「元」の選択)したデータ列が完全に数学の世界の中で作られていると思っていたので、そこが誤解ポイントでした。ωの測度で不確実性を表現しているが、測度自体は確定しているので、実は数学の世界に不確実性はないのですね。

2015-11-19 12:29:50
baibai @ibaibabaibai

@Kenmatsu4 「不確実性」ということばの意味によるとも思いますが・・

2015-11-19 12:34:34
baibai @ibaibabaibai

@Kenmatsu4 数学の中には「実現値」ってないんですよね.日常用語でいう意味の「ランダム」とか「サンプル」もない.確率の公理自体は「全体の面積が1のときの部分集合の面積」とかそういうのでも満たすわけで確率の値が「不確かさ」だっていうのもかなりの部分解釈の問題だともいえます.

2015-11-19 12:38:16
まつけん @Kenmatsu4

@ibaibabaibai 日常用語と数学の世界を混ぜると良くないということですね。つまり、確率測度が定義されている集合の元ωに対して、x=X(ω)で対応した実数値があるだけで、「実現値」も数学の外の解釈でしかない、確率測度もただの[0,1]の数値でしかない、ということですね。

2015-11-19 12:50:27
baibai @ibaibabaibai

@Kenmatsu4 うるさくいえば「円」や「円の面積」だって同じかもしれませんが,確率ということになると色々誤解しやすいので,特にそういう風に心がけるのが良いように思います.「大数の法則」が実際は何を言ってるのかだって,きちんと考えると自明じゃないと思います.

2015-11-19 13:01:41
まつけん @Kenmatsu4

標本空間の元ひとつひとつに等確率を割り当てる、つまり一様分布する。ここが自分の感覚的にはキモ。確率変数はその元のまとまりをどのように作るかのルール(例えば1という実数に対応する元はこれとこれ、みたいな)と理解した。これで部分集合ができるのでp()で[0,1]の実数に割り当てられる

2015-11-19 23:55:02
まつけん @Kenmatsu4

数式の中で確率的な変動が生まれてると考えてたからおかしくて、それは外の世界にあると考える。

2015-11-20 00:05:20
まつけん @Kenmatsu4

その変動するデータの結果値を持っていて、それを表現するような確率変数(データのグルーピングの仕方)と確率密度関数(グループごとの割合の対応づけ方)を適切に決めてあげてそれに突っ込むと、データを適切に表現できる。ちょっと曖昧だけどこんな感じが今の理解。

2015-11-20 00:06:20
oshokawa @oshokawa

@Kenmatsu4 「標本空間の元一つ一つに等確率を割り当て」てる時点で、標本空間に対してそういう確率分布を仮定してしまっているのでは?

2015-11-20 07:52:31
まつけん @Kenmatsu4

@oshokawa 割りあてる、という表現がよくなかったかもですね。標本空間の中から元を一つ選ぶのだけど、ランダムサンプリングなので各元が取り出される確率が等しくて、でもそれは数式で表されている世界の前の話ということです。うーん、表現が難しい…(-᷅_-᷄๑)

2015-11-20 08:01:44
oshokawa @oshokawa

@Kenmatsu4 んー、というか、各元が取り出される確率が等しいかどうかを決めること自体が、とりもなおさずその標本空間に確率分布を定義することだと思います。

2015-11-20 08:07:57
まつけん @Kenmatsu4

@oshokawa 例えば「1, 2, 2, 3, 3, 3, 4, 4, 5」という標本空間があって、根元事象が9個、つまり元が9個。これはもう前提条件とするわけですね。ここから一つ目隠しして選ぶ、という試行があって、それを適切に表現する数式は?という問題設定なので、

2015-11-20 08:09:06
まつけん @Kenmatsu4

@oshokawa そこから先が数式て表現される世界になるという理解です。

2015-11-20 08:10:06
まつけん @Kenmatsu4

@oshokawa その部分は確率分布というよりは、ただのオペレーションというか、うーん…、 @oshokawa さんの言っていることはその通りなのですが、言いたいことがうまく言語化できないので少し考えさせてください( •᷄⌓•᷅ )

2015-11-20 08:13:26