NetaTaneMenu? >>>> モンティ・ホールのジレンマ >>>> いくらもらえる? − 確率を解釈する


叔父さんのお年玉

モンティ・ホールのジレンマで脇道として出てきた問題です。確率というのはどう解釈されるべきものなのかをめぐってとても面白い展開になり,勉強になりました。多少長くなったのでこちらに分家させることにしました。結論が出たような感じになってますが,もちろん更に議論していくことも歓迎です。


ところで,モンティの問題設定とは直接の関係はないのですが,似た設定の次のような議論が浮かんできます。

目隠しして振ったサイコロの目を 3 と予想して掛け金を払った。
予想が当たっている確率は 1/6 だ。
その後目隠しをとって見た。そしたら 3 が出ていた。
確率は1だ。

うーん,なんか変ですね。確率を教わった中学生が言いそうだ(大人もいうかな)。だけどこの考えに対してどう応じればいいのでしょうか。そもそも確率って何なんでしょうか?

モンティからさらに逸れるのか少し戻るのか,あるいは上の問題提起「みる前・みた後」も絡むのかわかりませんが,人から聞いていまだにすっきりしない次のような問題もあります。

おじさんが親戚の子どもを前に,お年玉袋を二つ並べて言った。
「一方のお年玉袋には他方のお年玉袋の2倍の金額のお金が入っ
ている。好きな方をあなたにあげるので,選びなさい。」
子どもが選んであけてみると,1000円入っていた。おじさんはまた言った。
「1度だけ,交換してもいい,というチャンスを与えよう。もちろん,
交換しなくてもいいよ。」
子どもは考えた。
「2つのお年玉袋のどちらを選ぶかは,まったく五分五分だった。
だから,取り替えたときに金額が2000円になるか,500円になるか
はまったく五分五分だろう。だったら,期待値を考えれば1250円に
なるから取り替えた方が得だ。」
横で見ていたこの子のお姉さんに,おじさんはまったく同じゲームを
仕掛けた。姉がお年玉袋を選んで開ける直前に,おじさんは言った。
「今度は,袋を開ける前に取りかえるチャンスを与えよう。どうするかい?」
姉は考えた。
「弟の考えたことは,1000円という金額には無関係だ。袋の中の金額をx円
としよう。取り替えたときの金額は,0.5x円か2x円かのどちらかで,
その可能性は五分五分のはずだ。だから期待値は1.25x円となり,取り替え
た方が得だ。」こういって,封筒を取り替えようと手を伸ばした。
が,そこでまた考えた。「上の論法が正しければ,一度取り替えようと決心
して,でもまだ封筒を開けていないときに,改めて考えてみれば,
また取り替えた方が得だということになる。そこでまた考えてみれば
取り替えた方が得になって・・・」
とうとう姉は2つのお年玉袋の間で身動きがとれなくなってしまった。
いったい上の考えのどこが悪かったのだろうか?

「選びなおし」が絡むところがモンティと少し似ているかな?でもモンティと違って,選んでから以後新たな情報は何も与えられていないので,そこで取り替えた方が得になるというのはいかにもおかしい。上の姉弟の議論が間違っているはずだが・・・。意地の悪いおじさんと考え深い子どもたちですが,だれかすっきり説明できる方がいたら教えてください。

脱線大いに歓迎です。ネタが長続きしますから(^^)。さて,このお年玉の問題は,おじさんが胴元なんですよねえ。だからおじさんの立場から考えるとどうってことはなくなります。おじさんは2通りの封筒しか用意してませんから,もって行かれる金額の期待値はそれらの平均です。ところが子供たちのほうはというと,結果的に3通りの金額を想定することになりますね。その妥当性はどうなんでしょうか。

そうですね。たとえばサイコロの場合なら,6通りの出方はいずれも起こり得ることで,結局3が出たとしても,結果がわかった後から振り返っても出る可能性のあった目は6通りだった,ただそのうち何がでるかは事前にわからなかっただけだ,ということになります。でも,上のお年玉の問題は,1000円を前にして500円,2000円と3通りを想定している。で,あとから両方あけて振り返ってみれば(あるいは胴元の視点から見れば)じつはそのうちの一つは最初から決して起こりえないものを考えに含めていたということになる。このあたりに問題がありそうなのですが,では,「この問題は設定が悪い」で済ませるのもひっかかる。現実に考えうる上のような状況を確率の言葉で表現するにはどういう方法をとればいいのでしょうか?(ところで上の問題,もうすこし無味乾燥な設定だったのを書きながら脚色したのが不徹底で,お年玉袋が途中から封筒になってますね。)

確率を考える上で最も重要なポイントは,当然のことながら,「確率とは何か?それはどう解釈したらいいのか?」ということです。これは多分総論としては異存のないことでしょう。ところが,このポイントが実はあいまいなままで進んでしまっているのではないでしょうか。じゃあ,ある事象が起きる確率というのは何でしょうか。

確率を考える前提と,その上で確率 pが与えられる状況は次のようなものです。

このとき p は何を意味するのでしょうか。それは

ということですね。このように,確率を頻度で解釈,表現することでより的確な理解や意味の伝達が可能になるという実践的な研究がアメリカでなされているようです。

つまり,確率や期待値を考える時には,何回もの試行が少なくとも思考実験として可能であるという状況が必要です。お年玉を出すおじさんにはそれは可能。子供たちにとってそれはどうなんでしょう。

たとえば,おじさん役がランダムに2つの封筒にx円と2x円を入れ,子ども役がコインを投げて一方の封筒を選んでから両方の封筒を開き金額を調べる,という実験を繰り返す。たくさんの実験結果の中で,選んだ封筒の中の金額が1000円であったケースだけを拾い出し,そのときの他方の封筒の中身が2000円の場合と500円の場合の頻度を調べる,という実験は考えられないでしょうか。おじさんが「ランダム」に封筒に入れる額を決める,とはどういう状態かな。おじさんの選ぶ金額の対(x,2x)は,少ない方の額を定めたら自動的に多い方の額は決まるから,xで代表させて,根元事象の全体は{(x,a)|xは自然数,aは表or裏}かしら。無限離散集合上の確率?各根元事象が正の等確率を持つとすると全事象の確率が無限大に発散する。xの上限を定めておいて,あとから大きくして極限をとるのかな。なんてことを考えていつも放り出すのです。何か迷路にはまり込んでるのかも。

単純に次のように考えたらいいのではないでしょうか?
2つのお年玉袋にはそれぞれx円,2x円が入っているとします。
姉がそれぞれのお年玉袋を選ぶ確率は1/2ずつですから
1.お年玉袋を変えなかった場合の期待値は x×1/2+2x×1/2=(3/2)x
2.お年玉袋を変えた場合
最終的にx円のお年玉袋を選ぶ確率は,最初に2x円のお年玉袋を選ぶ確率と等しいから1/2です。同様に,最終的に2x円のお年玉袋を選ぶ確率は1/2です。 ですから,この場合の期待値は x×1/2+2x×1/2=(3/2)x
1.2.から結局お年玉袋を変えても変えなくても期待値は同じ。
直感的に言うと,おじさんに変えてもいいよと言われても,それだけでは,姉が選んだのが金額の多い方なのか少ない方なのか分からないので確率にはなんら影響しないということではないでしょうか?
もっとも,おじさんが意地悪か,いい人かで変化するかもしれませんが...
弟のときと結果が異なるのは,弟のときは片一方が500円のときはx=500で,片一方が2000円のときはx=1000というふうにxが変化するからではないでしょうか?
なんか,条件付き確率の問題みたいで,なかなか条件付き確率が理解できなかったことを思い出しました。

えーっと,「弟のときと結果が異なるのは,…」ということは,弟の主張は正しい,あるいは少なくとも弟のときと姉のときとでは状況が異なるということでしょうか?私は,両者は同じ議論に乗るはずで,姉の主張が間違っているのはもちろん,弟の議論も間違っているように思うのです。姉が考えていることは,まだお年玉袋を開けてはいないけれども,「開けたとして,それがたとえば2000円だったにせよ,3000円だったにせよ,金額が明らかになったとき(その具体的な額には関わらず)その条件のもとで考えれば」,弟が考えたのと同じ議論によって取り替えた方が得になる,ということではないでしょうか。そしてそこから,開けてみたときにその額によらずにいつも取り替えた方が得ならば,開ける前に取り替えても同じだろう,と考えたのだと思うのです。「開けたとして」という前提なしに,2つの袋を前にしたその状態で,「一つを選んですぐ取り替える」のと「単に一つを選ぶ」のとで違いが出ないというのはご指摘の通りで,それが直感の示すところでもあり,だからこそ上の姉弟の議論がおかしいとおもうのですが,「ここがこう違うのだ」という間違いの構造を指摘できないのがもどかしい。知りたいのはそこのところなのですが。

弟の行動を外から見ると,最初に 2x のをとる確率と x のをとる確率はどちらも 1/2。それから交換すると前者からは x, 後者からは 2x となるわけで,交換前と交換後とでは期待値は変わらない。だから,弟にしても交換は無意味と思いますが,いかが。

更なる「突っ込み」を,家のマックでは相変わらず書き込めなくて悶々としていたものですから,とここまでは前置き。外から見るとではなくて,選んで開ける前に考えれば,でしょう。観察は事象に影響する,とは違うかもしれないけど,1,000円というのが分かった段階をスタートとすれば,全体の事象は変わってしまいますよね。違うかなあ。うーん。うーん。

弟にしろ姉にしろ,次のように考えているわけです。

2度目の金額は 1/2x である確率と 2x である確率がいずれも 1/2 だ。
交換後の期待値をそれにもとづいて計算すると得失が分かる。
  1. この考えの妥当性を吟味すべきだということになりそうです。そこが違うのではないか,未来に生起する事件についての確率を考えるのに,試行や事象の概念をきちんとしないといけないんじゃないか。と私は思うのです。つまり,この問題が立場の違いによって異なった結果になること自体がまずいわけですから。 ! この考えの妥当性を吟味すべきだということになりそうです。そこが違うのではないか,未来に生起する事件についての確率を考えるのに,こんなふうに試行や事象の概念を使うのがそもそもまちがいなんだ。と私は思います。・・・と書いたところで寝ます。

ええ,弟にしても交換は無意味で,枠囲みにしていただいた考えを吟味すべきだと思います。だんだんはっきりしてきました。弟の立場で,すでにお年玉袋を開いて1000円とわかったとしましょう。そこで交換してよいといわれたときに自分はどう行動するべきかを確率を用いて考えようとした。このとき,2つのお年玉袋を前にして自分がどちらを選ぶかはまったく半々の確率であった,というのもいいでしょう。問題は,「だから,他方の袋の中身が500円であるか2000円であるかも,それぞれ確率1/2だ」と考えたところにあるようです。もしおじさんが用意した金額が「500円,1000円」である可能性と「1000円,2000円」である可能性が等確率ならば,たしかに「袋を選ぶ確率が1/2であること」が「他方が500円である確率,2000円である確率がそれぞれ1/2」であることを意味しますが,これがおかしいですね。おじさんがいくら袋に入れるか,を,さいころを振るような等確率の仮定を置いて考える事に無理がある。「金額」としては理論的にはいくらでもおおきな値をとりうると考えると,けっして等確率にはなりえない(もし等確率ならば,総和が1になりえない)。現実の問題を数学モデルを作って考える際に確率分布は理論から導出されるものではなく経験にもとづいて仮定されるものであり,確率分布が与えられたところから以後が数学の問題となる,ということでしょうか。金額xに対して,おじさんがx円と2x円を用意する確率p(x)を与え,分布関数p(x)を定めて始めて損得を期待値で考えることができる,というのが正解のような気がしてきました。この分布関数p(x)の形は,たとえばお年玉として妥当な金額・おじさんがこれまで与えてきたお年玉の額,などの経験から仮定される。もし,袋を開いてみたときの金額がかなり高額なら,取り替えたら損する確率が高い。低額なら,取り替えたら得する可能性が高い。袋を選ぶ際の等確率性が,そこに入れられる金額の選ばれ方の確率分布と混同されてこの問題のしくみが見えにくくなっており,それが弟の間違った判断を引き出した原因だった。こんなところでしょうか?マルがもらえるかな?

数学的には大体そんなところで落ち着けるように思います。

少しだけ,突っ込みます。おじさんは「既に」中身の入った二つの封筒を目の前にして、という条件なのではないのでしょうか?というより、そう考えても考えなくても、大勢に影響はない?つまり、封筒の中身は「確定」しているわけです。ということは封筒の中身には「上限」も「下限」も必然的に存在しているわけですね。違うかな?高額であるとか(物理的に封筒には入らないとか、、、いや、紙幣とは限らないか?)低額である(硬貨が入ってるから膨らみ具合でわかる?)とかは、本当に関係あるのでしょうか?問題を元のレベルに戻してしまったかな?いや、そんなはずはないはずだけど。


しかし,またも混ぜっかえしなんですが,それでも男の子の立場に立って考えるとどうなるんだろう,と思いたくなりませんか?あるいは,自分自身が先の見えない選択を迫られたときのリスク判断をどう考えるか。

もっとゲットできる可能性がある。やってみよう!

という,しごくまともな判断に対してどう言ってあげます?


さてさて,議論が白熱してきましたねえ。ネット上を探すと,上限がどうとか分布がどうとか言う似たような話が散見できますね。中学生や高校生?いやいや,いつも念頭に置くのは小学生なんですけど,一般的な説明はできないものでしょうか。

どこかにも書いてありましたが,小学生向けの問題の場合,きっと上限なんてものは考えにはいれないはずです。もちろん無限もね。さて,おだてていただいたからというわけでもないのですが,やっぱりこの封筒の問題でも,封筒が3つなら,4つならというのを考えてみるべきですね。二つに固執すると話が余所へ行ってしまうような気がします。

確率分布を念頭においたら?ってことですね,ふむふむ。一発ヒントのむらいさんだな(^^)。次のような状況のちがいが頭に浮かびます。

あるサンプルを手にした。このサンプルはどのような母集団に属するのだろうか?
ある母集団からサンプルをひとつ取った。このサンプルは母集団のどこにあるのだろう?

そうですねえ。例えば、

 弟が選んだ封筒を開けると、1001円入ってた。

とすると、100%交換しますよね!っていう噺かも。それで、更に袋が3つで、x,2x,4xと入ってると言う設定なら、交換しても色々だなってことです。うーん。更に謎をかけただけかも。

こんなケースがあるとしても、姉の場合は交換することには意味がない?というか理由がない。当たり前ですよね。「理由が」ないんですから。うふふ。


この問題は2倍でしたが、設定をもっと極端にすると解りやすくておもしろいです。ちなみに私は100倍で話をしてみました。封筒を開ける前と開けた後で何が違うんだろうと、家内に話をしてみたら、欲が出てくるからじゃないと軽く流されてしまいましたが・・・


手の内を知っているおじさんの立場からではなく男の子の立場からどう対処すればよいか(問題の中での男の子の考えのどこがおかしいのか,どうすればいいのか)を確率の言葉で説明することが知りたかったことでした。

そこで,「あるサンプルを手にした。このサンプルはどのような母集団に属するのだろうか?」と,この母集団を推測することが,この問題のケースでは,「おじさんはいくらくらいのお年玉をくれそうだろうか。1000円未満の硬貨ってことはないだろう,1万円以上ってこともないよな。まあ,いずれにせよ1000円以上1万円未満で,3000円から5000円までくらいがいちばんありそうかな」などと経験を頼りに考えることに相当する。「どのような母集団か」を知ることは,すなわち「母集団の分布を知る」ことですね。

その推測をしたならば,次に,推測した分布の中で「1000円」がどのあたりの位置にあるかを考える。これが「ある母集団からサンプルをひとつ取った。このサンプルは母集団のどこにあるのだろう?」にあたる。今の例では,分布の範囲の下限あたりの金額だから,自分の推測した分布にもとづく限り,取り替えた方が得,という判断となる。もし,袋を開けたときの金額が1万円だったら,推測した分布の上限あたりの金額だから,取り替えたら損,となる。(緑さんがされたように100倍にして考えたら,もし1000円入っていたときに,「いくらなんでも10万円はないだろう←これ自体母集団分布の推測の一部」となって取り替えないでしょうね)。高額,低額というのは,この意味(自分の想定した分布の中で上限あたりを高額,下限あたりを低額)でした。

この「分布の推測」にあたる部分で,なにも情報が与えられていないときにとりあえず仮定しがちな「等確率の仮定」を知らず知らず採用してしまったのが男の子の推論の間違い。それでも金額としてあらかじめ有限個の候補だけに限定されているならば(現実に有効かどうかは別にして)矛盾をきたさない推論が進められるが,そのような限定が一切ない状態で(無数にある候補に対して)「等確率の仮定」を持ち込むと,矛盾が生じる。それが問題の姉のケース。いろいろつっこんでいただいたおかげで,自分の中では非常にすっきりしました。

この議論は,人生における決断の問題とか相場の引け際を判断するとか,そんなときのヒントになりそうですね。たとえば20歳の青年が,これから出会う女性のだれと結婚すべきか考えるなんてのにも。

僕には「弟が袋を交換するのは正しい判断」で、「姉が袋を交換するのは意味がない」という結論になりました。最後の発言をみると「男の子の推論の間違い」ということになっているようにみえますが、本当にそうでしょうか。いままでの議論はなぜか、弟の判断は間違っているはずだからなぜ間違っているかを発見しよう、という方向に進んでいるように思います。その根拠は、姉の場合は明らかに交換する必要がなく、弟の場合でも中身を知ったからといってその状況が変化するわけはない、というところにあるようです。しかし弟の場合はすでにひとつの情報を得たわけですから、それによって判断が変化するのはむしろ当然です。6つ前の発言に100倍してみた、というのが載っていましたが、まさにそうしてみましょう。すると1000円の袋を持っている状況から残りは10円か100,000円かどちらかです。他に何の情報もない以上、それらのどちらの確率が高いか判断するすべは全くない。この場合は同じ確率と考えて判断するというのが一般的です。皆さんならどうしますか。10円か100,000円かです。僕なら迷わず交換しますね。弟の計算した期待値通りです。最小の金額を x 円、倍率を n として、姉の場合に期待値を計算すると1/3*(n*x/2+n^2*x/2)+1/3*(x/2+n^2*x/2)+1/3*(x/2+n*x/2) となるだけです。袋を取り替えてもこの期待値の計算は変わりません。(あ)

それはそうなんですが,ここでの議論の大勢は「同じ確率と考えて判断するというのが一般的」だが数学的にどうかな?って事が焦点だったようです。私的には,1001円の場合はどうなの?ってことで,そこを「どちらの側にも」突っ込んでいただきたいな。

(あ)の発言者です。昨晩、僕の考えが浅かったと反省しています。ここでは、なぜ姉の場合と違う結論が出てくるのかが焦点なのに、僕の発言では姉の期待値の計算が間違っているようなので、発言自体が意味ないものになっているようです。レスポンスがなかったら発言の取り消しするつもりでしたが、ここでは「浅い考えの解答の見本」として置いておきます。どうも済みませんでした。

いえいえ,浅いなんてとんでもない。普通に考えるとどうなのかということが分かりやすく書いてあるので有難いです。それよりもやっぱり「1001円の場合に」突っ込んで・・・ってしつこい?


なかなか深まっても「しっくり」は来ないので,いつものようにググって見ました。どうやら

ベイズ理論(推測)

という,偏見を元にした(表現は過激だけど)確率論が断りなく混ざっているのですね。これは少々まずいかも。従来の確率論とベイズ推定とどちらがより現実的かってことになるんでしょね。うーん。うーん。


たしかにベイズ推定が知らないうちに混じってるので話が混乱してますよね.ベイズ推定の「ご使用上の注意」をよく読んでから使わないと…….でも従来の確率論とベイズ推定って対立する概念じゃないし,どちらがより現実的かって話でもないんですよう…….従来の確率論で解くことのできる問題,つまりベイズ決定則で答が出せるのならそれが一番なんです.理論的にもそれがベストですし.でもそれでは解けない問題,たとえば今みたいにおじさんの確率モデルが未知の場合なんかは手が出せない.それは推定問題という別のカテゴリになって,その中でベイズ推定法なんかが出てくるんです.普通の確率の問題(確率モデルは与えられていて既知の場合)と,確率モデルが未知で観測データを元に推定する問題をごっちゃにするとややこしいことになるんです.

まず何が確率変数で何がパラメータ(固定値)かはっきりさせた方がいいと思います.この場合の確率変数は,少年がどっちの封筒を選ぶかですよね.おじさんが封筒に入れた金額は固定だからパラメータ.しかも値は不明の未知パラメータ(未知だけど固定).少年がしようとしていたのは,一方の封筒が1000円だったという観測データを元に,未知パラメータを推定しようとしてたってことですね.そして少年は,封筒をランダムに選んだときの確率分布が [1000円,500円が確率1/2ずつ]もしくは [1000円,2000円が確率1/2ずつ] というどちらかだと推定したんですよね.つまり未知パラメータが2つのどちらかのケースに違いないと推定した.ここまではいいけど,この後で一足飛びに,2つの確率分布はそれぞれ1/2の確率で生じると考えてしまった.これってものすごいアクロバチックな論理の飛躍ですよね.だって確率分布が確率的に変わるんだもの!通常の確率変数とは根本的に違った発想してますよね?

うーん、うーん。おっしゃりたい事はなんとなく分かるんですが、、、もし、「ベイズ推定を使わないければならん」のだとすれば、小学生や中学生、もちろん高校生にもちゃんと話をするのは難しくなりますよね。はたしてそうだろうか?というあたりが、わかりません。もひとつは、確率分布と確率変数という言葉に振り回されてませんか?っていうのが素直な感想です。それはまあ私の不勉強と読解力の無さが原因ということにして、「アクロバチック」だという部分を中学生にもわかるように解説できないものでしょうか?

どうも、こんにちは.最初のパラドクスのままなら別にベイズ推定は使わなくていいんです.使わなくていいんだけど、上でみなさんが展開している議論はベイズ推定の話なんです.わざわざ話を難しくしてしまってます.だから「しっくりこない」んだと思いますよー.私は、いったんベイズ推定のことは忘れて、ともかく確率論の基本からちゃんと見直したほうがいいと思います.それなら中高生でもわかる説明ができますよ.

やはりそうですよね。少し安心しました。とはいえ完全には安心していませんけどね。その上で、でもどう話が流れるかが楽しみです。ベイズ推定の話も高校生になら興味を持ってもらえるかもしれないし。

えーん,まだなんか疑われているの……?安心できないだなんて……(T_T) それに「どう話が流れるかが楽しみです」って、え、ボクがやるの!?基本に立ち返って地道にやればちゃんとできますってばぁ

そうそう。疑ってますよん。うふふ。性分なモノでね。誰がやるか?ではなくて,誰でも良いから参加して茶々入れてねってことかも。


おじさん,おじさん,ケチなこと言わないで教えてよ!

誰?

お年玉で困ってしまったボクだよう

ああ,君だったのか.ゴメン,わたしは〆切に追われてて今はそのヒマがないんだ.勘弁してよ,お願いだから…….そうだ私の代わりに君の叔父さんに来てもらおう.もしもし.もーしもーし!

誰だね,私を呼ぶのは……

叔父さんのいじわるな問題わからないから教えてもらおうと思ったんだけど,忙しいから叔父さんに聞けって.ねえ,教えてよ

なんじゃ,あいつはこんなこともぱっと教えられないのか,困ったもんだ…….じゃあヒマを見て少しずつ話していこうかね

わーい

さて,どうやら確率がよくわかっていないみたいだから,復習から始めようかね.まずサイコロを振る話からしようか.

それならわかるよ.どの目も確率1/6だよ

その1/6ってのはどうやれば出るの?

だって目は6通りでしょう.どれも同じ程度に出やすいから……1/6さ

「同じ程度に出やすい」っていうのはどういう意味?

えーと,そうだ,サイコロを100回振って,どの目が何回出るか調べるんだった.たくさんたくさん振って,どの目も同じくらいの回数が出ればいいんだ

ま,そんなところかな.学校ではそう教えるだろうしな.今君が考えたのは,一人の君が100回振ったイメージだよな.たとえば10秒間隔に

そうだよ

その考え方でも良い場合が多いんだけど,今回はお年玉というとてもデリケートな問題を扱うので,もう少し正確なやり方を教えてあげよう.いいかい,一人の君が100回振るんじゃなくて,100人の君が全員いっせいに1回サイコロを振るんだ

えー!?でもボクは一人しかいないよ!

そうなんだ.だからパラレルワールドが100世界あって,それぞれの世界に君が一人ずついると考える

いきなりそんなありえない話をされてもなあ

まあもうちょっとお聞き.ためしにバーチャル・パラレルワールド・マシーンを持ってきたから.略してVPWMさ.数字を100にセットして……

わあ,小さな部屋が100個もある!そしてそれぞれにボクがいる!

さていいかい,この100個のパラレルワールドは何から何まで全部同じだ.だけど,サイコロを振ったときとコインを投げたときと,そしてルーレットを回したときだけそれぞれの世界で違う結果が起きる.それ以外の条件はみんな同じなんだ.

へええ

その3つは確率的に結果が異なるから,出た結果を確率変数と呼ぶんだ.本当はゲタも確率変数にして天気予報がしたかったんだけど,プログラムが難しくてこの3つしかできなかったんだけどね…….さて,それぞれのバーチャルパラレルワールド(VPW)の君にサイコロを振ってもらおうか.スタートボタンを押してくれるかい?

これ?あ,動いた動いた.

結果は?

えーと,1の目が出てるVPWと2の目が出てるVPWと……どれもだいたい16前後あるみたい.ばらついてはいるけれど,だいたい1/6だ.

そうだね.だからサイコロの目がそれぞれ出る確率は1/6というわけだね.VPWが増えれば精度が上がもっと上がるだろうね.それから,100個のパラレルワールドで出たサイコロの目の平均を取ってみようか

えっと……だいたい3.5になりますね,これも

そう,これが期待値の意味だね.パラレルワールドの平均を取るんだ

それはアンサンブル平均で,期待値とは違うぞー!

む?何か外野から声が?今はいいんだ,大数の法則があるから,VPWの数が増えれば期待値に等しくなるんだから

おじさん,なんか言った?

ああ,実は期待値を計算するには2つの方法があってね.学校で習ったと思うけれど,ΣxP(x) を計算する方法と,今みたいに (x1+x2+...+xn)/n で計算する方法とがあって,後者はアンサンブル平均って言うんだ.そしてアンサンブル平均は n→∞のときに期待値に収束する.

要は2つ計算方法があって,nが十分大きければ同じになるんだね

実はこのほかに時間平均というのもあってね.たとえば君が一人でサイコロ100回振ったときの平均は,実は時間平均ってことになるかな.時間平均は,必ずしも等しくなるとは限らない

でもここまでなら,ボクが一人で100回やったことと結果が同じだよ

そうだね.この場合は別にパラレルワールドじゃなくてもいいんだけどね.だけど違う場合もあるんだ.何かいい例はないかな……そうだ,あの花瓶を落としたら,どれくらいの確率で割れるか考えてみようか

えー,お母さんが怒るよ!

だからVPWMの中でやるのさ.

スタート……100個のVPWのうち,割れたのは23個ですよ

1/4弱ってとこだね.この実験は,一人で何回もできるかな?

できません.でも花瓶を100個買ってくれたらできるかな

じゃあ人間国宝が作った世界に1個しかない壺だったら?

それは絶対に実験できない!

もう一つ別の例だ.これはおじさんが作った特別仕掛けのサイコロでね.なんと1が出るたびに目の数がひとつずつ増えていく.最初は1〜6のサイコロだけど,もし1の目が出ると以降は2〜7のサイコロ,また1が出ると今度は3〜8……元に戻すにはこのリセットボタンを押せばいい.じゃあこのサイコロで,パラレルワールドの場合と,一人で何回も繰り返す場合を比べてみようか.結果は同じかい?

もちろん違いますよ!

時間平均とアンサンブル平均も一致しないよね.じゃあVPWと一人で何度もやった結果を同じにするにはどうしたらいい?

そのつどリセットボタンを押します

そうだね.花瓶なら,まったく同じものを買ってくることに相当するかな.人間国宝の壺みたいなケースは,1回しか試行ができないから,本当は確率を定義しても意味は薄いだろうね.それでもパラレルワールドみたいなのを頭の中で想定して形式的な確率を考えることはできるだろうけどね.つまり基本はパラレルワールドの方なんだ.だけど実際にはそんなことはできないから,一人で何回も試行をくりかえすことになる.だけど,そのためには条件が必ず同じになるようにして,他の試行の影響がないようにする.VPWとVPWの間がお互い無関係だったようにね.このことにさえ注意すれば,別にVPWマシーンは使わなくてもいい.注意すれば,だぞ

はーい

ここでエルゴード性の説明を入れたいよう.それとPWMの考え方を知っていれば確率過程がすんなりわかるんだよな.VPWごとに違う時系列を取るのが確率過程だって.それがわかっていないから,試行を何度も繰り返す話と確率過程とをごっちゃにする学生が出て来るんだよなあ,ぶつぶつ

次は条件付き確率かな.またVPWマシーンで,サイコロ100個振ってもらおうか……さて,偶数の目が出たのはいくつかな?

約50個です

じゃあその50個の中で,2の目はどれくらい出てる?

ええと,16個でしたから,約1/3です

そうだね.それを偶数の目が出たという条件付きで2の目が出る確率という.このあたりでそろそろ数式の表記法を教えないといけないな.まず最初に確率変数に名前をつける.サイコロの場合はXにしよう.Xは出た目の数を表すとする.こうしてサイコロ・コイン・ルーレットで決まる変数が確率変数.それと,確率変数に何かの関数をほどこした結果も確率変数さ.たとえばサイコロの目の4倍をYとすると,Yは,Y=4Xという関係を満たす確率変数になる.さてそれはさておき,1の目が出る確率は1/6というのを式で書くと Pr(X=1)=1/6 となる.

カッコの中と外に2つもイコールがあっておもしろいや

あと,Px(1)=1/6 と書いてもいい.それから条件付き確率は縦棒で区切って,Pr(X=2|X=偶数)=1/3のように書く.さて,ここで問題を出そう.サイコロの目は,ちょうど反対の目と足すと7になることは知っているね?では,X=4が出たとき,反対の目が3である確率は?

えーと,どこから考えるのかな……

まず反対の目を確率変数として名前をつける.まあYにしておこうか(さっきちょっとだけ使ったけれど)

つまり Pr(Y=4|X=3)を求めるわけですね.100個のパラレルワールドの中から,まずX=3を満たす世界だけを取り出すんですね……1/6の世界が残るな……そして残ったVPWのサイコロを全部ひっくり返すと……そうか,全部4だよな,当然だけど

そうだね.つまり Pr(Y=4|X=3)=1 ってわけだ.じゃあこの問題文はどう考える?

目隠しして振ったサイコロの目を 3 と予想して掛け金を払った。
予想が当たっている確率は 1/6 だ。
その後目隠しをとって見た。そしたら 3 が出ていた。
確率は1だ。

これもVPWで考えるんですね.100個のVPWでサイコロを振ると,約1/6の世界で3が出ました.だから3が出る確率は1/6ですね.Pr(X=3)=1/6 ですね.目隠しをそとって見たら 3 が出ていた,今度は X=3 という条件下での確率だから……

教えたとおりの手順でするんだよ

まずVPWのうちから,X=3を満たすVPWだけを残す.次に,残ったVPWの中からX=3を満たすVPWがいくつあるか数え,比を求める……おじさん,もちろん全部Xは3ですよ

そうだね.ちょうど「サイコロの反対の目が4」の場合と同じだね.じゃあ式にしたら?

Pr(X=3|X=3)=1.X=3という条件付きでX=3が生じる確率は1……そりゃそうだ!

この問題の場合,目隠しを取ってみたときの情報がもたらすことの意味を尋ねてるんだから,情報エントロピーの話はしなくていいのかい?

なんか外野がうるさいなあ,今はそこまでしないよ

でも……きっとこの問題出した人,3の目が出る確率じゃなくて,今目の前にあるサイコロが何の目が出ているかを知りたいんじゃないのかなあ,きっと

ああ,そうなんだろうね.でも,目隠しをして今目の前にあるサイコロは何の目?という問題と,パラレルワールドN個のうち1の目が出るのはいくつ?という問題は全然違うよね?

うん.こうやってみると全然違うね.でも確率とはどこか関係してきそうだけどな

そうなんだ,確率とはもちろん関係している.けれど,違うことをしているんだってことは知っておこう.それはいつか説明するよ.今のところ君はこう答えればいい.「ボクは確率と期待値の出し方は習いました.でも目の前で起きていることを当てる方法についてはまだ習っていませんのでわかりません」ってね.大事なのは,出された問題が自分の知識で解ける問題なのか,そうでない問題なのかを見分けることだよね.だからこそ,確率を求めるときは必ずパラレルワールドに戻ってするようにくどく言ってるんだ

なるほどやっかいなことは先送りにしようって腹かい.でもまあ,自分の習った知識が適用できる場面と適用できない場面の違いを見分けるのは大事だよな

まったくうるさい外野だ…….さていよいよお年玉の話をしよう.今,ここに封筒が2つある.1と2って書いているね.いいかい,1の封筒に1000円札を1枚,2の封筒に1000円札を2枚入れるよ.ここまでは確率的かい?

いいえ

じゃあ,ここまでは100個のVPWでも全部同じことが進行してるってわけだ.いいかい,100個のパラレルワールドにそれぞれ1人ずつ君がいる.おじさんも1人ずついる.そしてどのVPWでも,おじさんは1000円と2000円を封筒に入れた.いいかい?

いいよ

さあ,ここで君はコインを投げた.これは?

確率的です

じゃあ確率変数を割り振ってみて

ええと,じゃあXにします

オモテならX=1,ウラならX=2ということにしようか.それぞれの確率はどうなっている?

ええと1/2と1/2ですよ……おっと,ちゃんとやらないといけないんですよね.100個のVPWのうち,約半数がオモテ,残りの半数がウラですから,Pr(X=1)=1/2,Pr(X=2)=1/2です

そうだね.じゃあ,今度はXと同じ番号の封筒を選ぶことにしよう.つまりX=1(オモテ)なら1の封筒を,X=2(ウラ)なら2の封筒だ.それぞれ1000円と2000円だね.そこで,「選んだ封筒に入っている金額を確率変数Y,残った封筒に入っている金額を確率変数Z」としようか.YもZもVPWごとに違うから確率変数だね.もしなんだったら封筒の番号と金額を対応付ける関数 f(.) を考えて Y=f(X), Z=g(X) としてもいい.YとZの確率は?

本当はこれもいちいちVPWの数を数えるんですよね……でも同じです,Pr(Y=1000)=1/2, Pr(Y=2000)=1/2, Pr(Z=1000)=1/2, Pr(Z=2000)=1/2 です

じゃあ今度は,選んだ封筒を開けたとしよう……開けた封筒が1000円だったという状況を考える

条件付き確率ですね?じゃあY=1000を満たすVPWだけをピックアップするんですね.もちろん約半数の世界が残りました

そうそう,VPWの,つまり確率の操作方法に慣れてきたじゃないか.じゃあピックアップされた世界の中で,Zはどうなっている?

えっと,全部 Z=2000 です.だから Pr(Z=2000|X=1000)=1 ですね

オッケー,じゃあいよいよ本題だ.おじさんは今から1の封筒にα,2の封筒に2α円を入れる.αは内緒だ.だけどαは決まった額で,おじさんはちゃんと知っている.ここまでは確率的かい?

いいえ.だからVPW全部同じってことですよね

ここでさっきと同じようにコインを投げて,どちらか一方の封筒を選んでごらん

はい……VPWのうち,半数はα円の封筒を選び,残りの半数は2α円になりました

Pr(Y=α)=1/2, Pr(Y=2α)=1/2というわけだね.じゃあYとZの期待値を求めてみようか

えっと,何も考えずに教えられたとおりにしますよ!Yの期待値は1.5αです.Zの期待値も1.5αです

そうだね,どっちも1.5α円の期待値だね.君の姉さんは,本当はこれを計算すべきだったんだ.じゃあ今度は君のケースについて考えてみよう.封筒にお金を入れなおすよ.1の封筒には1000円を入れておこう.そして2の封筒にはβ円を入れておこう.ちなみにβは500か2000かどっちかだけど,それ以上は教えない.

じゃあさっきと同じようにパラレルワールドでやってみますよ.半数のボクは1000円の封筒を選び,残りの半数はβ円の封筒を選びました.だから Pr(Y=1000)=1/2, Pr(Y=β)=1/2, Pr(Z=1000)=1/2, Pr(Z=β)=1/2 です.

さて君が選んだ封筒には1000円入っていたとしよう.そして君はもう片方の封筒の期待値を計算しようとした.そうだね?

はい.じゃあやってみます.まずVPWのうち,Y=1000の世界だけをピックアップします……半数の世界が残りました.ここでZの値を調べてみるんですね.Zは全部β円です.だから Pr(Z=β|Y=1000)=1 です.期待値は……そうか,β円です

そう,ちゃんと計算できたね

教えられた手順を絶対に守って計算しただけですから.でも結局βがいくらかわかりませんでしたよ

そうさ,βは未知数で,しかもβを割り出すための方程式は手元にないよね.だから「期待値はβ円です.βの値はわかりません」というのが正解.それ以上はデータ不足だから計算しようがない

でも,βが500か2000のどちらかってことは知っていますよ

その情報も使うなら 「もう片方の封筒の金額の期待値はβ円です.β=500もしくは2000のどちらかです」.それで十分だ

βは500か2000かのどちらか1/2ずつの確率ってやっちゃだめなんですか?

その答は自分で考えてごらん.VPWの中に答はある

そうだ,VPWの世界の封筒を全部開けてみよう……あ,全部2000円だ.そりゃそうだ,βは確率変数じゃないもんな

最初におじさんが封筒にお金を入れたとき,それは確率的かどうか確認したよね.βは確率変数じゃない.どのVPWでも全部同じ値だよね.もしβが確率変数で500と2000のどちらかを1/2の確率でとるならば,VPWの半数は500円,残りは2000円になっていなきゃだめだよね.でもそうはなってないよね

そうか,確率変数じゃないのに,確率的に変わると思って勝手な計算をしていたんだ.それからもうひとつわかった.ボクは1000円札を見たとき「これは高い方を引いた確率が1/2,低い方を引いた確率が1/2」と考えていた.でもこれって,X=1000という条件付き確率を考えてるんだよね.VPMの中からX=1000のケースだけを抜き出してみたんだけど,必ず反対の封筒はβ円だから,1000円の封筒は確率1で高い方もしくは1000円の封筒は確率1で低い方のどっちかしかないんだね.仮にβ=2000なら,Pr(X=高い方|X=1000)=0 だし,逆にβ=500ならば Pr(X=高い方|X=1000)=1だもん.確率という点で言えば,どっちか一方でしかなかったんだね.ただボクはデータ不足でそれをどっちかに決めることができなかったってわけだね.

そう,そうなんだ.本当にこれは確率かな?と思ったら,必ずVPMに戻って,該当する世界の数を数えるんだ.そして未知数はαとかβとか適当に名前をつけて,そのまま計算すればいい.勝手に確率変数にしたりはしない.未知数の入った計算結果だって立派な答えさ.未知数を決めるための方程式がありませんっていう答もありなんだから

そうかあ……じゃあボクがやろうとしていたことはなんだったんだろう.もう一方の封筒の額が大きいか小さいか知りたいって思っちゃだめなのかなあ

それはもちろんかまわない.だけど,確率を求めたり,期待値を求めたりする問題とは少しだけ違う種類の問題になるってことなんだ.別の種類の問題なのに,勝手に確率の問題の解き方で計算しようとしたから変なことになったのさ.高校までの数学ならここでおしまい.ここから先の話は大学生になってからまたしてあげよう.じゃあね.


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS