NetaTaneMenu? >>>> モンティ・ホールのジレンマ >>>> いくらもらえる? − 確率を解釈する+ ビリヤードのパズル >>>> 仮説検定---- >>>> 珈琲豆ブレンド検定

叔父さんのお年玉

モンティ・ホールのジレンマで脇道として出てきた問題です。確率というのはどう解釈されるべきものなのかをめぐってとても面白い展開になり,勉強になりました。多少長くなったのでこちらに分家させることにしました。結論が出たような感じになってますが,もちろん更に議論していくことも歓迎です。


ところで,モンティの問題設定とは直接の関係はないのですが,似た設定の次のような議論が浮かんできます。

目隠しして振ったサイコロの目を 3 と予想して掛け金を払った。
予想が当たっている確率は 1/6 だ。
その後目隠しをとって見た。そしたら 3 が出ていた。
確率は1だ。

うーん,なんか変ですね。確率を教わった中学生が言いそうだ(大人もいうかな)。だけどこの考えに対してどう応じればいいのでしょうか。そもそも確率って何なんでしょうか?

モンティからさらに逸れるのか少し戻るのか,あるいは上の問題提起「みる前・みた後」も絡むのかわかりませんが,人から聞いていまだにすっきりしない次のような問題もあります。

おじさんが親戚の子どもを前に,お年玉袋を二つ並べて言った。
「一方のお年玉袋には他方のお年玉袋の2倍の金額のお金が入っ
ている。好きな方をあなたにあげるので,選びなさい。」
子どもが選んであけてみると,1000円入っていた。おじさんはまた言った。
「1度だけ,交換してもいい,というチャンスを与えよう。もちろん,
交換しなくてもいいよ。」
子どもは考えた。
「2つのお年玉袋のどちらを選ぶかは,まったく五分五分だった。
だから,取り替えたときに金額が2000円になるか,500円になるか
はまったく五分五分だろう。だったら,期待値を考えれば1250円に
なるから取り替えた方が得だ。」
横で見ていたこの子のお姉さんに,おじさんはまったく同じゲームを
仕掛けた。姉がお年玉袋を選んで開ける直前に,おじさんは言った。
「今度は,袋を開ける前に取りかえるチャンスを与えよう。どうするかい?」
姉は考えた。
「弟の考えたことは,1000円という金額には無関係だ。袋の中の金額をx円
としよう。取り替えたときの金額は,0.5x円か2x円かのどちらかで,
その可能性は五分五分のはずだ。だから期待値は1.25x円となり,取り替え
た方が得だ。」こういって,封筒を取り替えようと手を伸ばした。
が,そこでまた考えた。「上の論法が正しければ,一度取り替えようと決心
して,でもまだ封筒を開けていないときに,改めて考えてみれば,
また取り替えた方が得だということになる。そこでまた考えてみれば
取り替えた方が得になって・・・」
とうとう姉は2つのお年玉袋の間で身動きがとれなくなってしまった。
いったい上の考えのどこが悪かったのだろうか?

「選びなおし」が絡むところがモンティと少し似ているかな?でもモンティと違って,選んでから以後新たな情報は何も与えられていないので,そこで取り替えた方が得になるというのはいかにもおかしい。上の姉弟の議論が間違っているはずだが・・・。意地の悪いおじさんと考え深い子どもたちですが,だれかすっきり説明できる方がいたら教えてください。

脱線大いに歓迎です。ネタが長続きしますから(^^)。さて,このお年玉の問題は,おじさんが胴元なんですよねえ。だからおじさんの立場から考えるとどうってことはなくなります。おじさんは2通りの封筒しか用意してませんから,もって行かれる金額の期待値はそれらの平均です。ところが子供たちのほうはというと,結果的に3通りの金額を想定することになりますね。その妥当性はどうなんでしょうか。

そうですね。たとえばサイコロの場合なら,6通りの出方はいずれも起こり得ることで,結局3が出たとしても,結果がわかった後から振り返っても出る可能性のあった目は6通りだった,ただそのうち何がでるかは事前にわからなかっただけだ,ということになります。でも,上のお年玉の問題は,1000円を前にして500円,2000円と3通りを想定している。で,あとから両方あけて振り返ってみれば(あるいは胴元の視点から見れば)じつはそのうちの一つは最初から決して起こりえないものを考えに含めていたということになる。このあたりに問題がありそうなのですが,では,「この問題は設定が悪い」で済ませるのもひっかかる。現実に考えうる上のような状況を確率の言葉で表現するにはどういう方法をとればいいのでしょうか?(ところで上の問題,もうすこし無味乾燥な設定だったのを書きながら脚色したのが不徹底で,お年玉袋が途中から封筒になってますね。)

確率を考える上で最も重要なポイントは,当然のことながら,「確率とは何か?それはどう解釈したらいいのか?」ということです。これは多分総論としては異存のないことでしょう。ところが,このポイントが実はあいまいなままで進んでしまっているのではないでしょうか。じゃあ,ある事象が起きる確率というのは何でしょうか。

確率を考える前提と,その上で確率 pが与えられる状況は次のようなものです。

  • 事象の集合{A,B,C,...}が与えられている。
  • 試行によって事象 A,B,C,... のうちいずれか1つだけが,必ず実現する。
  • このとき事象Aが実現する確率は pである。

このとき p は何を意味するのでしょうか。それは

  • 試行をN回行ったときに, A は平均して N p回実現する

ということですね。このように,確率を頻度で解釈,表現することでより的確な理解や意味の伝達が可能になるという実践的な研究がアメリカでなされているようです。

つまり,確率や期待値を考える時には,何回もの試行が少なくとも思考実験として可能であるという状況が必要です。お年玉を出すおじさんにはそれは可能。子供たちにとってそれはどうなんでしょう。

たとえば,おじさん役がランダムに2つの封筒にx円と2x円を入れ,子ども役がコインを投げて一方の封筒を選んでから両方の封筒を開き金額を調べる,という実験を繰り返す。たくさんの実験結果の中で,選んだ封筒の中の金額が1000円であったケースだけを拾い出し,そのときの他方の封筒の中身が2000円の場合と500円の場合の頻度を調べる,という実験は考えられないでしょうか。おじさんが「ランダム」に封筒に入れる額を決める,とはどういう状態かな。おじさんの選ぶ金額の対(x,2x)は,少ない方の額を定めたら自動的に多い方の額は決まるから,xで代表させて,根元事象の全体は{(x,a)|xは自然数,aは表or裏}かしら。無限離散集合上の確率?各根元事象が正の等確率を持つとすると全事象の確率が無限大に発散する。xの上限を定めておいて,あとから大きくして極限をとるのかな。なんてことを考えていつも放り出すのです。何か迷路にはまり込んでるのかも。

単純に次のように考えたらいいのではないでしょうか?
2つのお年玉袋にはそれぞれx円,2x円が入っているとします。
姉がそれぞれのお年玉袋を選ぶ確率は1/2ずつですから
1.お年玉袋を変えなかった場合の期待値は x×1/2+2x×1/2=(3/2)x
2.お年玉袋を変えた場合
最終的にx円のお年玉袋を選ぶ確率は,最初に2x円のお年玉袋を選ぶ確率と等しいから1/2です。同様に,最終的に2x円のお年玉袋を選ぶ確率は1/2です。 ですから,この場合の期待値は x×1/2+2x×1/2=(3/2)x
1.2.から結局お年玉袋を変えても変えなくても期待値は同じ。
直感的に言うと,おじさんに変えてもいいよと言われても,それだけでは,姉が選んだのが金額の多い方なのか少ない方なのか分からないので確率にはなんら影響しないということではないでしょうか?
もっとも,おじさんが意地悪か,いい人かで変化するかもしれませんが...
弟のときと結果が異なるのは,弟のときは片一方が500円のときはx=500で,片一方が2000円のときはx=1000というふうにxが変化するからではないでしょうか?
なんか,条件付き確率の問題みたいで,なかなか条件付き確率が理解できなかったことを思い出しました。

えーっと,「弟のときと結果が異なるのは,…」ということは,弟の主張は正しい,あるいは少なくとも弟のときと姉のときとでは状況が異なるということでしょうか?私は,両者は同じ議論に乗るはずで,姉の主張が間違っているのはもちろん,弟の議論も間違っているように思うのです。姉が考えていることは,まだお年玉袋を開けてはいないけれども,「開けたとして,それがたとえば2000円だったにせよ,3000円だったにせよ,金額が明らかになったとき(その具体的な額には関わらず)その条件のもとで考えれば」,弟が考えたのと同じ議論によって取り替えた方が得になる,ということではないでしょうか。そしてそこから,開けてみたときにその額によらずにいつも取り替えた方が得ならば,開ける前に取り替えても同じだろう,と考えたのだと思うのです。「開けたとして」という前提なしに,2つの袋を前にしたその状態で,「一つを選んですぐ取り替える」のと「単に一つを選ぶ」のとで違いが出ないというのはご指摘の通りで,それが直感の示すところでもあり,だからこそ上の姉弟の議論がおかしいとおもうのですが,「ここがこう違うのだ」という間違いの構造を指摘できないのがもどかしい。知りたいのはそこのところなのですが。

弟の行動を外から見ると,最初に 2x のをとる確率と x のをとる確率はどちらも 1/2。それから交換すると前者からは x, 後者からは 2x となるわけで,交換前と交換後とでは期待値は変わらない。だから,弟にしても交換は無意味と思いますが,いかが。

更なる「突っ込み」を,家のマックでは相変わらず書き込めなくて悶々としていたものですから,とここまでは前置き。外から見るとではなくて,選んで開ける前に考えれば,でしょう。観察は事象に影響する,とは違うかもしれないけど,1,000円というのが分かった段階をスタートとすれば,全体の事象は変わってしまいますよね。違うかなあ。うーん。うーん。

弟にしろ姉にしろ,次のように考えているわけです。

2度目の金額は 1/2x である確率と 2x である確率がいずれも 1/2 だ。
交換後の期待値をそれにもとづいて計算すると得失が分かる。
  1. この考えの妥当性を吟味すべきだということになりそうです。そこが違うのではないか,未来に生起する事件についての確率を考えるのに,試行や事象の概念をきちんとしないといけないんじゃないか。と私は思うのです。つまり,この問題が立場の違いによって異なった結果になること自体がまずいわけですから。 ! この考えの妥当性を吟味すべきだということになりそうです。そこが違うのではないか,未来に生起する事件についての確率を考えるのに,こんなふうに試行や事象の概念を使うのがそもそもまちがいなんだ。と私は思います。・・・と書いたところで寝ます。

ええ,弟にしても交換は無意味で,枠囲みにしていただいた考えを吟味すべきだと思います。だんだんはっきりしてきました。弟の立場で,すでにお年玉袋を開いて1000円とわかったとしましょう。そこで交換してよいといわれたときに自分はどう行動するべきかを確率を用いて考えようとした。このとき,2つのお年玉袋を前にして自分がどちらを選ぶかはまったく半々の確率であった,というのもいいでしょう。問題は,「だから,他方の袋の中身が500円であるか2000円であるかも,それぞれ確率1/2だ」と考えたところにあるようです。もしおじさんが用意した金額が「500円,1000円」である可能性と「1000円,2000円」である可能性が等確率ならば,たしかに「袋を選ぶ確率が1/2であること」が「他方が500円である確率,2000円である確率がそれぞれ1/2」であることを意味しますが,これがおかしいですね。おじさんがいくら袋に入れるか,を,さいころを振るような等確率の仮定を置いて考える事に無理がある。「金額」としては理論的にはいくらでもおおきな値をとりうると考えると,けっして等確率にはなりえない(もし等確率ならば,総和が1になりえない)。現実の問題を数学モデルを作って考える際に確率分布は理論から導出されるものではなく経験にもとづいて仮定されるものであり,確率分布が与えられたところから以後が数学の問題となる,ということでしょうか。金額xに対して,おじさんがx円と2x円を用意する確率p(x)を与え,分布関数p(x)を定めて始めて損得を期待値で考えることができる,というのが正解のような気がしてきました。この分布関数p(x)の形は,たとえばお年玉として妥当な金額・おじさんがこれまで与えてきたお年玉の額,などの経験から仮定される。もし,袋を開いてみたときの金額がかなり高額なら,取り替えたら損する確率が高い。低額なら,取り替えたら得する可能性が高い。袋を選ぶ際の等確率性が,そこに入れられる金額の選ばれ方の確率分布と混同されてこの問題のしくみが見えにくくなっており,それが弟の間違った判断を引き出した原因だった。こんなところでしょうか?マルがもらえるかな?

数学的には大体そんなところで落ち着けるように思います。

少しだけ,突っ込みます。おじさんは「既に」中身の入った二つの封筒を目の前にして、という条件なのではないのでしょうか?というより、そう考えても考えなくても、大勢に影響はない?つまり、封筒の中身は「確定」しているわけです。ということは封筒の中身には「上限」も「下限」も必然的に存在しているわけですね。違うかな?高額であるとか(物理的に封筒には入らないとか、、、いや、紙幣とは限らないか?)低額である(硬貨が入ってるから膨らみ具合でわかる?)とかは、本当に関係あるのでしょうか?問題を元のレベルに戻してしまったかな?いや、そんなはずはないはずだけど。


しかし,またも混ぜっかえしなんですが,それでも男の子の立場に立って考えるとどうなるんだろう,と思いたくなりませんか?あるいは,自分自身が先の見えない選択を迫られたときのリスク判断をどう考えるか。

もっとゲットできる可能性がある。やってみよう!

という,しごくまともな判断に対してどう言ってあげます?


さてさて,議論が白熱してきましたねえ。ネット上を探すと,上限がどうとか分布がどうとか言う似たような話が散見できますね。中学生や高校生?いやいや,いつも念頭に置くのは小学生なんですけど,一般的な説明はできないものでしょうか。

どこかにも書いてありましたが,小学生向けの問題の場合,きっと上限なんてものは考えにはいれないはずです。もちろん無限もね。さて,おだてていただいたからというわけでもないのですが,やっぱりこの封筒の問題でも,封筒が3つなら,4つならというのを考えてみるべきですね。二つに固執すると話が余所へ行ってしまうような気がします。

確率分布を念頭においたら?ってことですね,ふむふむ。一発ヒントのむらいさんだな(^^)。次のような状況のちがいが頭に浮かびます。

あるサンプルを手にした。このサンプルはどのような母集団に属するのだろうか?
ある母集団からサンプルをひとつ取った。このサンプルは母集団のどこにあるのだろう?

そうですねえ。例えば、

 弟が選んだ封筒を開けると、1001円入ってた。

とすると、100%交換しますよね!っていう噺かも。それで、更に袋が3つで、x,2x,4xと入ってると言う設定なら、交換しても色々だなってことです。うーん。更に謎をかけただけかも。

こんなケースがあるとしても、姉の場合は交換することには意味がない?というか理由がない。当たり前ですよね。「理由が」ないんですから。うふふ。


この問題は2倍でしたが、設定をもっと極端にすると解りやすくておもしろいです。ちなみに私は100倍で話をしてみました。封筒を開ける前と開けた後で何が違うんだろうと、家内に話をしてみたら、欲が出てくるからじゃないと軽く流されてしまいましたが・・・


手の内を知っているおじさんの立場からではなく男の子の立場からどう対処すればよいか(問題の中での男の子の考えのどこがおかしいのか,どうすればいいのか)を確率の言葉で説明することが知りたかったことでした。

そこで,「あるサンプルを手にした。このサンプルはどのような母集団に属するのだろうか?」と,この母集団を推測することが,この問題のケースでは,「おじさんはいくらくらいのお年玉をくれそうだろうか。1000円未満の硬貨ってことはないだろう,1万円以上ってこともないよな。まあ,いずれにせよ1000円以上1万円未満で,3000円から5000円までくらいがいちばんありそうかな」などと経験を頼りに考えることに相当する。「どのような母集団か」を知ることは,すなわち「母集団の分布を知る」ことですね。

その推測をしたならば,次に,推測した分布の中で「1000円」がどのあたりの位置にあるかを考える。これが「ある母集団からサンプルをひとつ取った。このサンプルは母集団のどこにあるのだろう?」にあたる。今の例では,分布の範囲の下限あたりの金額だから,自分の推測した分布にもとづく限り,取り替えた方が得,という判断となる。もし,袋を開けたときの金額が1万円だったら,推測した分布の上限あたりの金額だから,取り替えたら損,となる。(緑さんがされたように100倍にして考えたら,もし1000円入っていたときに,「いくらなんでも10万円はないだろう←これ自体母集団分布の推測の一部」となって取り替えないでしょうね)。高額,低額というのは,この意味(自分の想定した分布の中で上限あたりを高額,下限あたりを低額)でした。

この「分布の推測」にあたる部分で,なにも情報が与えられていないときにとりあえず仮定しがちな「等確率の仮定」を知らず知らず採用してしまったのが男の子の推論の間違い。それでも金額としてあらかじめ有限個の候補だけに限定されているならば(現実に有効かどうかは別にして)矛盾をきたさない推論が進められるが,そのような限定が一切ない状態で(無数にある候補に対して)「等確率の仮定」を持ち込むと,矛盾が生じる。それが問題の姉のケース。いろいろつっこんでいただいたおかげで,自分の中では非常にすっきりしました。

この議論は,人生における決断の問題とか相場の引け際を判断するとか,そんなときのヒントになりそうですね。たとえば20歳の青年が,これから出会う女性のだれと結婚すべきか考えるなんてのにも。

僕には「弟が袋を交換するのは正しい判断」で、「姉が袋を交換するのは意味がない」という結論になりました。最後の発言をみると「男の子の推論の間違い」ということになっているようにみえますが、本当にそうでしょうか。いままでの議論はなぜか、弟の判断は間違っているはずだからなぜ間違っているかを発見しよう、という方向に進んでいるように思います。その根拠は、姉の場合は明らかに交換する必要がなく、弟の場合でも中身を知ったからといってその状況が変化するわけはない、というところにあるようです。しかし弟の場合はすでにひとつの情報を得たわけですから、それによって判断が変化するのはむしろ当然です。6つ前の発言に100倍してみた、というのが載っていましたが、まさにそうしてみましょう。すると1000円の袋を持っている状況から残りは10円か100,000円かどちらかです。他に何の情報もない以上、それらのどちらの確率が高いか判断するすべは全くない。この場合は同じ確率と考えて判断するというのが一般的です。皆さんならどうしますか。10円か100,000円かです。僕なら迷わず交換しますね。弟の計算した期待値通りです。最小の金額を x 円、倍率を n として、姉の場合に期待値を計算すると1/3*(n*x/2+n^2*x/2)+1/3*(x/2+n^2*x/2)+1/3*(x/2+n*x/2) となるだけです。袋を取り替えてもこの期待値の計算は変わりません。(あ)

それはそうなんですが,ここでの議論の大勢は「同じ確率と考えて判断するというのが一般的」だが数学的にどうかな?って事が焦点だったようです。私的には,1001円の場合はどうなの?ってことで,そこを「どちらの側にも」突っ込んでいただきたいな。

(あ)の発言者です。昨晩、僕の考えが浅かったと反省しています。ここでは、なぜ姉の場合と違う結論が出てくるのかが焦点なのに、僕の発言では姉の期待値の計算が間違っているようなので、発言自体が意味ないものになっているようです。レスポンスがなかったら発言の取り消しするつもりでしたが、ここでは「浅い考えの解答の見本」として置いておきます。どうも済みませんでした。

いえいえ,浅いなんてとんでもない。普通に考えるとどうなのかということが分かりやすく書いてあるので有難いです。それよりもやっぱり「1001円の場合に」突っ込んで・・・ってしつこい?


なかなか深まっても「しっくり」は来ないので,いつものようにググって見ました。どうやら

ベイズ理論(推測)

という,偏見を元にした(表現は過激だけど)確率論が断りなく混ざっているのですね。これは少々まずいかも。従来の確率論とベイズ推定とどちらがより現実的かってことになるんでしょね。うーん。うーん。


たしかにベイズ推定が知らないうちに混じってるので話が混乱してますよね.ベイズ推定の「ご使用上の注意」をよく読んでから使わないと…….でも従来の確率論とベイズ推定って対立する概念じゃないし,どちらがより現実的かって話でもないんですよう…….従来の確率論で解くことのできる問題,つまりベイズ決定則で答が出せるのならそれが一番なんです.理論的にもそれがベストですし.でもそれでは解けない問題,たとえば今みたいにおじさんの確率モデルが未知の場合なんかは手が出せない.それは推定問題という別のカテゴリになって,その中でベイズ推定法なんかが出てくるんです.普通の確率の問題(確率モデルは与えられていて既知の場合)と,確率モデルが未知で観測データを元に推定する問題をごっちゃにするとややこしいことになるんです.

まず何が確率変数で何がパラメータ(固定値)かはっきりさせた方がいいと思います.この場合の確率変数は,少年がどっちの封筒を選ぶかですよね.おじさんが封筒に入れた金額は固定だからパラメータ.しかも値は不明の未知パラメータ(未知だけど固定).少年がしようとしていたのは,一方の封筒が1000円だったという観測データを元に,未知パラメータを推定しようとしてたってことですね.そして少年は,封筒をランダムに選んだときの確率分布が [1000円,500円が確率1/2ずつ]もしくは [1000円,2000円が確率1/2ずつ] というどちらかだと推定したんですよね.つまり未知パラメータが2つのどちらかのケースに違いないと推定した.ここまではいいけど,この後で一足飛びに,2つの確率分布はそれぞれ1/2の確率で生じると考えてしまった.これってものすごいアクロバチックな論理の飛躍ですよね.だって確率分布が確率的に変わるんだもの!通常の確率変数とは根本的に違った発想してますよね?

うーん、うーん。おっしゃりたい事はなんとなく分かるんですが、、、もし、「ベイズ推定を使わないければならん」のだとすれば、小学生や中学生、もちろん高校生にもちゃんと話をするのは難しくなりますよね。はたしてそうだろうか?というあたりが、わかりません。もひとつは、確率分布と確率変数という言葉に振り回されてませんか?っていうのが素直な感想です。それはまあ私の不勉強と読解力の無さが原因ということにして、「アクロバチック」だという部分を中学生にもわかるように解説できないものでしょうか?

どうも、こんにちは.最初のパラドクスのままなら別にベイズ推定は使わなくていいんです.使わなくていいんだけど、上でみなさんが展開している議論はベイズ推定の話なんです.わざわざ話を難しくしてしまってます.だから「しっくりこない」んだと思いますよー.私は、いったんベイズ推定のことは忘れて、ともかく確率論の基本からちゃんと見直したほうがいいと思います.それなら中高生でもわかる説明ができますよ.

やはりそうですよね。少し安心しました。とはいえ完全には安心していませんけどね。その上で、でもどう話が流れるかが楽しみです。ベイズ推定の話も高校生になら興味を持ってもらえるかもしれないし。

えーん,まだなんか疑われているの……?安心できないだなんて……(T_T) それに「どう話が流れるかが楽しみです」って、え、ボクがやるの!?基本に立ち返って地道にやればちゃんとできますってばぁ

そうそう。疑ってますよん。うふふ。性分なモノでね。誰がやるか?ではなくて,誰でも良いから参加して茶々入れてねってことかも。


おじさん,おじさん,ケチなこと言わないで教えてよ!

誰?

お年玉で困ってしまったボクだよう

ああ,君だったのか.ゴメン,わたしは〆切に追われてて今はそのヒマがないんだ.勘弁してよ,お願いだから…….そうだ私の代わりに君の叔父さんに来てもらおう.もしもし.もーしもーし!

誰だね,私を呼ぶのは……

叔父さんのいじわるな問題わからないから教えてもらおうと思ったんだけど,忙しいから叔父さんに聞けって.ねえ,教えてよ

なんじゃ,あいつはこんなこともぱっと教えられないのか,困ったもんだ…….じゃあヒマを見て少しずつ話していこうかね

わーい

さて,どうやら確率がよくわかっていないみたいだから,復習から始めようかね.まずサイコロを振る話からしようか.

それならわかるよ.どの目も確率1/6だよ

その1/6ってのはどうやれば出るの?

だって目は6通りでしょう.どれも同じ程度に出やすいから……1/6さ

「同じ程度に出やすい」っていうのはどういう意味?

えーと,そうだ,サイコロを100回振って,どの目が何回出るか調べるんだった.たくさんたくさん振って,どの目も同じくらいの回数が出ればいいんだ

ま,そんなところかな.学校ではそう教えるだろうしな.今君が考えたのは,一人の君が100回振ったイメージだよな.たとえば10秒間隔に

そうだよ

その考え方でも良い場合が多いんだけど,今回はお年玉というとてもデリケートな問題を扱うので,もう少し正確なやり方を教えてあげよう.いいかい,一人の君が100回振るんじゃなくて,100人の君が全員いっせいに1回サイコロを振るんだ

えー!?でもボクは一人しかいないよ!

そうなんだ.だからパラレルワールドが100世界あって,それぞれの世界に君が一人ずついると考える

いきなりそんなありえない話をされてもなあ

まあもうちょっとお聞き.ためしにバーチャル・パラレルワールド・マシーンを持ってきたから.略してVPWMさ.数字を100にセットして……

わあ,小さな部屋が100個もある!そしてそれぞれにボクがいる!

さていいかい,この100個のパラレルワールドは何から何まで全部同じだ.だけど,サイコロを振ったときとコインを投げたときと,そしてルーレットを回したときだけそれぞれの世界で違う結果が起きる.それ以外の条件はみんな同じなんだ.

へええ

その3つは確率的に結果が異なるから,出た結果を確率変数と呼ぶんだ.本当はゲタも確率変数にして天気予報がしたかったんだけど,プログラムが難しくてこの3つしかできなかったんだけどね…….さて,それぞれのバーチャルパラレルワールド(VPW)の君にサイコロを振ってもらおうか.スタートボタンを押してくれるかい?

これ?あ,動いた動いた.

結果は?

えーと,1の目が出てるVPWと2の目が出てるVPWと……どれもだいたい16前後あるみたい.ばらついてはいるけれど,だいたい1/6だ.

そうだね.だからサイコロの目がそれぞれ出る確率は1/6というわけだね.VPWが増えれば精度が上がもっと上がるだろうね.それから,100個のパラレルワールドで出たサイコロの目の平均を取ってみようか

えっと……だいたい3.5になりますね,これも

そう,これが期待値の意味だね.パラレルワールドの平均を取るんだ

それはアンサンブル平均で,期待値とは違うぞー!

む?何か外野から声が?今はいいんだ,大数の法則があるから,VPWの数が増えれば期待値に等しくなるんだから

おじさん,なんか言った?

ああ,実は期待値を計算するには2つの方法があってね.学校で習ったと思うけれど,ΣxP(x) を計算する方法と,今みたいに (x1+x2+...+xn)/n で計算する方法とがあって,後者はアンサンブル平均って言うんだ.そしてアンサンブル平均は n→∞のときに期待値に収束する.

要は2つ計算方法があって,nが十分大きければ同じになるんだね

実はこのほかに時間平均というのもあってね.たとえば君が一人でサイコロ100回振ったときの平均は,実は時間平均ってことになるかな.時間平均は,必ずしも等しくなるとは限らない

でもここまでなら,ボクが一人で100回やったことと結果が同じだよ

そうだね.この場合は別にパラレルワールドじゃなくてもいいんだけどね.だけど違う場合もあるんだ.何かいい例はないかな……そうだ,あの花瓶を落としたら,どれくらいの確率で割れるか考えてみようか

えー,お母さんが怒るよ!

だからVPWMの中でやるのさ.

スタート……100個のVPWのうち,割れたのは23個ですよ

1/4弱ってとこだね.この実験は,一人で何回もできるかな?

できません.でも花瓶を100個買ってくれたらできるかな

じゃあ人間国宝が作った世界に1個しかない壺だったら?

それは絶対に実験できない!

もう一つ別の例だ.これはおじさんが作った特別仕掛けのサイコロでね.なんと1が出るたびに目の数がひとつずつ増えていく.最初は1〜6のサイコロだけど,もし1の目が出ると以降は2〜7のサイコロ,また1が出ると今度は3〜8……元に戻すにはこのリセットボタンを押せばいい.じゃあこのサイコロで,パラレルワールドの場合と,一人で何回も繰り返す場合を比べてみようか.結果は同じかい?

もちろん違いますよ!

時間平均とアンサンブル平均も一致しないよね.じゃあVPWと一人で何度もやった結果を同じにするにはどうしたらいい?

そのつどリセットボタンを押します

そうだね.花瓶なら,まったく同じものを買ってくることに相当するかな.人間国宝の壺みたいなケースは,1回しか試行ができないから,本当は確率を定義しても意味は薄いだろうね.それでもパラレルワールドみたいなのを頭の中で想定して形式的な確率を考えることはできるだろうけどね.つまり基本はパラレルワールドの方なんだ.だけど実際にはそんなことはできないから,一人で何回も試行をくりかえすことになる.だけど,そのためには条件が必ず同じになるようにして,他の試行の影響がないようにする.VPWとVPWの間がお互い無関係だったようにね.このことにさえ注意すれば,別にVPWマシーンは使わなくてもいい.注意すれば,だぞ

はーい

ここでエルゴード性の説明を入れたいよう.それとPWMの考え方を知っていれば確率過程がすんなりわかるんだよな.VPWごとに違う時系列を取るのが確率過程だって.それがわかっていないから,試行を何度も繰り返す話と確率過程とをごっちゃにする学生が出て来るんだよなあ,ぶつぶつ

次は条件付き確率かな.またVPWマシーンで,サイコロ100個振ってもらおうか……さて,偶数の目が出たのはいくつかな?

約50個です

じゃあその50個の中で,2の目はどれくらい出てる?

ええと,16個でしたから,約1/3です

そうだね.それを偶数の目が出たという条件付きで2の目が出る確率という.このあたりでそろそろ数式の表記法を教えないといけないな.まず最初に確率変数に名前をつける.サイコロの場合はXにしよう.Xは出た目の数を表すとする.こうしてサイコロ・コイン・ルーレットで決まる変数が確率変数.それと,確率変数に何かの関数をほどこした結果も確率変数さ.たとえばサイコロの目の4倍をYとすると,Yは,Y=4Xという関係を満たす確率変数になる.さてそれはさておき,1の目が出る確率は1/6というのを式で書くと Pr(X=1)=1/6 となる.

カッコの中と外に2つもイコールがあっておもしろいや

あと,Px(1)=1/6 と書いてもいい.それから条件付き確率は縦棒で区切って,Pr(X=2|X=偶数)=1/3のように書く.さて,ここで問題を出そう.サイコロの目は,ちょうど反対の目と足すと7になることは知っているね?では,X=4が出たとき,反対の目が3である確率は?

えーと,どこから考えるのかな……

まず反対の目を確率変数として名前をつける.まあYにしておこうか(さっきちょっとだけ使ったけれど)

つまり Pr(Y=4|X=3)を求めるわけですね.100個のパラレルワールドの中から,まずX=3を満たす世界だけを取り出すんですね……1/6の世界が残るな……そして残ったVPWのサイコロを全部ひっくり返すと……そうか,全部4だよな,当然だけど

そうだね.つまり Pr(Y=4|X=3)=1 ってわけだ.じゃあこの問題文はどう考える?

目隠しして振ったサイコロの目を 3 と予想して掛け金を払った。
予想が当たっている確率は 1/6 だ。
その後目隠しをとって見た。そしたら 3 が出ていた。
確率は1だ。

これもVPWで考えるんですね.100個のVPWでサイコロを振ると,約1/6の世界で3が出ました.だから3が出る確率は1/6ですね.Pr(X=3)=1/6 ですね.目隠しをそとって見たら 3 が出ていた,今度は X=3 という条件下での確率だから……

教えたとおりの手順でするんだよ

まずVPWのうちから,X=3を満たすVPWだけを残す.次に,残ったVPWの中からX=3を満たすVPWがいくつあるか数え,比を求める……おじさん,もちろん全部Xは3ですよ

そうだね.ちょうど「サイコロの反対の目が4」の場合と同じだね.じゃあ式にしたら?

Pr(X=3|X=3)=1.X=3という条件付きでX=3が生じる確率は1……そりゃそうだ!

この問題の場合,目隠しを取ってみたときの情報がもたらすことの意味を尋ねてるんだから,情報エントロピーの話はしなくていいのかい?

なんか外野がうるさいなあ,今はそこまでしないよ

でも……きっとこの問題出した人,3の目が出る確率じゃなくて,今目の前にあるサイコロが何の目が出ているかを知りたいんじゃないのかなあ,きっと

ああ,そうなんだろうね.でも,目隠しをして今目の前にあるサイコロは何の目?という問題と,パラレルワールドN個のうち1の目が出るのはいくつ?という問題は全然違うよね?

うん.こうやってみると全然違うね.でも確率とはどこか関係してきそうだけどな

そうなんだ,確率とはもちろん関係している.けれど,違うことをしているんだってことは知っておこう.それはいつか説明するよ.今のところ君はこう答えればいい.「ボクは確率と期待値の出し方は習いました.でも目の前で起きていることを当てる方法についてはまだ習っていませんのでわかりません」ってね.大事なのは,出された問題が自分の知識で解ける問題なのか,そうでない問題なのかを見分けることだよね.だからこそ,確率を求めるときは必ずパラレルワールドに戻ってするようにくどく言ってるんだ

なるほどやっかいなことは先送りにしようって腹かい.でもまあ,自分の習った知識が適用できる場面と適用できない場面の違いを見分けるのは大事だよな

まったくうるさい外野だ…….さていよいよお年玉の話をしよう.今,ここに封筒が2つある.1と2って書いているね.いいかい,1の封筒に1000円札を1枚,2の封筒に1000円札を2枚入れるよ.ここまでは確率的かい?

いいえ

じゃあ,ここまでは100個のVPWでも全部同じことが進行してるってわけだ.いいかい,100個のパラレルワールドにそれぞれ1人ずつ君がいる.おじさんも1人ずついる.そしてどのVPWでも,おじさんは1000円と2000円を封筒に入れた.いいかい?

いいよ

さあ,ここで君はコインを投げた.これは?

確率的です

じゃあ確率変数を割り振ってみて

ええと,じゃあXにします

オモテならX=1,ウラならX=2ということにしようか.それぞれの確率はどうなっている?

ええと1/2と1/2ですよ……おっと,ちゃんとやらないといけないんですよね.100個のVPWのうち,約半数がオモテ,残りの半数がウラですから,Pr(X=1)=1/2,Pr(X=2)=1/2です

そうだね.じゃあ,今度はXと同じ番号の封筒を選ぶことにしよう.つまりX=1(オモテ)なら1の封筒を,X=2(ウラ)なら2の封筒だ.それぞれ1000円と2000円だね.そこで,「選んだ封筒に入っている金額を確率変数Y,残った封筒に入っている金額を確率変数Z」としようか.YもZもVPWごとに違うから確率変数だね.もしなんだったら封筒の番号と金額を対応付ける関数 f(.) を考えて Y=f(X), Z=g(X) としてもいい.YとZの確率は?

本当はこれもいちいちVPWの数を数えるんですよね……でも同じです,Pr(Y=1000)=1/2, Pr(Y=2000)=1/2, Pr(Z=1000)=1/2, Pr(Z=2000)=1/2 です

じゃあ今度は,選んだ封筒を開けたとしよう……開けた封筒が1000円だったという状況を考える

条件付き確率ですね?じゃあY=1000を満たすVPWだけをピックアップするんですね.もちろん約半数の世界が残りました

そうそう,VPWの,つまり確率の操作方法に慣れてきたじゃないか.じゃあピックアップされた世界の中で,Zはどうなっている?

えっと,全部 Z=2000 です.だから Pr(Z=2000|X=1000)=1 ですね

オッケー,じゃあいよいよ本題だ.おじさんは今から1の封筒にα,2の封筒に2α円を入れる.αは内緒だ.だけどαは決まった額で,おじさんはちゃんと知っている.ここまでは確率的かい?

いいえ.だからVPW全部同じってことですよね

ここでさっきと同じようにコインを投げて,どちらか一方の封筒を選んでごらん

はい……VPWのうち,半数はα円の封筒を選び,残りの半数は2α円になりました

Pr(Y=α)=1/2, Pr(Y=2α)=1/2というわけだね.じゃあYとZの期待値を求めてみようか

えっと,何も考えずに教えられたとおりにしますよ!Yの期待値は1.5αです.Zの期待値も1.5αです

そうだね,どっちも1.5α円の期待値だね.君の姉さんは,本当はこれを計算すべきだったんだ.じゃあ今度は君のケースについて考えてみよう.封筒にお金を入れなおすよ.1の封筒には1000円を入れておこう.そして2の封筒にはβ円を入れておこう.ちなみにβは500か2000かどっちかだけど,それ以上は教えない.

じゃあさっきと同じようにパラレルワールドでやってみますよ.半数のボクは1000円の封筒を選び,残りの半数はβ円の封筒を選びました.だから Pr(Y=1000)=1/2, Pr(Y=β)=1/2, Pr(Z=1000)=1/2, Pr(Z=β)=1/2 です.

さて君が選んだ封筒には1000円入っていたとしよう.そして君はもう片方の封筒の期待値を計算しようとした.そうだね?

はい.じゃあやってみます.まずVPWのうち,Y=1000の世界だけをピックアップします……半数の世界が残りました.ここでZの値を調べてみるんですね.Zは全部β円です.だから Pr(Z=β|Y=1000)=1 です.期待値は……そうか,β円です

そう,ちゃんと計算できたね

教えられた手順を絶対に守って計算しただけですから.でも結局βがいくらかわかりませんでしたよ

そうさ,βは未知数で,しかもβを割り出すための方程式は手元にないよね.だから「期待値はβ円です.βの値はわかりません」というのが正解.それ以上はデータ不足だから計算しようがない

でも,βが500か2000のどちらかってことは知っていますよ

その情報も使うなら 「もう片方の封筒の金額の期待値はβ円です.β=500もしくは2000のどちらかです」.それで十分だ

βは500か2000かのどちらか1/2ずつの確率ってやっちゃだめなんですか?

その答は自分で考えてごらん.VPWの中に答はある

そうだ,VPWの世界の封筒を全部開けてみよう……あ,全部2000円だ.そりゃそうだ,βは確率変数じゃないもんな

最初におじさんが封筒にお金を入れたとき,それは確率的かどうか確認したよね.βは確率変数じゃない.どのVPWでも全部同じ値だよね.もしβが確率変数で500と2000のどちらかを1/2の確率でとるならば,VPWの半数は500円,残りは2000円になっていなきゃだめだよね.でもそうはなってないよね

そうか,確率変数じゃないのに,確率的に変わると思って勝手な計算をしていたんだ.それからもうひとつわかった.ボクは1000円札を見たとき「これは高い方を引いた確率が1/2,低い方を引いた確率が1/2」と考えていた.でもこれって,X=1000という条件付き確率を考えてるんだよね.VPMの中からX=1000のケースだけを抜き出してみたんだけど,必ず反対の封筒はβ円だから,1000円の封筒は確率1で高い方もしくは1000円の封筒は確率1で低い方のどっちかしかないんだね.仮にβ=2000なら,Pr(X=高い方|X=1000)=0 だし,逆にβ=500ならば Pr(X=高い方|X=1000)=1だもん.確率という点で言えば,どっちか一方でしかなかったんだね.ただボクはデータ不足でそれをどっちかに決めることができなかったってわけだね.

そう,そうなんだ.本当にこれは確率かな?と思ったら,必ずVPMに戻って,該当する世界の数を数えるんだ.そして未知数はαとかβとか適当に名前をつけて,そのまま計算すればいい.勝手に確率変数にしたりはしない.未知数の入った計算結果だって立派な答えさ.未知数を決めるための方程式がありませんっていう答もありなんだから

そうかあ……じゃあボクがやろうとしていたことはなんだったんだろう.もう一方の封筒の額が大きいか小さいか知りたいって思っちゃだめなのかなあ

それはもちろんかまわない.だけど,確率を求めたり,期待値を求めたりする問題とは少しだけ違う種類の問題になるってことなんだ.別の種類の問題なのに,勝手に確率の問題の解き方で計算しようとしたから変なことになったのさ.高校までの数学ならここでおしまい.ここから先の話は大学生になってからまたしてあげよう.じゃあね.


こんばんは。とてもわかりやすい説明をありがとうございます。が,すべてを納得したわけではありません。1点だけ,同意できない部分があります。それは「おじさんが封筒に入れた金額はパラメータ,少年がどちらの封筒を選ぶかが確率変数」であり,「おじさんが封筒に入れた金額を確率変数のように扱った時点で間違い」という考え方です。

時間的前後関係にまどわされて奇妙にみえるかもしれませんが,この問題のしくみを考える上で,「おじさんが封筒に入れた金額がパラメータで,少年がどちらの封筒を選ぶかが確率変数」と「少年があけてみた(現に確認した)金額がパラメータでおじさんが封筒にいれた金額が確率変数」とは数学的にはどちらも考えうる(前者の考え方が妥当であるならばそれと同程度に後者の考え方に立つことも妥当である)のではないでしょうか。(どちらが考えやすいか,というのはまた別の話です)

パラレルワールドを使うならば,後者は「100のパラレルワールドのそれぞれにおじさんがいて,お金を封筒に入れていた。どのパラレルワールドも,その後少年が封筒を開けてみたら1000円入っていた,という現在につながっている」という捉え方です。これは,「おじさんが封筒にある金額をいれた。その世界が100のパラレルワールドに分かれて,それぞれに少年がいて封筒を開けている」という捉え方と数学的にはまったく対等の資格を持つもののように思うのです。

この問題の面白さは,(縮めて)「おじさんがパラメータ,少年が確率変数」という枠組みで考えた場合と「少年がパラメータ,おじさんが確率変数」という枠組みで考えた場合とから,一見矛盾を引き出してみせたところにあります。

その問いに正面から答えるには,二つの枠組みから矛盾した結論は出てこないのだ,ということを示す必要がある。そのためには「少年がパラメータ,おじさんが確率変数」という見方も避けることなく検討した上でそこでの少年の議論のおかしい点を指摘することが必要です。

どうも「確率の基本にもどれば簡単な話」とおっしゃるその内容は,『少年も「おじさんがパラメータ,少年が確率変数」という見方に立って考えればよかったのだ。だから矛盾など存在しない』といっているように聞こえます(私の誤解かもしれません)。これは,正しい結論を簡単に出す方法ではあっても,この問題の問いかけているものに対する答えではないように思うのです。

ずっと上でのあちこちさ迷いながら私としてはひとまずすっきりした気分になれた結論は,たしかにベイズ推定ということばも出さずいつのまにか(単に少年の議論のおかしい点を指摘するだけではなくではどうすればよかったのかを考えようとしたあたりから)その方向になだれ込んでいて,危なげだというのはおっしゃるとおりだと思います。ただ,「そもそもおじさんが封筒に入れた金額を確率変数のように扱った時点で間違い」という点については,まだ十分に納得しておりません。もう少し考え続けます。お時間とお手数を掛けていただきありがとうございました。

あまりこれ以上この問題には関われないと思いますが,最後に…….おじさんが封筒にお金を入れるときに,ルーレットを回して金額を決めたのならそれは確率変数です.もちろんそのような状況を設定してもかまいません.ただしその場合は,おじさんのルーレットの確率モデルをきちんと提示しないと問題は解けません.またルーレットを回さず決まった額を入れただけならば,それは単に少年にとって未知であるだけで,定数すなわちパラメータにすぎません.確率変数のように扱ってはいけません.確率の世界の約束事はとてもシンプルで明快なのです.まずパラレルワールドモデルで何が計算できて,何が計算できないかをもう一度じっくり考えてみるのがいいと思います.

おそらく質問の意味はこういうことですよね.「観測された値はもはや確率変数ではない.だって固定された値なのだから.そして観測されたデータを元に未知の定数を確率変数とみなして推定することはできるんじゃないか」と.きっと確率論をそのように拡張できるんじゃないかとお考えなんですよね.その答は「はい,そのように考える世界もあります.たとえばベイズ推定の世界です」.だけどその計算はベイズ推定の枠組みの中でする必要があり,ベイズ推定の約束事を守らなければいけません.この約束事が大事と私は思います.約束事を知らずに「気が付いたら踏み込んでいた……」というのはとても危ない状況です.たとえばベイズ推定では,未知パラメータを確率変数のように扱うだけで,確率変数そのものではありません.

おおざっぱに言って,次のようにして見分けると話は簡単です.確率モデルが全部既知.その状況で条件付き確率や期待値を求める問題,これは普通の確率の問題です.一方,確率モデルの一部がわかっておらず,その状況下で何がしかの観測がなされ,それをもとに何か未知の値を推定する問題,これは推定問題です.今解こうとしている問題がどちらのカテゴリか見分けることは大事かと思います.

少年の誤りを指摘するだけではだめで,「ではどうすれば良かったか」まで示さなければ片手落ちという意見はごもっともです.しかし上でも述べたように「どうすればよかったか」は推定問題のカテゴリですので,高校までの枠組みでは「習った範囲ではできないんだよ」としか言えません.高校生にベイズ推定を教えるのは,不可能ではありませんが,ひとつひとつかなり丁寧に教えていく必要があると思います.時間があればそのあたりも書きたかったんですけどね.


ねえ,ちょっと

は!?

まだ説明しなきゃなんないこと,いっばい残ってるんじゃない?それに私大学生よ.まだ1年だけど.大学生になら説明できるんでしょ?

いや,それは,モゴモゴ…….ところで君は?

いやねえ,さっきまで弟がここで叔父さんと話してたじゃない.たとえばね,叔父さんが本当にお金をランダムに決めてて,そして弟が選んだって状況があってもいいでしょ.なんでその話をしないのよ.これならどっちも確率変数だから,何も問題ないでしょ?それをすれば上の方の疑問だって解決するかもよ!

いやわたしは,その……あ,原稿の〆切があったんだ.ごめん,じゃあまたね

あ,行っちゃった…….しかたがないから叔父さんに聞こうかしら.叔父さん,叔父さん……あれ,叔父さんもいないの?もう困っちゃうわねえ.ぷんぷん

(ぬっ)呼んだかい?

あ,どこ行ってたの,聞きたいことがあったのに

彼も,本当は説明したいのはやまやまなんだろうけど,時間がねえ…….おっと,なに,1000円札をたくさん用意してきたのさ.おじさんが封筒に入れた金額も確率変数だったらって話なんだろう?

そうそう

じゃあ,ここで宣言しよう.今から当分の間,封筒に入れる金額は確率変数である,と.つまり,おじさんはルーレットで封筒に入れる額を決める.そしてこれがそのルーレットだ

1から10までの数が書いているわね.そしてどれも等確率で出るのね

そうだ.そしてルーレットの出た数がXだとすると(これは確率変数だね),一方の封筒に千円札をX枚,もう一方の封筒に2X枚入れることにする.それぞれの封筒の金額を確率変数としてもいいんだけど,もう面倒だから千円札を1単位にして話をすすめちゃおう.ここで封筒1の千円札をY1枚,封筒2をY2枚とする.そしてY1, Y2の確率分布P1(Y1), P2(Y2)としたらどうなる?

P1(1)=P1(2)=....=P(10)=1/10 ね.同様に P2(2)=P2(4)=...=P2(20)=1/10 となるわ.あ,P2は必ず偶数ね

念のため,パラレルワールドマシンを動かしてくれないか.ワールド数を,今度は1000にしておこう

スタートスイッチを押して……1000個のPWでおじさんがルーレットをまわしてる.Xは1から10まで100世界ずつになった

ここでパラレルワールドの中の1000人の君は,それぞれコインを投げて封筒を選ぶんだ

えーと,約500人の私は封筒1を選んだわ.そして残りは封筒2を選んだ

それじゃあ,選んだ封筒の中身のお札をZ1枚,選ばなかった方の封筒をZ2枚としようか.Z1の確率分布はどうなっている?

あら,えーと……,1枚が50世界.2枚が100世界.3枚が50世界……だから確率で書くと,確率 1/10 が 2,4,6,8,10 枚.確率 1/20 が 1,3,5,7,9,12,14,16,18,20 . Z2も同じ分布だわ

じゃあ期待値は?

ばっとは計算できないわよ!ちょっと待ってて(ピコピコ)8.25です.でもZ1とZ2の期待値はまったく同じ.だって分布が同じなんですもの.あ,もしおじさんが確率的に金額を決めて,そしてその確率モデルを教えてくれていたら,この期待値がわたしの計算すべきことだったんですね

そういうことだね.もっとも君の場合は,私の入れたお金の額が確率変数ということも,まして確率分布がどうなっているかも知らなかったわけだけどね.でも,どっちみちZ1とZ2の期待値はいつも一緒だ.次にね,受け取った方の封筒を開けることにしよう.パラレルワールドの中の君に,選んだ封筒を開けるよう指示を出して

はーい.本当はこれ,弟のケースに相当するんですよね.はい,開いた封筒の中身Z1は,1枚から20枚までいろいろです

じゃあここで,開いたら2000円入っていたことにしよう.ここから先は条件付き確率だ

Z1=2のケースだけピックアップするんですね.はい,100個PWが残りましたよ

そのときの,もう片方の封筒Z2はどうなっている?

はい,Z2=1 の世界が50個,Z2=4 の世界が50個です.だから Pr(Z2=1|Z1=2)=1/2, Pr(Z2=4|Z1=2)=1/2 ですね.これが,上の方の考えていた状況ですよね?

そうだね.Z1=2 という条件付きだから,もはやZ1は定数,パラメータとみなしてよい.つまり開けた封筒の額はパラメータとみなせるってことだ(条件付きで計算する範疇では,ね).そして,封筒に入れた金額は確率変数だね.これも間違いない

ここで期待値を計算する……そしたら,はーい,弟の計算どおり,1.25倍,今の場合だと E[Z2|Z1=2]=2.5 になります

そうだね.どうやらこの場合は,封筒を交換したほうが得しそうだね.他の場合は?

Z1=2,4,6,8,10 の5つのケースは同じ結果ですね.Z2の期待値はZ1の1.25倍.それから Z1=1,3,5,7,9 の場合,このとき Z2 の期待値はZ1の2倍です.そして Z1=12,14,16,18,20 の場合は,Z2の期待値はZ1の1/2倍,そうなりますね.だから,出てきたお札が10枚を超えていたら交換せず,逆に10枚以下だったら交換するのが良さそうですね

そうだね.そして何枚までだったら交換した方がいいってわかるのは,封筒に入っているお金の確率モデルがわかっているからだね.だからおのずと,交換したら得する上限の金額が決まってくる.パラドクスの中で弟君は,そうした上限を考えていなかったよねえ

じゃあこういうケースはどうなるんですか?おじさんは,等確率で数字が出るルーレットを使ってお金を封筒に入れた.だけどそのルーレットには,最大いくつまでの数字が書いてあったか教えてもらえなかったって場合なんですけど

つまり,確率変数 X が 1 から N までの等確率分布というわけだね.ここで Nは未知だけど固定したパラメータ だってわけだ.いいかい,Nは確率変数じゃないよ.パラメータだよ

おじさん,わたし先が読めたわ!開いた封筒の中に入っていた金額から,パラメータNをベイズ推定しちゃうのよ.そのときNはパラメータなのに確率変数扱いされちゃうのね,きっと.……なんだか想像するとおもしろそう.まず第1のルーレットがあって,そのルーレットの示した数字がNになるのね.それから今度は最大値がNの第2のルーレットを作って,それを回して封筒のお金を決める……

そりゃあ話が先に進みすぎ!もちろんそういう話になるわけだけどね.でもおじさんは,今はまだ推定問題の話はしたくないんだ.ひとつひとつ丁寧に話を進めたいから.まずできる範囲で計算してみようよ.ルーレットの最大値がNの場合,封筒1の方は最大N枚の千円札,封筒2の方は最大 2N 枚の千円札が入るかもしれないってわけだね.さあではパラレルワールドでコインを投げて,どっちか一方の封筒を選ぶとしよう.

はい,やってみたわ.あ,おじさん,Nを3にしていたのね.Y1は1,2,3,Y2は2,4,6の場合しかないわ.そしてそのとき,選んだ封筒の金額の確率分布 P(Z1) を求めると……2 の場合が 1/3, 1,3,4,6 が 1/6 ずつね.だけど,パラレルワールドの中の私はそれが計算できない.しかたがないから,未知数 N のままで計算するしかないわ.

この状況で,開けた封筒のお金が4000円だったとしよう.条件付き確率だ.Z1=4 のケースだけ抜き出してごらん.そのとき,Z2 はいくらになっている?

Z2は必ず2ね.Pr(Z2=2|Z1=4)=1. でもPWの中の私はNの値を知らないから,この確率はもちろん計算できないし,期待値も計算できない.

おじさん,Nの値をいろいろ変えてパラレルワールドの計算をさせてみてるの.そして Z1=4 であっても,N がいくらかによって Y2 の確率分布は変わるわ.もちろんそれによって期待値も.そしてZ1がN以下ならば交換した方がいいってことは言える.ただ,Nの値を知らないPWの中にはそれがわかってても意味ないけど.

とりあえずこういうことは言えそうだね.おじさんが封筒に入れた金額が確率変数の場合であっても,その確率モデルがわかっていればちゃんと計算できるし,さらに言えば封筒を交換すべきかどうかの判断もできた.でも,確率モデルのどこかに未知の部分があるときはうまくいかなかった.そうだ,これも確認しておこう.封筒の中身の金額は,最初に決めた確率モデルのとおりに分布して,それ以外の分布はしなかったよね?そこのところも大事なんだ.パラメータNは確率的にふらふら変動したりしない.

でも,なんとか計算できないものかしら.そうね,きっとちゃんとした計算結果を出すのは無理なのね.それでも,なんか「この封筒の期待値は,大きいような気がします!」みたいな計算ってできないものかしらねえ

そろそろ推定問題に話題を移すときがきたようだねえ.とりあえずここまでをまとめると,(1) 確率モデルが完全に与えられているときは,教わったとおりの手順で確率や期待値を求めればいい.(2) 確率モデルで未知の部分があるときは,とりあえず未知数だけどもαとかβとかの名前をつけて,知っている手順で解けばいい.出てきた答に未知数が残るかもしれないけれども.そして (3) 観測されたデータから,未知の数値を推定する.でもこのやり方はまだ教えていない.おじさんは,(1) と (2) がまずきちんとできるようになることが大事だと思うな.さて,では今日はこれくらいかな.またね

あーん,おじさん帰っちゃうの?


ああ,面白い。おじさんは,最初はお年玉に千円あげようと思ってたんだけど,それじゃあ面白くないから,遊んで見たなんていうとっても常識的な設定ではどうだろう。ってやっぱり,おじさんの意思は確率では測れないよねん。ってことだなあ。あたりまえか。


ここで説明していただいた「おじさんが封筒に入れる金額を確率変数と仮定する」という設定が,私の想定していた状況に一番近い。どうやら私の頭の中では「どうすればよいのか」を考えるあたりからではなく,もっと前,少年の立場に立ったその瞬間から推定モードに入っていたようです。「どうすればよいか」以前の「なにがおかしいか」の指摘の時点で,すでに,少年は推定をしようとしているという前提でその方法がおかしい(とりうる値の個数を有限個に限定しない一様分布というようなありえない仮定をしているために開けた封筒の中の額にかかわらず常に取り替えた方が得という姉の間違いにもつながる結論がでてしまったのだ)という内容になっている。他方の封筒の中身が500円か2000円がどちらがありそうかを考えること自体がすでにパラメータの推定に属する事柄だったのですね。重ね重ね,ありがとうございました。


やあ,ちょっと用事で近くまで来たので,寄ってみたよ

あ,おじさん,こんにちは.ね,今日は推定の話を教えてくれるの?

残念だけど,そんなには時間がないんだ

あら,がっかり〜

それでね,今までさんざん「知らないうちに推定の話を持ち込むと危ないよ」と言っておきながら,なんで危ないのか話してなかったことがどうしても気になってね.やっぱり理由がわかってるってことは大事だと思うから

そうね.理由も書かずに「危険、立ち入り禁止」って書かれても困るもんね

そうなんだ.ただ、何が危ないかなんてのは本に書いてないから、おじさんの知ってる範囲で危なそうなことを教えとこうなと.おじさんも推定問題の専門家というわけでもないから,本当はおじさんも気が付かないうちに危ないことをしてるかもしれないんだけどね…….おじさんの知ってる範囲では,4つかな

4つもあるの?

そうさ.1つめは,「推定値は正しい値と限らない」だ

え,それって当然じゃないの?だって推定値なんだもの,違ってて当然じゃない?

そりゃ「今、私は推定作業をしているよ」と自覚していればね.ところが本人は確率の問題を解いてるつもりでやってたら困るよね.推定値には必ず誤差が伴うんだ,不確定性が残るんだってことは知っておかないとね

そうね.計算で出た値が「期待値」なのか「期待値の推定値」なのかで違うもんね

第2は,推定方法はいくつもあるってこと.そして推定法の数だけ異なる推定値があるってこと

え,推定法っていろいろあるんだ!じゃあいろんな推定値が出てきたとき,どれを信じたらいいの?

それはね,どの推定法が他の推定法よりも正しいとか間違っているとかってことはないんだ.それぞれ違うやり方,違う評価基準で推定したから違う値になっただけでね.そしてどの推定方法もそれぞれ長所短所がある.自分の目的にはどの推定法が合っているか,その相性の方が大事だと思うな

ふうん,そうなんだ

観測データが増えれば増えるほど,どの推定法で出した結果も同じようになる.そりゃそうだよね.つまり,観測データが不足していれば不足しているほど,各推定法ごとのクセがはっきり出てしまうってことかな

つまり情報が足りないときに,それを補うやり方がそれぞれ違うと思えばいいのかしらね

そして3番目,これは2番目の言い換えになるかもしれないけれど,それぞれの推定法のクセを知っておくこと.推定法にはそれぞれ特有のクセがあってね.たとえば最尤推定法で分散値を推定すると偏りが出たりとか

偏りがあるって?

この場合は分散値を小さめに推定する傾向がある,と言えばいいかな?

そんな推定値でもいいの?

いいかどうかは使い方次第.ちなみに分散の最尤推定値は統計で言うσnになるんだよね.関数電卓にσnとσn-1の2つのキーがあるけど,どう使い分けするか知ってる?

あれ,いつも不思議だったのよー.どう使い分けるの?

そうか,知らなかったか.じゃあそれはまたいつか教えてあげるね.他にも,たとえばベイズ推定だと実際にはありえない確率分布を出してくるとか,まあそれぞれにクセがあるんだ.そういうクセがあるんだって知ってて使う分には別にかまわないけどね

「使用上の注意はよく読んでお使い下さい」って感じね,本当に

そして4番目,推定作業にはいろいろ仮定や前提が伴うってこと.確率モデルがわかっていないわけだから,そこにいろいろ仮定をおいて推定するわけだよね.たとえば一様分布に従うとか,正規分布に従うとかって仮定することある.それから何を評価基準にしますよって前提もあるし.出てきた推定値は,そうした仮定や前提が有効だっていう条件下で意味を持つ.仮定が違っていたら推定の作業結果も当然違っちゃうよね

ふうん,何かの仮定は必ず入っちゃうんだ

そうだね.自分の出した結論に,いつの間にか自分の知らない仮定や前提が紛れ込んでたらまずいよね?仮定の成り立たないような場合にまで拡大解釈してしまうことだってあるだろうし.それと,とても賢い人だったら,他の人が気が付かないうちに仮定をまぎれこませるようなこともできちゃうかもね.そうすれば上手に人をだます詭弁を作ったり,パラドクスのような状況を作ったりもできるかもしれない

あー!おじさんはそれを知っててわざと私たちをひっかけたんだあ!

ははは、そういうことかも.だから,何か怪しいと思ったら必ずパラレルワールドの世界に戻って,変な操作をしていないか確認することなんだ.そうしたらすぐに正しいかどうかわかるからね

だめよ,そうやって自分を正当化しちゃ!おじさん,罰として、私たちのお年玉を2倍にしてよね、いい!?


推定は統計学における中心的課題ですね。通常の確率計算と推定のもつ本質的な差異は,後者では母集団からの標本抽出(サンプリング)というプロセスが入ることにある。つまり,まず,母集団の部分集合をランダムに選んできた場合の,部分集合から得られる統計的パラメータと母集団の統計的パラメータとの関係を数学的に明らかにする。ここでモデルの問題が姿を現します。一般の社会調査などでは正規分布を仮定するのですが,対象によっては一様分布やその他の分布も考えるのでしょう。

標本抽出を軸とする本格的な統計学は大学でしか出てきません。一方,ある集団のもつ統計パラメータである平均,分散(標準偏差)は高校でも一応登場します(今の課程をよく知らないので昔の記憶です。間違っていたら訂正してください)。しかしこれは集団によって決まる確定した数値です。一方,サンプリングの結果得られる標本の統計パラメータは毎回浮動する確率変数として登場します。「標本のもつ確率的な性格」を取り扱うのが統計学なんですね。

えっと何を書くつもりだったっけ。そうそう。いわゆる一般的な確率というのは高校の化学や物理に於ける「理想状態」という仮定の下で成立していますよね。統計学はそれを現実に適応させることを主眼に置いていますね。無限は現実的でないから有限で、みたいなサンプリングもそうですけど。さて,確率にも推定にも仮定がある。その差は如何に?ってところがわかるとよいのですが。(なんて調理に口出す嫌な客状態かも,そういうおまえが作ったらって言うコックの声には,わたしゃここでは客だからと,,,)


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2005-10-29 (土) 07:33:10 (6753d)