コロンビア大学の条件付き確率の問題の解を直感的に理解する方法

Twitterで話題になっているのでツイートする方がいいかな
と思いつつ、結局こっちに書くことに。


http://togetter.com/li/25071
で話題になっている問題ですが
なぜ「火曜日」という、男女の別と関係ないように思われる情報が
確率に影響を与えるのか。
式の上では理解できても直感になじまない人は多いかと。
直感になじませる良い方法がないか、ちょっと考えてみました
(上のリンク先に書いてあるツイートの言い換えに過ぎませんが)。


まずは、数字を出して何が直感に合わないのかを整理します。

二人の子供をA, Bとします。
AとBの性別の可能性は
(1) A=男、B=男
(2) A=男、B=女
(3) A=女、B=男
(4) A=女、B=女 の4通り
まず、まったくヒントなし(「火曜日に生まれた男の子がいる」という情報もない)の状態で、子供が二人とも男である確率は、4通りのうちの1つだけなので1/4。
次に、「(火曜日と限定せず)男の子がいる」という情報を得ると、AもBも女という可能性がなくなるので、3通りだけ考えれば良くなり1/3。
この1/4と1/3の差である1/12は「男の子がいる」という情報の持つ価値みたいなもので、この情報がAとBの性別に関する予測の精度を上げていることになります。
で、上のリンク先で与えられている「火曜日に生まれた男の子がいる」という情報では1/3ではなく13/27となります。ここでは「火曜日に生まれた」という情報が付け加わるだけで、なぜか「男の子がいる」という情報よりも4/27、価値が上積みされています。

とまあ、こんな感じで、「火曜日に生まれた」という情報で4/27上積みされるのが直感に合わないと。


ここで、発想を逆転させて、「(1)もしAとBが両方とも男だったら」「(2)もしAだけが男だったら」「(3)もしBだけが男だったら」と考えてみましょう。
このとき「男の子がいる」確率は(1)〜(3)全てで1(100%)です。
それに対し「火曜日に生まれた男の子がいる」確率は(1)で13/49で、(2)と(3)では1/7(=7/49)。ちょっと(1)の方が確率高くなりますね。そりゃ、(1)の場合では男の子が二人おり、少なくともどっちか一人が火曜日であればいいわけだから、確率は上がります。(2)や(3)は一人しか男の子がいない状態で、その子がズバリ火曜日生まれでなければいけないので、ちょっとシビアです。
ということは、「火曜日に生まれた」という情報が付け加わるだけで、若干(1)がもっともらしくなるわけです。


どうでしょうか。「火曜日に生まれた」という情報が、性別の確率に影響を与えるのがなんとなく伝わってきましたでしょうか?




自分で書いてて直感的じゃねーな、と言わざるを得ない。