■書籍:運は数学にまかせなさい

20070912_book01
運は数学にまかせなさい ―確率・統計に学ぶ処世術
著者:ジェフリー・S・ローゼンタール
訳者:柴田裕之
監修:中村義作
発行:早川書房
価格:2000円+税

 竹内薫センセが紹介していた「運は数学にまかせなさい」という本の「モンティ・ホール」について書かれている部分を読んだ。あとの部分は、ざっと流し読み程度だけど。

 この本を読んでわかったことは、モンティが司会を務めていたテレビ番組の名は「レッツ・メイク・ア・ディール(仰天がっぽりクイズ)」で、賞品は「新車」ということ^^;

 「それだけかい!」というツッコミが聞こえてきそうだが;;この本では、他にもさまざまな確率問題を紹介している。

 たとえば「死亡率50%の病気があったとする(仮に確率性疾患と呼ぶ^^;)。この病気の患者5人に新薬を投与したところ、全員が回復した。はたして、この新薬の効き目はいかほどのものか?」

 頻度論派の統計学者は、この病気にかかって助かる確率は50%なので、5人全員が助かる確率は、P=(1/2)^5で(1/32)、P=3.125%になる。なにもしないで5人全員が助かる確率は5%(有意の条件?)に満たないので、まったくの偶然から回復するとは考えられない。この新薬は有効であるという結論を下す。

 ベイズ派の分析方法は、まず、薬の効き目に事前確率(先験確率)を割り当てる。この新薬が特効薬である確率を50%、まったく効果なしの確率を50%とするのだ。その後に、新薬を投与した5人の患者は、全員、回復したという事実に基づいて、事後確率(条件付き確率)を算出する。

/*以下引用(ただし、漢数字を半角数字に変更)—–
 2つの可能性(特効薬か無効か)は5分5分であるという事前確率を想定している。だから、比例の原理が使える。つまり、もし5人の患者が全員助かれば、この薬は無効ではなく特効薬である可能性のほうが32倍高い。これは、この薬が特効薬である事後確率が33分の32(約96.97%)、無効である確率が33分の1(約3.03%)であるということだ。
—–引用終わり*/

 これを読んですんなりと疑問を抱かず理解できただろうか。少なくとも私は、5人全員が助かる確率は(1/32)なので、その32倍は(32/32)=1(100%)と考えてしまった;;

 そこで、ちゃんと読み直してみる。どうやら私は「比例の原理」を理解していないらしい。この本では、以下のような例を用いている。

 あなたには「アリス」と「ブレンダ」という2人の妹がいる。あなたがシャワーを浴びようとしたら、すでに妹のどちらかがシャワー室を使っていた。あなたはシャワーを使えない怒りをどちらの妹に向けたらいいのかを考える。可能性としては、アリス、またはブレンダである確率は5分5分だ。すると、シャワー室から歌が聞こえてきた。アリスは歌が好きで、たいていシャワーを浴びながら歌を口ずさんでいる。いっぽうブレンダがシャワーを浴びながら歌を口ずさむのは、4回に1回くらいだ。当然、シャワーを使っているのはアリスである確率が高まる。でも、いったいどのくらい?

 ここで、あなたはひらめく。アリスがシャワーを浴びながら歌を口ずさむ可能性がブレンダの4倍とすると、アリス対ブレンダは、4対1の比で表すことができる。つまり、アリスである確率は(4/5)、ブレンダの確率は(1/5)となる。

 なるほど! ブレンダがシャワーを浴びながら歌を口ずさむのが「4回に1回」と聞いて、(1/4)の確率と考えたのは間違いではないが、これはブレンダのみの確率。アリスがシャワーを浴びながら歌を口ずさむ確率は(3/4)ではなく、たいてい…つまり(4/4)だ! ふたりが歌を口ずさむ回数は1回+4回で、5回としなければならなかったのか;; つまり、先ほどの例で言えば、薬を投与しない場合、投与した場合のそれぞれの回復率は、(1/32)と(32/32)になり、全体から見れば(1/33)と(32/33)となるわけね。

/*以下引用 —–
 この例からは重要な考え方が浮かび上がってくる。私はそれを「比例の原理」と呼んでいる(これは「ベイズの法則」の特殊なケースだ)。もし、別々の可能性(アリスがシャワーを浴びている可能性とブレンダがシャワーを浴びている可能性)が最初の時点では同じ確率と考えられる場合、新たな証拠(歌が聞こえたこと)が出てきたら、それぞれの可能性に比例するように(この例では、アリスが歌う可能性とブレンダが歌う可能性に比例するように)最初の可能性を見直さなければならない。
—– 引用終わり*/

 う~ん、どうだろうか。アマゾンなどで、この本のレビューを見ても、確率の問題をわかりやすく解説してくれている本という評価なのだけれど、もちろん、数学落ちこぼれの爺には数式を使って説明されても、ちんぷんかんぷんだ。そういう意味では、わかりやすいのだけれど、それだけに、数学とは縁のない人に確率の問題を文字だけで理解してもらうのは、やはり大変だ。

 この本の導入部分は、飛行機事故の話から始まるが、確率の話をするとき、飛行機事故に合う確率が引き合いに出されることが多い。ここからは、この本とは関係のない、よもやま話。

 飛行機の「10万フライト時間あたり、死亡事故は0.07件」というデータがあったとする。毎日、飛行機に乗り続けても事故に遭遇するのは438年に1回だそうだ。しかし、これまで一度も飛行機に乗ったことがなく、これからも乗るつもりのない人が飛行機事故に遭遇する確率は「0%」だよね。自分の頭上に飛行機が落ちてこないかぎりは……^^;でも、この場合、どちらが事前確率になるの?

 もうひとつ、たまたま手元にあった「同時に学ぶExcelと入門統計学」(新田功・著)という本におもしろい問題を発見した。

 問題:日本人の6人に1人が高齢者(65歳以上)です。自宅の前を通りがかった5人の通行人のうち、高齢者が3人である確率と、高齢者が2人以下である確率を求めなさい。

■高齢者が3人の確率
20070912_01

Excelの出した答え:約3.2%

■高齢者が2人以下の確率
20070912_02

Excelの出した答え:約96.5% 2人以下である確率は二項分布の累積確率関数を使って求める(関数形式をTRUEにする)。

 で、問題文に「ただし、自宅の場所は、渋谷(高齢者率は全国平均の1/2)とする」あるいは「自宅の場所を巣鴨(高齢者率は全国平均の2倍)とする」とあった場合、渋谷という条件や、巣鴨という条件は、事前確率なの? 事後確率なの?

20070912_book02
同時に学ぶExcelと入門統計学
著者:新田 功
発行:ムイスリ出版
価格:1900円+税

“■書籍:運は数学にまかせなさい” への1件の返信

  1. ああ、なるほど。そう言う風に解説してるんですね。
    ぶっちゃけ「比例の原理」なんて聞いたことが無くって(笑)「何の事だろ?」とか思ってたんですが、どうやら次の一文見る限り「この本限定での」ローカル原理みたいですね(別にそれが悪いとは言いませんが)。
    >私はそれを「比例の原理」と呼んでいる(これは「ベイズの法則」の特殊なケースだ)。
    例えば、確かに薬の例なんかはかなり巧妙な説明だと思います。ただし、50%の事前確率が「薬の有効性」に付いてなのか、ないしは「死亡率」を指してるのか、この辺りを正確に読まないと、かなり誤解するでしょうねえ。
    ちなみに、オーソドックスにベイズ統計学を適用すると、まずは「薬が効く」確率をθとして二項分布でデータ(試行数5成功数5)を組み入れた確率分布(特に尤度と言います)を作ります。
    L(θ|y)∝θ^5×(1−θ)^0
    それに事前分布としてベータ分布を乗じます。ここでベータ分布に付いては細かく解説しませんが(笑)、θの分布を表すものです。これはパラメータαとβにより形を変えるもので、α=1、β=1の時、0≦θ≦1の範囲で一様分布となります。すなわち、「効く確率」は0〜1の間で「どれもあり得る」と言う事ですね(ここで注意してほしいんですが、事実上「確率の確率」分布を考えてるんです)。そしてその期待値は1/2となるんです。
    そしてこれを積分形のベイズの定理
    P(θ|y)=L(θ|y)*B(1,1)/∫L(θ|y)*B(1,1)dθ
    で計算します。ここでB(α,β)はパラメータα、βを持つベータ分布です。
    ちなみに、計算後の事後分布の期待値は実は6/7(≒85.71%)になり、最頻値(モード:事後分布の最大値)は1(=100%)になりますね。
    まあ、上の計算結果は「点推定」なんですが、本の方の計算は恐らく何らかの「区間推定」と結果帳尻が合う、んでしょう(僕の方では試していませんし、その辺りは書いてないんで何とも言いようがありませんが)。
    と言う訳で、僕がやった方は、例えば「テレビ向け」解説と言う意味では当然全然ダメダメなんですが(笑)、かと言って、本の計算もそのまま鵜呑みには出来ませんね。
    アリスのブレンダの例も面白いです。この辺りは例の小島先生の書いた本の「標本空間の取りかた」に相通じるものがありますね。あるいはオッズと言うべきか。
    ガスコンさんが仰ってる通り、アリスである確率とブレンダである確率がそのまま比較できるのか、と言う問題があります。ちょっとこの辺りはかなり怪しいんですよ(笑)。
    例えば医療統計なんかで、「A氏がガンにかかる確率はB氏のそれより〜倍大きい」なんて事平気で書いてたりするんですが(笑)、直感的に「それって成り立つの?」とか思います(笑)。当然ある個人内で生じる確率が他と比較出来る保証はあると言えばあるだろうけど、ないっちゃねえだろ、と(笑)。
    オーソドックスなテでは確率同士を直接比べる事は無く、「オッズ比」
    オッズ比=p/(1-p)
    とか「ロジット」
    ロジット=log|オッズ比|
    なんかで比べるのが定式化してるんですが、それにせよ「何だかなあ・・・」って感じではありますよね(笑)。かなり怪しいんじゃなかろうか(笑)?
    いずれにせよ、このジャンルは魑魅魍魎ですよ(笑)。

コメントは受け付けていません。