搜尋

關 於 本 書

‧內容簡介
‧作者簡介
‧目 錄
‧得獎記錄

線 上 試 閱

【作者序】寶藏無限大 一切「從零講起」
★從已知推算未知的「茶壺原理」
用貝氏定律預測罹患乳癌的機率

作 者 作 品

語文力向上:國文課沒教的事3
大人的社會課:從阻撓議事到邊際效應,搞懂世界的真實運作
泛知識時代的7堂課:邁向選舉、密碼、商業交易的新思路
公民課該學的事:從自己出發,和社會好好相處
劉炯朗開講:3分鐘讀懂社會科學、文學與自然科學(全三冊)
劉炯朗開講:3分鐘拆解社會科學
劉炯朗教你一次搞懂自然‧社會科學【全二冊】
一次看懂社會科學
劉炯朗不一樣的邏輯課【全二冊】
劉炯朗開講:3分鐘理解自然科學

LEARN

【類別最新出版】
小蟲大哉問:自然生態的科學探察與人文思考
尋找故事開始的地方:故事點石成金30法,人人都能創造自己的成名作
蔡淇華故事法+寫作法套組:《尋找故事開始的地方》+《寫作吧!》全系列
怦然心動的文學課
牠們的情愛:動物的求偶心計與生殖攻防


你沒聽過的邏輯課:探索魔術、博奕、運動賽事背後的法則(VEK1018)

類別: 親子‧童書‧青少年>LEARN
叢書系列:LEARN
作者:劉炯朗
出版社:時報文化
出版日期:2015年07月03日
定價:280 元
售價:221 元(約79折)
開本:25開/平裝/264頁
ISBN:9789571363189

 放 進 購 物 車

 轉 寄 給 朋 友

 發 表 書 評 

 我 要 評 等 

Share/Bookmark

線 上 試 閱

 

【作者序】寶藏無限大 一切「從零講起」★從已知推算未知的「茶壺原理」用貝氏定律預測罹患乳癌的機率



  用貝氏定律預測罹患乳癌的機率

有一個看起來非常簡單,但是應用非常廣的公式叫做「貝氏定理」(Bayes Theorem),貝氏定理是遠在十八世紀(1701~1761),一位英國數學家,也是一位牧師貝葉斯提出的,這個定理說:

P(A)P(B|A)=P(B)P(A|B),

也就是


其中的P(A)和P(B)叫做「事前機率」(Prior Probability),

P(A|B)和P(B|A)叫做「事後機率」(Posterior Probability)。

說得更清楚一點,P(A)和P(A|B) 是在B發生以前和以後A會發生的機率,

P(B)和P(B|A) 是在A發生以前和以後B會發生的機率。

憑直覺,大家會想到,P(A)、P(B)、P(A|B)和P(B|A)這四個數值,彼此之間是有一個相連關係的。比方,按照統計的數據,四十歲以上的女性,每1000個裡,有14個會患乳癌,換句話說,用A代表一個四十歲以上的女性患乳癌這個事件,那麼P(A)=0.014。用X光檢查乳癌的可能是醫學上相當普遍的一個做法,按照統計每1000個女性做X光檢查,有100個的結果是肯定的(肯定表示有乳癌),用B代表一個四十歲以上的女性做X光檢查結果是肯定的這個事件,那麼,P(B)=0.1。

光從直覺來看P(A)=0.014,P(B)=0.1這兩個數字,我們會說,X光檢查是相當籠統的,因為在1000個人中只有14個人患乳癌,但是X光檢查有100個人的結果是肯定。不過,讓我們比較仔細一點地分析,按照統計,一個患有乳癌的病人,用X光檢查得到肯定的結果的機率是0.75,換句話說P(B|A)=0.75,那麼根據貝氏定理:

換句話說,如果X光檢查的結果是肯定的話,病人的確患乳癌的機率只是0.105,這個數字比一般直覺的估計低很多。

假如我有全部的資料,把它攤開來如下:

1000個人裡有14個人患乳癌,剩下來是986人沒有患乳癌,用X光檢查的結果有四個可能:

  患乳癌而且檢查的結果是肯定的,有10.5個人

  患乳癌而且檢查的結果是否定的,有3.5個人

  沒有患乳癌而檢查的結果是肯定的,有89.5個人

  沒有患乳癌而檢查的結果是否定的,有896.5個人


那麼,所有的機率就都可以直接算出來了:


貝氏定理可以用來從已知的事前機率算出未知的事後機率,更重要的是,在有更多新資訊的情形之下,事後機率又可以被視為新的事前機率,再用貝氏定理算出新的事後機率。

在我們上面的例子,P(A)=0.014是一位過了40歲的女性患乳癌的事前機率,P(A|B)=0.105是一位過了40歲經過X光檢查結果為肯定的女性患乳癌的機率。為了避免符號上的混淆,我們用C代表X光檢查的結果是肯定而且的確患了乳癌這個事件,P(C)代表這個事件發生的機率,也就是說,P(C)=P(A | B)=0.105。假設一位X光檢查結果是肯定的女性去做一次血液檢查,那麼我們怎樣分析血液檢查的結果呢?用D代表一位40歲以上的女性做血液檢查結果是肯定的這個事件,用P(D)代表這個事件發生的機率,譬如說P(D)=0.2,換句話說,每100個四十歲以上的女性檢血的結果有20個是肯定的。假設我們知道P(D|C)=0.9,那就是說一個患有乳癌而且經過X光檢查確定的人,檢血的結果是肯定的機率是90%,那麼


換句話說,如果血液檢查的結果是肯定的話,那麼用X光檢查的結果是肯定而且的確患乳癌的機率是0.4725,在這裡我們又看到P(C)是事前的機率,P(C|D)是事後機率之間的關係。(在這裡事前、事後是指血液檢查的事前、事後)

讓我在這裡指出兩個要點:

第一、許多人會誤解「X光檢查結果是肯定的話,患乳癌的機率只有0.105」那句話,以為那就不必做X光檢查了,這個誤解忘記了X光檢查以前,患乳癌的機率是0.014,X光檢查的準確率是75%(14個人患乳癌的人有10.5個人的檢查結果是肯定的),因此如果X光檢查結果是肯定的話,患乳癌的機率提高到0.105,再加上血液檢查的準確率是0.9,所以兩個檢查的結果都是肯定的話,患乳癌的機率就從0.014提高到0.4725。

第二、我的數據只是合理而不是真正的統計數字的數據,只能當作教科書上的例子來看。
讓我們倒過來,先做血液檢查,然後做X光檢查,讓A代表四十歲以上的女性患有乳癌這個事件,P(A)是這個事件發生的機率,我上面講過P(A)=0.014;讓D代表驗血結果是肯定這個事件,P(D)=0.2;我們知道P(D|A),那就是患乳癌的病人經由血液檢查結果是肯定的機率是0.9,那麼根據貝氏定理我們可算出:

也就是說先做血液檢查,如果血液檢查的結果是肯定的話,患乳癌的機率只是6.3%。如果血液檢查的結果是肯定的話,再做X光檢查,讓E代表血液檢查結果是肯定而且的確患了乳癌這個事件,也就是說P(E)=P(A|D)=0.063。同時,P(B)=0.1,P(B|E)=0.75,

可見,先做X光檢查後再作血液檢查,或者是先做血液檢查後作X光檢查,如果兩個結果都是肯定的話,那麼患乳癌的機率都是0.4725,換句話說,檢查的先後次序是沒有分別的。

再看統計數據,在1000人中有14個人患乳癌,但是根據X光檢查有100人的結果是肯定的,血液檢查有200人的結果是肯定的,我們可以看出,兩個檢查都是採取寧枉勿縱的態度,換句話說,把有病的門檻定得比較低,而且相對來說血液檢查有病的門檻又比X光檢查有病的門檻還要低。

看醫生划不划算?

講到這裡,我們只把診斷的結果講完,接下來的問題是,當我們知道了診斷的結果,我們要採取什麼行動,這就是「決策論」中有了資訊後,該怎樣下決定的問題了。讓我們就用X光檢查的結果是肯定的做為資訊,我們的決策是去看醫生,還是不去看醫生,當然,去醫生和不看醫生代價除了費用之外,還包括工作、生活及壽命的影響。
讓我們假設:

    1.患有癌症,找醫生治療,費用是不少的,就算代價是10,000元吧。
    2.沒有癌症,還是去看醫生,費用比較少,就算代價是2,000元吧。
    3.患有癌症,卻不去看醫生,那可能冒一個相當大的險,就算代價是400,000元吧。
    4.沒有癌症,不去看醫生,那麼費用就是出去慶祝,吃一頓大餐的價錢是300元吧。

但是,我們並沒有是否確實罹癌的數據,確切的數據只有X光檢查的結果。首先我們記得X光檢查結果是肯定的話,患癌症的機率是0.105,沒有患癌的機率是0.895,因此如果X光檢查的結果是肯定的話,我們決定去看醫生的代價是:

10,000×0.105+2,000×0.895=2,840,

決定不去看醫生的代價是:

400,000×0.105+300×0.895=42,268,

相形之下,我們當然應該選代價比較小的決定,那就是去看醫生。

反過來說,假設X光檢查的結果是否定,站在決策的立場,我們還是要決定去不去看醫生,首先在已知X光檢查的結果是否定的前提下,患癌症的機率是


沒有患癌症的機率是:

1-0.003888 = 0.996112

那麼,決定去看醫生的代價是:

10,000×0.003888+2,000×0.996112=38.888+1992.224=2031.112

如果不去看醫生的話代價是:

400,000×0.003888+300×0.996112=1555.20+298.8336=1854.0336

相比之下,看醫生的代價還是比不看醫生的代價高一點點,所以決策是:不去看醫生。