搜尋

關 於 本 書

‧強力推薦
‧內容簡介
‧作者簡介
‧目 錄

線 上 試 閱

前言
內文摘錄

作 者 作 品

數據之巔:大數據革命,歷史、現實與未來
數文明:大數據如何重塑人類文明、商業形態和個人世界
一小時看懂人工智能
一小時看懂大數據

NEXT

【類別最新出版】
拿回我們的未來:年輕氣候運動者搶救地球的深度行動
我們成了消耗品:全球化海嘯中被吞噬的中產階級
咖啡癮史:從衣索匹亞到歐洲,從藥物、祭品到日常飲品,揭開八百年的咖啡文明史(全新暢銷修訂版)
年輕人為何憤怒:暴力組織的危險誘惑以及我們能做什麼
樂觀者的遠見:在莽撞決斷的時代,我們如何克服短視、超前思考?


數商:向阿里巴巴前副總裁學習數據時代的生存商數(BED0285)

類別: 人文‧思潮‧趨勢>NEXT
叢書系列:NEXT
作者:涂子沛
出版社:時報出版
出版日期:2021年01月15日
定價:450 元
售價:356 元(約79折)
開本:25開/384/平裝
ISBN:9789571384634

 放 進 購 物 車

 轉 寄 給 朋 友

 發 表 書 評 

 我 要 評 等 

Share/Bookmark

線 上 試 閱

 

前言內文摘錄



  內文摘錄

難以戰勝的人類感覺(節錄)

1831 年,倫敦爆發了第一次霍亂大流行。小災進城,大災離城,在巨大死亡陰影的籠罩下,城市的居民都成群結隊向鄉村逃亡。這個時候,斯諾(John Snow,1813-1858)還是一名學徒,他目睹了出城的人流造成交通大壅塞,人走城空,正常的生活被傳染病快速摧毀,這些場景令他心如刀割。

他是一名麻醉醫生,這種傳染病跟他關係不大,但醫者仁心,他開始關注研究這種病。

當時的人們都傳言,霍亂是經由空氣傳播的,城市裡無處不在的臭味和瘴氣是這種傳染病的根源。

倫敦市政府的戶籍登記處有名統計學家,叫法爾(William Farr,1807-1883),他的職責就是記錄人口的最新變化,例如出生、結婚和死亡。這個法爾非常了不起,他在戶政部門工作 30 幾年,建立了完善的倫敦出生和死亡人口記錄體系,他也是上一章提到的,對疾病進行測量的主要宣導者。在他接手霍亂疫情統計之前,辦事員會記錄死者的姓名、地址、年齡和死因,但死因往往很籠統。法爾認為,增加記錄的變數就會增加數據的價值,他將疾病分成 27 類,並勸說醫生在報告死亡病例的時候,從這 27 類疾病當中選出一個死亡的原因,所以經他統計的數據,不僅有年齡、地址和職業,還有具體的死亡病因,這為倫敦的醫生和衛生機構提供了一個新的制高點,使他們有能力追蹤、調查城市流行病發生的時間、地點,分析其模式和原因。

法爾對死因的記錄方式後來成為世界各國普遍採納的模式,不過當時法爾也篤信瘴氣論,他認為汙濁的空氣會淤積沉澱在低處,更高的地方空氣更好,因此居住在高處的人感染霍亂的可能性較低。為了證明這個推測,他在收集霍亂死亡案例的時候增加了一個要求:記錄病人居住地「海拔高度」的數據項目。

霍亂大流行期間,法爾每週都發布倫敦市的死亡報表。這些數據好像真的顯示出高一些的地區病人更少、更加安全。

1848 年,倫敦爆發了第三次霍亂大流行。斯諾發現,霍亂患者的最初症狀都是腹瀉嘔吐,「如果真的是瘴氣傳播,為什麼最先被感染的不是鼻子和肺,而是腸胃?又為什麼一家人當中會有倖存者,接觸病人的醫生也不會被傳染?」

斯諾斷定,霍亂一定是經口腔進入腸胃的。他推測這極有可能是因為喝了不乾淨的水。但當時的科學設備看不到水裡的微生物,被霍亂弧菌汙染的水,看起來完全和正常的水一樣,仍然純淨透明。斯諾無法說服身邊的人相信他的判斷。

斯諾需要的顯然是更多的證據。他深入疫區,挨家挨戶敲門詢問患者和喝水有關的資訊。他發現了一個驚人的事實,1848 年至 1849 年霍亂爆發期間,倫敦市共有 7,466 人死亡,其中 4,001 人都居住在泰晤士河南岸,這意味著南岸的死亡率接近 0.8%,是市中心區的 3 倍,而倫敦西邊和北邊的死亡率僅僅只有 0.1%。

對此,瘴氣論的流行解釋是,泰晤士河南岸聚居了大量的勞工階層,汙濁的空氣導致死亡率更高。

斯諾認為這個解釋是錯誤的,他舉出反證說,倫敦東區比泰晤士河南岸聚居了更多的民工,是全倫敦最貧窮、最擁擠的地方,但死亡率只有泰晤士河南岸的一半。斯諾認為真正的原因是,南岸的倫敦人都飲用泰晤士河的水,而北岸倫敦人的飲用水來源並不僅限於泰晤士河,而是有多個來源。他分析了各個來源,發現死亡的數據和供水的路線有高度相關性。

斯諾的調查數據表明,飲用 A 公司水的家庭有 1,263 人死於霍亂,而飲用 B 公司水的家庭只有 98 人死於霍亂。當然,單純比較死亡的絕對人數是不公平的,因為有些地區的人多,有些地區的人少,斯諾又拿每一萬戶的死亡人數做對比,結論是飲用 A 公司水的家庭,每一萬戶死亡人數約是 B 公司的 8.5倍(315 除以 37)。

飲用不同供水公司的水,每一萬戶死亡人數就會有高達 8.5 倍的差距,這究竟是什麼原因?斯諾又進一步追蹤了兩家公司的水源,他發現 A 公司在流經倫敦市中心的泰晤士河下游取水,B 公司則在上游取水,而當時泰晤士河已經被霍亂患者的排泄物汙染了。

法爾對斯諾的觀點半信半疑,他提出:要測定水源對霍亂的影響,必須要有兩組居民,這兩組人生活在同一海拔高度、活動於同一空間、吃的東西一樣、日常活動也要相同,僅僅一方面不同,那就是喝的水,但在現實中的倫敦,顯然找不到這樣的實驗條件。

然而,斯諾認為,實驗已經擺在眼前。兩家公司的管道都通向所有的街道,進入幾乎所有的院落和小巷,無論貧富,無論房子大小,兩家公司都等而視之地提供自來水服務,而接受不同公司服務的客戶,他們在生活條件或職業方面也無明顯的區別,特別是他們都被同樣的「瘴氣」圍繞,為什麼有的生病,有的沒事呢?

1849 年,斯諾把這些調查和發現編寫成一本小冊子《霍亂的傳播方式》,正式提出水汙染是霍亂流行的真正原因:「再也設計不出比這更好的實驗方式,讓我們澈底地檢測水對霍亂的影響,整套實驗設計已現成地擺在研究者面前,而且這一實驗的規模相當大,多達 30 萬名不同性別、年齡、職業階層和地位的人,從上流人士到底層窮人,被分成了兩組,他們不僅不能主動選擇,而且在大多數情況下對這種選擇毫不知情。」一組得到乾淨的水,而另一組得到被汙染的水,所以斯諾得出結論:水源不乾淨,才是霍亂傳播的真正原因。

斯諾的論斷是天才式的。他在「隨機對照實驗」的概念遠遠尚未產生的時代,就在現實中發現了一次科學實驗。我們後文會闡述,科學的實驗機制要到 20 世紀初才被統計學家確立。但斯諾的這些論述只獲得極少數的人相信,這本小冊子總共才賣出去幾十本。大眾對瘴氣論深信不疑,畢竟,嗅覺是人類一種最原始的感覺,我們相信自己的感覺,就像哥白尼時代的人相信地球是靜止的一樣。人類對感官的迷信可謂根深蒂固,只有一流腦袋才能將數據當作「感覺的替代品」,透過數據來感知我們自己的身體和外部環境。

斯諾告訴法爾,為什麼光看死亡人數,瘴氣論好像很正確?那是因為在海拔高的地方,人口密度往往較低,因此死亡人口總數更少;但真正的原因不是這些地方遠離瘴氣,而是居民遠離了泰晤士河下游,水源較為乾淨。他甚至得出結論說,如果 A 公司將其取水口移到泰晤士河上游,就可以挽救 1,000多人的生命!斯諾最終說服了法爾,在他的統計當中增加一個新的變數:死亡者的飲用水源。

同樣是數據分析,為什麼只有斯諾才能洞察真正的因果關係?我想這源自於他對事實和規律持之以恆的細密追蹤。很多時候,流於表面的觀察都無濟於事,最高水準的成就來自一步一腳印的追蹤和不罷休。「實事求是」,事,就是事實;是,則是規律。實事求是即透過事實分析並發現事物的規律。斯諾的方法,可以總結為實「數」求是:把事實記錄下來,再透過全面細密的數據來尋找規律。