搜尋

關 於 本 書

‧強力推薦
‧內容簡介
‧作者簡介
‧譯者簡介
‧目 錄

線 上 試 閱

推薦序
前言
內文摘錄

譯 者 作 品

如何打造社會企業──以人為本的新商機,幸福經濟帶來大收益
創新可以更好、更快、更有效──全球最權威趨勢獵人,解析6大機會模式,讓商業點子源源不絕
百萬粉絲經營法則:30天3步驟打造社群經濟力,在社交平台擁有百萬追蹤數
危局:攸關自己與下一代的4大政經危機,我們選擇戰鬥或逃避?
我們安靜,我們成功!:內向者駕馭溝通、領導、創業的綻放之路。
下班後的黃金8小時
可以柔軟,不代表你必須一再退讓:讓情緒成為你的後盾,不再委屈自己的EQ練習
創意提問力:麻省理工領導力中心前執行長教你如何說出好問題
經濟學A─Z速查指南:《經濟學人》教你當代最重要的700個經濟學關鍵字
完美投資組合:親訪10位投資界傳奇的長勝策略

投資理財

【類別最新出版】
遠距團隊:打造溝通無礙合作無間的成功團隊
存債致富:每月3000元,輕鬆投資債券抗通膨,穩穩賺,資產不縮水
新創公司IPO的100件大小事:一本讀懂公司首次公開發行,走向上市上櫃之路
新創公司IPO的100件大小事+新創公司的100件大小事【專業會計師教你規劃新創公司套書】
看漫畫零基礎學會 資產配置:讓你「沒事總有錢花,有事不怕花錢」


一次看懂小數據──MIT經濟學家帶你搞懂生活中的統計數字,聰明做決定(BED0241)
Everydata: The Misinformation Hidden in the Little Data You Consume Every Day

類別: 行銷‧趨勢‧理財>投資理財
叢書系列:NEXT
作者:約翰.強森、麥可.葛拉克
       John H. Johnson、Mike Gluck
譯者:吳書榆
出版社:時報文化
出版日期:2017年08月25日
定價:380 元
售價:300 元(約79折)
開本:25開/平裝/336頁
ISBN:9789571370972

停售

 轉 寄 給 朋 友

 發 表 書 評 

 我 要 評 等 

Share/Bookmark

線 上 試 閱

 

推薦序前言內文摘錄



  內文摘錄

Chapter 1
數據,數據,生活無處不數據
──日常小數據簡介(摘錄)

從早晨睜開眼睛那一刻開始,數據就環繞在我們身邊。

根據加州大學聖地牙哥分校全球資訊產業中心「資訊知多少」計畫的調查,一般來說,一個美國人每天平均要用到34個十億位元組(GB)的數據。

34個十億位元組是很大的量,1個位元通常可以容納1個英文字母或數字,根據英國國家廣播公司(BBC)引用的資料,如果你印出34個十億位元組的數據,這些紙張可以裝滿幾十輛小貨卡。這還只是你在家中主動取得的數據量,比方說電視、廣播、電腦和電話,還不包括存在我們身邊、或是在職場上得到的資訊,後者的數量很輕易就能超出這個數字2、3倍。

花1分鐘來想想你可能會接觸到的所有「日常小數據」。就先從你展開一天的前1、2個小時好了:

‧你睜開眼睛,看到的第一個數據──鬧鐘閃動的數字。──估計數據使用量:9個位元

‧你拿起手機,還沒下床,就已經先掃過12封電子郵件、一些簡訊、幾則交通訊息通知和熱門新聞提醒。──估計數據使用量:2.1個百萬位元組(MB)

‧你走進浴室,站上體重計,看到你昨天晚上根本不應該吃披薩的證據。──估計數據使用量:3個位元

‧牙刷能為你提供數據嗎?當然可以。如果你是使用電動牙刷,每30秒會以震動方式提醒你要換個位置刷,這樣的震動就是另一種型態的數據。──估計數據使用量:60個位元

‧叮!手機上的行事曆提醒你今天要和客戶開會。──估計數據使用量:43個位元

‧女兒要你在她的數學考卷上簽名。你如何知道你看到的就是全部?女兒有沒有藏起其他考卷沒拿給你過目?還有,分數代表什麼意義,和她的能力相符,還是只代表她有去上課或其他指標?──估計數據使用量:46個千位元組(K)

‧早上你如何得知新聞消息?奧勒岡大學一項研究指出,與閱讀網路新聞相比,閱讀紙本報紙可以記得更多內容。當你掃過標題時,你看到:

〈民調顯示,76%的美國人不認同國會〉
〈紅襪隊名列第一,連贏15場,取得7勝領先〉
〈天氣預報顯示,今天高溫攝氏21度,低溫攝氏14度〉
〈最新研究顯示,每天1杯紅酒,可降低罹患心血管疾病的機率〉
〈從預算數字看,聯準會將再度調降利率〉──估計數據使用量:3.1個百萬位元組

‧你在想,如果調降利率,房貸再融資的成本(時間和金錢成本)有多高。你開啟手機一套應用程式,寫下備忘錄(它會自動和你的電腦同步),並發送電子郵件給你的配偶。──估計數據使用量:2.2個百萬位元組

‧該上班了,你跳進車子,迎接你的是充滿數據的儀表板。油表燈亮了嗎?引擎溫度多高?胎壓狀況如何?有些數據是藉由警示燈提醒,有的是透過類比傳遞,有的則是顯示在數位螢幕上。──估計數據使用量:63個位元

‧油箱還有4分之1桶油,這代表什麼意思?為什麼油表顯示已經沒油了,你還是能繼續開車?──答案請見第6章。──估計數據使用量:26個位元

‧經過加油站,這家加油站標出的價格比對面那家每加侖便宜了4美分,但是只收現金。每加侖4美分的差價會影響你的選擇嗎?──估計數據使用量:2.0個百萬位元組

‧你停在星巴克買咖啡。你要買16盎司的大杯,還是20盎司的特大杯?你考量著多出來的價格(和多出來的熱量)。你點餐,然後讀每一小包代糖上的標籤,上頭涵蓋了各種營養成分的相關資訊。(真正的砂糖包和蜂蜜包不會有營養成分列表,所以很難和人工代糖比較。)──估計數據使用量:10.1個千位元組

終於到辦公室了,你開始上工。從你緊追新聞,到查看電子郵件、確認工作表、磋商合約、檢視銷售預測、打電話與參加會議,全都是數據,數據一整天如影隨形。

但是,以上這長串清單都還沒搔到皮毛,還不足以解釋數據如何影響你的生活。因為,除了這些數據之外,你還沒決定要去哪裡加油,以及該如何處理小孩的數學成績。

你可以利用數據做什麼?

《時代》雜誌指出,「我們擁有豐富的數據,但數據創造的報酬正快速下降。因為超過某個水準之後,獲得越多的資訊,就越難從中得出意義。」

聽起來心有戚戚焉嗎?不是只有你這麼覺得。

◤小數據,才是真正影響我們的數據

你或許聽過「大數據」。基本上,這類數據對一般人而言數量太過龐大,可以用海量來形容如果,沒有精密的軟體和強大的運算能力將無法處理。舉例來說,「彭博商業網」(Bloomberg Business)有一篇報導說,優比速公司(UPS)每部車蒐集200個數據值(該公司約有10萬部車),利用這些數據來節省閒置的時間與油料,報導指出:「每天每位司機少開1英里,1年就可為公司省下價值5,000萬美元的油料、汽車保養和時間費用。」

全世界都用大數據來解決大問題。荷蘭利用大數據進行水資源管理;食品外送公司利用大數據滿足客戶半夜的嘴饞;IBM利用以千兆位元組(PB)計算的數據,找出可能的食物感染源。

大數據很誘人,經常成為新聞標題。《富比士》一篇報導說,一些和大數據相關的職務,市場需求每年成長幅度超過80%。《華爾街日報》引用數字,說明各種與數據有關的方案計畫快速成長,指出商學院學生需要的「大數據永遠都不夠」。

然而,就像你在前文看到的,小數據──日常生活中位元或位元組很小的數據──通常可以發揮很大的效果,影響你的健康、錢包、工作、人際關係和其他,而且是每天。從食品標籤到天氣預報,從你的銀行帳戶到你的醫生的辦公室,日常小數據圍繞你身邊。

可惜的是,人們並不完全相信這些數據,就算這些資料就攤在他們眼前。

「事實不一定能讓我們改變心意。實際情況正好相反。」《波士頓環球報》一篇報導引用密西根大學的研究發現,接收到錯誤資訊的人,反而容易深信不疑,甚至在面對事實時,更加堅持自己的(錯誤)想法。(顯然,有些人就是死不認錯。)

但是,再多的傳聞也不會變成事實。舉例來說,即便所有鄰居都說今年是有史以來最熱的夏天,也不代表這就是真的。

「我認為,我們面對的最大問題,是過度解讀軼事證據。」艾蜜莉.歐絲特(Emily Oster)如是說。她是布朗大學經濟系副教授,也是《期待更好》一書的作者。當我們請教她一般人如何解讀日常生活中的數據時,她給了上述的答案。

「人都會想從個別的故事或經驗當中學到東西,」她補充,「你很難強迫自己忽略這些軼事,至少,你會把這些傳聞當成參考,試著從這當中得出結論,而不看數據。」

傳聞或許很容易讓人記住,或許很有說服力,但重要的是,事實是什麼。

◤脈絡很重要

我們還要謹記另一件事,在日常生活中,你或許會在脈絡下檢視數據,或是和其他數據比較。有時候,脈絡與額外的數據會有幫助,有時候卻會造成誤導。來看看以下的案例:

‧加州何爾摩沙海灘市,消防隊的平均反應時間只有5分鐘多一點。這樣的反應時間是好是壞?要詮釋這個數據,你可能會和過去的數據相比、和相似社區的數據相比,或是和其他數據相比。

‧休士頓喬治布希國際機場收到申訴,旅客抱怨行李送達時間拖太久。於是,機場管理處把行李提領區搬離入境區更遠的地方,這樣一來,旅客要花更多時間走路,而非等待。之後申訴案件就變少了,因為人們覺得提領行李的時間變短了。

‧我們會用不同的方式使用與詮釋不同媒體上的數據,比方說,你會不會覺得《華盛頓郵報》的網路版比紙本版更準確,因為前者是即時更新?你是否偏愛閱讀紙本雜誌,因為你可以把有趣的文章剪下來?就算同樣都是紙本書,你是否覺得精裝本比平裝本更有權威感?

賽斯.高汀(Seth Godin)曾在一篇部落格貼文中提問:「哪一瓶酒滋味更香醇?是餐廳裡最便宜的、一瓶只要30美元的酒,還是隔壁餐廳定價較高的同一款酒?」所以說,脈絡很重要。

當然,還有各式各樣的隱性數據是你不會察覺到的。比方說,《華爾街日報》報導指出,幾年前,如果你在夏天某個潮濕的日子,利用天氣頻道的應用程式查詢天氣,你可能會看到潘婷Pro?V絲滑洗髮精的廣告(用來對付毛躁髮)。你會看到這個廣告似乎只是巧合,但實際上,廣告瞄準女性,並且根據她們查詢的地區,如果當地濕度高(會讓頭髮毛燥),廣告就會出現;如果濕度低,就顯示不同的護髮產品。當你查詢天氣,你也會看到廣告,但除非你在天氣頻道工作,不然的話,你可能看不出來兩者的關係。

在一個數據導向的世界裡,你不一定知道是什麼在導引數據。

◤當聰明的數據使用者

當一個聰明的數據使用者,你的任務是不斷問問題,了解你看到的數據如何影響你的生活。
你必須自問:

‧政治候選人在電視競選廣告中有哪些話沒說出來?
‧記者用的是精準樣本數據,還是,他只是拿出支持他報導的數據?
‧銷售預估仰賴哪些數據?
‧你的醫生是說你的病是因某種行為而起,還是僅僅說兩者有些關連?
‧行銷人員在產品包裝上強調哪些重點,為什麼要凸顯這些數據?
‧為什麼年報用圓餅圖顯示某些數據,卻用柱狀圖顯示其他數據?

有時候,數據試圖告訴你某些事,可能是產品、服務或觀點。有時候,光是知道新聞主播希望引起你的注意,政治人物想要你的選票,以及廣告主想要賺你的錢,你就能成為更好的數據使用者。但有時候並沒有其他考量──你就是須要弄清楚這些數據,才能理解這個世界。

而這也是本書的重點:幫助你在生活中辨識「日常小數據」,知道如何去解讀;並提出經過千錘百鍊的祕訣,幫助你避開常見的數據陷阱。你可以成為一個有素養的數據使用者,在生活中做出更好的決策。
我們開始吧。

Chapter 7
當心採櫻桃的人
──選擇性表述(摘錄)

◤何謂「選擇性表述」

英文片語的「cherry picking」,字面意為「採櫻桃」,引申為「選擇性表述」,起源很可能來自實際採櫻桃的動作。請這樣想:你在櫻桃園裡,帶著籃子和梯子,你的工作是用櫻桃裝滿籃子,拿到市場出售。你會跳過看起來受傷或還沒有成熟的櫻桃,你會用你能採到賣相最好的櫻桃裝滿籃子。因此,「採櫻桃」就用來指稱你會挑選其他人想要的東西(可能是數據或櫻桃)。

當然,「採櫻桃」的另一層意義,是指摘取最低處的櫻桃,這也是一種比喻性的說法。比方說,在籃球比賽裡,「採櫻桃球員」是指留在對手半場,在籃框下等待的球員,等隊友抄到球長傳,就可以輕鬆帶球上籃或灌籃。

就我們目的而言,我們談的「選擇性表述」,是指選擇最有利的數據,並忽略其他和預期結果相衝突的數據,以利立論。或者,就像一份研究說的:「取最好的,其他不要。」

那麼,你為什麼要當心選擇性表述?就像我們在第2章中看到的,當你檢視來自相同數據的不同樣本時,得出的結果可能大不相同。如果你故意這麼做,就有辦法得出你想要的結果。

來看看一家從午餐做到晚餐的餐廳。某一天,這家餐廳計算每小時有多少人來用餐,以下是他們得到的結果:

上午11點:2人 / 中午12點:25人
下午1點:30人 / 下午2點:3人
下午3點:0人 / 下午4點:2人
下午5點:28人 / 下午6點:35人
下午7點:5人 / 下午8點:3人

隔天,一位潛在買家想知道這家餐廳的生意好不好。「好極了,」餐廳老闆說,「我們午餐和晚餐時段都客滿,人都排到門外去了。」這位潛在買家離開,準備好要出高價收購這家小餐廳。

2分鐘後,房東走了進來,對餐廳老闆說要提高租金2倍。「你不能這麼做!」餐廳老闆說,「這個地方大部分時候都空蕩蕩的!」

當然,兩種說法都百分之百正確,但也都百分之百是選擇性表述。如果你只看午餐和晚餐的熱門時段,餐廳門庭若市。如果你僅看中餐到晚餐之間的時段,餐廳幾乎沒人。同樣的數據──不同的樣本和選擇性表述──得出的結果大不相同。

◤你也會做選擇性表述──對,說的就是你

到目前為止,你應該可以想到你在生活中會做的幾種選擇性表述。比方說,你可能做過:

‧填寫線上約會檔案
‧替同事寫推薦函
‧沒對伴侶說那個週末在賭城發生的事
‧決定今天不除草,因為好像會下雨

在上述所有情境中,你不可能用上所有的數據,你只會用你想用的數據。

當然,本來就不可能納入全部的數據。請想一想你的履歷,或是在LinkedIn網站上的檔案。從定義上來說,這些都是你過去所做所為的摘要,而且(多數時候)目的是為了幫助你得到一份更好的工作。那麼,你當然只會列出職涯重點,而且只囊括那些能讓你加分的項目。這仍是選擇性表述。你知道,你的主管知道,人力資源經理也絕對知道,也因為這樣,面試通常都設計成要揭開履歷上沒說的事。

◤只為娛樂

如果你是運動迷,你看過與聽過的選擇性表述的統計數據可能比一般人多很多。請想像一下:現在是1988年,你正在看一場世界大賽,今天是奧克蘭運動家隊對洛杉磯道奇隊。9局下半,2人出局。再過幾分鐘,我們就會看到道奇隊的柯克.吉布森(Kirk Gibson)打出棒球史上最讓人念念不忘的一計全壘打,此時,電視螢幕上出現了以下這些統計數據:「過去10年,在10次世界大賽中,有7次冠軍是由輸掉第一場比賽的隊伍抱走。」

這為什麼是選擇性表述?首先,播報員僅選擇談第一場比賽的輸贏。如果現場播報的就是第一場比賽,那還可以理解的。但為什麼他們把樣本集合限在過去10年?而不是5年?或20年?或30年?如果樣本集合不同,數據還會說出一樣說的故事嗎?

下一次,當你在看比賽(或是從收音機聽比賽,或是讀到報紙上的運動版)時,請看一看(或聽一聽)這類選擇性表述的統計數據。這些統計數據聽起來很有娛樂效果嗎?絕對是。可以幫助打發投球、牽制和傳球之間的時間嗎?當然。但有用嗎?沒什麼用。

◤覺得好一點了嗎?

在總結本章時,讓我們檢視行銷人員如何做選擇性表述,使得一般消費者難以看出各個品牌之間的差異。
來看看以下3種說法,來自於3家不同的醫療保健機構:

‧「____醫院22度被列為全美第一。」
‧「____醫院排名第一的專科超過全美任何一家醫院。」
‧「____醫院的醫生名列全美頂尖醫師的人數高於全美任何一家醫院。」

當你讀這些說法時,聽起來像是這3家醫院都希望你認為他們是最好的。但是,不管任何調查或研究,假設沒有3個機構並列第一的話,應該都只有1個第一名。

那麼,其他人怎麼辦呢?他們做選擇性表述,只為做出最強而有力的宣傳。

■面對選擇性表述,當聰明的數據使用者

當選擇性表述出現在你面前時,你要如何辨別?你可以從現在就開始做以下5件事:

1 首先,在尋找或使用任何統計數據時,閱讀小字說明。在嘉寶的範例中,我們可以從附註和免責聲明裡爬梳出很多資訊。進一步檢視警告、內文和註腳。當人們引用研究時──尤其是廣告主在引用時──你通常會看一位專家背書,有些是聯邦貿易委員會或其他機構規定一定要有的。要當聰明的數據使用者,請拿起放大鏡,好好閱讀小字說明。

2 第二,想一想你看到的數據是否出於任意(或有意義)的選擇,是否會導致特定的結果。比方說,運動界就經常可以看到任意選擇的數據。每當你聽到播報員說「在過去19場比賽裡……」或「自2002年以來……」時,就是在做選擇性表述。有什麼理由使用從特定時間點開始的數據嗎?你可能只是在聊季後賽,或是分析總統大選,或是檢視重要事件之前(或之後)發生了什麼事,比方說政策的改變,你都必須思考你看到的數據究竟是出於某個人任意的選擇,還是這樣的選擇實際上是有意義的。

3 第三,問一問少了那些數據。在嘉寶的範例中,我們看到有一群小兒科醫生根本不推薦嬰兒食品,另外還有一群不推薦任何特定品牌。當嘉寶提出「8成」的說法時,都沒有包含這兩群人。被忽略的數字,可能和被提出來的數字一樣重要。想一想裝了半杯水的杯子,樂觀主義者會說是半滿的,悲觀主義者會說是半空的,他們都是對的,但也都是選擇性表述。如果你想做出更好的決策,你需要全貌。

4 第四,不要賦予任何統計數據過多的意義,超越該有的程度。更全面的思考,不要被任何看來強而有力的單一數字左右,那可能是出於選擇性表述,無法精準表述全貌。如果一個紅襪隊球迷告訴他的兒子說,貝比.魯斯(Babe Ruth)在打者生涯中,被三振的次數達1,330次,小孩可能會認為這位球員很糟糕。
   
5 最後,多問問數據是從哪裡來的,這麼做永遠是對的。比方說,我們都很愛咖啡,這本書有一半的篇幅是在咖啡店寫的(我們需要用到一整頁的篇幅,才能向所有友善的咖啡師致謝)。然而,當你讀到美國國家咖啡協會的一篇報告,協會理事長與執行長說,現在人喝咖啡的量越來越大時,你無須驚訝。畢竟,國家咖啡協會的核心目標,是要「擁護美國咖啡產業的福祉」。不管你讀的是任何產業組織的新聞稿,當中的消息很可能都映照出這個群體積極的一面。(不過《華盛頓郵報》也有報導,「一份由奶油產業出資的相關的研究,發現奶油對人體不好。」)一如往常,當你在使用數據時,要想一想來源。

因此,下一次當你聽到主管說,因為「上個月銷量下滑」無法幫你加薪時,問問看他上一季,或是去年,或是過去10年的銷售狀況如何。

當你家中12歲的小孩吵著要看限制級的電影,理由是他「所有」的朋友都看過時,問問看他的數據集合有沒有把所有朋友都囊括進來,還是,他只算那些父母很酷的小孩。

還有,如果你聽到有人說「8成的人……」時,就該開始問問題了。