什麼,魔鬼也用統計,看怎麼對付那些善良的人?NO no no,你理解錯了,不是魔鬼的統計學,是超級有趣的統計現象,會讓我們覺得驚詫,讓我們覺得奇幻無比,就像是魔鬼那些出神入化的手段一樣。
大資料時代直覺輸給了基於資料的決策
白天你和閨蜜一起逛街,不知怎麼的就聊到準備要寶寶的事,結果晚上當你開啟某個APP,關於懷孕、優生優育的資訊撲面而來,各種嬰童用品也紛紛彈出。你會覺得好貼心是不是?
有一天你突然覺得咳嗽了幾下,覺得胸口有點悶,正在納悶是不是生病了。當你開啟APP,推薦給你的都是肺上的各種疾病,是不是突然有種被監控的感覺?
這就是我們熟知的演算法推送。是基於大資料時代,系統掌握了足夠多的資訊,對每個人的喜好進行了全面的分析,然後把我們可能感興趣的資訊推送給我們。就像上面兩個情形,其實我們可能在另一個購物軟體上搜索過嬰童用品,或者在其他搜尋頁面瞭解過肺部的症狀。這些APP相互之間有資料交換,於是其他的APP都紛紛推送類似的內容給你。
現在使用的大型資料集合,非常非常大,通常都是用太位元組或者拍位元組(1太位元組=1000G,1拍位元組=1000太位元組)。1太位元組非常龐大,整個國會圖書館大約有20個太位元組文字,而沃爾瑪資料庫存放了超過570太位元組資料。
國際象棋大師加里·卡斯帕羅夫輸給了深藍計算機,並不是計算機有了多麼高超的智力水平。而是深藍系統整合70萬盤大師棋局,並在幾秒鐘之內進行高速運算和推演,並選擇最有利的進攻或者防守。所以,高速運算有時候具有非常強的力量。對於個人的購物、生活、思維習慣等等,如果你自己來做一個問卷和一個基於大資料運算出的結果,你可能會非常驚奇地發現,大資料往往比你自己甚至更瞭解自己。
循證醫學可以降低誤診率
直到今天,醫生是否應該特別關注統計證據這一問題仍然存在爭議。但是對於患者而言,能更快地找準病因,對症下藥,然後儘快康復,才是重要的。
為什麼生病之後鄉看不好,就轉到市裡,市裡不行就到省裡,一級級往上轉診呢?我們經常說,人家省裡的某個專科醫生一天看的病人,比鄉里醫生一年看得還多。高一級醫院的醫生在大量接觸病人的過程中,對各種疑難雜症都有所瞭解,然後逐步掌握了治療方法。而有些鄉村醫生,一輩子可能也不會遇到那些特殊病例,或者看到了也不認識,只能根據自己的經驗判斷,說不定就誤診了。
診斷決策支援軟體“伊莎貝爾”,醫生輸入喊著的症狀,獲得最偶可能的原因清單。這樣可以極大地地幫助醫生去思考一些未被重視的細節,或者對一些非常見但是典型的症狀可以提出更多的的猜測。最難能可貴的是,這種關於相關性的預測不是非黑即白的布林式搜尋,而是其他可能的提醒系統。這和醫院的會診其實很相像,不過是不同時代、不同國家的醫生的研究成果,由軟體檢索出來,給醫生做出判斷提供更多的依據和遵循。
所以這種統計方法,無論是對於醫生、還是患者,都是大有裨益的。醫生不需要因為自己的權威受到了挑戰,就質疑這種技術。
隨著計算機技術的發展,我們的世界正在迅速的數字化。每個人的個人資訊、行為,都被網際網路記錄並在別人需要的時候被知曉。由伊恩·艾瑞斯撰寫的《魔鬼統計學》,讓我們瞭解到,我們以為不能算的,其實都能算。這些演算法可以為我們帶來收益、避免損失,甚至是拯救生命。伊恩·艾瑞斯是《紐約時報》“魔鬼經濟學”部落格的專欄作者之一,以《魔鬼經濟學》文風再講統計學。讓你在一個個咂舌的案例中,瞭解統計的強大,開啟你對統計的全新認識。