首頁>資訊 >
最新消息:錯誤鏈式反應:你看到的權威理論,可能沒有那么可靠 2022-09-14 05:39:12  來源:36氪

1

前段時間,學術界爆出一個大丑聞,《發(fā)現(xiàn)》雜志經過調查,認定一篇由著名神經科學家Karen Ashe為通訊作者、于2006年發(fā)表在Nature上的文章,使用了多張經過篡改的圖像。而這篇文章曾被引超過2300次,是阿爾茨海默癥“淀粉樣蛋白”假說領域的奠基性工作,全球各大公司一半的研發(fā)費用都放在這個方向上。

后果有多嚴重,還有爭議,這不是本文要討論的重點。我想說的是,在結論相對明確的自然科學界,又這么重要的奠基性文章都有問題,可想而知,在社會科學領域,有更多的我們深信不疑的理論,問題可能更嚴重。


(資料圖片)

特別是在心理學、經濟學之類可以用統(tǒng)計數(shù)據(jù)和數(shù)學公式偽裝成自然科學的領域,那些理論、假說,常常用于營銷、服務等有經濟利益的活動,更是值得我們警惕。

2

行為經濟學的經典著作《思考,快與慢》一書中,曾經用“大數(shù)效應”為理論依據(jù),批評很多研究成果樣本數(shù)不足,但立刻就有人指出,本書中大量引用的社會心理學的“啟發(fā)效應”,其實驗同樣存在樣本數(shù)不足的問題。

“啟發(fā)效應”可能是營銷學家和大眾媒體最喜歡引用的心理學研究,比如紐約大學心理學家約翰·巴赫的“熱咖啡效應”,實驗結果宣稱,一個手里捧著一杯熱咖啡的人,會增加別人對他的信任度。

果然,“啟發(fā)效應”的大部分實驗,最后都無法重復結果,讓全世界的銷售員浪費了大量咖啡。

甚至有很多大家耳熟能詳?shù)睦碚?,根本就不是實驗的結果,比如“啤酒與尿布”理論,說超市喜歡把啤酒放在尿布邊上,方便下班回家的年輕爸爸在買尿布時,給自己帶上一罐啤酒,超市因此可以增加啤酒的銷量。

這個理論如此之有名,很多超市都做過這種嘗試,但我們幾乎看不到哪一個超市是這么陳列商品的,只能說明效果得不到銷售數(shù)據(jù)的驗證。

事實上,最早提出這個理論的人,根本就是營銷專家,在某個課程中提到了自己曾經看到某超市這么做,這個效應聽上去頭頭是道,卻完全經不起任何實驗的檢驗。

樣本數(shù)效力不夠是社會學實驗的通病,這是因為,自然科學的要素之間的獨立性比較強,只要符合統(tǒng)計要求的樣本數(shù)就行了;但社會領域大部分事情之間,啤酒與尿布之間,咖啡與客戶成交之間,必然存在忽高忽低的聯(lián)系,小樣本數(shù)下,任何結論都有可能得出。

一個可靠的社會學理論,需要非常大的樣本數(shù)才有足夠效力。

比如心理學上最著名的“旁觀者效應”,即遇到緊急情況救助時,身邊的人越多,得到救助的概率反而更小。為了證明這個效應,達利和拉丹這兩位心理學家,前后十幾年時間里,設計了各種各樣的實驗,單次試驗的樣本數(shù)也非常大,其中的電梯實驗中,助手搭乘電梯的過程中故意丟下一些硬幣或是鉛筆,計算被對方撿起來的概率,研究團隊安排了145名助手搭乘了1497次電梯,前后共有4813個人與他們共乘一部電梯。最后才得到結論:

當他們只與一個人搭乘電梯時,別人幫他撿起掉下的硬幣與鉛筆的概率是40%,而當他與多個人一起搭乘電梯的時候,被幫助的概率只有20%。

即使這樣大的樣本數(shù),后來仍然有多個“旁觀者效應”實驗宣稱得到相反的結論,所以“旁觀者效應”的有效性也沒有那么強。

說到這兒,還有一個問題,包括開頭的“淀粉樣蛋白”,這些都是非常著名的實驗,事關全球幾千萬患者的健康,為什么這么低劣的造假手段,在長達16年的時間,沒有被揭露呢?

這就是學術論文的“錯誤鏈式反應”。

3

有一天,某個學者(通常是社會科學領域)忽然產生了一個見識獨到、似乎很有道理的想法。

于是他設計了一個實驗去驗證,但因為經費有限,或者說,社會科學領域太容易出想法了,平攤下來實驗經費就有限了,他不得不縮減整個實驗的時間,并虛報實驗對象的樣本數(shù)。

非常幸運的是,他得到了驚人的顯著性統(tǒng)計效果,論文發(fā)表后,成為當年該領域的重大成果——事實上,這個想法早有人嘗試,只是因為實驗效果不明顯而被擱置。

更多的研究者開始跟進研究,但不是重復這個實驗,為了讓自己的研究更有創(chuàng)新性,他們會改進這個實驗的某些條件,以得到進一步的研究成果。

非常不幸的是,跟進的研究者大部分無法重復這個結果,他們怎么辦呢?

如果實驗結果完全無效,這些研究者會將之束之高閣,趕快進行下一項研究,而不是發(fā)表文章質疑這個結果;

如果實驗結果有效但不明顯,很多人會懷疑是自己設計或操作上的問題,要么修改結果,要么剔除一部分他認為不正確的結果,以增加顯著性。

于是,越來越多的新實驗,“證實”了這個假說,它也從學術領域進入大眾視野。

直到有一天,某個認死理的研究者,為了搞清楚自己實驗失敗的原因,完全重復了數(shù)遍最初的實驗……

4

總結這個“鏈式反應”,導致錯誤不能被及時糾正的三個原因出自人性的弱點:

1、學者發(fā)論文壓力大,實驗必須要成功

2、習慣于修辭數(shù)據(jù),以讓結果看起來更有說服力

3、質疑權威的風險大,延續(xù)權威結論的收益更穩(wěn)定

所以,不能因為一個理論聽上去很有道理,有一堆數(shù)據(jù)和專家背書,就認為它不可能出錯。

曾經有讀者批評我寫文章,不給列出引用的參考文獻。

我曾經一度也這么做過,可這讓它看起來更像是一篇學術文章,暗示結論的科學性,但我本人并不確定這一點,我沒有能力去重復那些實驗的結果,它們只是看起來有道理,所以我希望它們以某一方面的觀點而不是證據(jù)的形式呈現(xiàn)。

自媒體的文章不具有學術性,無論它的形式多么像一篇論文,它們的目的只是為了完成一篇文章,而不是一項研究。雖然有追求的作者總是盡量選擇可靠的觀點,但文章就是文章,追求的是閱讀率、傳播效果、而不是研究結果的可靠性。

所以,謹慎地對待你看到的任何權威文章,特別是那些看起來對你很有利的,引起你極度舒適的,并讓你產生共鳴的觀點。

關鍵詞: 鏈式反應 旁觀者效應 社會科學

相關閱讀:
熱點
圖片 圖片