從一則健康新聞談起(Correlation does NOT mean causation)

最近有則新聞,有個25歲的年輕人,在近一年內參與多達十幾次的藥物試驗,之後罹患肝癌。請要參與藥物試驗的人三思。

這則新聞它想說什麼?它想說藥物試驗會造成肝癌。這是一個完全錯誤的推論,但是一個很好的新聞題材。

為什麼要在理財部落格談這個,因為很多人在投資時,犯了一模一樣的錯誤。

中國股市某次大跌之後,全球股市下跌。所以中國股市造成全球下跌。錯誤推論。

股市和債券相關性很低。所以股市現在大跌,我的債券應該會上漲,幫我彌補一些損失。錯誤推論。

這些推論都錯在一樣的地方,錯在他們不知道”相關不代表因果”。

一個事情發生,結果另一個事情就會跟著發生。我們會說,這兩件事很有相關性。但不可以馬上跳到,事件A造成事件B這種結論。

這個世界上資料繁多,多到你可以把兩個不相關的事情扯上關係。曾有人發現,孟加拉乳酪的產量可以完美的解釋過去美國股市的走勢。你要不要用乳酪產量來評估是要進場還是出場?任何人都知道這是單純的巧合。

那麼某國股市下跌後,晚一點開盤的國家股市也下跌,所以這就是前者造成的嗎?這個結論跳得太快。

首先,要證明這不是單一事件。也就是要有很多次,兩國的股市呈現相關,我們才能說,這兩個股市有很高的相關性。

即便有很高的相關性,也絕不等於因果。你絕不會說,因為乳酪增產,所以美股上漲。就算這兩者有0.99的相關性,這還是無稽之談。你要找到確切的成因,才能說因為…所以..這句話。譬如乙國規定,假如甲國股市收盤下跌,則本國股市收盤價不得超過前一日收盤價之90%。有這種規定的話,你就可以說因為甲下跌所以乙下跌。

在現實世界,說因果不是那麼簡單的事。很多事,都只研究到相關這一步。

回到新聞中的年輕人。假如你要證明藥物試驗和肝癌相關,你要有兩組人,一組接受藥物試驗,一組不接受藥物試驗,然後追蹤,看接受藥物試驗這組人的肝癌發生率,是否比不接受那組高。假如真的比較高,你才能說,藥物試驗和肝癌相關。做了那麼多,才只是相關,不是因果。因為有太多可能,可能不是藥物引起肝癌,可能是這些接受藥物試驗的人,把拿到的營養費都拿去買酒喝,造成肝病變。也可能是藥物試驗用的針不乾淨,讓這些人都得到了肝炎。要說因果,你要確切找到藥物引起肝癌的機制,這是艱困的工程。

不要混淆相關和因果,很多投資數據呈現的都是相關的概念。

不要以為股市和債券相關性低,所以它們應該走相反的方向。它們可以大大方方的齊漲齊跌,因為它們的走勢之間不是因果關係。更不要看單一事件或是短期內的事情,就以為趨勢已經形成。事實是,長期資料比短期資料的可性度更高。

某個年輕人得肝癌,是個醫藥新聞,不代表相關,更不是因果。

某次XX下跌後,YY也下跌,是個財經故事,不代表相關,更不是因果。


回到首頁:請按這裡

初來乍到:請看”如何使用本部落格

相關文章:
共變異數與相關係數(Covariance and Correlation Coefficient of Financial Assets)

原物料的通膨避險效果(Commodities as Inflation Hedge)

蘋果橘子經濟學(Freakonomics)讀後感---表相與原因

4 comments:

憂鬱豬 提到...

綠角大
看到這篇真的是很認同您的看法
不知道是不是很多人都吸收錯誤的廣告訊息
就以為那是真實的情況!
在下潛水了很久
在理財方面也還只是新新手
常常十分認同您的文章 學會向下扎根

可是胸無點墨實在不敢與您討論
深深覺得您真是佛心來著
分享您的心得,傳道授業

也希望您能繼續分享~
著實獲益良多

綠角 提到...

寫這些文章 我自己也有收獲 自己懂 和能說給別人聽 讓別人也懂 是兩個不同的層次 我不敢說是傳道授業 有時候都會發現過去自己不對的地方 歡迎多留言交流

Wei-Chung 提到...

就藥物本身討論,的確非常多藥物都具有肝毒性,尤其是部份的重症藥物(癌症,心血管疾病)。

做藥物實驗之後引起肝癌,雖然未必是一個必然的結果(肝癌形成非一朝一夕且關聯還需要討論),但是卻不難想像關聯。例如B肝就是病毒長期的攻擊破壞細胞內質網,最後細胞不正常增生成為肝硬化甚至肝癌。藥物誘發肝病不是不可能的。

藥物實驗初期可能沒發現對人具有強烈的肝毒性。Phase 1是用老鼠,有時會發生老鼠身上看不出來但對人嚴重的副作用。

多吃藥不好,沒事別吃藥。綠角大財經論點精闢實用,深表敬佩。就生物醫學角度平衡報導,若非必要請不要亂參加人體藥物實驗。

绿角 提到...

感謝Wei Chung的深入解說