分享

機率不是預測的工具

機率 預測 預測未來
在生活中,我們很常聽到天氣預報的用語「明天降雨機率70%」。這看起來明天要帶雨具出門,因為下雨的機會很高。可這70%的使用是正確的嗎?
機率這個用法是有其嚴謹性的,它來自數學,形成定義、公設等。所以就讓我從機率的概念開始說起,你才能了解為什麼機率不適合用在預測。
所謂機率是來自於「機率空間」並且滿足機率公設的計算方法。

機率空間的概念

那什麼是機率空間呢?我們以(Ω, F, P)表示。Ω 稱為樣本空間,代表所有一個隨機試驗的所有可能結果的集合。
就像我們想知道在台北市東區的某百貨公司門口,12:00我們遇到的顧客是男性(身份證判定)的機會多高,那麼Ω裡頭就有{男, 女}。事件為此隨機試驗的一些可能結果,例如:「在台北市東區的某百貨公司門口,12:00我們遇到的顧客是男性」。
FΩ子集合的集合。這是什麼意思呢?Ω子集合可以是{}, {男}, {女}, {男, 女},這四種。Ω子集合的集合就是這四種放在一起,{{}, {男}, {女}, {男, 女}}。會出現哪種結果是未知的。
上述讓我們知道Ω, F, A。A來自F。如果有若干個事件A(Ai)可完整切割Ω,則每個事件Ai 都來自F,並且合在一起就是完整的Ω。這個稱為事件Ai 聯集為樣本空間。
既然A來自F,我們就以F為定義域,通過P函數,轉成介於0到1的數字,稱為機率或機率函數。此函數要滿足公設:
  1. 對於所有事件A,可得到P(A) ≥ 0
  2. 對於Ω,可得到P(Ω) = 1
  3. 若干事件A無交集,所以所有事件Ai聯集的機率是所以事件Ai的機率和
機率 預測 預測未來

方型為樣本空間,由設事件Ai切割樣本空間


各位看出來了嗎?想要計算機率值,得先有樣本空間(Ω)和sigma-field(F)。如果樣本空間(Ω)和sigma-field(F)裡頭沒有未來的數值或是未來事件,那用機率算未來是不可能的!
所以預測用機率值的計算方法是有問題的!我們不可不察。那你會想知道這前面提到的70%是什麼意思?通常我們會用過去的歷史資料計算後,再用條件機率去計算。例如下雨機率為70%,可以是全體歷史資料量為分母,下雨的天數做分子,得到機率值,這稱為邊際機率,P(A)=0.7。另一種的條件機率,以P(A|B)表示,如果事件B為濕度標準,在高濕度的條件下,下雨的機率值。
網上查詢降雨機率的算法後,發現是以圖像比對,從過去歷史圖像,挑出相似圖像,再由過去情況看接下來是降雨或晴或陰等。計算過去情況占相似圖像個數的比重。這可視為有事件B的存在所計算得到條件機率。
事件B是現在的圖像,事件A是接下來的時間氣候圖像。這讓人感覺到有前後的時間關係,產生預測感覺。但若以機率定義來看並無未來的情況,所以機率不是預測工具,是無法做預測的。
#機率 #預測 #分析 #建模 #觀念
其他參考:《高中數學與程式》影片:機率定義與性質
#機率  #預測  #預測未來 
分類:學習

🟠掃除觀念的雷點🟠算學的運用🟠建模技術🟠大數據分析方法🟠人工智慧分析方法

評論
上一篇
  • 你必須知道大數據的兩三事
  • 下一篇
  • 迴歸分析不能不說的二三事 (上篇)
  • 更多文章
    載入中... 沒有更多了