1

分享

為什麼傳統迴歸分析難以精準建模

迴歸分析的大部份理論都是基於直線的估計。 為什麼傳統迴歸分析難以發展精準建模呢?
迴歸分析 統計學 精準建模

圖片來源:維基百科


直線簡單

對估計回歸方程式的係數來說,線性可以簡化求解係數的估計值。還能發展到結構方程式。讓使用者可以同時考慮多個自變數和多條方程式。
試想如果是個函數形式,你要求解並不容易,得依賴電腦。過去上課教學是黑板手寫,要用手寫解答出複雜函數的係數估計值是件難事。所以在發展過程中仍維持在線性概念。
這也是人類最常見、最容易理解的概念。人類的腦袋習慣性尋求簡單的樣子來解決問題。如果可以簡單化,又何必捨近求遠。所以如果直線可以顯示出一些狀況,了解問題所在。這樣的資訊就足夠了。
綜合上述,人類發展和思維是習慣將事情簡化,用簡化後的結果解讀複雜的現象。在過去只能用手算解答出問題時,簡單化提供的資訊就足夠了。
在現今的新科技發展時代也是如此,但不是所有事情都能如此。這也就是為什麼在精準建模上始終難以突破的原因,以及為何各國央行雖然採用一般均衡模型來研究與分析央行政策和經濟體系的關係,卻如夢幻泡影。不過擁有大量的經濟詳盡數據仍可看出一些詳細的關聯,做有效的決策(例如葛林斯班)。

係數估計的統計量得找抽樣分配

迴歸分析有個強烈的假設就是常態分配。常態分配的參數是平均數,而迴歸分析是就對期望值找出估計線的方程式。至於其他分配的參數未必是平均數,甚至可能不存在平均數。所以係數的統計量就難以被檢定。這也就是為什麼要有常態分配的假設。
另外,我們可以說樣本數夠大時期望值可以有近似常態,但多少樣本數才夠呢?沒有研究過就無法知道!而使用者卻不管不顧地使用,就很容易造成無法知道真實的誤差,或者錯認係數是可信的!

容易轉為用做邊際角度解讀

如果數據難以被檢測來自何者分配,自然就以人為認定方式,使用近似常態分配進行檢定。而且從個別係數的檢定以邊際角度解讀效果用,如果你的模型是複雜的函數形式,想用於邊際效果解讀都不是件易事。
原本個別係數檢定是為了確認這些係數在迴歸模型中的顯著性,因為線型方程式的特性,讓使用者轉為邊際角度的解讀,並假設其他自變數不改變的情況。這在一些數學理論中是可行的,但在迴歸分析的整體估計觀念上則是相悖論的。
回到先前段落所言,如果要做精準建模就是整體性資料在尋找模型,並不是要看個別係數所表現的邊際意義。因此,線性模型變成是非常廣泛應用的工具,但違反了初始的理論基礎。使用者將原本整體角度估計的模型用在邊際角度,其實都是直線方程式為他們帶來的勇氣。

結論

直線是人類最廣泛使用的概念,所以在理論發展過程中,容易被拿來使用,並且擴大使用。但是迴歸分析的數據是數對形式。如果是簡單迴歸可以說得過去,複迴歸的係數解讀就說不過去了。這也就是為什麼在理論發展時還是常用二維空間的變數關係來設計,而不是多個自變數。如果要提到多個自變數就用函數形式表示。
另外數學的觀念在推展到迴歸分析時同樣也是因數據是數對形式,它們有聯動關係。我們無法說在其他變數不改變下,只討論某一自變數和應變數的邊際效果。簡單線性迴歸可以,不代表複迴歸可以。
而迴歸分析的目的在尋找機率分配參數的數學形式。這是個常態的條件機率分配。你如果能夠試著獲得條件指數分配的模擬值,可以嘗試看看迴歸分析得到的期望值估計線回對應條件指數分配的哪個參數。或者你可以模擬條件柯西分配,嘗試去看期望值估計線對應哪個參數。
除了學習傳統的迴歸分析,也讓我們跟著時代的演進,嘗試更為了解數據分析與建模技術吧。
#迴歸分析 #簡單迴歸 #複迴歸 #精準建模 #直線方程式
#迴歸分析  #統計學  #精準建模 
分類:學習

🟠掃除觀念的雷點🟠算學的運用🟠建模技術🟠大數據分析方法🟠人工智慧分析方法

評論
上一篇
  • 正在學習商管的你怎樣接軌大數據分析
  • 下一篇
  • 人工智慧重要在哪?
  • 更多文章
    載入中... 沒有更多了