狂徒
2024-06-30 14:32

在量化因子領域,一直有「經濟解釋」和「數據挖掘」的取捨。
經濟解釋往往從理論和數學模型出發,而數據挖掘則利用算力和統計指標來篩選。
󠀠
最好的狀況下,我當然希望一個因子既有經濟解釋又能統計有效。
但如果只能二選一,我寧願統計顯著,而不求人為能理解。
󠀠
這種偏data driven的做法,在十年前對一些量化機構都還是很大的挑戰,然而受益於ML發展(尤其DL)和IT建設成本的降低,暴力探索做法也逐漸變得實際。
󠀠
"Does Peer-Reviewed Research Help Predict Stock Returns?"算是很得我心的paper,因為它提到了兩者的差異以及因子衰退幅度。
(10天之前更新,https://arxiv.org/pdf/2212.10317)
󠀠
作者對比經濟解釋因子和數據挖掘因子。
經濟解釋因子來自期刊論文,並經過同儕審查;數據挖掘因子來自於財報比例的組合,t>2的因子有約29000個。
󠀠
他們發現,兩者的超額報酬非常相近(約1%),而在公開發表後,也經歷相似的衰退(約剩0.5%)。
換句話說,數據挖掘本身並不遜於old school的金融方法。
另一方面,投資人比較容易將財報因子歸類,所以這些數據挖掘因子還可以走在人類理論之前,帶動經濟解釋的進步。
󠀠
進一步的,作者又比較一些嚴謹理論因子,發現它們並不如數據挖掘因子。
論文內也提到Cochrane猜想(修過資產定價的朋友應該繞不過他的教科書),理論上有經濟理論支撐的因子在樣本外比較不會衰退,然而實際狀況並不滿足理想假設,因此通過同儕審查的因子很可能並沒有額外意義。
󠀠
作者們也比較了基於風險、錯誤定價和未知因子的穩健性,得出一樣的結論,即數據挖掘和經濟理論的因子表現相似。
即使是最廣為人知的B/M因子和動量因子,和數據挖掘的樣本外表現也不相上下。
󠀠
所以呢?
數據挖掘當然暗藏陷阱,然而應用到實際投資上,表現和基於經濟理論的因子能並駕齊驅,有些地方甚至超越。
我也重申自己的投資哲學,與其追求絕對解釋,不如思考如何利用算力輔助自己。
(以openFE的財報和算子組合而言,一階段就有70萬個因子。)
󠀠
如果妳只是想吵架,那妳可以稱量化投資人為數學家,妳可以對因子投資人說數據挖掘的缺點。
不過如果你認真想獲利,不妨思考怎樣將自身的知識優勢最大化,提取各研究流派的優點。
󠀠
對於因子有興趣的朋友,也歡迎討論指教。
https://line.me/ti/g2/J3M1kPs7vCIRlQ42R7JENbCNXDYQfp3l1YB4dw
󠀠
󠀠
#狂徒投資
#暴徒投資
#因子投資
#量化投資

← 20240710_041525_狂徒分享了 1 條連結。嚴格來說,資產配置涉及投資組合優化、風險評估(標準差/CVaR)和心理的效用函數。 →