引言

量化投資中經常聽到的「多因子模型」是個什麼鬼?因子是影響因素的簡稱,或簡單理解成指標。我們都知道股票收益受到多重因素的影響,比如宏觀、行業、流動性、公司基本面、交易情緒等等。所謂「多因子模型」,說白了就是尋找那些對股票收益率最相關的影響因素,使用這些因素(因子或指標)來刻畫股票收益並進行選股。

多因子模型是量化投資領域應用最廣泛也是最成熟的量化選股模型之一,建立在投資組合、資本資產定價(CAPM)、套利定價理論(APT)等現代金融投資理論基礎上。多因子模型假設市場是無效或弱有效的,通過主動投資組合管理來獲取超額收益。多因子選股的核心思想在於,市場影響因素是多重的並且是動態的,但是總會有一些因子在一定的時期內能發揮穩定的作用。在量化實踐中,由於不同市場參與者或分析師對於市場的動態、因子的理解存在較大差異,因此構建出各種不同的多因子模型。

作為多因子模型入門篇,本文主要介紹多因子模型產生的理論背景、基本原理和實現步驟等,為大家學習和研究多因子量化選股模型提供一個背景知識和理論框架。

多因子模型的理論背景

現代金融投資理論主要由投資組合理論、資本資產定價模型、套利定價理論、有效市場假說、期權定價理論以及行為金融理論等組成。這些理論的發展極大地改變了過去主要依賴基本分析的傳統投資管理實踐,使現代投資管理日益朝著系統化、科學化、組合化的方向發展。

1952年馬柯維茨(Markowitz)在The Journal of Finance(金融學最頂級的學術期刊)上發表了《證券組合選擇》論文,開啟了現代證券組合管理理論的先河。馬柯維茨開創性地引入了均值和方差來定量刻畫股票投資的收益和風險(被認為是量化交易策略的鼻祖),建立了確定最佳資產組合的基本模型。

其後,越來越多的經濟金融學者通過數量化的模型以及周邊市場和投資交易問題。夏普(William Sharpe)、林特爾(John Lintner)、特里諾(Jack Treynor)和莫辛(Jan Mossin)分別於1964、1965和1966年在馬柯維茨投資組合理論基礎上,發展出了資本資產定價模型(CAPM)。該模型不僅提供了評價收益-風險相互轉換特徵的可運作框架,也為投資組合分析、基金績效評價提供了重要的理論基礎。

CAPM模型認為所有證券的收益率都與唯一的公共因子(市場證券組合)的收益率存在著線性關係。1976年,針對CAPM模型存在不可檢驗性的缺陷,羅斯(Stephen Ross)提出了套利定價理論(Arbitrage Pricing Theory,APT)。套利定價理論以收益率形成過程的多因子模型為基礎,認為證券收益率與一組因子線性相關,這組因子代表證券收益率的一些基本因素。事實上,當收益率通過單一因子(市場組合)形成時,將會發現套利定價理論形成了一種與資本資產定價模型相同的關係。因此,套利定價理論其實是一種廣義的資本資產定價模型,該理論成了多因子量化選股模型的重要理論基礎。

但是套利定價理論並沒有指出影響證券收益的具體因素,在應用中需要預先判斷哪些因素可能影響證券收益,並使用統計分析方法進行驗證。研究者從不同角度出發,發現了各類影響證券收益的因子,比較經典的有Fama-French三因子模型

市場中的小市值、價值股表現明顯超過市場,而這一效應不能用CAPM模型解釋。1981年,大衛·布斯和雷克斯·桑奎菲爾德成立了維度投資顧問公司,買入小市值、低估值的股票,獲得了高額回報。1992年,Fama和French對美國股票市場決定不同股票回報率差異的因素的研究發現,股票的市場的beta值不能解釋不同股票回報率的差異,而上市公司的市值、賬面市值比、市盈率可以解釋股票回報率的差異,因此提出了著名的三因子模型

隨著市場交易實踐和研究的不斷深入,研究者又發現市場中的動量現象無法用三因子模型解釋。1997年,卡哈特(Carhart)認為研究股票收益應在Fama和French的三因子模型基礎上加入動量效應,構建四因子模型。動量是物理學名詞,是與物體的質量和速度相關的物理量,一般而言,一個物體的動量指的是這個物體在它運動方向上保持運動的趨勢。而股市中的動量投資策略依據的就是動量效應,又稱為「慣性效應」,即某個時段跌得最深或長得最凶的股票往往會沿著原來的方向繼續運動。

雖然四因子模型將股票收益與價格本身聯繫起來了,但與公司價值關係不大。從直覺上理解,在其他條件一定的情況下,財務質量高的上市公司應該帶來更高的投資回報,因此有必要引入刻畫公司資產質量的因子。2013年,Fama的學生阿斯內斯 (Asness)對公司「質量」進行量化,並提出了五因子模型

後來,研究者們又發現低波動率(低beta)股票組合的實際收益比高波動率(高beta)股票組合的要高,這一現象無法用五因子模型解釋,於是法拉瑞利等於2013年又將波動率因子引入,建立了六因子模型

多因子模型的構建

多因子量化選股的原理不難理解,即認為股票收益率是由一系列因素(因子)決定的,根據經濟金融理論或市場經驗尋找這些因子,然後通過對歷史數據的擬合和統計分析進行驗證和篩選,最後以這些因子的組合作為選股標準,買入滿足這些因子的股票。在實踐中,多因子量化選股已經是一個相對成熟且大致框架較為固定的策略,具體可分為五個步驟,分別為因子選取、因子有效性檢驗、因子篩選、綜合評分模型以及模型的評價和改進

因子的選擇

多因子選股模型的第一步是發掘各類與股票收益率相關的因子,因子的選擇主要基於經濟邏輯和市場經驗,在經典的規模、估值、動量、波動率等全市場通用因子基礎上,根據宏觀、行業、公司基本面、市場特徵,結合各類特異因子來構造投資組合。影響股價收益的因子多種多樣,見仁見智,參考券商研報總結,有以下幾類(還可以繼續細分和挖掘):

(1)市場整體:市場因子、系統性風險等;

(2)估值因子:市盈率、市凈率、市銷率、 市現率、 企業價值倍數、 PEG 等;

(3)成長因子:營業收入增長率、營業利潤增長率、凈利潤增長率、每股收益增長率、凈資產增長率、股東權益增長率、經營活動產生的現金流量金額增長率等;

(4)盈利能力因子:銷售凈利率、毛利率、凈資產收益率、資產收益率、營業費用比例、財務費用比例、息稅前利潤與營業總收入比等;

(5)動量反轉因子:前期漲跌幅等;

(6)交投因子:前期換手率、量比等;

(7)規模因子:流通市值、總市值、自由流通市值、流通股本、總股本等;

(8)股價波動因子:前期股價振幅、日收益率標準差等;

(9)分析師預測因子:預測凈利潤增長率、預測主營業務增長率、盈利預測調整等。

因子有效性的檢驗

一般檢驗方法主要採用排序的方法檢驗候選因子的選股有效性。例如:可以每月檢驗,具體而言,對於任意一個候選因子,在模型形成期的第一個月初開始計算市場中每隻正常交易股票的該因子的大小,按從小到大的順序對樣本股票進行排序,並平均分為 N 個組合,一直持有到月末,在下月初再按同樣的方法重新構建 N 個組合併持有到月末,一直重複到模型形成期末。還有一個參數是候選組合的數量,具體參數的最優選擇,需要用歷史數據進行檢驗。

剔除冗餘因子

不同的選股因子可能由於內在的驅動因素大致相同等原因,所選出的組合在個股構成和收益等方面具有較高的一致性,因此其中的一些因子需要作為冗餘因子剔除, 而只保留同類因子中收益最好,區分度最高的一個因子。例如成交量指標和流通量指標之間具有比較明顯的相關性。流通盤越大的,成交量一般也會比較大,因此在選股模型中,這兩個因子只選擇其中一個。

冗餘因子剔除的方法:假設需要選出 K 個有效因子,樣本期共 M 月,那麼具體的冗餘因子剔除步驟為:

(1)先對不同因子下的 N 個組合進行打分,分值與該組合在整個模型形成期的收益相關,收益越大,分值越高;

(2)按月計算個股的不同因子得分間的相關性矩陣;

(3)在計算完每月因子得分相關性矩陣後,計算整個樣本期內相關性矩陣的平均值;

(4)設定一個得分相關性閥值,將得分相關性平均值矩陣中大於該閥值的元素所對應的因子只保留與其他因子相關性較小、有效性更強的因子,而其它因子則作為冗餘因子剔除。

多因子選股的判斷方法

多因子選股的判斷方法分為回歸法(OLS)打分法。回歸方法是利用股票歷史收益率對篩選出的多因子進行回歸,估計出回歸方程係數,然後將最新的因子帶入回歸方程估計股票未來收益,以此為依據進行選股。回歸方法的問題是很難找到一個精確擬合的回歸方程,模型誤差比較大。

打分法是根據各個因子的大小對股票進行打分,然後根據一定的權重加權得到一個總分,根據總分對股票進行篩選。例如每個月初,對市場中正常交易的個股計算每個因子的最新得分並按照一定的權重求得所有因子的平均分。最後,根據模型所得出的綜合平均分對股票進行排序,然後根據需要選擇排名靠前的股票。例如,選取得分最高的前 20%股票,或者選取得分最高的 50 到 100 只股票等等。打分法操作簡單,但是權重的確定比較困難,對結果的影響較大。

模型的評價及持續改進

多因子量化選股模型是建立在市場無效或弱有效的前提之下,隨著使用多因子選股模型的交易者數量的不斷增加,有的因子會逐漸失效,而另一些新的因素可能被驗證有效而加入到模型當中。此外,一些因子可能在過去的市場環境下比較有效,而隨著市場風格的改變,這些因子可能短期內失效,而另外一些以前無效的因子會在當前市場環境下表現較好。

在計算綜合評分的過程中,各因子得分的權重設計、交易成本考慮和風險控制等都存在進一步改進的空間。因此在綜合評分選股模型的使用過程中會對選用的因子、模型本身做持續的再評價和不斷的改進以適應變化的市場環境。因子和參數的獲取只能通過歷史數據回測來獲得,但是在回測過程中,防止出現過度優化也很重要的。

結語

多因子量化選股本質是基於歷史數據的統計分析,通過尋找那些與股票收益率最相關的因子,並基於套利定價理論(APT),將多個影響因子進行組合,構建綜合選股指標來篩選股票。任何一個多因子選股模型具有一定的時效性、風險性,需要使用者根據市場情況進行調整和更新,這是多因子選股策略存在的不足。多因子選股模型作為一種量化投資選股策略,最大的優勢在於其結果是根據客觀的數據和完整的模型得出的,可以避免交易者個人主觀意念的干擾,具有一定客觀性。多因子選股研究的對象主要是因子,因此單因子的回測和有效性檢驗是整個多因子模型的重要組成部分。

後期將以系列推文的形式結合因子分析的Python工具包Alphalens對因子的選擇和回測進行實踐分析。

參考資料:

1、丁鵬《量化投資——策略與技術》

2、華泰證券研報《多因子選股策略——數量化選股策略之十二》

3、網路資料《多因子量化模型簡介》


推薦閱讀:
相关文章