摘要

在尋找 α 的努力中,最重要的是獲得新的數據或者是對已有數據的創新用法。與數據相比,演算法先進性的作用相對有限。本文介紹的 Lee et al. (2018) 提出了獲取 α 的新視角。

1 引言

今天給大家介紹一篇新鮮出爐的文章,題為 Technological links and predictable returns(Lee et al. 2018),它即將刊發於 Journal of Financial Economics,領銜作者是斯坦福大學的 Charles M. C. Lee 教授和北京大學的張然教授,這兩位均長期從事基本面量化投資的研究。

該文提出了一個獲取 α 的新思路:科技關聯度(technological links)。雖然它是以美股為研究背景(使用該因子構建的多空投資組合每個月可以獲得 1.17% 的超額收益),但相信對投資 A 股的小夥伴也會有很大的啟發。更重要的是,該文的行文邏輯堪稱因子研究的典範。相信讀過本文的介紹後,你就能夠認可這種說法。

下面馬上進入正題。

2 科技關聯度

在知識經濟時代,科技實力已經成為一個公司短期盈利和長期生存的重要因素。世界上的科技巨頭,如亞馬遜、谷歌、蘋果、英特爾等公司,它們的產品可能截然不同,但在科技層面卻有著千絲萬縷的聯繫。這些科技上的關聯超越了傳統的行業界限,卻通常不易從公司的財務報告中辨別出來。

Technological links and predictable returns 一文研究了公司之間的科技關聯度和公司股票未來預期收益率之間的關係。它背後的邏輯是公司的科研並不是獨立的,一項科技進步的溢出效應將會影響科技關聯度高的一系列公司,而這種影響將改變這些公司基本面,並最終(先後)反映到公司的股價中。

基於此,該文揭示了一個令人驚訝的實證關係,即目標公司的股票收益率和與其科技關聯度相近的公司前期的收益率之間有一種滯後-領先關係。換句話說,對於任何一個目標公司,使用某種代理指標來計算它和其他公司的科技關聯度,然後以該關聯度為權重和其他公司的當期收益率就可以計算出一個加權收益率,該收益率對目標公司下一期的收益率有一定的預測性。因此,以科技關聯度為權重的加權收益率是一個優秀的 α 因子。這種領銜-滯後關係也可以被稱作「科技動量」。

下面就來介紹如何構建這個因子。首先需要計算公司之間的科技關聯度。為此,Lee et al. (2018) 使用兩個公司專利分布之間的 uncentered correlation(就是計算相關係數的時候省去減均值的步驟,類似的做法也被 Jaffe 1986 和 Bloom et al. 2013 採用)計算科技關聯度:

displaystylembox{TECH}_{ijt}=frac{T_{it}T_{jt}}{left(T_{it}T_{it}
ight)^{1/2}(T_{jt}T_{jt})^{1/2}}

上式左側 mbox{TECH}_{ijt} 代表了公司 i 和 j 在第 t 期的科技關聯度;上市右側的 T_{it} 是一個 427 維的橫向量,即 T_{it} = [T_{it1}, T_{it2}, …, T_{it427}] 。427 這個數字源自美國專利商標局(United States Patent and Trademark Office)定義的 427 個科技大類。因此,一個公司的專利分布由它過去五年獲取的全部科技專利在這 427 類中的比例決定。舉例來說,假如從當前時點計算,某公司過去五年獲得了 100 個科技專利,分別屬於編號為 1(10 個), 100(60 個) 和 303(30 個)的三大類,則該公司的專利分布中, T_{it1} = 10/100 = 0.1T_{it100} = 60/100 = 0.6T_{it303} = 30/100 = 0.3 ,而其他大類 k 對應的 T_{itk} 值為 0,這些 T_{itk} 就構成了 t 期該公司的專利分布向量,由此就可以計算不同公司之間的科技關聯性 mbox{TECH}_{ijt}

下圖來自 Lee et al. (2018),它展示了兩家公司 Regeneron Pharmaceuticals 和 Illumina 在 2002 到 2006 年間科技專利所屬類別的情況(絕對數量,未經標準化)。Regeneron 是一家製藥公司,而 Illumina 生產生命科學工具並提供遺傳分析服務。這倆家公司所處完全不同的行業,且在供應鏈方面也沒有什麼聯繫。但是科技關聯性從全新的角度揭示了它們之間的關聯 —— 這兩家公司在 435 大類(分子和微生物學)方面均有很多專利,它們之間的 TECH_{ijt} 高達 0.71。可見科技關聯度可以找到被行業以及上下游產業鏈忽視的公司之間的關係,Lee et al. (2018) 發現經驗數據表明這種關聯在選股方面大有可為。

得到 mbox{TECH}_{ijt} 之後,利用它作為權重按下式計算加權收益率作為選股因子:

displaystylembox{TECHRET}_{it}=frac{sum_{j
e i}mbox{TECH}_{ijt}	imesmbox{RET}_{jt}}{sum_{j
e i}mbox{TECH}_{ijt}}

上式左側 mbox{TECHRET}_{it} 就是公司 i 第 t 期的因子取值;右側的 mbox{RET}_{jt} 為公司 j 在 t 期的收益率,所有和 i 不同的公司 j 的收益率以 mbox{TECH}_{ijt} 為權重加權在一起,構成了選股因子。由於計算科技關聯度需要使用到過去五年的專利數,因此每期的候選股票池為在這段時間內至少獲得了一個專利的股票(以專利的官方授予日期計算,從而避免了前視偏差)。

值得說明的是,雖然選股因子 mbox{TECHRET}_{it} 的更新是月頻,但是其中的科技關聯度 mbox{TECH}_{ijt} 更新的頻率是每年一次,在每年年末使用過去五年的專利數來更新 mbox{TECH}_{ijt} 。由於收益率 mbox{RET}_{jt} 是月頻收益率,因此最終的因子更新頻率是月頻。

關於數據的來源和處理方法更詳盡的說明請參考 Lee et al. (2018) 中的第二節,這裡不再贅述。

3 投資組合檢驗

為了檢驗 mbox{TECHRET}_{it} 因子的選股效果,Lee et al. (2018) 首先進行了投資組合檢驗(portfolio tests)。每個月初,以最新的因子取值將股票池中的股票排序並分成十檔,做多分數最高的第一檔,做空分數最低的第十檔,以此構建一個 L/S 組合,並考察該組合的收益率。L/S 組合的收益率如下表所示(該表是 Lee et al. 2018 中最重要的結果)。

先來看看 Panel A。第一列是 L/S 組合相對於無風險收益率的超額收益。按等權重構建的該組合每月可以獲得 1.17% 的超額收益;按照市值權重構建的投資組合每月獲得 0.69% 的超額收益。Panel A 的第二到第六列彙報了考慮了其他常見的因子後,該 L/S 組合仍然能夠獲得的超額收益。

以第三列的 3-Factor alpha 為例,它的計算如下:使用 TECHRET 因子的 L/S 組合收益的時間序列和 Fama-French 三因子(Fama and French 1993)的時間序列在時序上回歸,得到的截距恰好就是截面上 L/S 無法被三因子解釋的超額收益(這是因為 Fama-French 三個因子本身是投資組合 MKT,SMB,HML 的收益率;需要這方面背景知識的小夥伴請參考《股票多因子模型的回歸檢驗》)。

其他列考慮的不同因子模型之後獲得的超額收益可以類似的解釋。其中,4 factor model 是 Fama-French 三因子 + Carhart (1997) 的動量因子,5 factor model 是 Fama and French (2015) 提出的五因子模型,而 6 factor model 是該五因子加上動量因子。結果顯示,市場上常見的其他主流因子均無法解釋 L/S 獲得的超額收益。

上表中 Panel B 展示了使用 4 factor model 對 L/S 組合進行時序回歸時,得到的因子載荷。以等權為例,結果顯示該組合在市場因子(MKT)上有負的暴露,在 SMB 和 MOM 因子上有正的暴露。這意味著該策略在市場下行、以及小市值和動量股表現好的時候額外有效。

4 回歸檢驗

除了 portfolio tests 之外,Lee et al. (2018) 還使用 Fama and MacBeth (1973) 進行了截面回歸檢驗其目的是為了在控制住其他變數後考察 TECHRET 因子對於股票截面收益差異的解釋程度。

Fama-MacBeth 回歸是在每個時點在截面上用因子載荷和個股的收益率進行回歸,從而得到每期各因子的收益率,然後在時序上取平均就得到因子的預期收益率(需要進一步了解 Fama-MacBeth 回歸的朋友請參考《股票多因子模型的回歸檢驗》)。此外,Lee et al. (2018) 通過 Newey-West 調整求出了因子收益率的 standard error,從而計算出了 Fama-MacBeth t-statistics。下表給出了實證結果。

在(1)到(3)列中,被解釋變數是股票的收益率 RET。在截面回歸中,解釋變數是因子載荷。在這方面的處理上,作者並沒有通過時序回歸求解因子載荷,而是將股票在各個因子上的取值按其大小映射到 0 到 1 之內的十分位上。比如,如果某一期一個股票在 TECHRET 因子上的取值是所有股票中的前 10%,則它在該因子上的載荷就是 1。

在上表中,除了那些我們熟悉的因子外,其他的因子包括 Gross Profitability (GP)、Asset Growth (AG)、R&D intensity (RD) 以及 INDRET,它是目標公司所在行業的市值加權收益率。結果表明,當控制了這些變數後,TECHRET 因子的預期收益率依然顯著大於零(t-statistic 在 4 以上)。

在上表的第(4)列中,作者從 RET 中減去了 INDRET 作為解釋變數,從而直接排除行業動量造成的潛在影響。即便如此,Fama-MacBeth 回歸結果仍然表明,TECHRET 因子的預期收益率顯著大於零,其 t-statistic 高達 6.06。

除了上述控制變數外,Lee et al. (2018) 還考慮了市場中存在的其他可能造成 lead-lag 收益率效應的關聯,這其中包括 customer-supplier links(Menzly and Ozbas 2010)以及 standalone-conglomerate firm links(Cohen and Lou 2012)。結果表明,這些已有關聯並不能解釋新發現的科技關聯度。

另一方面,Burt and Hrdlicka (2016) 指出,存在某種關聯的公司可能會在一些共同因子上有近似的暴露,導致在評價新因子時出現偏差。為了排除這個影響,Lee et al. (2018) 也在構建 TECHRET 因子時使用了股票的特異性收益率(即收益率減去 4 factor model 解釋的部分)。使用根據特異性收益率計算的 TECHRET 因子選股,所構建的 L/S 組合仍然能夠獲得主流因子無法解釋的超額收益(下圖)。這也再次說明 TECHRET 和這些主流的因子之間在很大程度上是正交的。

除了本小節介紹的這些檢驗之外,Lee et al. (2018) 中還包括了更多的 robustness tests,由於篇幅的問題就不逐一介紹了,感興趣的小夥伴請閱讀原文。

5 內在有效機制

前文的結果說明 TECHRET 因子在選股方面確實有效,而且它獲得的超額收益不能被市場中常見的其他因子解釋。本節就來看看它為何有效。

對於超額收益,學術界和業界主流的兩種解釋是錯誤定價風險補償。搞清楚 TECHRET 背後的機制至關重要:錯誤定價意味著投資者可以通過合理的策略獲得潛在的超額收益;而風險補償則意味著投資者獲得的收益是以承擔額外風險為代價的。本節和下一節分別考察錯誤定價和風險補償這兩種解釋。

在考察該因子獲取的超額收益的可持續性上,作者發現 L/S 投資組合在未來幾個月內都可以持續的獲得收益(下圖);表明科技動量是一個價格發現的過程,隨著投資者逐漸意識到科技關聯公司的新息,股價也隨之反映完全。這或許說明價格對於與科技有關的基本面消息的吸收是緩慢的,從而導致了錯誤定價。

為驗證上述猜想,Lee et al. (2018) 研究了以下三個方面:

  1. 科技相關新息(innovation)的性質;
  2. 投資者對這類新息的有限注意力(limited attention);
  3. 投資者的套利成本。

在第一方面,實證結果表明,TECHRET 因子的強度和目標公司的 technology intensity 以及 technology specificity(強度和專度)有關。舉例來說,在強度方面,R&D 開銷大的公司獲得的 TECHRET 因子收益更高;在專度方面,該文以專利集中度作為衡量專度的指標並發現專度高的公司獲得的 TECHRET 因子收益更高。

Lee et al. (2018) 指出,對於行業應用集中度高的專利類別來說,科技新息被價格反映的速度更慢一些。而上述的結果與這個說法一致。對於科技專度更高的公司,TECHRET 因子包含了更多的該公司的估值信息。此外投資者對於科技專度高的公司的估值變化反應不足。這兩種原因導致了較慢的信息擴散過程。

在第二方面,為了檢驗投資者的 limited attention,作者的猜想是關注度低的公司 —— 特徵是市值小、分析師報告和媒體報道更少、機構投資者佔比低 —— 可以獲得更高的 TECHRET 因子收益率。為此,作者分別構建了 dummy 指標,並進行了回歸分析,結果證實了上述猜想。

在最後一方面,作者的假設是那些套利成本高的公司能夠獲得更高的 TECHRET 因子收益率。使用特異性波動率(Baker and Wurgler 2006, 2007)以及負面新聞(Hong et al. 2000)作為套利成本的代理指標,Lee et al. (2018) 的分析結果和上述猜想一致。對於 limited attention 和套利成本方面的回歸分析結果如下表所示。

上述結果從科技新息性質、投資者的有限注意力以及套利成本方面證實了價格對與科技類基本面消息的吸收是緩慢的,從而造成了錯誤定價。

6 風險解釋站不住腳

除了錯誤定價這種解釋外,另一種常見的解釋是從風險補償的角度,即因子之所以獲得超額收益是因為它暴露於某種未知的風險。然而 Lee et al. (2018) 的分析說明,這種解釋並不成立。

由於「未知」,我們不可能羅列所有潛在的風險然後考察 TECHRET 因子在上面的暴露如何。取而代之,Lee et al. (2018) 從另外四個角度來分析風險補償說。本文著重介紹其中的兩個。

第一個是考察股票在盈餘公告期的收益情況,這是一種被學術界普遍認可的方法。它背後的邏輯是,如果某個異象和錯誤定價有關,則該因子在盈餘公告期內應該比其他時間內獲得更高的收益,這是因為最新的盈餘報告有助於修正投資者之前對該股票的估值錯誤。而反過來,如果該異象是源自風險補償,我們將不會觀察到上述現象,換句話說,該因子在不同時期(無論是否盈餘公告期內)的收益率應該大致相當。

回歸結果(下表)說明,在考慮了一系列必要的控制變數後,盈餘公告期內 TECHRET 因子能夠獲得非盈餘公告期內 4 倍以上的收益率,這是風險補償說完全無法解釋的。

第二個角度是 standardized unexpected earnings(SUE,未預期盈餘),它是一個非收益率指標,因此不會被對風險的控制不足所影響。Lee et al. (2018) 檢驗了 TECHRET 能否預測未來的 SUE。由於 SUE 是公司未來現金流的決定因素,如果 TECHRET 能夠預測 SUE 則說明前者帶來的超額收益和公司基本面的改變相關,而非風險補償。

實證結果如下表所示,它說明 TECHRET 對 SUE 有統計上顯著的預測性。此外,Panel B 的結果表明,當前季度的 TECHRET 對未來三個季度的 SUE 都有顯著的預測性,且這種預測性在逐步減弱。這一結果有力的佐證了該因子可能來源於錯誤定價,而非風險補償。

此外,Lee et al. (2018) 還指出技術變化風險以及競爭替代風險均無法解釋 TECHRET 因子。綜合本節和上一節的結果,Lee et al. (2018) 認為,TECHRET 獲得超額收益的原因在於人們對科技新息可造成的股價變化反應不足,而非額外的風險補償。

7 結語

Lee et al. (2018) 是一篇研究因子的典範。

以下高度概括一下它的行文邏輯:首先它從世界經濟發展造成的公司之間越來越密切的聯繫出發提出了科技關聯度這個新視角,並選擇了適當的代理指標(專利分布之間的相關係數)來計算公司之間科技關聯度的強弱。為了檢驗這個因子在解釋股票截面預期收益率差異上的作用,該文使用了業界廣泛流行的 portfolio tests 和 regression tests 指出該因子確實能夠獲得超額收益,並通過一系列更為細緻的 robustness tests 來確認這一點。該文最後錯誤定價和風險補償兩個主流角度分析了該因子有效的內在機制,並指出它背後的原理是投資者對於科技新息的反應不足。

我第一次通讀該文後大呼過癮。然而,在受到這個新思路的啟發之餘,更讓我感慨的是海外學術界和業界對於美股研究的這一整套科學的、完全可以複製的體系。首先是研究美股的數據非常完善(專利數據、股票數據等);其次是經過幾十年來無數學者在頂級期刊上發表的豐碩成果的積澱,一個新的因子被提出後,應該進行哪些 tests、使用哪些主流因子來分析這個新因子、以及如何識別該因子是源自風險補償還是投資者對它的反應不足等,有大量被反覆驗證過的文獻形成一個科學的分析框架。這種積累不是一朝一夕能形成的,這實在是讓人羨慕,也值得我們的學術界和業界學習。

我一直以來的觀點是,在尋找 α 的努力中,最重要的是獲得新的數據或者是對已有數據的創新用法。與數據比起來,演算法先進性的作用相對有限。在這方面,Lee et al. (2018) 的貢獻尤為突出,提出了獲取 α 的新視角。

這是真正的計量經濟學。

這是真正的金融工程。

這是真正為人們理解股票截面預期收益差異而做出的卓越努力。

參考文獻

  • Baker, M. and J. Wurgler (2006). Investor Sentiment and the Cross-section of Stock Returns. Journal of Finance, Vol. 61(4), 1645 – 1680.
  • Baker, M. and J. Wurgler (2007). Investor Sentiment in the Stock Market. Journal of Economic Perspectives, Vol. 21(2), 129 – 152.
  • Bloom, N., M. Schankerman, and J. Van Reenen (2013). Identifying Technology Spillovers and Product Market Rivalry. Econometrica, Vol. 81(4), 1347 – 1393.
  • Burt, A. and C. M. Hrdlicka (2016). Understanding Network-based Measures of Information Diffusion. Unpublished working paper, University of Washington.
  • Carhart, M. M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance, Vol. 52(1), 57 – 82.
  • Cohen, L. and D. Lou (2012). Complicated Firms. Journal of Financial Economics, Vol. 104(2), 383 – 400.
  • Jaffe, A. B. (1986). Technological Opportunity and Spillovers of R&D: Evidence from Firms』 Patents, Profits, and Market Value. American Economic Review, Vol. 76(5), 984 – 1001.
  • Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: empirical tests. Journal of Political Economy, Vol. 81(3), 607 – 636.
  • Fama, E. F. and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.
  • Fama, E. F. and K. R. French (2015). A Five-Factor Asset Pricing Model. Journal of Financial Economics, Vol. 116(1), 1 – 22.
  • Lee, C. M. C., S. T. Sun, R. Wang, and R. Zhang (2018). Technological Links and Return Predictability. Journal of Financial Economics, forthcoming.
  • Menzly, L. and O. Ozbas (2010). Market Segmentation and Cross-Predictability of Returns. Journal of Finance, Vol. 65(4), 1555 – 1580.

原創不易,請保護版權。如需轉載,請聯繫獲得授權,並註明出處,謝謝。已委託「維權騎士」(維權騎士_免費版權監測/版權保護/版權分發) 為進行維權行動。

推薦閱讀:

相关文章