因為是閑談,所以不收入魔王專欄。

眾所周知,隨機過程(或者其低配版時間序列)在投資領域可以說是非常不受待見了。這之中除了一些認知偏差意外,還有一些原因是有些道理的. 貓雖然對這個現象表示十分無奈,但是還是憑藉自己在買方實習半年的微薄經驗談一個中原因。

拋出一些本身帶有認知偏差比如「這些參數化模型的假設都是虛假」(你tm倒是自己去選正確假設啊)和主觀因素「太難,太虛假不想學」之外,機制上原因大致上有這兩個:

1.投資領域相較於資產路徑,更加關注資產終值分佈

2.序列樣本內精確擬合困難且容易有偏差

投資領域相較於資產路徑,更加關注資產終值分佈:

我們經常聽到交易員說的一句話就是「只要能賺錢,怎麼都行」,這句話的一另一個意思是:我只關注能不能賺錢,而不關注怎麼賺錢的。所以兩個今天都是5快,下個月都是10塊的資產,一個直線上漲一個九曲十八彎,在假設不爆倉的前提下對交易員的最終PnL是一樣的。

可是他們在隨機過程(或者其低配版時間序列)的觀點下完全是兩種生物,前者是一個除了時間均值以外其餘項全部為零的簡單過程,無論什麼假設下擬合出來的東西都一樣。後者你不知道他除了均值和波動率以外還有什麼可怕的東西,而且不同假設擬合出來的結果都不一樣。

以上這些對一個看這些都一樣的交易員來說自然就是虛假理論,這並非毫無道理。

但是反過來,什麼時候路徑對投資領域看是有用了呢?自然是在做「路徑依賴」的投資方向的時候(這是一句廢話)。那麼哪些具體方向是需要路徑依賴的呢,貓用自己淺薄的經驗列幾個:

1.基於均值回歸的投資(比如配對交易,和本身帶有回歸性質的資產如波動率衍生品):

因為回歸不僅要考慮或回歸到的均值位置本身,還需要考慮回歸的速率和回歸時的波動率,因此路徑(或者叫演化規律,dynamic)就變得比較重要

2.動量投資:

跟很多人想像的不一樣,動量是一個非常依賴路徑的方式,因為雖然其最終盈利本身只與均值有關,但是其盈利的實時PnL嚴重受波動率影響。 @石川 石川:量化擇時到底有用嗎? 引用了Roncalli的結果表示動量策略具有負vega

3.回報率乾脆是資產dynamic本身的各種方式(主要依賴各種衍生品實現)

典型的有,straddle,risk-reversal, strangle和各類奇異衍生

序列樣本內精確擬合困難且容易有偏差:

和期權定價這種有明確擬合目標(市場期權價格)的方向不同,一般投資領域裡沒有一個明確的擬合目標(機器學習那些人管這個叫「損失函數」),只能在時間序列的樣本內自己尋找擬合目標。這就造成了非常大的擬合上的困難:

1.如何把整個時間序列作為多個而不是一樣本?需要做假設

2.兩個時間戳之間能不能是iid?需要做假設

3.如果不能是iid,那麼關於時間的分佈變數應該是何種形式? 需要做假設

4.找到了分佈形式,用什麼統計量去擬合? 需要做假設

。。。。

可以看到每做一個假設,擬合的難度就提高一倍,而且一旦假設不小心,很容易就變成虛假的假設了。 這也不難理解為啥投資領域裡那麼多人青睞號稱「完全沒有任何假設的data based model」了。

而且,時間序列的樣本內擬合可以說的是一個又深又大又沒人願意碰的野雞方向(做理論的不惜的搞這些,做實證的都去搞機器學習了),之前貓在試圖做一個某個特性levy過程樣本內校準時曾經遇到查了一個星期沒找到相關論文的窘境。

但是反過來,一旦有不需要做過多假設的明確擬合的目標,時間序列的樣本內的擬合就能派上用查。比如快速查看波動率」形狀「這種需求,一般最虛假的Garch都能滿足的很好。

總之隨機過程(或者其低配版時間序列)在投資領域實現起來總是有這樣或那樣的侷限性,但是不代表他們是毫無用處的虛假模型,只是使用的時候需要格外小心

希望喜愛用」深度學習預測價格「的從業者們對自己喜愛的模型也有這樣批判的態度,這樣這個時代就能少誕生些想黑貓這樣的極端反對者,黑貓期待你們的反思。


推薦閱讀:
查看原文 >>
相關文章