既然市场无法预测,那这种纯技术的分析真的可以跑赢市场吗?


先问是不是,再问为什么。

很多人,包括题主对金融时间序列的了解可能来自别人的知识,就是金融工程的教材,书本或者来自知识SNS App上口口相传的碎片知识。我除了被动接受以上知识来源,还经历了量化编程统计实践,2年数字币程序量化自动交易和A股市场的1年实盘交易洗礼,对于这个问题有自己的思考。Talk is cheap, 数据说话。

第一个问题,金融市场是不是随机游走的?

完全有效市场理论认为金融市场是混沌系统,对于混沌系统,预测走的是概率路线,大概思路跟天气预报台风路线差不多:

图片收集自网路,侵删

但是完全有效市场假说基于全员理性,其实这个假设不可能成立,只有全员量化估值才会出现全员理性的情况,一般人如果不动手算,并且统计行业平均数的话,连估算当前标的的价格偏差都估算不准。

我答案:不是随机游走,为了训练xgboost概率预测模型,我对A股核心指标内的1700个股票,最近3年的所有1小时和日线K线数据进行了统计和标签分类。一共是510万条K线数据。

包含以下A股板块:[中证酒, 国证食品, 全指消费, MSCI成份, 深证可选, 富时A50, 上证100, 消费电子, 上证180, 中证100, 数字货币, 医药电商, 证券, 4G5G, 5G概念, 1000可选, 中药, 生物医药, 医疗改革, 综企指数, 上证50, 中证白酒, 消费100, 黄金, 深证消费, 消费金融, 白酒, 深成消费, 上证380, 生态农业, 文化传媒, 创业板指, 银行, 中小板指, 黄金概念, 上证电信, 中小银行, MSCI中国, 医疗器械服务, 电信等权, MSCI概念, 行业龙头, 机场航运, 上证150, 医疗器械, 生物疫苗, 三网融合, 军工, 啤酒, 医药商业, 深证300, 中证500, 沪深300] Total:1325 (通达信自定义板块每天数据更新会变化,我第一次模型训练的时候是1700+,现在变成1300~1400)

这是统计结果,持反对意见的最好你们用数据说话而不是简单的说一句:「我反对!」

单论个股在超过90%的情况下,金融时间序列是前序相关的离散序列。只有3%的时间是大于3.82%随机波动。出现连续4小时(单日)超过7%下跌的黑天鹅概率只有0.4%。加上指数和ETF基金,符合周期波动的金融产品数量就增加到了总数的95%以上。

这95%符合自然周期走势的金融产品行情趋势,可以使用周期性自回归技术分析。有5%左右的金融产品(加上大宗商品期货如豆bo比例更多一些),跟毛衣战、国家政策紧密相关的,如纸黄金ETF,如x大国有银行股票,不适合进行周期自回归技术分析。表现为出现EEMD经验模态分解失败或者回归树演算法拟合失败(拟合函数与MA平均线的相关性低于0.8),它们在可交易标的总量中占比小于10%。我们可以选择不做(交易)此类无法简单使用周期性自回归技术分析的金融标的;也可以选择其他更复杂的量化手段进行技术分析进行量化交易。

此处应有截图,目前实盘策略代码又迭代更新了一个月,旧的训练代码居然不能运行了,截图都办不到,这几天加班装机,社区还要排队全员核酸检测,调整策略和重新调通代码,训练xgboost新模型,还有QIFI规范和实盘介面适配的工作量排期,过几天有空了慢慢更

继续前面的结论,金融时序分析科的班理教材论认为,金融时序序列交易行情走势可以符合ARIMA分析。

它们理解的行情走势规律是这样的——

此处应有截图,这几天加班装机,社区还要排队全员核酸检测,调整策略和训练xgboost新模型,还有QIFI规范和实盘券商介面适配的工作量排期,过几天有空了慢慢更

Facebook 时间序列预测开源演算法 Prophet 整合了ARIMA模型

标准的周期性分解预测

图片收集自网路,侵删

Prophet 配合走势进行波动范围预测

图片收集自网路,侵删

但是实际上我的实践表明,实际一条金融数据走势中蕴含有大约6~17阶次的函数变数信息叠加而成。

例如沪深300指数的1小时K线数据,这里有个细节,因为量价数据没有Normalized,为了标准化数据,我计算了CCI(14),这样行情K线数据转换为+220~-220区间内的标准化数据,再进行分解处理。这样做的目的标准化不同历史时期点位的数据,让2015年1月3050点的时候的拟合分型和2019年1月2450点位的拟合分型在程序量化分析中是认为是同样的走势形态(列举的例子只是打个比方,并非真实分析结果,防杠补丁)。这也是我目前使用的交易系统的基础理念——「历史总是惊人的相似;你以为你在开荒新路,其实所有的上升路径已经被前人无数次的走过了。——阿财:这话是我说的」

此处应有截图,这几天加班装机,社区还要排队全员核酸检测,调整策略和训练xgboost新模型,还有QIFI规范和实盘介面适配的工作量排期,过几天有空了慢慢更

它可以被分解成复数形式的子周期函数分量。我们可以看到,在最小级别的函数(了解EEMD演算法就会知道,最小级别的IMF 1其实是行情数据中最后无法分解的残差)它的波动表现为无规律的随机噪音波动;除此之外,在5min~15mim(估计)以上级别,开始表现为符合一元二次函数的规律性周期性波动。

这是我原创图,不可能侵,所以不删

但是EEMD分解存在最末端点波动的问题(最后一个函数点输出的Y轴位置会随著新行情bar的到来而上下摆动)。为了稳定计算结果,同时也为了简化计算量,我使用rolling(滚动时间窗口)一次九项式分解拟合替代EEMD分解使用作为金融行情波动周期的分析辅助工具,比传统的ARIMA一阶差分要拟合准确地多。

金融时间序列数据,它还可以使用隐马夫科夫方法分析(总所周知西蒙斯公开提出并且在量化基金中使用此方法盈利);也可以使用缠论进行分析。它们都具有前序数据相关性假设,在量化行业中,经过超过10年的实践证明也是行之有效技术分析方法。

此处应有截图,这几天加班装机,社区还要排队全员核酸检测,调整策略和训练xgboost新模型,还有QIFI规范和实盘介面适配,过几天有空了慢慢更

上述方法都是依赖前面若干周期的数据,和当前数据的关系,判断出当前的涨跌趋势和概率。

——

下面其他答主提及价格「一会儿服从这个分布、一会儿又服从另一个分布」,这个特定我也发现了,所以我的策略代码中增加了自创的「失效性检查」,利用的是趋势走势符合的一个特征——我叫做「梯云纵」;说人话就是:当走势满足趋势的时候,它的极值点在程序演算法上满足:最小递增序列和最小递减序列。

未完待续

上面讨论的 Python 程序代码稍后会放出到我的GitHub上面


假如资产价格服从一个随机游走过程,技术分析没有任何意义。

但量化大有意义,因为资产定价将成为有解析解的简单问题、Q-Quant成为金融行业唯一有用的道路。那时候量化更像是保险精算,行业里的quant只剩structurer和risk。

但很明显,从长时间看,资产价格不是随机游走过程,也不服从任何一个已知的过程。这才赏给了掉包侠、学术界几口饭吃,也有不少韭菜被割。从我个人体验,目前资产价格的随机性,来源于他一会儿服从这个分布、一会儿又服从另一个分布,你不能预测他未来是什么分布,就像你不知道你的策略什么时候「有效」/「失效」。这种随机性才是吸引那么多人沉迷赌场的原因,一会儿觉得自己天下无敌,一会儿又一败涂地,自己却不知道为什么。


这个问题我个人认为可以从几个方面回答。

先说市场可不可以被预测。

首先,单个股票或许真的符合随机游走。只能说是「或许」,只是因为真实世界的收益率分布过于复杂,接近于随机。

其次,价格是否符合随机游走也并不是能否跑赢市场的关键,回答这个问题也并不具有实际意义。因为更重要的是,想要跑赢市场,什么时候入场,什么时候出场才是具有决定性的考量,而不是能不能预测对下一个时点的价格。比如:

不管你在什么时候入场,如果你不能在1929,1968,1994年之前出场,恐怕在这三个时点后的20年左右都不能盈利。当然如果你从200年前就开始投资,把股票留给孙子一辈,就当我没说。从另一个角度来说,这也就是 Eugene Fama 和 Robert Shiller 对与回报率来源有分歧,但他们都支持价值投资的原因。

另外,之所以大家都说(股票)价格符合随机游走,多半是基于我们只能根据当下或更早的信息作出决策,而不能看到未来的信息,而未来的信息又有极大的不确定性,故而造成了价格不可预测。但是如果研究对象是整个市场,那它并不是随机游走,并且是可以被预测的。不过这个不是说你要预测他具体是多少,不是说这个月3500点,下个月能不能3550点。而是,市场的波动可以在多大程度上被某些变数解释。Shiller 很早就证实了,回报在年度级别数据上是可以被预测的,而且股息率和回报率的相关性关系很高。可参见:

我肯定疯了:Asset Pricing, A Dirty View②?

zhuanlan.zhihu.com图标

不过值得注意的是,研究仅限于年度数据的级别,就是至少要是yearly data,当然拓展到3,5,7年年度数据也依然成立。月度数据就没有多准确了。所以,大家期望在更高的频率上解决可预测性的问题。最近的研究又集中在了投资者情绪上,在月度数据的频率下,投资者情绪可以解释很大一部分价格波动。可参考:

我肯定疯了:回报的可预测性(Return Predictability)?

zhuanlan.zhihu.com图标

再说说技术分析。

其实技术分析在理论上可行,也不可行。

不可行点在于缺乏理论根据,比如投资者会根据财务或者宏观数据进行投资,这是一个十分合理的决策依据。技术分析或许和动量还有些许联系,但是也没有很直接的证据表明技术指标可以完全由动量解释。因此,学术界比较「老套」的教授,还是不认可技术分析,甚至动量。但是不妨碍他们发顶刊。

可行点又在于,学术界是认可投资者情绪发挥了不可忽视的作用的。很多不能解释的现象确实可以被投资者情绪解释。有不少文章认为,技术指标直接或间接的造成了投资者 「异常」 的情绪。虽然没有明说,但是你可以明显的感觉到,学术界认为有很多不成熟的交易者再投资时是利用技术指标的,这些 「没有理论根据」 的指标,造成了难以被解释的价格波动。更重要的是,这些看上去不成熟的交易风格,会让专业的投资者失去套利的机会。因为即便是专业的投资者,在十分波动的市场中,同样没办法分辨到底是什么导致了价格波动。聪明的投资者更会顺应这股不理智的交易趋势一段时间,并且在均值回归之前套现离场。所以绕来绕去,「离场时刻」 才是能不能打败市场的重要依据。

不过技术分析,多少有点「先有鸡还是有蛋」的意思。是价格波动导致了一个 「难以观测」 的能量导致人们发明了技术指标,还是人们发明了技术指标造成了这股 「难以观测」 的能量。

最后说说量化的作用。

我认为更多的还是,量化手段去处理大量的数据,并且排除实际交易时情绪的影响,理性的做交易决策,其中就涉及到能不能果断的止盈离场。如果以赚钱为目标,量化的表现并不一定如预期那样好。尤其是在一个十分情绪化的市场中。比如2020的市场中,量化策略收益率普遍不如主观策略。

所以,总结下来,不管是量化还是技术指标,都只是赚钱的手段。他们并不具有什么绝对的优势。但根本原因并不是因为市场很难预测。

另外,借用某个知乎大V的一句话,忘了是谁说的,但是看了一遍就忘不了。

说市场可以预测的,都是装逼。

说市场不可预测的,都是傻逼。

以上。


之前水群的时候,遇到一个硕士研究生,他也提到了随机游走问题。当时没在意,没想到在知乎上遇到了相似的话题,所以现在认真对待下,算是缅怀之前水群的记忆吧!

我没怎么了解过这个理论,我自己也玩量化,但是思路跟那些科班出身的人不一样。我属于野生玩家,路子走得也就比较野。前面的回答提到了很多高大上的东西我都没学过。那我来到这里又拿什么来回答呢?经验。

随机游走理论,这个听上去就有点奇葩!既然是随机,那随便买卖,盈利就平仓,一年赚个几块钱,有的平台还给你返利,岂不是美滋滋?别说,我之前还真这么干过,问题是赚钱的单子赚得少,亏钱的单子亏得多,盈亏比太低,重复下去也是稳定亏钱的命。那么提高盈亏比不就行了?

问题又来了,就算把盈亏比提高到1:1,你的胜率必须高于50%,才能实现盈利,如何保持胜率高于50%呢?随机游走意思就是上涨下跌概率一样,都是50%。知乎上有人分析过随机游走,完全是高中生就能理解的。最后得出结论,翻倍跟亏完的概率相等?算上交易成本,亏玩的可能性还大一些。呵呵!真要是上涨下跌的概率相等,瓜娃子才会去交易。这不明显是抛硬币吗?还不如抛硬币。交易者正是因为自己觉得上涨下跌概率不相等才会去交易。

最后,我想说的是,一切都是概率问题。那么最重要的那就是资金管理以及调整盈亏比。因为这才是你能把握的东西,概率不是你能操控的。市场是不可知的,无论什么理论,那都是自欺欺人。赚钱了就说理论很牛逼,亏钱了就说市场变了,理论失效了。呵呵!一个理论如果具有时效性,这东西跟迷信有多大的区别?

做交易跟做人一样,都需要构建自己的三观,没得这东西人就不可能形成判断,有了这东西就可以很好地指导行为。有些理论看起来漂亮,但未必实用。佛教有一套对待人生的理论,基督教也有,甚至是小学生都有一套自己的三观。我记得自己曾经很小的时候,意识到沟通的重要性,就兴高采烈地认为一切问题都可以通过沟通解决,现在看来真要是这么简单,那这世界就不可能存在那么多纷争了。就在前年,一个985的朋友还跟我大谈一些复杂的看起来玄之又玄的话题,我要是十几岁出头,或许还会产生不明觉厉的感觉,但是现在,不可能。为啥?都是花架子,不具有实用性。又比如说知乎上很多人在讨论缠论,这东西在我看来就是花架子,亏得一塌糊涂的人才会去相信这些东西。这不是民科,还是啥?

前不久在一个算命群里面,还有很多人相信什么占星术,纸牌,八字,星宿……每个人都有自己的一套理论去解释世界。对应到市场,那么每个人都有自己的一套交易理论。对于世界的看法,就算是理论物理,量子力学和相对论还是矛盾的。所以不要迷信任何所谓的理论,你也只是因为不理解这些理论才回去相信他。这叫不明觉厉!

回到交易,这个市场就是来割韭菜的。绝大多数人亏钱,少数人赚钱。是什么决定了你赚钱还是亏钱?跟你相信的理论关系不大,跟你自身的特质关系密切。交易说到底是很吃天赋的,而天赋那不是理论能解释的。量化也只是工具而已,说到底最重要的还是人,你身上的特质决定了你能不能在这个市场上赚钱。有的人全手动操作,发了财,不需要靠程序,有的人手动真的很烂,所以才寻求程序辅助交易。

人跟程序之间什么关系?人和工具的关系,选择适合自己的工具也就是策略,但也不能迷信工具。随机游走跟缠论差不多,都是你认为它能解释市场,但实际呢?不要期望太高,市场是不可解释的。


1,这涉及到核心思想既价值观的问题。在法玛提出这个理论之后,差不多在1965年提出,几十年来受到了很多的怀疑,并且也提出了许许多多的论据来对其进行反驳。世界上这么些天才大脑都争得面红耳赤。那么,对于一个普通人来说。怎么办?首先,如果你是应该是怎样的价值观既理想主义,那么你应该去多读书,思考,世界上又多了一个追求真理的人,不一定能追求到,但也是你存在的意义之一。量化这些是否有效对你来说没有任何意义,只是你的验证对象而已。后半句不成立。其次,如果你追求的是实际是,既现实主义的价值观,或者再简单,就是想赚钱,那么法玛说的有不有效对你又有什么意义呢?你追求的是获利,只要你去寻找你认为的能够超越市场的操作策略就可以了。总得来说就是莫要因为一个在当前既不能证实也不能证伪的观点,影响到你的目标实现。


推荐阅读:
相关文章