“莫总,那我就开始了啊!”一位王姓数学博士笑着说道。
“好啊,我一定认真听讲。”莫雯雯微笑着说道。
这里是沈家公司的一间小会议室。按照袁小天的安排,两位数学博士与一位计算机专家,在给莫雯雯与袁小天讲解“隐含马尔科夫链”的模型算法。
经过三个小时的细致讲解,莫雯雯大致懂得了这种概率模型的原理及应用情况。
在了解这个模型之前,需要知道什么叫做马尔科夫过程。简单来说,一件事物的变化,不依赖过去历史,而是基于当下情况进行变化的过程,就是一个马尔科夫过程。
比如,预测某个地方明天是否会下雨,只与这个地区最近两三天的天气情况有关;而与一周前或者一个月之前的天气无关。所以天气的变化的过程,就是一个马尔科夫过程;也叫作马尔科夫链。
而对于金融资产的价格,也存在一定的马尔科夫过程。明天或者下一周、下一月价格的变化,只与最近一周、一月的变化有关系。而与一年前,三年前,甚至五年前的价格,没有任何直接关系。
因此马尔科夫过程告诉投资者们,我们预测未来资产的价格,只需要基于近期价格的变化特点进行分析即可,而不用去分析太多、太长的历史数据。那没有任何意义。
而对这个过程进行概率预测的模型,就叫做马尔科夫模型。在众多马尔科夫模型中,现在公认最为有效的一个模型,叫作隐含马尔科夫模型。
它的基本原理是也很简单。就是假设一个马尔科夫过程中,我们表面上能看到一组变量在不断的连续变化。但在这种连续变化的表象下,还有一些隐藏的变量在不断变化。正是这些隐藏变量的变化,才导致了我们能够观察到的变量有所变化。
比如资产价格的变化,其背后隐藏的是投资大众的情绪、预期的差距等看不见的因素。
而我们能看见的是什么呢?是价格本身的变化、成交量、持仓量的变化,公司盈利情况的变化、宏观流动性的变化,还有因此而衍生的各种技术指标。
隐含马尔科夫模型在传统贝叶斯框架下的“先验概率”、“条件概率”的基础上,开创性的提出了转移概率的理念。将概率理解成为了,在一个时间连续的变化过程中,概率是可以根据当下的情况,向下一步进行转移的。
其预测思路是,通过分析近期价格、成交量等能够直接观察到的变化情况,来不断的揣测隐藏在其背后的变量的变化情况。
在计算出隐藏变量的变化概率后,再通过概率的转移特性,去推导出未来价格变化的概率。
比如,我们分析了最近三天的价格变化,根据模型测算出价格背后的市场情绪的变化概率,然后假设未来三天,市场情绪依然保持这个概率趋势,再反过来推算出未来三天价格将出现如何的变化。
……
这个模型目前广泛的应用在语音识别领域。比如,根据人们当下说的词语,推断语义,然后再预测出下一时刻将要出现什么词语。反过来也可以进行倒推。
在语音识别领域,这项技术已经非常的成熟了。预测结果的准确性超过了90%。
……
在一些国际知名的量化基金中,都或多或少的使用了这项技术。
比如著名的米国的小奖章基金,连续30年都保持了56%的费后年化收益率。因此震惊全球。
虽然其核心模型都是对外保密的,但这家公司聘请了很多从事语音分析专业的博士。业内普遍猜测,小奖章基金的基础模型,便是与语音分析息息相关的“隐含马尔科夫”预测模型。
……
“原来是这么回事啊。”莫雯雯听得非常认真,小小的黑色小笔记本上密密麻麻的记了很多的笔记。
“其实这个马尔科夫模型,算法上很简单。但是原理却是很深刻的啊。”袁小天望着王姓博士在投屏上精美的ppt,若有所思的说道。
“算法上不难,难的是模型的调整与优化。”王姓博士笑了笑说道。
“这个要形成量化模型,其实也有一些技术包可以支撑。最主要的是模型基础上的参数,和一些模型的局部调整。各家都不相同的,这才是每家公司最核心的机密。”计算机专家一边思考着一边说道。
在场的人员都沉默了片刻,都在等着莫雯雯说话。
“王博士,谢谢你精彩的课程。我也基本听懂了。”莫雯雯点着头说道:“但是我有一个问题啊。”
“莫总,请讲。”王姓博士见莫雯雯那认真的样子,感觉到非常的钦佩。
“这个过程和思路没有问题。但是在投资交易的实务角度上说,时间越短,马尔科夫的效用越强。但是一旦时间周期放长,马尔科夫的效果就越来越弱了。对不对?”莫雯雯一边思考着,一边说道。
“莫总,您真是个天才!直觉出奇的好啊。”王博士露出了惊讶的神情。
“哦?我说对了?”莫雯雯笑着问道。
“完全正确。因为时间周期一长,这个过程的概率结果就开始呈现出发散状态,时间越长发散的越厉害。基本就不能用了。反过来讲,时间越短,这个模型的概率值的收敛性越好,准确性也就越高。”王博士点头说道。
“因为时间超过日线级别,人们比较喜欢看趋势,所谓的趋势都是从历史价格上参考出来的。无论是价格本身,还是基本面的盈利情况。很大程度上就是根据历史数据来预测未来的线性思维,这是人类的天性。你看那些画线的,没有历史数据,他们怎么画线呢?”莫雯雯微笑着说道。
“哈哈哈”大家都笑了起来。
“如果是日内,那可以。比如下一分钟的k线,和上三分钟相关,而和半个小时前或者一个小时前的甚至是一天前的一分钟k线,确实没什么相关性。”莫雯雯凭着直觉说道。
“没错,莫总!在时间越短的区间里,马尔科夫的效用越强。之所以在啊语音识别领域中,这个模型这么强大。就是因为语音本身就是个很快的东西。”王博士有些佩服的说道。
“那么也就是说,这种模型如果用在日内交易,甚至是高频的话,那么稳定性就应该很好。”莫雯雯继续说道。
“没错,尤其是高频,我们拿一些模型做过测试。”王博士高兴的说道:“在高频的毫秒级别上,马尔科夫模型的胜率能达到92.34%。”
“哦?这么夸张?”莫雯雯大感意外的说道:“那盈亏比呢?”
“不高,最多做到1:1,就算是极限了。”王博士推了推眼镜继续说道:“那也是合算的,因为交易速度快,就算盈亏比不高,也绝对是能赚钱的。”
“90%的胜率?这不可能吧。”袁小天有些怀疑的问道。
“有测试数据支持的,我们做了两三百万组历史交易数据测试的。”王博士笑着说道。
“这也有可能。”莫雯雯思考着说道:“在交易领域,有很多人工高频的高手,都是在一分钟k线上天天折腾,胜率就能保持超高。我们公司以前有个叫韩天泽的神奇小子,他就是人工高频的高手,每天交易几百次,四个交易屏幕都不够用。他的胜率常年就能保持在90%以上。我当时还亲自向他请教过,眼睁睁的看着他做了两百多笔交易,只有一笔亏了钱。其他的全部赚钱。”
此刻,莫雯雯的脑海中回想起了韩天泽那一头颓废长发的样子。也不知他现在怎么样了。