塞帕思:人工智能在量化投资领域的机遇与展望

来源:象树资产 2019-07-23 15:59:00

摘要
2019年7月20日杭州塞帕思投资管理有限公司执行董事王潇航先生受邀参加杭州象树资产“梧桐树俱乐部”会员活动。本次活动共邀请30余位台州地区高净值客户到场参加。活动中王潇航分享了量化投资的特点和优势,以及塞帕思的投资策略等。      &n

2019年7月20日杭州塞帕思投资管理有限公司执行董事王潇航先生受邀参加杭州象树资产“梧桐树俱乐部”会员活动。本次活动共邀请30余位台州地区高净值客户到场参加。活动中王潇航分享了量化投资的特点和优势,以及塞帕思的投资策略等。

            塞帕思:人工智能在量化投资领域的机遇与展望

量化的发展


杭州塞帕思投资管理有限公司是2015年7月成立的,从16年开始正式使用机器学习和人工智能的方法做量化对冲投资。到目前为止,16年的收益率跑赢市场差不多130个点,17、18两年加起来基本上跑赢市场100个点,今年以来差不多跑赢市场15%。 


量化投资其实是一个国外的一个舶来品,在中国的发展时间其实不算很长,但是在中国发展的速度是非常迅猛的,就短短的将近七年时间已经淘汰了很多种量化模型。从最早12年的时候,从华尔街回来的人,用北美的方法在中国根据财务数据以及各种基本面信息去进行一个基本面的量化,筛选的股票非常多,调控周期也非常慢。


但是他们刚进中国就有一个非常好的收益,因为那个时候小盘股比大盘股好。像塞帕思那个时候最早做高频交易策略的,换手率最高的时候能做到300多倍,基本上就是每天把能换的股票全都换一遍,16年的时候流动性好,但随着熊市的不断深入,交易量越来越低,然后就是交易量大部分还被上证50这些蓝筹给分走了,导致大部分股票表现非常差,以至于现在量化的高频策略就越来越难做了。


现在市场上分成了很多派别:一,就是把调仓的频率降到很低,可能一个月调一次,或者说两、三个礼拜调一次,但是我主要通过T0的方式来赚钱,这个是现在市场上主流的一类。他其实赚的是一个T0的钱;二,还是当年那些做财务数据的人,他们把财务数据和技术面结合在一起,做了一个比较低频的模型;三,机器学习、人工智能。


股票市场有一个非常好的特性就是它的数据获取度非常容易,并且特征非常多。机器学习最大的优势就是它可以在特征非常多的情况下也可以分析,且相对来说更精准一些。我们公司在这么多年的发展中,从开始基本面到后来做高频,其实就是一个在因子变多的过程中用模型对它进行分析。


因子挖掘&算法


现在市场上做人工智能比较多,我们是全市场中最早的。人工智能和传统的投资方式主要有什么差别?简单介绍一下,一直以来中国整个投资方法被割裂成了两种:一种是通过技术面的分析,另一种是通过财务数据的分析。这两种投资方法在中国是天然的割裂的。量化就是在技术分析的基础上,运用更多新的方法去分析。我们最早的时候做这些技术分析的,指标非常少,比如只有3-5个,慢慢地发展到100个,然后我们现在指标将近3万。我们用将近3万个因子去描述每一个股票,因子在不断的上升。我们可以把股票类比成人脸识别,我要描述一个人他是谁?就通过他原点上的各个指标,他的眼睛的瞳距有多大?他的鼻子有多宽?耳朵有多大?通过各方面的指标来描述一个人指标越多的时候,描述的就越精准。


但是如果指标很少的话,肯定描述不出来。所以我们认为原来传统技术分析它就是因为指标太少了,你不可能对这个股票有一个合理性的分析。然后我们就通过各种方式把因子提高到一个非常高的维度,通过一个更高的维度来更好地描述这个市场。目前我们挖的3万个因子已经很多很多了,现在市场上投顾平均就两三千个因子数量,塞帕思主要就是因子上的一个差异。 


然后就是算法,这个是最重要的。为什么?即使我因子非常多,我算不过来其实也是没用的。把3-5个因子扩到了3万之后,算法就很复杂了。因子其实不是越多越好,而是在我运算得过来的基础上是越多越好,因为我们收盘的时间太有限了。收盘就这么十来个钟头,我在这十来个钟头之内就把所有股票全部都算一遍,就是在和时间赛跑。所以说更重要的是人工智能的算法,在算法这个领域上,我们觉得现在就是国内私募水平是不高的,因为重要的算法主要都是我们这些搞计算机人做的,算法上的优势可以让我们扩到一个更高的维度。 

            塞帕思:人工智能在量化投资领域的机遇与展望

市场上大家在做的,就是不断地挖超额因子。这个东西就得益于我们现在这套挖因子的算法。现在市场上有两个做法,一种是用计算机去挖因子,另外就是招了很多人去挖因子。用计算机挖因子,它有一个非常大的好处——就是速度非常快,我们现在算下来差不多一天就一千多个因子,可能检验出来比较有效的有十个。但是如果人去挖因子的话,最大问题是,他找的因子肯定是有意义的因子,不可能挖几万个,且有些因子比较简单,比如说收盘价加开盘价、成交量,其实这些东西是没太大现实意义。 


所以说我们就要不断引进人才,我们投研团队基本上全是来自于北大的。不断招更多的人才是我们觉得对公司可持续发展一个很重要的事。 


关于风控


简单讲一下产品的模式,对于我们这种用人工智能选股的来说,最重要的其实是风险控制。因为因子太多了,最后很难知道收益到底是哪些因子贡献的,或者说那些因子占比可能没那么高。因此对我们来说更重要的是风控,就是在模型不赚钱的时候怎么去把仓位去降下去,这个是最核心的问题。因为现在所有的量化投资策略,它面临的问题其实都是一样的,就是技术类的选股没有一个技术指标是永远是有效的,即使你叠加的再多,到最后来看也会有很长一段时间他是不赚钱的。


比如股票,去年12个月,小十个月是赚钱的,再如商品期货的一些量化,可能12月里面只有两个月是赚钱的,对大家来说风控就格外重要。风控是一个非常有意思的话题,现在大家其实说的风控其实就是跌得多了把仓位降下来,反之亦然。其实这个是不对的,如果跌的多了,降仓然后涨起来,来回都是反的。事实应该根据波动率去改,所以我们现在风控主要是根据市场波动去做风控。市场波动非常大的时候,仓位可能就不需要那么高,就可以获得相应的一个收益。


量化对冲&指数增强


量化对冲就是一篮子的股票,然后用等市值的期货工具去做对冲。什么意思?比如我现在买了5000万的一篮子股票,然后我用5000万的期货去对冲,我就能获得一个跑赢指数的收益。但是就这几年情况看下来,我们对冲的成本一直非常高。像16年的时候对冲的成本将近达到50个点,然后在17、18年差不多对冲成本两年加起来是35个点,然后到了今年现在对冲成本还有将近15个点,这意味着什么?


如果我做量化对冲,从现在这一个时刻开始到12个月之后,如果指数的跌幅没有超过15%的话,我对冲其实也没什么意义。那么指数增强的好处在于——它永远是满仓的,它永远在和指数做对比,这是最大的一个优势。


高频转低频


在IT运营上的投入,现在最头部的这几家私募,其实更多的投入是在IT。因为到了最后,当算法开发到极限之后,可能拼的就是谁的交易延时低那么一点点,可能就毫秒级别的差距。比如正常散户的交易的速度差不多在四秒,因为行情刷新是四秒一次,用接口我们可以把延时降到十毫秒以内,我们可以通过数据上和运算上的一些方法把延时降到超低,这样的话可能人家都还没有得到这个行情数据,我的单子已经出去了,这就是很大的一个优势。 


现在市场上,根据统计有13万亿的私募基金,其中有将近2万亿是做股票投资的,有11万亿是做股权的,然后2万亿里面只有1000亿是做量化的,但是1000亿量化里面有800亿是高频。其实800亿的高频已经很夸张了,因为我们每天成交量就3000多亿,像800亿的高频,我们算过它每天可以为这个市场将近贡献300亿左右的一个交易量,然后这些高频做的事其实在我们看来都是大同小异的,相当于它占了市场10%的交易量。


如果交易量持续很低迷的话,高频也不是避风港。所以我们认为现在真正的突破应该是在从高频转向偏低频的一个方式。因为当行情差的时候,最主要情况就是这些票换来换去也没用,反正就从一个坑到另一个坑,还损失手续费,这就是现在最主要的情况。


最后,量化投资这个行业在中国,可以说“新”,但事实也已经淘汰很多人了。发展到现在,我们觉得高频的优势也越来越少。从时间轴来看,16年的时候把低频的人淘汰了,然后进入了量化的高频时代。但是可能从今年开始或明年开始,这些做高频的也会比较难,主要因为市场的拥挤。之后更大的机会可能就在我们现在偏低频的模型当中。从去年到现在的行情中,我们现在模拟出来的数据可以在52周中使胜率基本上达到90%,那这个是高频不可比拟的,所以我们认为未来更多机会应该是在偏低频的量化上。


以上就是我的观点,谢谢。


关键字: