程志田:大数据核心在于信息优势

更新时间:2016-08-29 09:01:14来源:中国证券报

程志田,创金合信量化投资部总监,创金合信量化多因子股票基金经理,创金合信量化发现灵活配置拟任基金经理。从业10年,专注于量化投资,熟悉资本市场各种金融工具,长于组合构建和对冲策略,奉行收益与风险两者平衡、业绩平稳高效增长的理念。先后就职于券商及摩根士丹利华鑫基金、泰康资产等国内知名投资机构,担任金融工程总监、基金经理、量化投资总监等职务。

今年以来,在基金市场中本属小众的量化基金越来越受到关注。在众多基金经理看来,使用数据模型来进行选股已成为时下不可忽视的趋势之一。要将基金经理的投资理念结合到数据模型当中,并使得基金产品产生收益,深厚的专业功底和对整个市场的判断能力显得尤为重要。作为一个已有十年经验的投资老手,在创金合信量化投资部总监程志田看来,量化工作的核心就是通过对信息的整合与分析来进行选股和择时择仓。

拟于8月29日正式发行的创金合信量化发现灵活配置型基金即由程志田担任基金经理。在具体操作上,这只基金也将采用独立开发的大数据模型进行选股,并使用量化择时模型和BARRA风控模型运行。在采访过程中,程志田对团队独立开发的大数据模型颇具信心。他认为,大数据的核心即是信息优势。

打造独具信息优势的大数据模型

程志田于2006年进入证券行业,2015年正式加入创金合信基金,担任量化投资部总监。10年来,程志田专注于量化投资,他熟悉资本市场的各种金融工具,长于组合构建和对冲策略,奉行收益与风险两者平衡、业绩平稳高效增长的理念。

在与程志田的交谈中,他会反复强调“勤奋”二字。在他看来,这是作为一名基金经理必须具备的素质。“本着对投资者负责任的态度,需要勤奋”,程志田说,“做量化的还需要更勤奋一些。一般来说,勤奋的投资经理业绩即便不是特别耀眼,但至少也不会太差。”Wind数据显示,程志田管理的创金合信量化多因子股票基金业绩优异,该基金成立于2016年1月22日,截至8月24日,成立以来的收益率为19.90%,大幅跑赢各大指数,且同类排名靠前。

程志田介绍,要想保证量化基金的业绩,需要在前期开发模型的阶段便投入大量精力,不仅要建立一个数据模型,更要把投资理念结合到模型当中。他用具体的案例对此做出了解释:近两年来,大数据的概念在新成立的基金产品中出现的频率越来越高,其中不少基金通过采购第三方的数据来完成数据的收集和挖掘。但程志田认为,这种模式存在天然的问题,大数据的核心在于信息优势。不论是哪个第三方,也仅仅是掌握了小范围的数据,且具有将数据卖给很多买方的动力。“仅仅采用这些大家都能获取的同样数据是不够的。”所以,他的团队在建立大数据模型时,选择了独立开发,模型中采用的数据来源于所有互联网以及媒体上与财经相关的数据和信息。

整个大数据模型从研发到上线都有着极其严苛的评价标准,例如通过统计一段时间内有多少人登录行情来判断市场的热度如何。程志田表示,这个模型不存在调整参数的问题。“如果一个大数据模型在某一个市场阶段失效,一定是你的思维上有某些漏洞,需要把所有问题放在模型开发阶段解决,而不是到模型出了问题再去改。就好像手机一样,如果一部手机隔一段时间就需要修理,那么这部手机一定是有问题的。”程志田道。

但同时,模型也在不断完善。“我们会通过增加大数据的来源与多样性去增加模型的超额收益。”他解释说,主要是发现一些新的数学规律,或者新增一些大数据的来源。通过大数据模型,可以检测到哪个行业、板块以及哪些股票活跃度较高。

模型初步建立后,还需要经过回测和实盘的检验,才能验证模型是否有效。“只有一个模型能够在一段比较长的时间里的每个时间段都经受住考验,我们才认为它是可靠的。”他说。创金合信基金的大数据模型选择从2008年开始回测,而多数的投资团队都无法将回测推到2008年那么远,因为整个大数据兴起也就是2013年前后的事情,而年代久远的大数据获取技术门槛较高,少数团队才可以拿到数据并将回测推到2008年。同时,从2008年到现在,各种常见的市场环境也都经历过了。此外,这个模型从2014年开始有实盘业绩,也有了更加实际的经验。“现在创金合信鑫安保本基金中的权益部分投资采用的便是这个大数据模型。截至8月24日,这只基金以较低的平均仓位赚了2.7%左右,如果单看模型的话,收益率会达到30%。”程志田说。

控制风险与提高业绩并重

拟于8月29日正式发行的创金合信量化发现灵活配置型基金也是由程志田来担任基金经理。据悉,这只基金也将采用大数据模型进行选股,还会使用与创金合信量化多因子股票基金相同的量化择时模型。程志田介绍,两只基金最大的区别在于基金类型不同,创金合信量化多因子基金为普通股票型基金,建仓期结束后始终保持在高仓位的状态,而新发的创金合信量化发现基金仓位可在0-95%之间灵活调整;新发基金的仓位调整空间更大,择时模型的贡献也会更多一些。

在量化投资中,全面的数据模型建立之后,风险控制也显得十分重要。据了解,正在发行的创金合信量化发现基金采用的是BARRA风控模型。“我们的模型是非常严格且严厉的,一定要区分出哪一部分是真正的超额收益(α),哪一部分是因为风险暴露而产生的收益。”

为了更好地解释这个风控模型,程志田从现代金融投资学的核心——α和β开始讲起。α代表超额收益,β的暴露通常代表风险,是现代金融投资学的两个基石。例如一群与“一带一路”沾边的股票,这些股票共同构成了一个β,α则是共同特征股票群里面跑得比较好的股票。“投资中如何实现不去冒额外风险的收益呢?中国A股市场有很多个β,我们希望在每一个β里面都要获取一定的α,我在每个β里面都找到一群比较好的股票,最后我的收益就是由很多个α构成的,同时没有在β上有暴露,不会因为哪个β没配或者配多了而产生风险。”程志田告诉记者。

BARRA可以把所有的风险点量化,给每一只股票在风险点上赋一个值,股票组合的风险暴露值就等于单个股票的风险暴露值的加权平均,组合的风险暴露值来源于股票的风险暴露值,组合里面各种各样的风险暴露就会有各种各样的风险暴露值,所以,需要把每个值控制在你要的范围之内。例如市场上共有2000多只股票,属于“一带一路”概念的有30多只股票,于是,属于这个概念的股票赋1,不属于这个概念的股票赋0,总和就是所有股票在这个风险点上的风险值。假设要使500只股票的股票组合中“一带一路”的风险控制与全市场差不多,那么30除以2000,就是在全市场的占比大概为千分之1.5,我的组合里面也要有千分之1.5的“一带一路”股票。“也就是说,股票组合里面各种各样的风险全都是均衡的。”他说,“BARRA把所有风险暴露全部量化成一个值,把它变成数字以后,才能进行更好的风险控制。”

按照这样的风控思路,新发行的基金不会主动去超配哪个行业,而是不管这个行业如何,都能找到其中好的那一部分。他介绍说,这就是他们量化的工作核心,即通过对信息的整合与分析来进行选股和择时择仓,保证在每个风险点上都有α。

量化的优势在于“长跑”

据Wind数据统计,在市场89只量化基金中,有51只今年以来的回报率为负,而程志田管理的创金合信量化多因子在今年以来回报率中排名第二。

程志田说,今年整体来看行情并不是特别好,这是系统性的原因。“但决定一只量化基金的投资策略是否奏效,最重要的因素在于其模型本身的质量水平。如果一个量化模型在研发阶段的论证是合理的,有严苛的逻辑,那么其在之后的运行过程中也是大概率奏效的。他认为,量化基金间的差异远远大于非量化基金间的差异,所以拿量化基金整体水平来评价某一只基金并不合适。”他表示,投资者需要仔细甄别量化基金间的差异,然后进行选择。

程志田还为投资者提供了判断一只量化基金是否优秀的标准。即如果这只基金是做绝对收益的,可以看它的夏普比率;如果基金是做相对策略的,就看信息比率。程志田解释:“夏普比率达到1以上就算及格,如果能达到1.5或2就是很优秀了;信息比率达到2算是比较好,而达到3就是很优秀。”

他进一步表示,量化基金的优势在于长跑,且往往都具有均衡配置的特点,目标是能够在各种市场环境下比较稳定地获得超额收益。而量化基金能否跑赢大盘与量化基金本身获取超额收益的能力,以及每一只量化基金自己的风格有关。在程志田看来,这只新发的创金合信量化发现基金的风格便在于,这是一只绝对收益量化基金,是先追求绝对收益,再追求排名。而基金的风格在模型建立初期就被融入其中,从建模的各项指标中可以体现出来。

虽然是灵活配置基金,但这只基金的重点不会放在债市。当仓位降到0的时候,现金就空出来了,也会投一些信用债、可转债,也会去打新,但收益的重点来源还是以股票为主。“因为现在我们对债券市场相对谨慎。”他说。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。