南方基金刘治平:指数编制难在大数据加工,
大数据和金融碰撞出火花,背后的“牵线人”至关重要,而南方新浪大数据指数的诞生和南方基金量化投资部总监刘治平密不可分,他负责指数编制等工作。他坦言,大数据的意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。而“大数据指数”编制难点正是大数据因子深度加工——将传统的量化投资和新浪财经大数据有机整合。
中国基金报:您作为“i指数”编制人员之一,能否谈谈这只指数的优点和不足?
刘治平:正如市场所见,“i指数”的优点在于大数据指导投资,指数使用了常规投资方法中无法使用到的股票热度、微博、新闻关注度等全新的信息来源,更精准地刻画和描述市场主体的情绪。
而这只基金的不足之处在于太“新”——历史沉淀不够。A股指数如上证综指、深证成指均有20余年的历史,甚至超过了中国互联的历史,即使是沪深300等跨市场的指数也有接近10年的历史。而大数据指数的回溯历史不到5年,是一个很“年轻”的指数。同时由于等权指数的构成方法整体上偏向中小盘股票的表现,目前i100和i300指数更代表了民企和中小盘市场。
中国基金报:在“i指数”编制过程中,您如何筛选因子?
刘治平:筛选因子时重点考虑因子的几个属性,如超额收益、稳定性、行业属性、普适性、易算性,以及因子的内在解释逻辑,根据过去历史的表现衡量各个指标,综合选出比较有效的因子。
以超额收益和稳定性两个指标为例,比方说一个因子A,平均超额收益有5%,但是波动为3%,另一个因子超额收益4%,但是波动只有0.5%,那么综合超额收益和稳定性两个指标会倾向于A因子。
指数编制的难点主要是大数据因子深度加工,关键是如何将传统量化投资和新浪财经大数据有机整合。比方说因子库有大量的因子指标,如估值、成长、质量、事件、成长预期等,不同指标与大数据因子的相关性研究、互补性研究,各种指标组合下的逻辑解释都需要进行深入研究。
中国基金报:相较目前市面上的指数,基于大数据的指数最大创新点是什么?
刘治平:传统的指数编制体系和编制数据来源相对固化,比如对市值的要求及对上市地点的要求等,而i指数最大的创新点在于它有互联大数据信息的融入、投资者情绪行为因子的加入,这种海量信息的不断注入将赋予i指数非常旺盛的生命力,因时而动、因势而动,它将是对普通指数的有效补充。
此外,与市场同类指数相比,在指数编制时不仅考虑到指数收益表现,也考虑到其可投资性和投资容量,从而更利于后续的投资产品开发,这也是构建i100和i300两个指数的原因。
而且,互联数据与权益类指数的结合,在国内外都是一个比较新的领域。目前国外还没有类似的指数上市,中国在这方面应该是全世界第一个发行上市这样的指数。