变革投资实践
投资思维的转变,必然引发投资实践的变革。站在大数据时代的历史拐点,证券投资界需要思考大数据思维、技术与资产相结合,对投资实践可能产生的深远影响,据此进行投资方法、技术和流程的全方位变革。只有如此,这个传统行业才能实现自我更新,重获引领其他行业的理念与技术优势。
信息之变
证券分析师的工作是处理信息,评估各类信息对金融市场的可能影响,据此形成投资观点。虽然他们的观点千差万别,但是所掌握的信息资源几乎雷同,从宏观经济到微观企业经营,这些信息全部来自公开渠道。捣鼓这些信息不仅做不出新菜,靠它赚钱也越来越难。相比之下,大数据却是片“蓝海”,它从信息采集方式、信息分析理念等方面,对投资实践产生了革命性影响。
尽管大数据很具诱惑性,中国投资机构对它的认识与应用还不多。向来对新技术接受和应用较快的证券投资界,却落在了政府和其他行业之后。政府的秘诀就在于信息获取方式的改变。人民网在2008年组建的舆论监察室,可对线上媒体、网络社区、论坛以及微博等自媒体的意见领袖实现24小时监测,实现了从民意搜集到综合信息服务的转型。它面向市场推出的《网络舆情》,可被视为网络时代最有代表性的大数据产品之一。同时,由于社交媒体空前流行,已成为社会组织平台,对政府来说有监控的必要。2013年五六月,土耳其持续爆发反政府示威,当时土耳其总理就曾公开指责社交媒体对社会的危害,并要求Facebook协助提供部分用户的数据。反观之下,投资界似乎还生活在石器时代,既没看到大数据的利,也没看到它的害,信息获取方式依然是等着各种官方数据、企业财报的发布,投资分析重回顾而轻前瞻。总之,一切还是“看着后视镜向前开”。
投资决策信息转向大数据,首要的问题是大数据的搜集。作为公共资源的大数据较少,虽然在政府推动下,城市交通、教育、住房、公共设施、犯罪和无线网络热点位置等数据,可在大数据平台上共享,但这些与投资所需的仍相去甚远。为获得大数据资源,投资机构需要有创造性的解决方案,比如自主跟踪线上的大数据统计。就有这样的投资经理,为跟踪某家公司主打产品的销售情况,每天查询、记录电商成交与顾客评价。西蒙斯也曾提到,其麾下研究团队为搜集数据,会前往美联储影印其未入库的利率数据,同时也会手工搜集区域性的经济数据等。除此之外,某些投资机构也可与手握大数据的互联网企业合作。
但不管使用什么方式,对大数据资源的搜集不能触及法律红线。某些机构为获得非常规信息,有时候会铤而走险,彭博社算是典型。它比较偏执地搜集数据,从用户终端的键盘敲击,到重要客户的即时位置,从公司创始人每次访问家族基金的记录,到租用卫星拍摄石油库存的照片,直至发展成丑闻。
谷歌引领风险投资界新趋势
谷歌旗下的风险投资更关注投资交易的科学性,在资金开始运作之前必定对数据的搜集、核对和分析做足功课。谷歌风投是第一家重度依赖数据的重要风险投资机构,谷歌拥有全球首屈一指的数据资源和云计算基础设施,所以,“贸然凭直觉进行投资是愚蠢的做法”。谷歌风险投资利用来自学术文献、以往经验和初创企业及其创始人的数据不断改进算法,即便对从未创业的大学生都能建立量化记录。
其实,证券市场自身也坐拥大数据。每笔交易和报价都可视为投资者意见的表达,反映了投资者对股票价格的预期。挖掘市场交易数据这座富矿,从中找出盈利的投资策略或者规律,也是量化投资早就在做的事情。
算法是关键
在大数据时代之前,证券分析师认为数据资源稀缺,所以尝试各种办法,玩尽花样,试图从有限的数据中挖掘出更多信息。但在大数据时代,数据的生产速度像核裂变般迅猛,投资分析的短板不再是数据数量,而是对大数据的处理能力。
要增强数据处理能力,只靠招兵买马、扩充研究团队的老办法当然不行。大数据的海量、动态和非常规,不是证券分析师用Excel(微软公司运算表软件)就能对付的。在海量数据中过滤掉不重要的数据,并把数据处理成可快速分析的格式,需要云计算、机器智能等针对大数据的专有解决方案。更智能的计算机可以拯救被大数据淹没的金融“苦力”,让他们腾出手来,有更多时间去干更有价值的事——琢磨大数据的算法。形象地说,算法设计是对大数据所蕴含信息的提炼过程,也是整个大数据寻宝游戏的决定性环节。而且,大数据往往是信息的贫矿,单位体量数据的信息含量比传统样本低很多,但它以量补质,填补了样本数据的信息空白。这也决定了挖掘大数据的规律或者信息,是项极其烦琐和复杂的工作。譬如,在谷歌预测流感、电影票房等经典案例中,为提高模型预测的精准度,研究员可能需要处理成千上万甚至上亿个的预测方程。
挖掘大数据算法,靠金融财务的科班出身的研究员不够,还需要复合型人才。国外以数据科学家为主导完成对大数据的算法设计,这个职位的性质类似于20世纪八九十年代华尔街的量化投资分析师。对数据科学家的要求是既精于数据建模,又熟悉业务决策,其薪酬自然比资产管理公司内的信息技术工程师或者金融分析师高出不少。
大数据、云计算——投资新利器
美国Kensho Finance公司在云计算的大数据处理技术的基础上,开发出了Robotrage运算软件。该软件可以根据美国证券交易所和纽约证券交易所两个交易所的股票,结合收益、经济指标和政治事件等进行相关性计算。据该公司称,华尔街投资机构里,只有桥水和文艺复兴科技公司等少数10家顶级量化对冲基金,才有如此尖端的投资利器。而这些世界上最成功的对冲基金对其投资策略极为保密,普通人根本无法借鉴。例如文艺复兴科技公司倾向于雇用有经验的密码工程师和数学家,并与他们签署竞业禁止条款。为弥合对冲基金与个体投资者之间巨大的技术差距,Kensho Finance计划将这个“核武器”卖给付费客户。只要一点费用,散户就将拥有顶级对冲基金的技术优势。
要注意的是,算法与数据分析速度之间需要平衡。要做到算法的尽善尽美是十分耗时、耗力的,而对投资来说,快无止境,越快越容易出错。在证券投资的世界,快与慢只是个相对的概念,只需追求相对的安全边际。而且,为节约计算时间,大数据分析可着眼于增量数据,并适度降低对算法的精准性要求。总之,算法与速度之间的理想平衡,应以投资策略的有效性为前提。
跟上基本面
传统的数据与信息,不论是GDP、CPI、PMI等宏观经济指标,还是微观的企业经营数据,都只是现实世界留下的历史投影。投资分析需要把握实时动态,紧跟事物最新发展,靠“历史老照片”不行,必须依靠大数据的微拍、实拍。作为信息革命2.0版,大数据将革命性地提升信息搜集、处理和分析的速度,让投资者的认识与时俱进,始终站在事物发展的最前沿。
基本面在不停刷新,事物微小变化在低频率数据中难以显现,大数据会使你有“春江水暖鸭先知”的认知优势。举例来说,分析固定资产投资的变化,等官方数据或有长达一月的时滞,如果跟踪日本小松集团的小松挖掘机的工作小时数,却可以将观察与基本面同步到每一天。因为这些挖掘机大多安装了传感器,可实时采集并返回挖掘机工作时间等数据。而全球最大的工程机械制造商卡特彼勒也可利用更高频率的销售数据,去研判世界经济的复苏情况,还能通过比较亚太、拉丁美洲、欧洲等大区销售额的动态变化,判定各区域经济增长差异。再者,全球信用支付公司VISA有世界最大的交易和信息处理网络,它的数据部门搜集和分析了来自210个国家的15亿信用卡用户的650亿条交易记录,以此预测客户的消费趋势、当地商业的发展环境,然后把这些数据结果卖给其他公司。另外,现在观察某家企业的产品销售情况,可以直接跟踪淘宝、京东等电商的销售数据,无须等到其发布季度经营报告。如果不嫌麻烦,还可实时监控更新的原材料购进、制成品售出价格,对上市公司经营做出动态研判,同样能获得先财务报表一步的信息优势。
不只是经济基本面,连政策的基本面也可以用大数据捕捉到。就拿2014年春季股市上炒得沸沸扬扬的特斯拉概念来说,当投资者还不确定国家电网能否与特斯拉携手时,特斯拉中国区负责人已在微博上发出了项目经理和技术人员的招聘广告。如果这一条信息还不能证实特斯拉将与国家电网合作建设充电站的话,有心人还会注意到,某位特斯拉客户的微博同时也发布了这么一条消息:“特斯拉公司与国家电网的人都过来了,测量了下充电时的电流情况,还有充电时间。”将这些琐碎的信息关联起来,进而合成的图像与真实情形相去不远。
总之,大数据时代的投资分析再也不用等和靠。因为投资者等不起,而且等到的信息再也靠不住。想在瞬息万变的市场里赚钱,必须以大数据思维捕捉更新、更全面、更多元的信息资源,再以更快捷的方式进行基本面研究。
预测力是种计算能力
投资面向的是未来和未知,大数据的强项就是预测,在未知世界里寻找相对的确定性。大数据的预测能力从何而来?一是因为市场从来不会随机漫步,它们是投资者行为的结果,而投资作为人类行为,尤其是群众行为,从来就不是随机的;二是大数据将人类行踪尽收眼底,对个体信息实时跟踪与更新,对人类行为有最真实和深切的把握。
尽管投资者学过有效市场假设,了解预测市场的风险,但是关于证券的电视节目总喜欢请教投资专家对市场的看法。为什么?因为个人投资者想从专家们的多空分歧中寻得投资操作的启示或信心。《中国证券报》在每个季度会开展投资者调查,搜集散户们对下个季度的市场观点,并调研投资者对后市的乐观程度。如果你认为这种预测方式有效,可以考虑,但建议还是谨慎为妙。因为预测是门科学,有诸多限制条件,专家们或某个散户随口说涨跌,还真算不上是预测,可能跟瞎掰没两样。
法默认为,人类世界存在两种复杂性,一种是内生性的复杂性,即在人类的经验之外;另一种是噪声系统的复杂性,隐藏着可探索的秩序。前者是真正的未知世界,这种情形不能做预测,因为预测的可靠程度与算命是一样的,猜中纯属运气。后一种复杂性好似浓雾弥漫的街道,尽管人们视野模糊,但是还有迹可循,能够预测的也就是这类情形。
预测本质上是种计算能力。1997年,IBM研发的计算机深蓝击败了国际象棋大师加里·卡斯巴罗夫,依靠的就是计算机的大数据技术。因为象棋高手只能推演两三步,计算机却可以推演到5步之外,预见到更多信息。因此,计算机根据对未来的预测,找出人类棋手的软肋,诱导他进入圈套,就能战胜对方。商品价格预测公司Decide.com成立的宗旨是帮助客户省钱,增强消费者在做购物决策时的自信。它通过分析近400万产品、超过250亿条价格信息,告诉客户何时才是购买某商品的恰当时机。出于好奇,我访问了这家公司的网站,却意外发现该公司已经被购物网站eBay收购。现在的Decide.com已不对消费者开放,它转而帮助eBay网站上约2 500万卖家制定商业决策。我为消费者及投资者少了这个大数据的预测平台而可惜。试想一下,当商品价格可以被预测,它的价值又何止是帮客户在购物时节约一两百美元,更可以在投资领域派上大用场。
上面所说的《中国证券报》就散户们对后市看法的调研不可靠,并不是因为两根大阳线或大阴线就改变了散户们的观点,而是因为散户们预测的方法不科学,而且这种调研也存在方法上的缺陷。虽说股市是场“选美比赛”,普通大众有投票权,但是以往,群体智慧没法利用,因为电话调查等总是有偏颇,但是在互联网时代,我们有了新的民意搜集机制,除了直接的网上调查问卷之外,还有看新闻点赞、预测市场的交易网站等。如Foresight Exchange、Intrade等网站,以虚拟或真实货币为赌注,对某些事情的结果进行预判。由于涉及虚拟或真实财富,参与者的非理性噪声可降至最低,其交易结果自然更能反映群体智慧。
大数据的预测能力对于投资的价值,主要表现在两个维度:一是,它可以直接预测证券的涨跌,这一点稍后举述;二是,它可以预测证券相关变量的变化,间接揭示投资机会。譬如,谷歌用某电影预告片的搜索量、前几部同系列电影的票房表现,以及档期的季节性特征,可提前30日预测出该电影票房收入。这一预测对投资机构当然有价值,当基金经理看着《致青春》票房上涨,而猛追光线传媒等受益个股时,有些人却凭借谷歌票房预测模型,提前一月从容布局投资机会。
大数据扭转择时困境
有人说,投资是件再简单不过的事,低买高卖而已。但脱离了时间讲空间,对投资没有任何意义。什么时候买和卖,才是投资最重要的问题。大家都知道择时很重要,但是很少有人能做到。我们常听到投资者抱怨,说自己预见某只股票将要大涨,但买了就被套,亏得一无所有,它却开始大涨了。
需要记住,有预见力与把握投资时机,完全是两回事。美国次贷危机因房地产泡沫而起,预知这场房地产泡沫的破灭,成就了若干位市场先知。早在2000年,罗伯特·席勒在其著作《非理性繁荣》中,就注意到了美国的房地产泡沫,这或许是他荣获2013年度诺贝尔经济学奖的主要原因之一。英国经济政策研究中心经济学家迪安·贝克在2002年也提到了房地产泡沫。《经济学人》杂志2005年6月刊发了题为“美房地产泡沫为史上最大泡沫”的文章。2005年8月,诺贝尔经济学奖得主保罗·克鲁格曼撰文,讨论这轮房地产泡沫及其必然破灭的后果。尽管在大方向上几位说得很对,但根据这些预言进行投资,你可能早被市场清洗在黎明到来之前。例如,席勒早在2009年就表达了对上海、深圳等地的房地产泡沫的担忧,但是现在看来,那时还真是不可多得的投资时点。
这些专家的预见力过于超前,看到了普罗大众所不及的将来。但可悲的是,决定现在的往往是那些短视的人。想知道短视的多数派的想法,以前靠抽样调查,现在关注网络舆情就可以了。《信号与噪声》里谈到,美国民众对房地产泡沫的持续关注发生在2004年以后。2004年1月至2005年,谷歌里“房地产泡沫”的搜索量迅速增长了10倍。而且,2001年带有“房地产泡沫”这个词条的新闻只有8则,2005年时蹿升至3 447条。不仅如此,网络舆情观察还实现了精准打击。比如,对“房地产泡沫”这一词条关注度最高的地方,恰好是房价迅猛飙升的加利福尼亚州。这一情况与2013年冬天中国“雾霾”一词的网络出现频率异曲同工。“雾霾”一词在新浪微博上出现频率最高的时点是上午八九点,想必人们刚到公司就抱怨。更厉害的是,新浪微博还可跟踪呈现提及“雾霾”最多的区域,比如江苏、上海等地,实现准确定位。前文提到2013年5月下旬“防风险”新闻的暴增,与中国金融市场“钱荒”的叠加,说的也是同样的故事。
上述案例说明,投资需要把握时机。时机不到,投资即使看对也会做错。想要看对又做对,就需要关注普通大众的想法。《技术元素》说,目光聚集的地方,金钱必将追随。市场营销学讲“眼球经济”,同样指的是群体的普遍关注。大数据可贴近、跟踪普通群众的所思所想,找到他们关注的爆发时机,从而使投资做到有的放矢、御风而行。由此可见,大数据将一改小数据时代选不准时机的尴尬困境,极大地增强投资者的择时能力。
大数据时代的热点投资
热点投资的魅力在于兵无常形,没有常法可以遵循,每一次的热点都是独一无二的剧本。这么多年,公募基金很少在热点投资中获利,原因不仅是公募基金缺乏想象力,还欠缺投资手法。热点投资根本没有谋划布局的时间,“编剧”或者“导演”不止一个,通常是集体作品。这种投资讲究御风而行,逆风则停。
要想把握这种投资机会,利用大数据可能更占优。新浪微博的数据中心掌握了微博平台的大数据资源,可以实时提供各种排行榜单,统计如综合、时事、影视、名人、财经、体育等领域内最新出现的网络热词,还提供各类微博人物、机构的影响力排名。这些网络热词实时采集、时时更新,能够反映网民大众在当下的重点关切。而通过对热词背后信息的解读,某些机构可以挖掘出投资机会,并根据用户关切的热度消长,准确选择买入与卖出时机。
情绪也是投资策略
利用情绪赚钱的想法并不新鲜。情绪是非理性的,非理性的投资者市场行为,自然会给理性的投资者提供盈利机会。巴菲特在2004年写给投资者的信中曾提到,他的投资哲学概括地说,就是“在别人恐慌时贪婪,在别人贪婪时恐慌”。道理虽然说得通,可问题在于怎么去把握“贪婪”与“恐慌”?如今,这个问题因社交媒体的流行而迎刃而解。通过对社交媒体实时且非结构化的数据进行搜集和处理,我们可以捕捉到社交群体的情绪。下一个问题在于,情绪与证券价格波动有怎样的关联?
金融学对情绪与证券价格的关系早有研究。将时间拨回到社交媒体的大数据之前,研究者还没有想到直接度量公众情绪的办法,于是选择了五花八门的代理指标。赫舒拉发和寻威研究了1982~1997年每个交易日早晨的天气,比如晴、雨和雪等,分析国际范围内26个股票交易所的市场收益率与天气存在的可能联系。他们研究发现,早晨的晴朗天气与当天收益率显著正相关,而雨雪天气与股市收益率的相关性不强。这项研究表明,早上给投资者一点阳光,股市就灿烂。爱德蒙斯等人认为,国家足球队在国际赛事中的比赛失利,将使该国投资者心情沉重。于是,他们选取39个国家足球队在大小赛事的比赛结果,作为该国投资者第二天郁闷心情的代理指标,考察投资者心情郁闷时对股市收益率的影响。他们研究发现,一国足球队的比赛失利确实会导致股市下跌,而且在大型比赛(如欧洲杯、世界杯)中失利,该国股市将有更大跌幅。
尽管通过代理变量,研究人员发现情绪与股市收益有显著联系,但这些毕竟不是最直接的证据。随着Twitter、Facebook等社交媒体的兴起,以及非结构化分析工具的发展,学者开始用社交媒体的文本数据分析大众情绪。其中,最为知名的研究来自美国印第安纳大学的博伦及其合作者。他们利用两种不同的情绪跟踪工具,分析和整理Twitter上将近1 000万条信息。工具之一是匹兹堡大学开发的一个开源软件包Opinion Finder,工具之二是由这几位研究者开发的基于情绪状态量表的算法。他们将Twitter上所有关于心情的词汇归类为6种情绪类别,分别是冷静、警惕、确信、重要、和善、快乐。他们的实证研究发现:在这个基于情绪状态表的心情测量法中,只有“冷静”具有预测价值,靠这个情绪指标能够预测未来3~4天道琼斯指数的涨跌,准确率可高达87.6%。
与博伦等人的研究互补,慕尼黑工业大学的两位学者对Twitter情绪与证券价格的关系做了进一步的分析。他们将分析对象界定为含股票代码和美元符号的信息,比如“AAPL”代表苹果公司等。两位学者借用计算语言学中的另一种情绪分析法,对提到标普100指数成分股公司的25万条信息进行逐日拣选,看其是否给出“买入”、“持有”或“卖出”信号,并对这些信号与第二天证券收益的关系进行计量检验。他们研究发现,关于某只股票的信息数量、看涨程度,与这只股票下一个交易日的收益率、交易量有显著的正向联系。不仅如此,他们依据Twitter买入信号的强烈程度,构建了一个投资策略,即买入最看涨的3只股票、卖空看涨程度最低的3只股票,半年内可获得高达15%的绝对回报。
这些研究绝非纸上谈兵,还可以直接,运用于投资实践。在2011年5月16日,一家总部设在伦敦的对冲基金管理公司Derwent Capital Markets,推出了欧洲第一只以社交媒体情绪为策略的投资基金。该基金公司创始人兼基金经理保罗·霍汀受博伦等人研究的启发,对这种投资策略深信不疑,并与博伦签订了使用其算法程序的排他性合同。霍汀所坚持的投资理念是“市场受情绪驱动:当人们贪婪时,股市就会上涨;而当人们害怕时,股市就会下跌”。从霍汀管理的基金业绩来看,他的投资理念和策略似乎可行。
欧洲第一只基于社交媒体情绪的策略基金
保罗·霍汀管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4 000万美元。该基金的投资标的包括流动性较好的股票及股票指数产品。他们的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。
在该基金公司的网页,你可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会”。该基金的基金经理,同时也是基金公司的创始人保罗·霍汀在基金宣传册里表示:“多年以来,投资者已经普遍接受了一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪指导投资。”
我们可以从该公司的网站上查到该基金的业绩,2012年的投资收益率为3.5%(2012年7月以后的数据),2013年为23.77%,2014年1~2月为3.73%。在有数据可查的月度大多实现了正收益,虽然收益的波动率不小,但总体上还算是有竞争力的对冲基金产品(见图2-1)。
图2–1 Derwent媒体策略基金的历史表
看到投资机构对社交媒体的着迷,StockTwits网站整合了社交与投资的联系,为投资者打造有关股票新闻、投资建议的共享平台。同时,它也是投资者情绪和意见的搜集工具。比如,它提供“热点地图”的功能,可以实时搜集过去若干天讨论最热烈的股票或者行业,为投资者把握市场情绪提供方便。另一家公司Market Prophit在2013年发布了面向机构与个体投资者的金融大数据产品,通过语义算法分析Twitter里的金融对话,将其内容量化为“–1(极度看空)”与“1(极度看多)”之间的投资建议。在该公司官网上,还有对这套投资策略有效性的介绍,有兴趣的读者可以查阅。
量化投资是大数据的天然实验室
如果说价值投资是在垃圾中找珍宝,成长投资是在珍宝中找便宜,那么量化投资则是在数据中找规律,用统计学、数学的方法,从历史数据中回测、追踪、寻找能够带来超额收益的各种规律。在方法论上,如果价值投资和成长投资是用鱼叉捕鱼,那么量化投资是用渔网捕鱼;在交易执行上,如果价值投资和成长投资是点射的步枪,量化投资就是扫射的机关枪。
由于金融市场自身拥有大数据,传统量化投资更是以各种软件直接处理交易数据,反而可能比其他人更容易误解大数据。相比其他,市场现有的量化投资策略更需要转型,因为大数据已经重构了交易。之前的量化投资在技术上并不复杂,无论是因子选股、统计套利、事件驱动,还是高频交易等,均是通过迅速找出价格错位或者反应滞后来获利。随着市场效率提升,这类获利机会将越来越少。比如在沪深300期货推出的早期,期现套利、跨期套利机会层出不穷,但现在要想通过这种机会获利,收益可能连塞牙缝都难。
穷则思变。为了变穷途为坦途,传统量化对冲基金正在探索新的交易策略。比如,国外高频交易商在利润空间受挤压之后,对高频交易也做出了调整,开发出“策略时序交易”这一新武器。这种技术由程序算法来识别和分析交易数据,捕捉其他市场参与者留下的交易痕迹。如果某机构为降低价格冲击,将大额交易单拆分成1 000股等分成交,那么程序算法技术就可能识别这种交易模式,并根据这种模式做出相应的交易指令来获利。这种交易策略的本质是利用投资者之间的博弈,结果增加了其他投资者的交易成本,或者说占了其他投资者的便宜。
另外,某些对冲基金也开发了基于媒体或情绪的程序交易系统。前面已经介绍的Twitter情绪交易策略,以及对冲基金基于白宫爆炸新闻的交易策略,就是典型代表。实质上,这种投资策略可以归为事件类。桥水也比较在乎事件投资策略,该公司搜集了历史上各类大小事件,并对它们对股票价格的影响进行了量化分析。在事件触发的瞬间,桥水的计算机可以在第一时间找到受影响的证券品种,并据此进行多空交易。
量化投资传奇
詹姆斯·西蒙斯是美国的数学家、投资家和慈善家。作为最伟大的对冲基金经理之一,他是量化投资的传奇人物。
西蒙斯1958年毕业于麻省理工学院数学系,1962年在加利福尼亚大学伯克利分校获得博士学位。他曾任教于麻省理工学院、哈佛大学和纽约州立大学石溪分校。陈–西蒙斯规范理论就是以陈省身和他的名字命名的。1976年,西蒙斯摘得数学界的皇冠——全美维布伦奖,数学事业达到顶峰。之后,西蒙斯转入金融界,于1978年创立了私人投资基金Limroy,5年后创立文艺复兴科技公司,并在1988年推出了公司旗舰产品—— Medallion基金。
Medallion基金以计算机运算为主导,运用数学模型在全球各种市场上进行短线交易。1989~2009年,西蒙斯操盘的Medallion基金平均年回报率高达35%,较同期标普500指数年均回报率高出20多个百分点,比“金融大鳄”索罗斯和“股神”巴菲特的操盘表现还高出10多个百分点。即便是在次贷危机爆发的2007年,该基金的回报率仍高达85%。用数学模型捕捉市场机会,由计算机做出交易决策,是这位超级投资者的成功秘诀。
风险控制新进阶
前面讲投资的大数据应用,讲的是“矛”,接下来谈“盾”。大数据骨子里是防风险的,因为应用大数据对算法、预测精准度有极高的要求,时刻验证方法与市场的“知行合一”。
关于风险控制,《趋势戒律》里有句话相当经典:你无法改变风向,但可以调整自己的风帆。身边多数投资者的问题是不能改变风向,不时调整自己的风帆,可就是无法感知风向。套用徐志摩的诗句,是“我不知道风是在哪一个方向吹”。可见,风险控制的起点在于对事物的正确认识。大数据正是对事物的高度写实,一方面记录事物的细微变化,有敏锐的洞察优势;另一方面,可完整呈现事物规律,帮助投资者对风险状况做出防范与提前应对。凡此两点,便是大数据对于风险控制的价值。
在监控投资的市场风险方面,大数据将大有可为。在资产配置层面,大数据对相关关系的敏锐感,为投资者明察资产之间的联动,动态调整资产的配置头寸提供优势。运用相关思维,大数据还可监控股市的运行状态。比如,投资者害怕股市的崩盘或者“跳水”,这在大数据看来有据可查。研究股市复杂性行为的学者认为,预测和揭示股市“跳水”的指标是联动指数,这也是一种动态的相关指数。他们研究发现,如果股市处在正常状态,股票应该有涨有跌,个股之间的相关性较弱,但是在“跳水”或者其他不利情况发生时,股票之间的联动性增强,股票会突然呈现同涨同跌的特点。这一点中国股民应该深有体会,不仅因为A股市场经常出现同涨同跌的现象,还有2013年爆出的“816乌龙指”事件。如果投资机构对市场风险有大数据的监控指标,它们或许能发现,当天上午股指突然飙升,伴随上证180指数成分股的联动性增强,而其他个股慢了半拍,股指期货的交易也没有同步跟进。这些事实足以说明市场不正常,可坊间还在流传种种政策利好。
将眼光放得更长远些,大数据还可记录股市由过热到恐慌,甚至崩盘的全局景象。物理经济学及物理金融学借用物理学的方法论研究股市危机。这些学科认为,系统中彼此相关的单元共振,将会导致整体行为的剧烈变化,如水加热后沸腾、蒸发,积雪增压后发生雪崩。所以在正常的股市,应该是投资者独立决策,投资行为不是过度跟风,股市涨跌的关联也是随机的。但是到了过热阶段,股民们不再独立决策,买卖股票纷纷效仿他人,导致股票间的联动性增强。这种集体行为达到临界点,投资者的好日子就到头了。
股票联动性与股票崩盘
哈蒙等人在研究中构建U函数,用来指代集体行为的一致程度。当该函数值逐渐趋近于1时,表示集体行为渐趋临界点。为验证该函数对股市崩盘的预测性,各时间点的函数值以此前12个月的平均值替代。他们研究发现,2000~2003年,美国股票市场的行为一致程度逐渐上升,并且在2003年之后的平台期逐渐下行,于2009年达到临界点,显示股民在这一时间更加偏好对股票进行相同的操作,与2007~2009年美国股市的崩盘相呼应。同时,他们将数据回溯到1985年,发现每次股市崩盘前4年,股票之间的联动性都会上升。
大数据还可以管理流动性风险,这听起来有点不可思议。以与余额宝对接的天弘基金为例,外人羡慕它半年即突破千亿的规模增长,却看不到天弘基金所做的技术准备。为了应对24小时赎回,并获得有竞争力的投资收益,天弘基金需要对流动性做到提前安排。于是,支付宝每天会分6个时点,将淘宝、天猫用户通过余额宝赎回、提现、消费和转账数据报给天弘基金。对这些数据进行建模分析,天弘基金就能对第二天的申购赎回额进行大致预测。毫无疑问,这种风险管理能力的增强是需要成本的。旁人想不通,在余额宝规模飙升的同时,天弘基金2013年未经审计的盈利情况竟为亏损。钱都去哪儿了?当然是花在信息技术和数据处理中心建设上了。
对于投资从业人员的道德风险,大数据比道德说教、规章制度更管用。在现实中,监管机构或投资公司秉持“人心本恶”的信条,不让投资人员个人买卖股票,亲属投资股票也须备案。基金公司的投资研究人员经常抱怨,交易时间上缴手机,在工作计算机上不能聊QQ和微信。其实,这些行为都是因噎废食之举,少了与外界的及时沟通,说不定还会影响投资业绩。在大数据时代,这些不合理的规章与规范可以废除。有了明察秋毫的大数据,投资机构从业人员的道德风险也会降低。
需要指出,基于大数据的风险管理必然走向智能化,毕竟这不是普通人可以干的事。2011年,IBM的超级计算机Watson战胜了电视智力竞赛Jeopardy的冠军;2012年,中国的无人驾驶汽车在京津高速上的时速高达一百多公里,它不仅预测被超车的风险,其间还超车33次。这足以表明,一个基于大数据的智能时代已经来临,包括风险管理的许多工作都可由计算机完成。Watson在参加智力竞赛一年后,在华尔街找到了一份风险管理的新工作,帮助花旗银行管理证券组合风险,即通过监控交易指标、新闻和经济数据等,为证券组合构建、调整提供风险方面的建议。花旗允许Watson在家上班(即待在IBM),通过云平台提供交互式服务,与其他员工一样领取绩效工资。下一步,IBM还想将它改造为选股高手,届时它可以领到双份工资。