电子说
针对金融市场数据量有限性,在投资实践中,目前一些比较成熟的技术已经可以在大多数情况下很有效地避免“过度拟合”问题。
人工智能(AI)技术在过去一两年间飞速发展,已成为了许多产业不可或缺的部分。尤其是新年以来严峻的新冠疫情中,从社区管理、病征筛查、快速检测,到病毒传播模型的估算,新型药物的开发……许多人突然发现,处处都能见到人工智能的身影。
尽管技术已经越来越普及,但大部分普通民众对人工智能的感觉依然神秘。比如不少人认为人工智能就是机器学习,这是个不准确的印象。人工智能解决的问题是机器如何可以像人类一样适应变化、学习、理解和推理的全方位领域,而作为人工智能的一个类别,机器学习主要聚焦在人工智能这一系列目标中“学习能力”方面的研究。
在全球金融投资领域,各种算法模型经过多年来业界积极的研究、试验,也已逐渐开始成为行业领先的投资机构中量化投资业务的新引擎,而“机器学习”则由于其特殊的算法优势,成为投资领域最具潜力的新星。
人脑和传统量化模型的陷阱
虽说是“学习如何像人一样学习”,其实机器学习的能力和长处其实与人类大脑非常不同,与人类通过数据统计来寻找规律的传统方法也有很大差异。
人类大脑的一大优势在于抽象概念,但同时人脑对于概念的理解和判断往往是模糊的,难以准确量化。这就导致了实际投资中,投资者会陷入“人脑的陷阱”。例如,目前人工智能在投资中用途最常见的是在股票的量化投资中挖掘“因子”。譬如所有投资者都耳熟能详的“价值股”,大多数基金经理乃至较资深的投资者,都能够说到股价与市盈率(P/E)、市净率(P/B)以及股息(dividend)之间存在一定关系。然而如果要进一步精确描述这些“关系”是如何动态结合,其权重分配如何量化,如何作为一个具有统计学意义的投资依据来用,人脑就很难做到了。
更加困难的是,如果要做到“精确描述”,就要加上时间变量,因为在不同的市场状况下,“价值股”的描述很可能截然不同,如此多维度的准确描述人脑就更加难以胜任了。然而这却正正是机器学习的长处,机器学习的算法不但能够十分精确和细致地描述这一抽象概念,更可以不断随着市场的时间性变化去实时调整其定义中不同变量的权重,以更加精确的标准来筛选“价值股”。
基于统计学的传统量化投资模型,能够通过统计、检验大量数据来解决配比权重的问题,但同时又容易陷入另一个陷阱,我们称之为“线性模型陷阱”。这里指的是传统模型基于简单的线性关系的假设往往是不准确的。例如当投资者考虑是否买入一只股票时,“负债率”往往是区分好坏公司的重要考虑因素。然而,“负债率”并不是一个简单的线性关系——公司的负债率过高,显然有更大的破产风险;但是公司如果盈利能力正常的情况下,负债率过低则可能没有充分利用资金的杠杆作用,对公司发展也是不利的。
在这种情况下,公司的盈利能力不错,债务率适中,显然才是最优选。这样的例子在股票投资中不胜枚举。如果使用统计学的线性模型,我们就会陷入建模不准确的境地,而机器学习的模型则大多是非线性的,就可以避免这个陷阱,更加准确地描述投资中的变量和收益之间的数学关系,找出最优秀的股票标的。
金融投资领域的机器学习
当然,机器学习在股票投资中的应用刚开始不久,离理想境界还非常遥远,同样也有自身的陷阱,比如被提及最多的“过度拟合(Overfitting)陷阱”。在过度拟合情况下,机器学习模型并不能对整个数据的分布情况达到正确的估计,导致机器学习得出虚假的“投资规律”,一旦用于样本以外数据,或是真实的市场场景中就失效了。
机器学习中的不同类型,对于数据量的要求是不一样的。比如由于谷歌的“阿尔法狗”(Alpha Go)战胜世界围棋冠军而成名的“强化学习”,尽管创下了人工智能“战胜人类”最高的成绩,但我们在研究中已发现,强化学习需要庞大接近无限量的数据,如果用于金融投资领域则非常容易陷入“过度拟合陷阱”,应该尽量避免使用。这是因为“强化学习”要求的数据量非常庞大,然而金融市场数据看似很多,事实上以时间点标记的数量却非常有限,基本上每一个市场都只有一组时间标注的数据。在如此有限的数据量中,许多机构选择强化学习模型的尝试就难以成功。
“过度拟合”是目前机器学习领域不断在解决和完善的问题,其中也已经形成了不少有效的方法,包括在深度学习中使用“正则化”(regularization)方法,如调整模型的大小和系数,或是将样本分成多个部分来“交叉验证”(cross validation)等方式。在投资实践中,目前这些比较成熟的技术已经可以在大多数情况下很有效地避免过度拟合。针对金融市场数据量的有限性,也可以通过多市场数据回测的方式去解决这一问题。
全球量化投资界在过去几年间大力拥抱机器学习技术,目前全球部分顶尖的对冲基金已经在大比重运用机器学习筛选投资标的。我们认为,并不仅仅是一次产品或模型的更新换代,而将是一场席卷并彻底改变金融业的深刻革命。
能够在这场科技革命中脱颖而出的,将是与今天多数业界机构截然不同的,更像一家科技公司的金融机构,能够聚集大量的科技精英人才,深刻贯彻科研文化,并在投资决策、运营、风控、合规、客户等领域,全方位运用人工智能技术来运作和管理的新一代金融机构。就在今天,我们已经迎来这个行业的一场最深刻而严峻的时代考验。
全部0条评论
快来发表一下你的评论吧 !