Man Group | 资产管理中的人工智能
来源:量化投资与机器学习
Harry Moore、Martin Luk、Matthew Hertz革命性的电灯花了四十年的时间才实现完全普及。要开启人工智能应用的时代需要什么?我们什么时候才能实现这一目标?我们来看看人工智能革命在资产管理领域将发挥怎样的作用。
摘要
电力是人类历史上最伟大的发明之一。它改变了社会的方方面面,从通讯、交通,再到产业和娱乐。它还促成了电报、股票行情机、计算器和计算机等新技术的诞生,这些技术彻底改变了金融世界。
今天,随着人工智能(AI)的出现,我们正在见证类似的转变,尤其是生成式人工智能,它可以创造出以前无法想象的新功能。
生成式人工智能正在对英仕曼AHL产生影响,从数据增强、特征工程到数据挖掘和投资组合构建。
引言
今天,很难想象一个没有电的世界。然而,在 1879 年托马斯·爱迪生发明电灯泡 20 年后,只有 3% 的美国家庭通了电。又过了 20 年,电力才得到大规模使用。Agrawal 和他的同事在《权力与预测》中很好地阐述了这一点,他们认为我们在人工智能领域也处于类似的节点。我们发现自己处于“中间时期”(The Between Times),人们充满热情,同时期待着真正改变世界运行法则的突破性成果。
在英仕曼AHL,我们观察到了类似的趋势。生成式人工智能当然还没有取代研究人员或投资组合经理,也没有产生一个全新的系统来提供超越市场的业绩。然而,它所做的是提高生产力,让量化分析师花更多时间专注于阿尔法生成。在本文中,我们展示了生成式人工智能产生影响的四个例子。我们还讨论了生成式人工智能对量化研究未来面临的挑战和机遇。
人工智能热潮为何突然升温?
目前的重点主要集中在生成式人工智能上。这一飞跃允许用户使用人类语言与模型交互并生成新的输出,这是最近热潮的重要驱动因素。生成式人工智能是机器学习的一个子集,而机器学习又是更广泛人工智能的一个子集。
人工智能的子集对于感兴趣的读者,大家可以查看这篇论文:
https://www.researchgate.net/figure/A-comparative-view-of-AI-machine-learning-deep-learning-and-generative-AI-source_fig1_373797588
本文详细介绍了生成式人工智能的发展,并讨论了其历史、工作原理和预测的经济影响。机器学习技术在资产管理领域也已得到充分证实,成功增强了资产预测指标,改善了风险管理并降低了执行成本。目前其使用生成式人工智能的四种方式:
#1:使用 Copilot 进行编码 – 使用自然语言与代码交互
生成式人工智能最有效的用例之一是协助编码。GitHub Copilot 等工具可以通过预测代码连续性来加速工作原型和初步研究结果的开发,从而缩短开发时间。它还促进了知识共享,因为开发人员可以要求人工智能解释其他人编写的代码的各个部分。
挑战和机遇在于训练这些工具理解专有内部代码。在英仕曼AHL,拥有大量自有代码库,可用于执行市场数据采集、股票行情映射和运行模拟等任务。现成的人工智能模型缺乏对这些专门存储库的了解。
而且英仕曼AHL正在开发能够理解内部代码的聊天机器人。例如,一个聊天机器人可以确定在哪里可以找到市场代码的元数据并检索时间序列价格,指定正确的库和字段,从而节省时间。这是一个重大挑战,需要大量工作才能获得有用的输出,但这种能力提高了我们的效率并利用了我们的专有知识。
Copilot使用内部库绘制标准普尔500E-Mini期货的时间序列#2:为巨灾债交易提取信息
一个例子是巨灾债,这是一种债务工具,旨在在发生预先指定的事件(通常是自然灾害)时支付。每只巨灾债都有独特的特点,需要在投资前清楚了解,而且与利率或信用违约掉期不同,它们没有标准化的条款。这个过程包括阅读发行说明书(由一名人工分析师完成),然后由另一名人工分析师再次检查提取的数据。由于这些文件长达 200 页,因此可能需要相当长的时间。
巨灾债的发行说明书可能长达200多页今天,我们正在测试一个由 ChatGPT 完成数据提取的流程,将相关信息放入系统模板中供审阅者检查。这样可以让一名分析师腾出时间专注于新的研究。
#3:聊天机器人协助研究投资者的问询
英仕曼集团的客户关系团队协助客户解答有关公司全套投资产品(包括英仕曼AHL的系统量化投资策略)的问题。许多问题都依赖于各种投资材料中的信息,包括月报、介绍材料、尽职调查问卷和投资评论。然后,团队会拟写面向客户的回复。例如,客户可能会要求提供有关费用、交易品种数量或投资策略风险目标的信息。
ChatGPT 可以自动执行此过程中的几个步骤。首先,它可以从相关文档中提取所需的信息。其次,它可以起草一份可供人工分析师审查的答复。这种效率让团队有时间专注于更高价值的任务。下图显示了问答聊天机器人查询文档并生成可供检查的答复的屏幕截图。
聊天机器人返回信息的截图提高数据提取效率是一个普遍的主题——我们在巨灾债示例中看到了这一点——其他团队也从中获益:
自由投资分析师从监管新闻服务 (RNS) 公告中提取信息。
数据科学专业人员从供应商电子邮件中提取数据更新信息。
设计专业人员从未格式化的图表中提取基础数据以转换为英仕曼集团品牌。
#4:以初级量化分析师的水平分析宏观数据
ChatGPT 利用其对基本宏观经济关系的了解,在定量宏观研究中非常有用。一个用例是将其用作假设生成器,以表明特定经济时间序列是否与特定市场具有基本合理的关系。然后可以使用统计回测方法测试这些假设。
虽然 ChatGPT 目前不会取代我们的宏观研究团队,但它的理解能力可以与研究生研究员一样好。主要区别在于,人类研究人员需要休息,而 ChatGPT 可以系统地查询数千种关系,并可能对这些关系发出信号。
ChatGPT 还可以加快学习基本宏观信息的速度。与维基百科等手工制作的资源相比,ChatGPT 可以更简洁、更相关,帮助研究人员快速了解宏观经济现象的关键驱动因素。
ChatGPT 解释简单宏观经济关系的图示到目前为止,我们学到了什么?
写到这里,我们一直关注的是机会。下面,我们将重点介绍我们在生成式人工智能方面的经验教训。
1、必须控制幻觉
ChatGPT的回应不能完全信任。为了帮助减轻幻觉的影响,我们使用工具来突出显示信息在原文中出现的位置,以帮助人工检查。代码的情况也类似,它只是一个原型,需要人工验证。
2、提示工程至关重要
如果ChatGPT不能很好地完成任务,通常是由于提示指定错误。完善提示需要大量资源、反复试验和特定技术。
3、将任务分解为更小的子任务
ChatGPT无法一次性逻辑地分解并执行复杂问题。有效的“人工智能工程”涉及将项目分解为更小的任务,每个任务由ChatGPT的专业实例使用定制的提示和工具处理。挑战在于整合这些代理来解决复杂问题。
4、教育是更广泛采用的关键
了解ChatGPT的功能和局限性至关重要。怀疑论者应该看到它的优势,而爱好者则需要了解它的缺点。有效使用需要学习如何与模型交互并了解其训练和功能。
5、为下一个最佳事物做好准备
生成式人工智能技术已经在资产管理中创造了效率,但用户必须敏捷地采用下一个最佳模型才能从这项不断发展的技术中获益。到目前为止,进展迅速,2019年发布的GPT-2被描述为“远非可用”⁷,而GPT-4已经收集了多个用例,并且似乎比历史技术扩展得更快。
结论
电力改变了社会,但花了40年的时间。人工智能可以做到同样的事情, 但速度更快。我们的分析师已经看到了数据增强、特征工程、模型选择和投资组合构建方面的改进。我们相信,在短短十年内,那些拥抱生成式人工智能的资产管理者可以通过更快的创新速度和卓越的业绩表现获得竞争优势。
我们的投资作家也在提高使用生成式人工智能工具的技能。正如 Duolingo 首席执行官Luis von Ahn所说:“our job’s not going to be replaced by AI. It’s going to be replaced by somebody who knows how to use AI. ”。
从爱迪生发明灯泡到电力改变大众生活方式,用了40年的时间。也许人工智能会在10年内达到这一里程碑。