跳转至

对冲基金的AI表现优于ChatGPT?Balyasny组建专门AI团队

在当今人工智能领域中,大型语言模型(Large Language Models,简称 LLM)已成为改变信息处理和决策流程的核心工具。然而,仅凭模型本身的训练数据并不总能满足复杂应用场景的高质量信息需求。这时,“检索增强生成”(Retrieval Augmented Generation,RAG)技术应运而生。简单来说,RAG 的关键在于为 LLM 提供“外脑”——在回答复杂问题时,它可以根据用户需求实时检索并嵌入外部数据,为用户提供更有针对性的答案。对于金融行业而言,这种技术的应用显得尤为敏感且具有挑战性,因为高质量的金融资讯既不易获取,也需要专业化的解读。

RAG 在金融领域的挑战与契机

在金融投资中,时效性、精准性和专业性是核心要素。一个对冲基金的研究员或者交易员,往往需要在瞬息万变的市场环境中迅速判断某支股票、债券或金融衍生品的价值走向,并预估重大事件(如政策变化、地缘政治冲突、产业转型)的潜在影响。这类决策需要的不仅是模型内部固有的常识与历史数据,更需要最新发布的财经资讯、研报、财报以及各类政策法规信息。

传统的 LLM 通常是在通用文本上进行训练,它们能广泛理解人类语言,对一般知识和话题都有所涉及,但对特定行业的“行话”或特殊数据结构可能并不敏感。对冲基金经理和数据科学家不可能完全依赖一个对时效性和专业度要求极高却仍有信息盲区的通用模型。RAG 因此成为理想的解决方案:通过将外部信息检索结果嵌入 LLM 的上下文中,让模型在回答问题时能够结合最新的、专业度更高的外部数据源。

Balyasny 的 AI 团队:从 Google、DeepMind 吸纳人才,打造专属工具

在诸多尝试将 RAG 应用于金融领域的机构中,对冲基金 Balyasny Asset Management 可谓先行者。该基金吸纳了来自 Google 和 DeepMind 的资深人士,组建了一支应用型 AI 研究团队,专门开发面向内部业务的 AI 工具。其中最受关注的产品之一便是 BAMChatGPT——一个为内部交易员和分析师量身定制的聊天机器人。

根据负责该工具研发的工程师 Michal Mucha 的说法,这些 AI 工具目前已被 Balyasny 内部约 80% 的员工所使用。无论是希望即时了解公司所持有某支股票的最新动态,还是想评估地缘政治事件对投资组合的潜在影响,BAMChatGPT 都能在一定程度上提供有价值的初步建议。尽管这些工具无法取代人类专家的独立判断,但却能大大提高研究和决策的效率。

BAM Embeddings:专为金融“黑话”设计的新型嵌入

本月早些时候,Balyasny 在一篇学术论文中公布了其新成果 BAM Embeddings。要了解这项技术的意义,我们需要知道在 RAG 流程中,“嵌入(Embeddings)”扮演什么角色。对于 LLM 来说,嵌入是将文本转化为可计算的向量表示,让模型能以数学方式理解文本语义的关键步骤。当 LLM 需要调用外部资料时,首先需要将文本资料通过特定的嵌入模型向量化,这样才能高效检索和匹配与用户问题最相关的信息片段。

然而,通用嵌入模型往往对行业特定术语理解不足,例如金融领域充斥各类缩写、复杂术语和专业惯用表达,这些在通用语料中出现频率不高,模型理解力往往不足。BAM Embeddings 则致力于解决这一问题:它针对金融行业的“晦涩行话”进行了优化训练,让嵌入模型能够更好地理解和匹配相关信息。

初步试验结果令人瞩目。当研究人员让 LLM(在此案例中是 Mistral 7B Instruct 模型)在一组金融文档中搜索最相关的段落时,使用 BAM Embeddings 能在超过 60% 的情况下返回最优片段,而使用 OpenAI 的通用型嵌入则不足 40%。在公开的 LLM 基准测试平台 FinanceBench 上,BAM Embeddings 的查询准确率达到 55%,而 OpenAI 的 ada-002 嵌入则仅有 47%。这一数据对比显示,在金融语境中,专有化的嵌入确实可以显著提升信息检索和问题回答的准确性。

不完美的现实:幻觉与潜在风险

尽管结果令人鼓舞,但并不代表 Balyasny 的方案已经无懈可击。在 FinanceBench 测试中,使用 BAM Embeddings 的回答仍有约 30% 的错误率。这说明即使引入了 RAG,LLM 的“幻觉”(Hallucination)问题依然存在,模型依旧可能提供无中生有或不合逻辑的回答。

研究显示,幻觉在当前的 LLM 应用中普遍存在。7 月的一项研究表明,被广泛用于算法交易的 GPT-3.5 在使用 RAG 时仍有 27.8% 的回答存在幻觉。Balyasny 的 BAM Embeddings 在训练过程中使用了 1430 万条合成查询,这一庞大的合成数据集虽然能增强模型在特定领域的理解力,但也有专家担心,这可能会引入偏差或特定语境下的误导性信息,从而导致幻觉率难以进一步降低。

行业趋势:RAG 的崛起与企业应用前景

尽管存在一些不足,Balyasny 的尝试依然具有前瞻性和竞争性。在企业实际应用场景中,RAG 已经成为主流趋势之一。根据风投公司 Menlo Ventures 的报告显示,RAG 将成为 2024 年 51% 企业的主要 AI 架构方法,与前一年的 31% 相比大幅上升。对于一家需要快速响应市场变化和信息需求的对冲基金而言,这种前沿技术的先发布局无疑能在激烈的竞争中获得一大优势。

展望未来:专业化与定制化

随着越来越多的企业将 RAG 纳入核心策略,通用的 LLM 和嵌入方案或许无法满足高度专业化的领域需求。Balyasny 的案例彰显了未来的一个可能趋势:行业定制化 AI 工具的崛起。这不仅是算法层面的优化,更是数据、模型和应用场景的深度融合。

在这个过程中,我们或许会看到更多由金融机构自行训练的专有嵌入模型和 LLM,从而在理解金融术语、捕捉市场信号、洞察宏观变量变化等领域提供更高精度、更高时效性和更具可解释性的辅助决策工具。正如 Balyasny 当前的尝试,它有望在不断优化迭代中,为整个金融 AI 生态带来新的启示与价值。

关于LLMQuant

LLMQuant是由一群来自世界顶尖高校和量化金融从业人员组成的前沿社区,致力于探索人工智能(AI)与量化(Quant)领域的无限可能。我们的团队成员来自剑桥大学、牛津大学、哈佛大学、苏黎世联邦理工学院、北京大学、中科大等世界知名高校,外部顾问来自Microsoft、HSBC、Citadel、Man Group、Citi、Jump Trading、国内顶尖私募等一流企业。