芝加哥大学的研究人员已经证明,大型语言模型 (LLM) 可以进行财务报表分析,其准确度可与专业分析师相媲美,甚至超过专业分析师。
该研究结果发表在题为“使用大型语言模型进行财务报表分析”的工作论文中,可能对未来的财务分析和决策产生重大影响。
这个影响到底是什么?用一句话来总结就是,GPT-4通过在财务报表分析中展现出与专业人类分析师相媲美甚至更优的性能,以及生成有价值的叙述性洞察和交易策略,预示着它可能会在财务分析行业中发挥核心作用,从而颠覆传统的决策制定过程。
研究人员测试了GPT-4的性能,GPT-4 是由OpenAI开发的最先进的 LLM (大语言模型),用于分析公司财务报表以预测未来收益增长。值得注意的是,即使只提供标准化、匿名的资产负债表和没有任何文本背景的损益表,GPT-4 也能胜过人类分析师。
“我们发现 LLM 的预测准确度与经过严格训练的最先进的 ML 模型的性能相当,”作者写道。“LLM 的预测并非源于其训练记忆。相反,我们发现 LLM 可以生成有关公司未来表现的有用叙述见解。”
报告最后指出,最后,与基于其他模型的策略相比,我们基于 GPT 预测的交易策略产生了更高的夏普比率和阿尔法值。
综上所述,我们的研究结果表明,LLM 可在决策中发挥核心作用。
思路链提示模拟人类分析师的推理
一项关键创新是使用“思路链”提示,引导 GPT-4 模拟金融分析师的分析过程,识别趋势、计算比率并综合信息以形成预测。
GPT-4 的这个增强版本在预测未来收益方向方面实现了 60% 的准确率,明显高于人类分析师预测的 53-57% 范围。
研究人员总结道:“综合起来,我们的研究结果表明,大语言模型可能在决策过程中发挥核心作用。”他们指出,大语言模型的优势可能源于其广泛的知识库和识别模式和商业概念的能力,即使在信息不完整的情况下,也能够进行直觉推理。
尽管面临挑战,大语言模型仍有望改变财务分析
鉴于数值分析历来是语言模型面临的一大挑战,这一发现就更加引人注目了。
“语言模型面临的最具挑战性的领域之一是数值领域,模型需要进行计算、进行类似人类的解释并做出复杂的判断,”该研究的合著者之一 Alex Kim 说道。
“虽然 LLM 在文本任务上很有效,但它们对数字的理解通常来自叙述背景,它们缺乏深度数字推理或人类思维的灵活性。”
一些专家警告称,研究中用作基准的“ ANN ”模型可能并不代表量化金融领域的最新水平。“那个 ANN 基准远没有达到最新水平,” Hacker News 论坛上的一位从业者评论道。“人们并没有在 1989 年停止研究这项工作——他们意识到这样做可以赚很多钱,而且是私下做。”
尽管如此,通用语言模型能够匹敌专业 ML 模型的性能并超越人类专家,这表明 LLM 在金融领域具有颠覆性的潜力。作者还创建了一个交互式 Web 应用程序,向好奇的读者展示 GPT-4 的功能,但他们警告说,其准确性应该得到独立验证。
随着人工智能的快速发展,财务分析师的角色可能会成为下一个被改变的角色。虽然人类的专业知识和判断力不太可能在短期内被完全取代,但像 GPT-4 这样的强大工具可以大大增强和简化分析师的工作,并有可能在未来几年重塑财务报表分析领域。
文章来源:新芒X