前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理,一系列公开测试说明了其中缘由。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中 ,迄今为止AI的表现并不算好 。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第2张图片

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude、谷歌的Gemini 、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略、对竞争对手表现作出反应,以及使用高杠杆操作。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第3张图片

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场 。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时 ,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一。过去几年,从摩根大通到Balyasny Asset Management等行业巨头 ,几乎已将这项技术用于其他各个环节 。如今,大语言模型已在量化机构中用于解析新闻,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中 ,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙,因为众所周知 ,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险 。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。 ”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准 。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极。2025年第四季度 ,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 疫情地区重点小区有哪些/疫情重点区域名单

    疫情地区重点小区有哪些/疫情重点区域名单

    北京丰台疫情确诊小区及管控措施〖壹〗、丰台区:封控区实施“14+7”管控措施,一学校停课一周丰台区第一时间启动应急响应机制,现将工作开展情况通报如下:一是迅速进入疫情防控应急状态。全区各单位停止休假,工作人员全部返岗,补充一线工作力量,做好疫情防控各项工作。二是立即展开流调,隔离相关人员。〖贰〗、病例基本情况该人员入境后,在京外完成21天集中隔离,之后进京...

  • 哈尔滨地区疫情结束了么/哈尔滨疫情结束没

    哈尔滨地区疫情结束了么/哈尔滨疫情结束没

    低风险回哈尔滨不报备行吗法律分析:如果在省内疫情低风险地区回来的话,是不需要隔离,也不需要做核酸检测的,甚至不需要到社区报备。但是,如果跨省回来的话,无论是在疫情低风险地区,还是疫情中高风险地区,都必须到社区报备。否则的话,就当是隐瞒行程。凡哈市域外抵返哈人员均须主动向社区(村屯)报备旅居史。未能提供48小时内核酸检测阴性证明的人员实行主要进口落地即检,核...

  • 非重点疫情地区回广州/非疫情重点地区啥意思

    非重点疫情地区回广州/非疫情重点地区啥意思

    2022外省人员进入广州最新规定022年外省人员进入广州的最新规定主要包括落地核酸检测、社区主动报备、个人健康管理、严格公交查验以及特别提醒告知等方面,具体如下:落地核酸检测:近14天有本土病例报告城市来(返)穗人员,抵穗后须在机场、火车站、公路客运站进行一次核酸检测,或24小时内尽早就近进行一次核酸检测。022年外省低风险地区绿码人员到广州后,抵穗前3天...

  • 吉林地区是否有疫情了呢(吉林地区有新增病例吗)

    吉林地区是否有疫情了呢(吉林地区有新增病例吗)

    吉林一高校疫情大爆发,疫情的源头,有事在哪里呢?导致疫情大面积爆发是什...〖壹〗、首先,关于疫情的源头,通常疫情的爆发往往与多种因素有关,包括但不限于病毒传播者的活动轨迹、人员密集场所的管理漏洞、以及防控措施的不到位等。在吉林农业科技大学此次疫情中,具体的源头尚未有官方明确公布,因此无法直接指出。〖贰〗、疫情发生的时间线与初始源头起始时间与地点吉林省本轮...

  • 近来疫情一二类地区/疫情一类二类地区

    近来疫情一二类地区/疫情一类二类地区

    防控二类地区是指什么防控二类地区主要指在特定蚊媒传染病(如登革热、基孔肯雅热)传播风险评估中,存在较高风险的省份。定义标准二类地区的划分依据主要为两点:伊蚊活跃期较长或存在本地病例及聚集性疫情风险。这类地区需加强蚊媒监测和病例预警,防止疾病暴发。疫情防控中的“二类地区”并没有全国统一标准,但在实际管理中通常对应两类划分:中风险区或管控区。按高中低风险区...

  • 【铝价历史走势图,铝价历年走势】

    【铝价历史走势图,铝价历年走势】

    如何获取铝板700克45x90的费用历史走势图〖壹〗、获取费用走势图的可行路径『1』专业行业平台付费订阅上海有色金属网(SMM)或长江有色金属网等平台,它们提供最权威和详尽的金属历史费用数据与图表,但需要企业资质或付费。〖贰〗、核心影响因素铝板费用主要由规格参数、材料工艺和市场供需决定。铝期货费用_铝期货费用走势图026年05月14日20:52:32的实...

  • 廓坊地区疫情防控电话(廓坊地区疫情防控电话是多少)

    廓坊地区疫情防控电话(廓坊地区疫情防控电话是多少)

    廊坊防疫中心电话24小时电话〖壹〗、河北省廊坊市疫情防控中心热线电话,询问热线,0316-12320,0316-2206300,全国部分地区疫情时有发生,支持和做好新型冠状病毒感染防控工作人人有责,防控疫情全民参与,抗击肺炎人人有责。个人防疫基本措施河北省廊坊市疫情防控询问电话服务时间,全天24小时尽量减少外出活动,外出佩戴口罩,保持手部卫生。〖贰〗、...

  • 疫情国家地区状况/疫情国家地区状况查询

    疫情国家地区状况/疫情国家地区状况查询

    新冠传播到几个国家常规疫情传播范围根据公开信息,截至北京时间2025年3月2日晚,中国以外的国家和地区中,新冠肺炎疫情已明确蔓延至65个。这一数据反映了常规疫情传播的地理覆盖范围,涵盖亚洲、欧洲、美洲、非洲和大洋洲等多个区域。不同国家因防控措施、医疗资源及人口流动等因素,疫情严重程度存在差异,但均被纳入全球疫情监测体系。截至2025年7月,有3种变异新冠病...

  • 四川成都最新疫情(四川成都最新疫情防控政策)

    四川成都最新疫情(四川成都最新疫情防控政策)

    如何查询四川成都疫情分布情况?〖壹〗、使用微信搜索本地宝,选取小程序。进入小程序后,点击页面左上方将城市修改为成都,点击小程序主页中的新冠疫情,即可进入成都新冠疫情最新信息汇总界面。在此即可查看成都各区疫情等级地图、成都疫情最新消息以及郫都区疫情最新消息,点击隔离政策还可以查看进出成都最新隔离政策、紧急提醒等。〖贰〗、成都疫情分布地图可以在成都本地宝查看。...

  • 【郑州限号2021最新通知8月份,郑州限号2021年3月最新通知】

    【郑州限号2021最新通知8月份,郑州限号2021年3月最新通知】

    郑州2021限号是怎么限的郑州2021年限号政策为工作日每天限行两个尾号的机动车,具体规则按车牌尾号与日期对应执行,法定节假日不限行。限行区域:东三环(107辅道)、南三环、西三环、北三环(均不含本路)以内区域的所有道路。限行时间:每周工作日的7时至21时,周末及法定节假日不限行。郑州对外地车辆的限行规定从2021年1月1日起实施,具体规定为工作日7时至2...

返回顶部