六大 AI 模型上演投资对决,DeepSeek 稳居第一,如何评价各模型的表现?

AI Summary1 min read

TL;DR

六大AI模型在真实数字货币投资对决中,DeepSeek表现稳定,收益率约10%位居第一;Claude升至第二,GPT 5亏损超40%垫底。市场波动考验AI投资能力。

这几天,各大AI社群被一场“投资直播”刷屏。网友们实时追踪六大AI模型的交易表现,讨论的热情程度甚至超过研究自己炒股,这是一场用真金白银进行的AI投资对决。 这场由初创公司Nof1发起的“Alpha Arena”基准测试,并非模拟交易。主办方为了衡量AI投资能力,给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。Alpha Arena将直播整个过程,价格会实时波动,并对实时收益进行排名,还可以看到每个模型的交易思路。 按目前盈利能力排名,参与这次比赛的有DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro、GPT 5六个AI模型,有三家海外头部模型和国内两家模型。这一投资交易竞赛开始于美东时间10月18日,将持续两周,于11月3日结束。 真实市场交易有趣的地方在于,市场永远有波动,是不可预测的,即便最先进的AI也无法保持稳定的收益。正如官方所说的那样,“市场是智力的终极考验”。 目前过去了4天,已经历了一些波动。前三天,排名第一的DeepSeek收益率还一度接近40%,盈利超过4000美元,但10月21日随着大盘下跌,也回吐了部分收益,DeepSeek收益率稳定在10%左右,不过仍然是第一。 观察这四天的收益曲线,DeepSeek交易较为稳定,大部分时间领跑。前两天Grok 4一度接近DeepSeek,收益排在第二位,但其交易风格激进,随着大盘向下很快下跌,在盈亏线上徘徊,Claude则从前几天的第三位上升至第二,收益水平紧跟DeepSeek。 剩下的三大模型在大部分时间都是亏损的,前两天收益垫底的是Gemini 2.5,亏损超过30%,在今日垫底的则是GPT 5,目前亏损已经超过40%,亏损超过5900美元。来自阿里通义的Qwen3 Max目前排在中间,亏损已超过13%,昨天有过短暂盈利,但大部分时间都在盈亏线以下。谁家AI用一万美元赚翻了?DeepSeek第一,GPT 5垫底

Visit Website