六大 AI 模型上演投资对决，DeepSeek 稳居第一，如何评价各模型的表现？

AI Summary1 min read

TL;DR

六大AI模型在真实数字货币投资对决中，DeepSeek表现稳定，收益率约10%位居第一；Claude升至第二，GPT 5亏损超40%垫底。市场波动考验AI投资能力。

这几天，各大AI社群被一场“投资直播”刷屏。网友们实时追踪六大AI模型的交易表现，讨论的热情程度甚至超过研究自己炒股，这是一场用真金白银进行的AI投资对决。这场由初创公司Nof1发起的“Alpha Arena”基准测试，并非模拟交易。主办方为了衡量AI投资能力，给每个模型账户发放了一万美元的启动资金，让它们在真实市场自主交易数字货币。Alpha Arena将直播整个过程，价格会实时波动，并对实时收益进行排名，还可以看到每个模型的交易思路。按目前盈利能力排名，参与这次比赛的有DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro、GPT 5六个AI模型，有三家海外头部模型和国内两家模型。这一投资交易竞赛开始于美东时间10月18日，将持续两周，于11月3日结束。真实市场交易有趣的地方在于，市场永远有波动，是不可预测的，即便最先进的AI也无法保持稳定的收益。正如官方所说的那样，“市场是智力的终极考验”。目前过去了4天，已经历了一些波动。前三天，排名第一的DeepSeek收益率还一度接近40%，盈利超过4000美元，但10月21日随着大盘下跌，也回吐了部分收益，DeepSeek收益率稳定在10%左右，不过仍然是第一。观察这四天的收益曲线，DeepSeek交易较为稳定，大部分时间领跑。前两天Grok 4一度接近DeepSeek，收益排在第二位，但其交易风格激进，随着大盘向下很快下跌，在盈亏线上徘徊，Claude则从前几天的第三位上升至第二，收益水平紧跟DeepSeek。剩下的三大模型在大部分时间都是亏损的，前两天收益垫底的是Gemini 2.5，亏损超过30%，在今日垫底的则是GPT 5，目前亏损已经超过40%，亏损超过5900美元。来自阿里通义的Qwen3 Max目前排在中间，亏损已超过13%，昨天有过短暂盈利，但大部分时间都在盈亏线以下。谁家AI用一万美元赚翻了？DeepSeek第一，GPT 5垫底