如何评价 Anthropic 最新发布的 Claude Opus 4.5?有哪些技术亮点值得关注?
TL;DR
Anthropic发布Claude Opus 4.5 AI模型,在编码、智能代理和日常任务中表现卓越,编程能力超越人类工程师。模型面向专业开发者和知识工作者,并伴随多项功能更新和价格下降。
当地时间周一(11月24日),美国人工智能初创企业Anthropic在官网宣布,公司推出了最新的AI模型“Claude Opus 4.5”。 Anthropic表示,该模型智能高效,“是目前全球在编码、智能代理和计算机应用方面表现最佳的模型,它在深度研究、处理幻灯片和电子表格等日常任务方面也显著优于其他模型。” 据了解,Opus 4.5是Anthropic在短短两个月内发布的第三个重大模型版本,该公司9月下旬发布了Sonnet 4.5,又在10月推出了Haiku 4.5。这再次体现了AI行业惊人的发展速度。 Anthropic最出名的是其名为Claude的一系列AI模型,通常其中最大的模型被称为Opus,中等规模的模型为Sonnet,最小的模型为Haiku。此前发布的Opus模型是在今年8月,名为Opus 4.1。 Anthropic旗下Claude.ai的产品负责人Scott White在接受采访时说道:“我们向市场发布产品的速度,以及由此产生的反馈循环,让我感到无比兴奋。” White表示,Opus 4.5的理想用户是专业软件开发人员以及金融分析师、顾问、会计师等知识型工作者。他补充说,那些“希望激发自身创造力、打造新事物、拓展职业边界”的人,同样会觉得这款模型非常有用。 在“代理式编程”(agentic coding)方面,Opus 4.5达到了当前的最先进水平。根据用于衡量AI编程能力的测试集SWE-bench,Opus 4.5的表现要优于谷歌上周发布的Gemini 3 Pro以及OpenAI的GPT-5.1。Anthropic发布模型Opus 4.5,称其编程能力已超越人类工程师 Anthropic还表示,他们让Opus 4.5参加了一项难度极高的闭卷测验,这套考题通常用于选拔优秀的软件工程,该模型的得分超过了历史上所有人类候选者。 新闻稿表示,Opus 4.5将在所有平台上线,并成为Anthropic 的Pro、Max和Enterprise(企业版)产品的默认模型。除了新模型外,公司还宣布了多项产品和功能更新。 Anthropic表示,允许Claude在不同浏览器标签之间执行操作的扩展工具Claude for Chrome现已向所有Max用户开放;能够理解和编辑电子表格的Claude for Excel,也已向所有付费用户推出。 此外,Anthropic还将Claude Code引入其桌面应用,并为开发者平台增加了新的功能。 售价大幅下降,号称单位输出水平的Token消耗也大幅下降 能否替代一部分sonnet4.5?