宝玉的博客
Baoyu
RSSzh

宝玉的博客

Information
Website
Baoyu
Followers
Following
AI Overview
3 posts analyzed·Updated 1/19/2026

Key Highlights

  • AI Agent 通过循环调用工具和自主决策,比聊天机器人更有商业价值,能真正替代部分工作。 1 post

  • Skills 是短期红利,但投资 Skills 积累的能力(如 Prompt 和上下文工程经验)会成为长期壁垒。 1 post

  • Anthropic 报告显示 AI 对高学历任务加速效果更明显,但成功率较低,且可能加剧全球不平等。 1 post

Main Topics (3)

Latest posts

website-logo

SubAgent 与 Skills:AI Agent 的两种扩展方式

宝玉的博客

一句话解释 SubAgent 和 Skills 的区别:AI Agent 就像操作系统,Skills 就像应用程序,SubAgent 也是操作系统,不过预装了应用,并且像虚拟机一样运行,独立上下文。 Skills:教 Agent 新技能 Skills 是一份“操作手册”。 你招了个聪明的助理,但他对你的业务一无所知。每次布置任务,你都得从头解释流程、注意事项、工具用法。Skills 就是把这些知识写成文档,Agent 需要时自己去翻阅,不用你反复交代。 比如我写了一个“给文章配图”的 Skill,它告诉 Agent: 怎么分析文章找出需要配图的位置 有哪些风格可选(科技感、温暖、极简……) 怎

website-logo

Skills 究竟是短期红利还是长期壁垒?

宝玉的博客

这是个好问题: 随着基础模型继续进化,Skills 是否会逐渐被更强的自主规划取代?作为创业者现在去布局 Skills,究竟是短期红利还是长期壁垒? 我的看法是:Skills 是短期红利,也是长期壁垒——但壁垒不在 Skills 本身。 让我用 AI 发展的三个阶段来解释这个判断。 第一阶段:AI Chatbot + Prompt 回归第一性原理:AI 也好,Agent 也好,能解决问题才有价值。 最早的 AI Chatbot 加上好的 Prompt,已经能解决很多「生成类」问题——回答问题、情感陪伴、翻译、写作、摘要。 那时候 Prompt 就是短期红利。你会写出好的 Prompt,就能

website-logo

“关于 AI Agent,你最想知道的 3 个问题——为什么我说”垂直 Agent“是个伪命题”

宝玉的博客

回答几个读者问题。 1、AI Agent 是否有一个权威的概念?中美两国对这个概念是否有统一的解释? AI Agent 的定义和国家无关,更多是行业共识的演进。 目前业界比较认可的定义来自 Anthropic。他们在《Building Effective Agents》(https://www.anthropic.com/research/building-effective-agents)这篇文章中做了一个很重要的区分: 工作流(Workflow):通过预定义的代码路径来编排 LLM 与工具的系统。 Agent:由 LLM 动态地指挥自己的流程和工具使用方式的系统,始终由 LLM 来掌控完

website-logo

AI 会取代你的工作吗?Anthropic 用 200 万对话告诉你答案

宝玉的博客

“AI 会先替代流水线工人和客服,知识工作者暂时安全”,这可能是过去两年最流行的 AI 经济叙事。 但 Anthropic 刚发布的 Economic Index 第四期报告,用真实数据讲了一个完全不同的故事:AI 对高学历任务的加速效果,比低学历任务高出 30%。AI 正在从知识工作的核心地带切入,而不是从边缘蚕食。 这份报告分析了 200 万次 Claude 对话(100 万来自 Claude.ai,100 万来自 API),首次提出了"经济原语"这个分析框架,试图回答一个关键问题:AI 到底在改变什么样的工作? 复杂任务获益更多,但成功率更低 Anthropic 发现了一个有趣的权衡:

website-logo

我写了个 Skill,让 Agent 自动给文章配图

宝玉的博客

写完一篇长文,配图是一件让人头疼的事。 你得一张张想画面、写提示词、生成、挑选、插入……一篇三千字的文章配五六张图,光这个环节就能耗掉半小时。 我最近折腾了一个 Agent Skill,让 Agent 帮我全程代劳。把文章丢给它,它自己分析哪里需要图、应该画什么风格、然后一张张生成并插入对应位置。整个过程我只需要一句话:“给这篇文章配图。” 包括你现在看到的这篇文章的配图,都是这个 Skill 帮助完成的。 今天就聊聊这个给文章配图的 Skill 是怎么设计的,顺便科普一下 Agent Skills 这个被很多人忽略的强大功能。 什么是 Agent Skills? 先说个类比。你新招了个助理,

website-logo

Claude Code 的"懒加载"更新:AI 终于学会了"随叫随到

宝玉的博客

想象一下这个场景:你是一个项目经理,手下有 50 个员工,每个人都有不同的专长。每次开会之前,你都要求所有人先到会议室,每个人都要做一遍自我介绍,详细说明自己能干什么。 结果光是听完自我介绍,会议时间就用掉了一大半,真正讨论问题的时间所剩无几。 这就是 AI 工具生态面临的一个真实困境,直到今天,Claude Code 推出了一个叫 Tool Search 的功能,终于解决了这个问题。 AI 的"工作记忆"有多金贵 要理解这个更新为什么重要,我们得先聊聊 AI 的”上下文窗口“是什么。 你可以把上下文窗口理解成 AI 的”工作记忆“,就像你我同时能记住的事情是有限的一样,AI 在一次对话中能

website-logo

代码日趋廉价,软件依然昂贵

宝玉的博客

原文标题:Code Is Cheap Now. Software Isn't. 作者:Chris Gregori( https://x.com/codestirring ) 原文链接:https://www.chrisgregori.dev/opinion/code-is-cheap-now-software-isnt 发布时间:2026-01-10 软件构建的门槛已然崩塌,但构建有价值事物的门槛却依然高不可攀。 Claude Code 和 Claude Opus 4.5 的发布给这股热潮又添了一把火。虽然大语言模型(LLM)工具早已存在,但现在它们变得空前强大,吸引了更多目光。但这并非 S

website-logo

Cursor Agent 最佳实践

宝玉的博客

编程 Agent 正在改变软件开发的方式。 如今,模型可以连续运行数小时,完成复杂的多文件重构,反复迭代直到测试通过。但要充分发挥 Agent 的潜力,你得理解它的工作原理,掌握新的使用模式。 本指南将介绍与 Cursor Agent 协作的技巧。不管你是刚接触 Agent 编程,还是想了解我们团队怎么用 Cursor,这里都能找到与 Agent 高效协作的方法。 理解 Agent 框架 Agent 框架(Agent harness)有三个核心部分: 指令:引导 Agent 行为的系统提示词和规则 工具:文件编辑、代码库搜索、终端执行等能力 用户消息:你的提示词和后续指令 Cursor 为每个

website-logo

“软件工程的未来两年”

宝玉的博客

软件行业正面临一个奇怪的拐点。AI 编程已从单纯的“超级自动补全”,进化为能自主执行开发任务的 AI 智能体 (AI Agents)。曾经助推科技界“抢人大战”的经济泡沫已破,取而代之的是对效率的硬性指标:企业现在更看重利润而非增长,更青睐老手而非应届生,更倾向于用神兵利器武装精简的团队。 与此同时,新一代开发者正步入职场,心态截然不同:他们务实地追求职业稳定,质疑“内卷文化”(hustle culture),并且从入行第一天起就是 AI 的原住民。 未来充满了不确定性。以下是将在 2026 年之前重塑软件工程的五个关键问题,我为每个问题设想了两种截然不同的情景。这并非预言,而是帮助大家做准备

website-logo

清华 AGI 峰会圆桌对话:笨笨的坚持,也许走到最后的就是我们

宝玉的博客

1 月 10 日,清华 AGI-Next 峰会的圆桌对话:中国 AI 的下一步,主持人:李广密,嘉宾:阿里千问的林俊旸、智谱的唐杰、联邦学习先驱杨强、刚从 OpenAI 回国加入腾讯的姚顺雨,整容强大。 我最感兴趣的还是姚顺雨的发言,毕竟他刚从 OpenAI 跳槽到腾讯不到一个月,这是他首次公开亮相,不过是通过视频远程参加。 主持人李广密在两个小时里问了很多好问题,我只是挑几段有价值的对话分享一下。 谁在分化? 李广密先问了个分化的问题: “硅谷几家公司开始走不同的路,Anthropic 专注企业和 Coding,OpenAI 做 To C,中国呢?” 姚顺雨说有两个大的分化正在发生:

website-logo

Vibe Coding 方法论:不会编程的人如何用 AI 写出能跑的代码

宝玉的博客

前几天看到一篇文章《how to vibe code w/ claude code》https://x.com/elenakvcs/article/2008228601980985550 🔗,作者 Elena 是一位 AI 研究员,每天读论文、测模型、写报告,理解 AI 的工作原理,却从没自己写过代码。直到有一天她用自然语言向 Claude 描述了一个需求,45 秒后拿到一段 Python 脚本,运行,成功。原本要花 6 小时手动清理的 4000 行数据,一分钟搞定。 她完全不懂那些代码是什么意思。但它跑起来了。 这就是 vibe coding:不是学会编程,而是学会“说清楚你要什么”。 失

website-logo

你可能不再需要 workflow,大部分场景 skills 足矣——五步框架把 Workflow 变成可进化的 Skill

宝玉的博客

"80 多个节点的 workflow,稳定性和可调整性,不是 subagent 能比拟的。" 上面这话这是我在 X 上和朋友 pippingg 的一次围绕 Dify 这样可视化拖拽 workflow 和 Claude Code Skills 的一次讨论。 这话对,也不对。 对在哪里?传统 workflow 编排的确有它的核心价值——每次执行结果可预测,出了问题能一步步排查,普通人也能看懂流程图。这些优势实实在在。 不对在哪里?很多人低估了 AI Agent + Skills 架构的潜力。我的观点是:大部分 workflow 编排场景,都可以被 Agent + Skills 取代。 Workfl

website-logo

2025年末全球 AI 行业流量报告:狂热退潮,分化开始

宝玉的博客

2025 年最后一个季度,ChatGPT 的网站流量同比下跌了 22%。 这个数字来自 Similarweb 刚刚发布的全球 AI 行业流量追踪报告( https://www.similarweb.com/corp/wp-content/uploads/2026/01/attachment-Global-AI-Tracker-6.pdf  ),数据截止 2026 年 1 月 2 日。作为全球流量分析的权威机构,他们的数据一直是投资者判断科技公司真实状况的重要参考。 ChatGPT 流量出现两位数下滑,这是一个很大的信号。 【1】谁在涨,谁在跌 先说数据口径:这份报告追踪的是网站访问量,不包

website-logo

动态上下文发现 (Dynamic Context Discovery)

宝玉的博客

作者:Jediah Katz AI 智能体(AI Agent)正在迅速改变软件开发的格局。它们的飞速进步,既得益于更强大的智能体模型,也归功于更出色的 Context Engineering(上下文工程,即如何通过构建更好的提示词和环境来引导模型)。 在 Cursor,我们会为每一个新接入的前沿模型单独优化“智能体交互框架”(即我们提供给模型的指令和工具)。但在 Context Engineering(上下文工程)方面,我们发现了一些通用的改进空间——比如在一个漫长的任务过程中,如何收集上下文以及如何优化 Token 的使用效率——这些改进适用于我们框架内的所有模型。 随着大语言模型(LLM)

website-logo

Google 团队一年都没做出来的项目 Claude Code 一小时就把代码写出来了

宝玉的博客

前几天 Google 首席工程师(Principal Engineer)Jaana Dogan 发了一条推文: “我们团队去年一整年都在做分布式 Agent 编排系统,各种方案,各种分歧,始终没有定论。我把问题描述给 Claude Code,它一个小时就生成了我们去年做的东西。” 这条推文在我的 Timeline 上刷屏好几天。有意思的是,几乎每个人都能从中找到自己想要的证据。 有人说这是大公司病的铁证:一年的活儿一小时干完,可见组织效率有多低。 有人说这是 Claude Code 封神时刻:Google 自己的首席工程师都在用竞品。 还有人说程序员要失业了:AI 已经能替代整个团队。 这些

website-logo

AI 时代的代码审核:写两遍,反而更快

宝玉的博客

做过几年开发的人,大概都有过这种痛苦记忆:第一版代码写完,功能好不容易跑通了,然后发现需求理解错了一半,技术方案踩了三个坑,架构设计根本撑不住后续迭代。 想推翻重写?老板说deadline不等人。只好硬着头皮往上堆,三年后回头看,那坨代码已经成了没人敢动的屎山。 这个问题存在了几十年,但现在 AI 编程工具的出现,意外地给了一个新解法。 【1】我的解法:两个版本,两套标准 这个解法其实不新,软件工程教科书里叫“原型开发法”:先做个粗糙版本验证想法,再正式开发。但以前没人这么干,因为成本太高。写一个能跑的原型,可能要花正式开发一半的时间,谁等得起? 现在情况变了。AI 写代码的速度,快到让人不适

website-logo

Code Review in the AI Era: Why Writing It Twice Is Actually Faster

宝玉的博客

If you've been coding for a few years, you've probably lived through this nightmare: you finish the first version, finally get it running, and then realize you misunderstood half the requirements, hit three technical dead ends, and the architecture won't survive the next iteration. Want to rewrite f

website-logo

Claude Code 之父 Boris 的 9 条实战技巧:原来高手的配置这么“朴实无华”

宝玉的博客

Boris Cherny 在 Anthropic 内部有个绰号:Claude Code 之父。他最近在 X 上很活跃,于是很多人问 Boris:你自己到底怎么用 Claude Code?他刚在 X 上分享了 9 条实战技巧。 没有你想象的那么多技巧,每一条都朴实无华。 【1】核心理念:Claude Code 的最佳实践并没有标准答案 Boris 开场就说: My setup might be surprisingly vanilla! Claude Code works great out of the box, so I personally don't customize it much

Manus 谈 AI Agent 之道:做对一千件小事,比做对三件大事更重要

宝玉的博客

张小珺这期采访Manus联合创始人兼首席科学家季逸超(Peak)的访谈 张小珺Benita的微博音频挺值得听听的。 访谈地址:https://www.xiaoyuzhoufm.com/episode/695331cb2db086f897b50ea9 里面有一句话给我印象挺深刻:“做对一千件小事,比做对三件大事更重要”。 熟悉苦涩的教训《The Bitter Lesson》的应该能理解这句话的含义。 AI 研究的历史反复证明,那些依赖人类精心设计的规则和知识的方法,最终都会被更简单粗暴能更好利用算力进行通用学习的方法打败。 换句话说,与其让人类专家花大力气设计聪明的规则,不如让机器自己去学。

AI 2025-2026 众包调研年终总结:从「聊天」到「干活」的范式转变

宝玉的博客

受微博科技邀请,参与年度话题,分享我对今年AI发展的几点思考,但这次我换了一种方法来回答这个问题:众包调研。 我在 X 上问了三个问题: 2025 年 AI 最关键的技术突破是什么? 哪些产品让你眼前一亮? 2026 年什么趋势不可忽视? 没想到收到了很多认真的回复。我花了一两个小时时间,认真的把这些留言和答案汇总整理了一下,也把自己的一些思考融入了其中。 127 条留言,95 个人回答了同样的三个问题。 看完所有答案,我发现大家虽然各有侧重,但在某些判断上出奇一致。答案五花八门,但有些词频繁出现:推理 (Reasoning)、Agent (智能体)、Claude Code、Manus

website-logo

Claude Code 5亿美元背后的AI工程革命

宝玉的博客

来整理一下 Claude Code 诞生的故事,主要来源是科技博主 Gergely Orosz 采访 Claude Code 核心成员的文章。 Claude Code 确实了不起,5 亿美元年化收入,三个月用户量涨了 10 倍,现在也是很多程序员首选 Coding Agent 工具。 这个工具最初只是一个能告诉你“现在在听什么歌”的命令行小玩具。 Gergely Orosz 采访了 Claude Code 的三位核心成员: 创始工程师 Boris Cherny(17 年从业经验,前 Meta 主任工程师) 二号工程师 Sid Bidasaria(Subagents 功能的作者) 以及产品

website-logo

运气表面积公式:让好运找到你

宝玉的博客

我一直觉得运气这是纯粹看命,有的人就是运气好,有的人就是运气差。 今天看到一个有意思的观点,叫“运气表面积”(Luck Surface Area): > “你生活中会有多少‘无心插柳柳成荫’的意外之喜?这取决于你的‘运气表面积’ (Luck Surface Area)。简单来说,这个面积的大小,是由你对某件事的热爱程度,以及你能把这件事有效地传达给多少人,这两者共同决定的。” —— Jason Roberts (来源:https://www.codusoperandi.com/posts/increasing-your-luck-surface-area ) 上面这个观点包含两个核心要素: 1

website-logo

将文章、故事变成漫画脚本提示词参考

宝玉的博客

案例:深度之赌:从卧室到上帝机器 生成脚本示例对话:https://gemini.google.com/share/5a8802514d11 画图示例对话:https://gemini.google.com/share/e0c3b6f93825 --- Prompt --- 请为一本若干页(另加1页封面)的原创知识传记漫画创作详细的结构和情节设计。本漫画采用《Logicomix》式的叙事风格,适合呈现科学探索历程、跨越数十年的时间线,以及复杂概念的可视化解释。 视觉风格定义: 线条清晰(Ligne Claire):参考Hergé《丁丁历险记》或Joost Swarte的画风——轮廓线均匀

website-logo

深度之赌:从卧室到上帝机器

宝玉的博客

【引子】 2012年冬天,内华达州太浩湖畔,一家赌场。 楼下,赌徒们拉着老虎机,每赢一万美元,铃声大作。楼上,一群搞机器学习的研究者正在开会——这是当年的NeurIPS,没人愿意赌钱,赌场恨死他们了。 但赌场不知道的是,楼上正在进行一场更大的赌博。一个64岁的教授和他的两个学生,正在把自己"卖"给出价最高的买家。每次加价一百万美元。 这三个人后来被称为"深度学习三巨头"中的核心力量。那个教授叫Geoffrey Hinton,刚刚拿了诺贝尔奖。他的两个学生,一个叫Ilya Sutskever,后来创办了OpenAI又离开了;另一个叫Alex Krizhevsky,他在父母家的卧室里训练出了一个叫

website-logo

Stack Overflow 2025 年度报告:写代码如果不值钱了,我们该去哪?

宝玉的博客

84% 的人在用 AI 工具,创历史新高。但正面评价呢?从去年的 70% 跌到了 60%。 Stack Overflow 在今年 7 月底发布的 2025 年度开发者调查(https://survey.stackoverflow.co/2025 ),这是他们连续第 15 年做这件事。来自 177 个国家的程序员填写了问卷,覆盖 314 种技术栈,今年还专门加了 AI Agent 和大模型相关的问题。如果说有什么能代表全球程序员的集体判断,大概就是这份报告了。 今年的主题很明确:AI 到底改变了什么? 早些年的时候,程序员们对 AI 的态度两级分化的很厉害,一部分相当狂热,觉得“AI 要替代程