- Website
- Baoyu
- Followers
- —
- Following
- —
Key Highlights
Claude Code推出Tool Search功能,通过懒加载方式按需调用MCP工具,节省高达98.7%的上下文窗口空间。 1 post
AI工具生态从功能堆砌转向效率优化,类似智能手机从比拼App数量到关注续航和内存管理的成熟过程。 1 post
MCP协议成为AI的App Store,社区已开发数千个服务器,但工具说明书曾占用Claude三分之一上下文窗口。 1 post
Main Topics (2)
Latest posts

Claude Code 的"懒加载"更新:AI 终于学会了"随叫随到
想象一下这个场景:你是一个项目经理,手下有 50 个员工,每个人都有不同的专长。每次开会之前,你都要求所有人先到会议室,每个人都要做一遍自我介绍,详细说明自己能干什么。 结果光是听完自我介绍,会议时间就用掉了一大半,真正讨论问题的时间所剩无几。 这就是 AI 工具生态面临的一个真实困境,直到今天,Claude Code 推出了一个叫 Tool Search 的功能,终于解决了这个问题。 AI 的"工作记忆"有多金贵 要理解这个更新为什么重要,我们得先聊聊 AI 的”上下文窗口“是什么。 你可以把上下文窗口理解成 AI 的”工作记忆“,就像你我同时能记住的事情是有限的一样,AI 在一次对话中能

代码日趋廉价,软件依然昂贵
原文标题:Code Is Cheap Now. Software Isn't. 作者:Chris Gregori( https://x.com/codestirring ) 原文链接:https://www.chrisgregori.dev/opinion/code-is-cheap-now-software-isnt 发布时间:2026-01-10 软件构建的门槛已然崩塌,但构建有价值事物的门槛却依然高不可攀。 Claude Code 和 Claude Opus 4.5 的发布给这股热潮又添了一把火。虽然大语言模型(LLM)工具早已存在,但现在它们变得空前强大,吸引了更多目光。但这并非 S

Cursor Agent 最佳实践
编程 Agent 正在改变软件开发的方式。 如今,模型可以连续运行数小时,完成复杂的多文件重构,反复迭代直到测试通过。但要充分发挥 Agent 的潜力,你得理解它的工作原理,掌握新的使用模式。 本指南将介绍与 Cursor Agent 协作的技巧。不管你是刚接触 Agent 编程,还是想了解我们团队怎么用 Cursor,这里都能找到与 Agent 高效协作的方法。 理解 Agent 框架 Agent 框架(Agent harness)有三个核心部分: 指令:引导 Agent 行为的系统提示词和规则 工具:文件编辑、代码库搜索、终端执行等能力 用户消息:你的提示词和后续指令 Cursor 为每个

“软件工程的未来两年”
软件行业正面临一个奇怪的拐点。AI 编程已从单纯的“超级自动补全”,进化为能自主执行开发任务的 AI 智能体 (AI Agents)。曾经助推科技界“抢人大战”的经济泡沫已破,取而代之的是对效率的硬性指标:企业现在更看重利润而非增长,更青睐老手而非应届生,更倾向于用神兵利器武装精简的团队。 与此同时,新一代开发者正步入职场,心态截然不同:他们务实地追求职业稳定,质疑“内卷文化”(hustle culture),并且从入行第一天起就是 AI 的原住民。 未来充满了不确定性。以下是将在 2026 年之前重塑软件工程的五个关键问题,我为每个问题设想了两种截然不同的情景。这并非预言,而是帮助大家做准备

清华 AGI 峰会圆桌对话:笨笨的坚持,也许走到最后的就是我们
1 月 10 日,清华 AGI-Next 峰会的圆桌对话:中国 AI 的下一步,主持人:李广密,嘉宾:阿里千问的林俊旸、智谱的唐杰、联邦学习先驱杨强、刚从 OpenAI 回国加入腾讯的姚顺雨,整容强大。 我最感兴趣的还是姚顺雨的发言,毕竟他刚从 OpenAI 跳槽到腾讯不到一个月,这是他首次公开亮相,不过是通过视频远程参加。 主持人李广密在两个小时里问了很多好问题,我只是挑几段有价值的对话分享一下。 谁在分化? 李广密先问了个分化的问题: “硅谷几家公司开始走不同的路,Anthropic 专注企业和 Coding,OpenAI 做 To C,中国呢?” 姚顺雨说有两个大的分化正在发生:

Vibe Coding 方法论:不会编程的人如何用 AI 写出能跑的代码
前几天看到一篇文章《how to vibe code w/ claude code》https://x.com/elenakvcs/article/2008228601980985550 🔗,作者 Elena 是一位 AI 研究员,每天读论文、测模型、写报告,理解 AI 的工作原理,却从没自己写过代码。直到有一天她用自然语言向 Claude 描述了一个需求,45 秒后拿到一段 Python 脚本,运行,成功。原本要花 6 小时手动清理的 4000 行数据,一分钟搞定。 她完全不懂那些代码是什么意思。但它跑起来了。 这就是 vibe coding:不是学会编程,而是学会“说清楚你要什么”。 失

你可能不再需要 workflow,大部分场景 skills 足矣——五步框架把 Workflow 变成可进化的 Skill
"80 多个节点的 workflow,稳定性和可调整性,不是 subagent 能比拟的。" 上面这话这是我在 X 上和朋友 pippingg 的一次围绕 Dify 这样可视化拖拽 workflow 和 Claude Code Skills 的一次讨论。 这话对,也不对。 对在哪里?传统 workflow 编排的确有它的核心价值——每次执行结果可预测,出了问题能一步步排查,普通人也能看懂流程图。这些优势实实在在。 不对在哪里?很多人低估了 AI Agent + Skills 架构的潜力。我的观点是:大部分 workflow 编排场景,都可以被 Agent + Skills 取代。 Workfl

2025年末全球 AI 行业流量报告:狂热退潮,分化开始
2025 年最后一个季度,ChatGPT 的网站流量同比下跌了 22%。 这个数字来自 Similarweb 刚刚发布的全球 AI 行业流量追踪报告( https://www.similarweb.com/corp/wp-content/uploads/2026/01/attachment-Global-AI-Tracker-6.pdf ),数据截止 2026 年 1 月 2 日。作为全球流量分析的权威机构,他们的数据一直是投资者判断科技公司真实状况的重要参考。 ChatGPT 流量出现两位数下滑,这是一个很大的信号。 【1】谁在涨,谁在跌 先说数据口径:这份报告追踪的是网站访问量,不包

动态上下文发现 (Dynamic Context Discovery)
作者:Jediah Katz AI 智能体(AI Agent)正在迅速改变软件开发的格局。它们的飞速进步,既得益于更强大的智能体模型,也归功于更出色的 Context Engineering(上下文工程,即如何通过构建更好的提示词和环境来引导模型)。 在 Cursor,我们会为每一个新接入的前沿模型单独优化“智能体交互框架”(即我们提供给模型的指令和工具)。但在 Context Engineering(上下文工程)方面,我们发现了一些通用的改进空间——比如在一个漫长的任务过程中,如何收集上下文以及如何优化 Token 的使用效率——这些改进适用于我们框架内的所有模型。 随着大语言模型(LLM)

Google 团队一年都没做出来的项目 Claude Code 一小时就把代码写出来了
前几天 Google 首席工程师(Principal Engineer)Jaana Dogan 发了一条推文: “我们团队去年一整年都在做分布式 Agent 编排系统,各种方案,各种分歧,始终没有定论。我把问题描述给 Claude Code,它一个小时就生成了我们去年做的东西。” 这条推文在我的 Timeline 上刷屏好几天。有意思的是,几乎每个人都能从中找到自己想要的证据。 有人说这是大公司病的铁证:一年的活儿一小时干完,可见组织效率有多低。 有人说这是 Claude Code 封神时刻:Google 自己的首席工程师都在用竞品。 还有人说程序员要失业了:AI 已经能替代整个团队。 这些

AI 时代的代码审核:写两遍,反而更快
做过几年开发的人,大概都有过这种痛苦记忆:第一版代码写完,功能好不容易跑通了,然后发现需求理解错了一半,技术方案踩了三个坑,架构设计根本撑不住后续迭代。 想推翻重写?老板说deadline不等人。只好硬着头皮往上堆,三年后回头看,那坨代码已经成了没人敢动的屎山。 这个问题存在了几十年,但现在 AI 编程工具的出现,意外地给了一个新解法。 【1】我的解法:两个版本,两套标准 这个解法其实不新,软件工程教科书里叫“原型开发法”:先做个粗糙版本验证想法,再正式开发。但以前没人这么干,因为成本太高。写一个能跑的原型,可能要花正式开发一半的时间,谁等得起? 现在情况变了。AI 写代码的速度,快到让人不适

Code Review in the AI Era: Why Writing It Twice Is Actually Faster
If you've been coding for a few years, you've probably lived through this nightmare: you finish the first version, finally get it running, and then realize you misunderstood half the requirements, hit three technical dead ends, and the architecture won't survive the next iteration. Want to rewrite f

Claude Code 之父 Boris 的 9 条实战技巧:原来高手的配置这么“朴实无华”
Boris Cherny 在 Anthropic 内部有个绰号:Claude Code 之父。他最近在 X 上很活跃,于是很多人问 Boris:你自己到底怎么用 Claude Code?他刚在 X 上分享了 9 条实战技巧。 没有你想象的那么多技巧,每一条都朴实无华。 【1】核心理念:Claude Code 的最佳实践并没有标准答案 Boris 开场就说: My setup might be surprisingly vanilla! Claude Code works great out of the box, so I personally don't customize it much
Manus 谈 AI Agent 之道:做对一千件小事,比做对三件大事更重要
张小珺这期采访Manus联合创始人兼首席科学家季逸超(Peak)的访谈 张小珺Benita的微博音频挺值得听听的。 访谈地址:https://www.xiaoyuzhoufm.com/episode/695331cb2db086f897b50ea9 里面有一句话给我印象挺深刻:“做对一千件小事,比做对三件大事更重要”。 熟悉苦涩的教训《The Bitter Lesson》的应该能理解这句话的含义。 AI 研究的历史反复证明,那些依赖人类精心设计的规则和知识的方法,最终都会被更简单粗暴能更好利用算力进行通用学习的方法打败。 换句话说,与其让人类专家花大力气设计聪明的规则,不如让机器自己去学。
AI 2025-2026 众包调研年终总结:从「聊天」到「干活」的范式转变
受微博科技邀请,参与年度话题,分享我对今年AI发展的几点思考,但这次我换了一种方法来回答这个问题:众包调研。 我在 X 上问了三个问题: 2025 年 AI 最关键的技术突破是什么? 哪些产品让你眼前一亮? 2026 年什么趋势不可忽视? 没想到收到了很多认真的回复。我花了一两个小时时间,认真的把这些留言和答案汇总整理了一下,也把自己的一些思考融入了其中。 127 条留言,95 个人回答了同样的三个问题。 看完所有答案,我发现大家虽然各有侧重,但在某些判断上出奇一致。答案五花八门,但有些词频繁出现:推理 (Reasoning)、Agent (智能体)、Claude Code、Manus

Claude Code 5亿美元背后的AI工程革命
来整理一下 Claude Code 诞生的故事,主要来源是科技博主 Gergely Orosz 采访 Claude Code 核心成员的文章。 Claude Code 确实了不起,5 亿美元年化收入,三个月用户量涨了 10 倍,现在也是很多程序员首选 Coding Agent 工具。 这个工具最初只是一个能告诉你“现在在听什么歌”的命令行小玩具。 Gergely Orosz 采访了 Claude Code 的三位核心成员: 创始工程师 Boris Cherny(17 年从业经验,前 Meta 主任工程师) 二号工程师 Sid Bidasaria(Subagents 功能的作者) 以及产品

运气表面积公式:让好运找到你
我一直觉得运气这是纯粹看命,有的人就是运气好,有的人就是运气差。 今天看到一个有意思的观点,叫“运气表面积”(Luck Surface Area): > “你生活中会有多少‘无心插柳柳成荫’的意外之喜?这取决于你的‘运气表面积’ (Luck Surface Area)。简单来说,这个面积的大小,是由你对某件事的热爱程度,以及你能把这件事有效地传达给多少人,这两者共同决定的。” —— Jason Roberts (来源:https://www.codusoperandi.com/posts/increasing-your-luck-surface-area ) 上面这个观点包含两个核心要素: 1

将文章、故事变成漫画脚本提示词参考
案例:深度之赌:从卧室到上帝机器 生成脚本示例对话:https://gemini.google.com/share/5a8802514d11 画图示例对话:https://gemini.google.com/share/e0c3b6f93825 --- Prompt --- 请为一本若干页(另加1页封面)的原创知识传记漫画创作详细的结构和情节设计。本漫画采用《Logicomix》式的叙事风格,适合呈现科学探索历程、跨越数十年的时间线,以及复杂概念的可视化解释。 视觉风格定义: 线条清晰(Ligne Claire):参考Hergé《丁丁历险记》或Joost Swarte的画风——轮廓线均匀

深度之赌:从卧室到上帝机器
【引子】 2012年冬天,内华达州太浩湖畔,一家赌场。 楼下,赌徒们拉着老虎机,每赢一万美元,铃声大作。楼上,一群搞机器学习的研究者正在开会——这是当年的NeurIPS,没人愿意赌钱,赌场恨死他们了。 但赌场不知道的是,楼上正在进行一场更大的赌博。一个64岁的教授和他的两个学生,正在把自己"卖"给出价最高的买家。每次加价一百万美元。 这三个人后来被称为"深度学习三巨头"中的核心力量。那个教授叫Geoffrey Hinton,刚刚拿了诺贝尔奖。他的两个学生,一个叫Ilya Sutskever,后来创办了OpenAI又离开了;另一个叫Alex Krizhevsky,他在父母家的卧室里训练出了一个叫

Stack Overflow 2025 年度报告:写代码如果不值钱了,我们该去哪?
84% 的人在用 AI 工具,创历史新高。但正面评价呢?从去年的 70% 跌到了 60%。 Stack Overflow 在今年 7 月底发布的 2025 年度开发者调查(https://survey.stackoverflow.co/2025 ),这是他们连续第 15 年做这件事。来自 177 个国家的程序员填写了问卷,覆盖 314 种技术栈,今年还专门加了 AI Agent 和大模型相关的问题。如果说有什么能代表全球程序员的集体判断,大概就是这份报告了。 今年的主题很明确:AI 到底改变了什么? 早些年的时候,程序员们对 AI 的态度两级分化的很厉害,一部分相当狂热,觉得“AI 要替代程

设计师该不该写代码?一个被问错的问题——AI时代的设计价值与慢思考
设计师该不该写代码? 类似的话题隔几年就会火一次。最近随着 Cursor、v0 这些 AI 工具的成熟,用代码做设计变得前所未有地容易,于是这话题在设计圈又成了热门话题。 Linear 的创始人 Karri Saarinen 最近写了一篇文章,他的观点让我挺有共鸣:这个问题本身就问错了。 【1】问对问题 最让我共鸣的其实是他思考问题的框架: 我学会的第一件事就是:先质疑问题本身,而不是把它当作既定假设。如果有人让我做一个东西,我会先问:这是一个真问题吗?如果我们不做这个会怎样?是谁定义了这个问题? 就像前几天我分享的自己的失败的 Agent 落地故事,就是问题没有定义清楚,错把重点放在如何

AI 新纪元:无限大脑的重构力——从钢铁蒸汽到未来组织,告别后视镜思维
Notion 的创始人 Ivan Zhao 的精彩文章:《钢铁、蒸汽机与无限大脑》 越来越清晰的感觉到,我们正处于 AI 革命的早期阶段,对于未来谁也不知道会怎么样,所以都喜欢从历史中、去工业革命、互联网革命中寻找规律,以期望能对未来有所启发。 相对来说,这篇文章虽然也是尝试从钢铁和蒸汽机的历史里,寻找 AI 时代的答案,还是挺有深度。 【1】第一个观点是:我们正在看着后视镜开车 每一代新技术刚出来时,人们总是习惯用旧的方式去理解它。这就是所谓的“看着后视镜驶向未来”。 想想看,早期的电话,大家把它当成“会说话的电报";早期的电影,其实就是把摄像机架在观众席拍舞台剧。 现在的 AI 也是一样。
蒸汽、钢铁与无限的大脑
作者:@ivanhzhao 每个时代都由其标志性的“奇迹材料”所塑造。 钢铁锻造了“镀金时代”(Gilded Age,指19世纪末美国经济飞速发展的时期);半导体开启了数字时代。而现在,AI 作为一种“无限的大脑”降临了。如果历史能给我们什么启示,那就是:谁掌握了这种材料,谁就定义了这个时代。 左图:少年时的安德鲁·卡内基和他的弟弟。 右图:镀金时代匹兹堡的钢铁厂。 19 世纪 50 年代,安德鲁·卡内基还只是个穿梭在匹兹堡泥泞街道上的电报员。当时,十个美国人里有六个是农民。但在随后的两代人时间里,卡内基和他的同辈们锻造出了现代世界的雏形。马车让位给了铁路,烛光让位给了电力,生铁让位给了钢

AI Agent 要变强:两条路径(Skills vs SubAgent)
AI Agent 要变强,有两条完全不同的路。 一条是 Skill,也就是给自己装技能,把新能力直接塞进脑子里。 另一条是 SubAgent,就像派小弟去干活,自己只看汇报。 这两条路听起来都能让 Agent 更厉害,但适用的场景还是有所不同,用错了的话,你的 Agent 可能反而会越用越慢、越用越乱。 Skills,就像是给主 Agent 装插件。 比如你的 Agent 原本只会聊天,现在你想让它能写 PPT。Skills 的做法是:把写 PPT 的能力说明、工具调用方式、注意事项,全都塞进主 Agent 的上下文中。主 Agent 通过上下文学会了这项技能,它可以自己来写 PPT。

预订本年度最有价值提示词 —— 生成既有质感,又能随意修改文字的完美 PPT
大家都很喜欢 NotebookLM 生成的 Audio Overview,它最近生成的 Slide Deck(幻灯片)风格也很棒。但有一个大问题:生成的 Slides 是死图,文字不能改,内容不能动。 想用它的风格,又想完全掌控内容? 我写了一套工作流 + 提示词模板,让你既能拥有那个质感,又能随意定制每一页的文字。 💡 原理揭秘 这个方法稍微绕一点,但自由度极高。核心思路是将“内容生成”与“视觉绘制”拆开: 大脑 (Planner):先用我的提示词模板,根据你的素材生成 Slides 大纲 + 对应的画图指令。 画师 (Artist):拿着画图指令,去用绘图工具(如 Nano Ba