- Website
- Baoyu
- Followers
- —
- Following
- —
Key Highlights
AI编程工具(如Opus 4.5、GPT-5.2)已达到能生成高质量代码的水平,许多开发者已完全依赖AI编写生产代码,软件工程正经历根本性变革。 1 post
传统产品需求文档(PRD)流程因编程Agent而终结,实现成本极低导致评审成为新瓶颈,工程、产品、设计角色需融合并提升系统思维能力。 1 post
AI写代码将导致编程语言专精、原型开发等传统技能贬值,但软件工程中的架构设计、测试验证、技术债管理等能力价值大幅提升。 1 post
Main Topics (4)
Latest posts

DeepSeek 的 10 万亿美元大战略
DeepSeek 的 10 万亿美元宏伟战略 作者:GDP (@bookwormengr) DeepSeek's 10 trillion USD grand strategy 你有没有想过,DeepSeek 到底打算怎么赚钱,而且是赚大钱? 他们没有像智谱(GLM)、月之暗面(MoonShot)和 MiniMax 那样推出有竞争力的编程订阅计划。他们没有多模态、语音或视频模型。时至今日,他们甚至连一个评测框架(Harness,用于测试和评估模型性能的基准测试工具)都没有(虽然最近听说他们开始招人做了)。而且,DeepSeek 还长期致力于开源,乐此不疲地分享自己的“独家秘方”。这难道是疯了吗?

来自 Codex 官方团队的分享:如何把 Codex 用到极致
来自 Codex 官方团队的分享:如何把 Codex 用到极致 作者:jason (@jxnlco) Getting the most out of Codex 大多数开发者刚接触代码编辑类的 AI 智能体 (AI Agent) 时,通常只让它们干一件事:写代码。比如让它检查一下代码库,生成个差异对比 (diff),跑跑测试,然后再提个合并请求 (pull request)。 写代码确实依然是 Codex 的核心强项。但仔细想想,我们在电脑上做的大部分工作,本质上其实都和代码息息相关:执行终端命令、浏览网页、调用应用程序接口、导出文档、响应各种事件,或者是触发自动化流程。当 Codex 开始延

为什么我不“凭感觉编程”
为什么我不“凭感觉编程” 作者:Jacob Harris Why I Don’t Vibe Code 最近网上关于“凭感觉编程”(Vibe Coding)以及大语言模型(LLM)将如何颠覆软件开发的讨论铺天盖地。据说,每一个新模型的发布都会把我们带入纯粹生产力的天堂,让我们能以光速发布软件,彻底消除产品开发中的所有摩擦和内耗。 或许吧,我姑且信之。但我自己,是不“凭感觉编程”的。 如果你觉得这套好用,那太棒了!我写这篇文章并不是为了探讨 LLM 的优劣,只是这玩意儿对我个人来说,从来没对过胃口。这篇文章,算是我简单盘点一下其中的种种原因。 我是个守财奴 我不是个原教旨主义者。我试过用集成在 I

Forward Deployed Engineer:AI 时代的新宠岗位,到底干什么?
一场 AI 岗位的“军备竞赛” 先看看最近 AI 圈的一个关于新职位 Forward Deployed Engineer(FDE)的新闻。 Google 正在 FDE 岗位上加倍投入,并且大幅简化了面试流程。Google Cloud 的 CEO 托马斯·库里安(Thomas Kurian)宣布,他们在市场营销(Go-To-Market)团队下成立了一个全新的、以 AI 为核心的部门,并且正在为此疯狂招募 FDE。 听说,他们的面试流程已经被大幅压缩,从过去长达数周、多达 4-6 轮的面试,缩短到了仅仅两天内的两轮面试。看来 Google 对填补这些空缺不仅是渴望,简直可以说是迫不及待了。

AI 时代到底该怎么管一个工程团队
Fiona Fung 在 Anthropic 大会上讲了 28 分钟,聊了聊 AI 时代到底该怎么管一个工程团队。 她做这套幻灯片时,Anthropic 还没有推出 Routines 功能。 三周后,Routines 上线了。这是一个让 Claude Code 在云端按计划自动跑任务的功能,不需要在本地一直开着终端。等到她真正站上 Code with Claude 2026 大会的讲台时,幻灯片里好几张就已经过时了。 Fiona Fung 是 Anthropic 旗下 Claude Code 和 Cowork 两条产品线的工程与产品负责人。她之前在微软干了十二年(从 Visual Studi

为什么资深开发者讲不清自己的专业能力
为什么资深开发者总是无法传达他们的专业价值 作者:Tuhin Nair Why senior developers fail to communicate their expertise 你对下面这句话有什么感觉? “AI 智能体 (AI agents) 是软件开发的未来。我们再也不需要那些拖慢业务进度的开发人员了。” 如果你是一位资深开发者,并且认同这句话,那我可能要对你的专业水平打个问号了(我会解释原因的,我并不是在故意找茬)。 但如果你不是资深开发者,却认同这句话,我觉得你大概率是对的。 咦?这到底是怎么回事? 广告文案 (Copywriting) 的本质,其实就是让信息精准匹配它的受众

Codex 的野心,MCP 和 Skill 的下一步
这段时间我在密集使用 Codex App、Cursor 等 Agent 应用,有件事越来越觉得有意思。 去年大家争的是谁家模型更强,今年争的好像变成了谁家窗口右侧更好用。 Codex、Claude 桌面版、Cursor 3.0、TRAE SOLO,这几家最顶尖的 Agent,在完全没有协商的情况下,几乎同时收敛到了同一个界面布局:左侧是项目和会话列表,中间是和 Agent 的对话,右侧是工作区,放着文件浏览、网页预览、文件变更审查这些功能。 肯定不是相互之间的抄袭,更像是当前 Agent 交互的最优解。 为什么是三栏 传统 Chatbot 只需要两栏,左边会话历史,右边对话窗口,你问它答,

机器人的终局:英伟达 Jim Fan 宣告 VLA 时代结束,WAM 登场
Jim Fan 是英伟达机器人与 AI 研究组(GEAR Lab)负责人,过去几年主推的 GR00T 人形机器人基础模型用的是 VLA(Vision-Language-Action,视觉 - 语言 - 动作)架构。他刚在 Sequoia AI Ascent 2026 上做了一场 20 分钟的演讲,主题叫《Robotics' End Game》,第一件事就是宣布 VLA 路线过时——包括他自己半年前还在推的 GR00T。 取而代之的新范式叫世界动作模型(WAM),代表作是英伟达 2 月发布的 DreamZero。他把这套思路叫“底层同构”:复制 LLM(Large Language Model,

裁员潮将持续,直到我们学会发掘 AI 的商业价值
作者:Arnav Gupta 在我们公司的高层办公室里,某处正躺着一份多达 8000 人的裁员名单。我有 10% 的概率在这份名单上。再过几天,也就是 5 月 20 日,我就能知道自己的命运了。 看到今天 Coinbase 宣布的“AI 裁员”消息,我决定写下这篇文章。我特意赶在 5 月 20 日之前动笔,因为我想分享一些最真实的看法,不带任何“我是走是留”的个人情绪。这些想法不仅与我是否被裁无关,也不仅仅局限于我所在的公司。它们来自我那些在各大中型企业工作的朋友们的真实心声。 现在有大量的文章在争论:这新一波的裁员潮(大家普遍认为是从杰克·多西裁掉 Square 40% 员工开始的)到底是因

深度拆解:AI Agent Harness 的构造
深度拆解:AI Agent Harness 的构造 作者:Akshay 原文:The Anatomy of an Agent Harness 本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理,以及那些将“无状态”的大语言模型(LLM)转变为全能 Agent(Agent)的底层机制。 你可能已经开发过聊天机器人,甚至可能用一些工具搭建了一个 ReAct 循环 (ReAct:Reason + Act,一种让模型在行动前先进行推理的模式)。跑 Demo 的时候看着挺好,但一旦投入生产环境,系统就

使用 Claude Code:HTML 难以置信的奇效
使用 Claude Code:HTML 难以置信的奇效 Markdown 已经成为 AI 智能体 (AI Agent) 与我们沟通时最常用的文件格式。它简单、便携、具备一定的富文本 (Rich text) 能力,而且极其容易进行人工修改。你甚至会发现,Claude 已经变得极其擅长在 Markdown 文件里用 ASCII (美国信息交换标准代码,这里指用纯文本符号拼凑成图表) 字符来画图了。 但是,随着 AI 智能体变得越来越强大,我开始觉得 Markdown 变成了一种束缚。面对动辄上百行的 Markdown 文件,我根本没有耐心读下去。我想要更丰富的视觉展现、明亮的色彩和直观的图表,而且

Anthropic 兄妹 Dario Amodei 和 Daniela Amodei 最新对话:Claude 为什么一直限速?
在 5 月 6 日的 Code with Claude 旧金山场上,Anthropic 兄妹 Dario Amodei 和 Daniela Amodei 一起坐到了台上。这是 Anthropic 第二届开发者大会,同一天,Anthropic 刚刚宣布与 SpaceX 签下 Colossus 1 数据中心的全部算力(超过 300 MW、22 万张 NVIDIA GPU)。 主持这场对话的是 Anthropic 首席产品官 Ami Vora(2026 年 1 月接替转去 Labs 的 Mike Krieger)。话题从“指数曲线上的体感”开始,覆盖开发者生态、模型训练逻辑的下一步、Anthropi

Boris Cherny:Claude Code 之后,写代码正在变成“管理 Agent”
Boris Cherny 是 Anthropic 内部 Claude Code 的创建者,从一个三人小团队的孵化项目做起,把“在 IDE 里按 Tab 自动补全一行代码”这件事彻底升级成“让 Agent 把整个项目写完”。Claude Code 在 2026 年初已经超过十亿美元年化营收,被 Anthropic 自己称为“史上从研究预览到十亿美元产品最快的一次”。 这次访谈来自 Sequoia 2026 年的 AI Ascent 大会,主持人是红杉合伙人 Lauren Reeder。 原始视频:https://www.youtube.com/watch?v=SlGRN8jh2RI 要点速览

大多数公司根本没有为 AI 做好准备
作者:Daniel Miessler Most Companies Aren't Anywhere Near Ready for AI 并不是公司不想用 AI,而是他们根本用不了。 AI 不是问题,说不清目标才是问题 很多人抱怨 AI 总是无法满足他们的需求,感到十分受挫。但说句实话,真正的问题在于:他们自己都说不清楚到底想要什么。 我曾为全球顶尖的巨头企业、数百家初创团队,以及无数全球 1000 强里的中大型公司做过咨询。我发现,排名第一的致命问题就是:公司的愿景和目标极其模糊,而且朝令夕改。 AI 的核心优势在于“执行”。如果它不知道到底要执行什么,它就毫无用武之地。相反,那些非常清楚自己

Demis Hassabis:AGI 还缺什么,智能体到底行不行,下一个科学突破长什么样
Demis Hassabis 是 Google DeepMind 的 CEO,也是 Isomorphic Labs 的 CEO。他在棋手神童和游戏开发者的身份之外,拿了认知神经科学的博士学位,研究海马体和记忆的工作方式。2024 年,他因为 AlphaFold 的工作获得诺贝尔化学奖。 这次他做客 Y Combinator 的 How to Build the Future 直播,和 YC CEO Garry Tan 聊了四十分钟。几个核心话题:当前 AI 范式距离 AGI 还差什么、智能体的真实水平、AI 在科学领域的突破模式,以及给深科技创业者的建议。 原始视频:https://www.

深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区
深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区 作者:Manthan Gupta I Read Hermes Agent's Memory System, and It Fixes What OpenClaw Got Wrong 如果你读过我之前关于 ChatGPT、Claude 以及 Clawdbot 记忆系统的文章,你就会知道我一直在钻研同一个问题:这些 AI 智能体(AI Agent)到底是怎么记事的? Hermes Agent 对我来说格外有趣,因为这次我不需要只靠观察它的行为来搞“逆向工程”。Hermes 是开源的,它的代码库和文档都是公开的。所

Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering
Andrej Karpathy 说,他已经记不清上次修改 AI 生成的代码是什么时候了。 Karpathy 参与创建了 OpenAI,在 Tesla 领导过 Autopilot 视觉团队,去年一条推文发明了“凭感觉编程”(Vibe Coding)这个词,后来被 Collins 词典选为 2025 年度词汇。 2026 年 4 月,Karpathy 在 Sequoia Capital 的 AI Ascent 现场接受合伙人 Stephanie Zhan 的访谈。这场 30 分钟的对话覆盖了他对编程范式剧变的亲身感受、Software 3.0 的实质、AI 为什么在某些地方极强而在另一些地方离谱地

为 Agent 设计产品
原文:Designing for Agents 如果你和我一样,经常混在 X 上同一个信息圈里刷动态,那么你大概也见过这种说法:用户界面已经死了。 你会一边刷到“我如何用 Obsidian 搭建第二大脑”,一边刷到“Anthropic 彻底杀死了某某行业”这类帖子。然后很快,你就会看到有人说:一个产品如果不能被 AI 智能体(AI Agent)通过 MCP、API、CLI,或者介于它们之间的方式使用,那它就活不下去。 这个趋势在 Ramp 已经很明显。过去三个月里,随着越来越多客户开始通过 Claude、ChatGPT 和其他 AI 智能体进入我们的产品,我们 MCP 上的每周活跃用户增长了

Cat Wu 面试了几百个 PM 候选人,几乎没人答对一个问题:AI 产品经理到底应该干什么?
Cat Wu 是 Anthropic Claude Code 和 Cowork 的产品负责人,和 Boris Cherny 搭档,带着团队把产品功能的交付周期从半年压到了一天。在 Lenny's Podcast 最新一期中,Cat 聊了 Anthropic 内部的速度文化、PM 角色的剧变、源代码泄露的善后,以及那个让开源社区炸锅的 OpenClaw 封堵决定。 https://www.youtube.com/watch?v=PplmzlgE0kg 要点速览 大多数 PM 候选人仍然在用 6-12 个月路线图的思维找工作,Anthropic 的节奏是一周甚至一天发布一个功能 Claude

两小时激辩:黄仁勋为什么不怕 TPU、不怕华为、不怕出口管制?
黄仁勋最近接受了 Dwarkesh Patel 长达两个小时的高密度专访。这场访谈没有客套寒暄,只有密集的观点碰撞。如果你没时间看完,那就记住这一句话——掌控全球 AI 基础设施命脉的老黄,用这样一句话定义了 Nvidia 的使命: “输入是电子,输出是 Token,中间是 Nvidia。” (“The input is electron, the output is tokens. That is in the middle, Nvidia.”) 整场对话的气氛激烈又直白。主持人 Dwarkesh 在每个话题都紧追不放,尤其涉及中国芯片出口时,两人更是直接“杠”了整整二十分钟。老黄强烈反对

设计圈的 Claude Code 时刻来了
Anthropic 今天发布了 Claude Design,第一时间体验了一下,震惊程度不亚于当年第一次用 Claude Code 写代码。借用 flypig 老师一句话: 刚才用了一下,这么说:Claude Design 让 Google 那个 Stitch 看起来像个笑话。 这就是设计领域的 Claude Code 时刻。 我不会说“设计已死”、“设计师要被替代了”之类哗众取宠的话,只是想说: 从想法到高保真交互原型的差距已基本消失,非设计师终于能独立产出可交付设计;设计师生产力指数级提升,但设计外包和传统设计工具要大幅缩水了。 今天 Figma 股价大跌也侧面印证了这一点。 先看我的实测

Vibe Coding 是中年男人的钓鱼
我发现 AI 对于很多中年男人来说,就跟钓鱼一样,是一种合法且体面的独处方式。 中年男人的生活,大多处在一种身份叠加的夹缝之中。白天,他可能是部门经理,需要照顾团队绩效与上下级关系;晚上回到家,他是丈夫、是爸爸,要操心家里的大事小情;到了周末或节假日,又得参加各种社交,应付朋友之间的人情往来。总之,他生命里的每一分钟,好像都属于别人,唯独不属于自己。 于是钓鱼成了一种奇妙的避难所。当男人坐在河边,拿着鱼竿凝视着水面的时候,他拥有了一个无可辩驳的理由拒绝外界的干扰:"我在钓鱼呢"。简简单单五个字,构筑起一道旁人难以跨越的屏障,彻底保护住那段名正言顺的孤独时光。 AI,其实也是同样的道理。 当深

使用 Claude Code:会话管理与 100 万 上下文
作者:Thariq Using Claude Code: Session Management & 1M Context 【注:Thariq 是 Anthropic 员工,Claude Code 的核心对外布道者。这篇本质是产品使用指南,有官方推广成分,但操作建议确实实用。】 今天,我们为 /usage 命令推出了一项全新更新,旨在帮助你更清晰地了解自己在 Claude Code 中的使用情况。这个决定的背后,是我们近期与用户进行的多次深入交流。 在这些交流中,我们反复听到了一个现象:大家在管理会话时的习惯可谓是五花八门。尤其是最近 Claude Code 将上下文窗口(Context Win

为什么你的"AI 优先"战略可能大错特错?
今天刷到《Why Your”AI-First”Strategy Is Probably Wrong》这篇文章(原文翻译我放到下面)几次,说点不一样的。与其说 AI First,不如说软件工程 First。 这篇文章看着在讲 AI,底下全是软件工程。 抛开后面讲组织和人的部分,原文前半段的重点简单总结一下: AI 时代,人成了瓶颈。 PM 花几周做需求,AI 两小时就能实现,PM 成了瓶颈。QA 测三天,AI 写代码只要两小时,QA 成了瓶颈。团队 25 个人,对手几百人,人力也是瓶颈。 怎么办?把人从链条里拿掉。 AI 写代码、AI 审查代码、AI 跑测试、AI 部署上线、AI 监控线上状态

“多智能体协作指南:五种主流模式怎么选、怎么用?”
在之前的一篇文章中,我们探讨了多智能体 (Multi-agent) 系统何时能发挥最大价值,以及什么时候只用单个智能体 (Agent) 其实更好。这篇文章则是为那些已经决定采用“多智能体”路线的团队准备的:面对手头的问题,到底该选哪种协作模式? 我们常常看到,有些团队在挑选模式时,只顾着选听起来“高大上”的,却忽略了到底适不适合手头的问题。我们的建议是:从最简单的、能跑通的模式开始,观察它在哪里会遇到瓶颈,然后再逐步升级。 今天这篇文章,我们就来拆解五种常见模式的运作原理和局限性: 生成 - 验证者 (Generator-verifier):适用于看重输出质量、且有明确评估标准的场景。 调度