宝玉的博客
Baoyu
RSSzh

宝玉的博客

Information
Website
Baoyu
Followers
Following
AI Overview
2 posts analyzed·Updated 3/12/2026

Key Highlights

  • AI编程工具(如Opus 4.5、GPT-5.2)已达到能生成高质量代码的水平,许多开发者已完全依赖AI编写生产代码,软件工程正经历根本性变革。 1 post

  • 传统产品需求文档(PRD)流程因编程Agent而终结,实现成本极低导致评审成为新瓶颈,工程、产品、设计角色需融合并提升系统思维能力。 1 post

  • AI写代码将导致编程语言专精、原型开发等传统技能贬值,但软件工程中的架构设计、测试验证、技术债管理等能力价值大幅提升。 1 post

Main Topics (4)

Latest posts

website-logo

DeepSeek 的 10 万亿美元大战略

宝玉的博客

DeepSeek 的 10 万亿美元宏伟战略 作者:GDP (@bookwormengr) DeepSeek's 10 trillion USD grand strategy 你有没有想过,DeepSeek 到底打算怎么赚钱,而且是赚大钱? 他们没有像智谱(GLM)、月之暗面(MoonShot)和 MiniMax 那样推出有竞争力的编程订阅计划。他们没有多模态、语音或视频模型。时至今日,他们甚至连一个评测框架(Harness,用于测试和评估模型性能的基准测试工具)都没有(虽然最近听说他们开始招人做了)。而且,DeepSeek 还长期致力于开源,乐此不疲地分享自己的“独家秘方”。这难道是疯了吗?

website-logo

来自 Codex 官方团队的分享:如何把 Codex 用到极致

宝玉的博客

来自 Codex 官方团队的分享:如何把 Codex 用到极致 作者:jason (@jxnlco) Getting the most out of Codex 大多数开发者刚接触代码编辑类的 AI 智能体 (AI Agent) 时,通常只让它们干一件事:写代码。比如让它检查一下代码库,生成个差异对比 (diff),跑跑测试,然后再提个合并请求 (pull request)。 写代码确实依然是 Codex 的核心强项。但仔细想想,我们在电脑上做的大部分工作,本质上其实都和代码息息相关:执行终端命令、浏览网页、调用应用程序接口、导出文档、响应各种事件,或者是触发自动化流程。当 Codex 开始延

website-logo

为什么我不“凭感觉编程”

宝玉的博客

为什么我不“凭感觉编程” 作者:Jacob Harris Why I Don’t Vibe Code 最近网上关于“凭感觉编程”(Vibe Coding)以及大语言模型(LLM)将如何颠覆软件开发的讨论铺天盖地。据说,每一个新模型的发布都会把我们带入纯粹生产力的天堂,让我们能以光速发布软件,彻底消除产品开发中的所有摩擦和内耗。 或许吧,我姑且信之。但我自己,是不“凭感觉编程”的。 如果你觉得这套好用,那太棒了!我写这篇文章并不是为了探讨 LLM 的优劣,只是这玩意儿对我个人来说,从来没对过胃口。这篇文章,算是我简单盘点一下其中的种种原因。 我是个守财奴 我不是个原教旨主义者。我试过用集成在 I

website-logo

Forward Deployed Engineer:AI 时代的新宠岗位,到底干什么?

宝玉的博客

一场 AI 岗位的“军备竞赛” 先看看最近 AI 圈的一个关于新职位 Forward Deployed Engineer(FDE)的新闻。 Google 正在 FDE 岗位上加倍投入,并且大幅简化了面试流程。Google Cloud 的 CEO 托马斯·库里安(Thomas Kurian)宣布,他们在市场营销(Go-To-Market)团队下成立了一个全新的、以 AI 为核心的部门,并且正在为此疯狂招募 FDE。 听说,他们的面试流程已经被大幅压缩,从过去长达数周、多达 4-6 轮的面试,缩短到了仅仅两天内的两轮面试。看来 Google 对填补这些空缺不仅是渴望,简直可以说是迫不及待了。

website-logo

AI 时代到底该怎么管一个工程团队

宝玉的博客

Fiona Fung 在 Anthropic 大会上讲了 28 分钟,聊了聊 AI 时代到底该怎么管一个工程团队。 她做这套幻灯片时,Anthropic 还没有推出 Routines 功能。 三周后,Routines 上线了。这是一个让 Claude Code 在云端按计划自动跑任务的功能,不需要在本地一直开着终端。等到她真正站上 Code with Claude 2026 大会的讲台时,幻灯片里好几张就已经过时了。 Fiona Fung 是 Anthropic 旗下 Claude Code 和 Cowork 两条产品线的工程与产品负责人。她之前在微软干了十二年(从 Visual Studi

website-logo

为什么资深开发者讲不清自己的专业能力

宝玉的博客

为什么资深开发者总是无法传达他们的专业价值 作者:Tuhin Nair Why senior developers fail to communicate their expertise 你对下面这句话有什么感觉? “AI 智能体 (AI agents) 是软件开发的未来。我们再也不需要那些拖慢业务进度的开发人员了。” 如果你是一位资深开发者,并且认同这句话,那我可能要对你的专业水平打个问号了(我会解释原因的,我并不是在故意找茬)。 但如果你不是资深开发者,却认同这句话,我觉得你大概率是对的。 咦?这到底是怎么回事? 广告文案 (Copywriting) 的本质,其实就是让信息精准匹配它的受众

website-logo

Codex 的野心,MCP 和 Skill 的下一步

宝玉的博客

这段时间我在密集使用 Codex App、Cursor 等 Agent 应用,有件事越来越觉得有意思。 去年大家争的是谁家模型更强,今年争的好像变成了谁家窗口右侧更好用。 Codex、Claude 桌面版、Cursor 3.0、TRAE SOLO,这几家最顶尖的 Agent,在完全没有协商的情况下,几乎同时收敛到了同一个界面布局:左侧是项目和会话列表,中间是和 Agent 的对话,右侧是工作区,放着文件浏览、网页预览、文件变更审查这些功能。 肯定不是相互之间的抄袭,更像是当前 Agent 交互的最优解。 为什么是三栏 传统 Chatbot 只需要两栏,左边会话历史,右边对话窗口,你问它答,

website-logo

机器人的终局:英伟达 Jim Fan 宣告 VLA 时代结束,WAM 登场

宝玉的博客

Jim Fan 是英伟达机器人与 AI 研究组(GEAR Lab)负责人,过去几年主推的 GR00T 人形机器人基础模型用的是 VLA(Vision-Language-Action,视觉 - 语言 - 动作)架构。他刚在 Sequoia AI Ascent 2026 上做了一场 20 分钟的演讲,主题叫《Robotics' End Game》,第一件事就是宣布 VLA 路线过时——包括他自己半年前还在推的 GR00T。 取而代之的新范式叫世界动作模型(WAM),代表作是英伟达 2 月发布的 DreamZero。他把这套思路叫“底层同构”:复制 LLM(Large Language Model,

website-logo

裁员潮将持续,直到我们学会发掘 AI 的商业价值

宝玉的博客

作者:Arnav Gupta 在我们公司的高层办公室里,某处正躺着一份多达 8000 人的裁员名单。我有 10% 的概率在这份名单上。再过几天,也就是 5 月 20 日,我就能知道自己的命运了。 看到今天 Coinbase 宣布的“AI 裁员”消息,我决定写下这篇文章。我特意赶在 5 月 20 日之前动笔,因为我想分享一些最真实的看法,不带任何“我是走是留”的个人情绪。这些想法不仅与我是否被裁无关,也不仅仅局限于我所在的公司。它们来自我那些在各大中型企业工作的朋友们的真实心声。 现在有大量的文章在争论:这新一波的裁员潮(大家普遍认为是从杰克·多西裁掉 Square 40% 员工开始的)到底是因

website-logo

深度拆解:AI Agent Harness 的构造

宝玉的博客

深度拆解:AI Agent Harness 的构造 作者:Akshay 原文:The Anatomy of an Agent Harness 本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理,以及那些将“无状态”的大语言模型(LLM)转变为全能 Agent(Agent)的底层机制。 你可能已经开发过聊天机器人,甚至可能用一些工具搭建了一个 ReAct 循环 (ReAct:Reason + Act,一种让模型在行动前先进行推理的模式)。跑 Demo 的时候看着挺好,但一旦投入生产环境,系统就

website-logo

使用 Claude Code:HTML 难以置信的奇效

宝玉的博客

使用 Claude Code:HTML 难以置信的奇效 Markdown 已经成为 AI 智能体 (AI Agent) 与我们沟通时最常用的文件格式。它简单、便携、具备一定的富文本 (Rich text) 能力,而且极其容易进行人工修改。你甚至会发现,Claude 已经变得极其擅长在 Markdown 文件里用 ASCII (美国信息交换标准代码,这里指用纯文本符号拼凑成图表) 字符来画图了。 但是,随着 AI 智能体变得越来越强大,我开始觉得 Markdown 变成了一种束缚。面对动辄上百行的 Markdown 文件,我根本没有耐心读下去。我想要更丰富的视觉展现、明亮的色彩和直观的图表,而且

website-logo

Anthropic 兄妹 Dario Amodei 和 Daniela Amodei 最新对话:Claude 为什么一直限速?

宝玉的博客

在 5 月 6 日的 Code with Claude 旧金山场上,Anthropic 兄妹 Dario Amodei 和 Daniela Amodei 一起坐到了台上。这是 Anthropic 第二届开发者大会,同一天,Anthropic 刚刚宣布与 SpaceX 签下 Colossus 1 数据中心的全部算力(超过 300 MW、22 万张 NVIDIA GPU)。 主持这场对话的是 Anthropic 首席产品官 Ami Vora(2026 年 1 月接替转去 Labs 的 Mike Krieger)。话题从“指数曲线上的体感”开始,覆盖开发者生态、模型训练逻辑的下一步、Anthropi

website-logo

Boris Cherny:Claude Code 之后,写代码正在变成“管理 Agent”

宝玉的博客

Boris Cherny 是 Anthropic 内部 Claude Code 的创建者,从一个三人小团队的孵化项目做起,把“在 IDE 里按 Tab 自动补全一行代码”这件事彻底升级成“让 Agent 把整个项目写完”。Claude Code 在 2026 年初已经超过十亿美元年化营收,被 Anthropic 自己称为“史上从研究预览到十亿美元产品最快的一次”。 这次访谈来自 Sequoia 2026 年的 AI Ascent 大会,主持人是红杉合伙人 Lauren Reeder。 原始视频:https://www.youtube.com/watch?v=SlGRN8jh2RI 要点速览

website-logo

大多数公司根本没有为 AI 做好准备

宝玉的博客

作者:Daniel Miessler Most Companies Aren't Anywhere Near Ready for AI 并不是公司不想用 AI,而是他们根本用不了。 AI 不是问题,说不清目标才是问题 很多人抱怨 AI 总是无法满足他们的需求,感到十分受挫。但说句实话,真正的问题在于:他们自己都说不清楚到底想要什么。 我曾为全球顶尖的巨头企业、数百家初创团队,以及无数全球 1000 强里的中大型公司做过咨询。我发现,排名第一的致命问题就是:公司的愿景和目标极其模糊,而且朝令夕改。 AI 的核心优势在于“执行”。如果它不知道到底要执行什么,它就毫无用武之地。相反,那些非常清楚自己

website-logo

Demis Hassabis:AGI 还缺什么,智能体到底行不行,下一个科学突破长什么样

宝玉的博客

Demis Hassabis 是 Google DeepMind 的 CEO,也是 Isomorphic Labs 的 CEO。他在棋手神童和游戏开发者的身份之外,拿了认知神经科学的博士学位,研究海马体和记忆的工作方式。2024 年,他因为 AlphaFold 的工作获得诺贝尔化学奖。 这次他做客 Y Combinator 的 How to Build the Future 直播,和 YC CEO Garry Tan 聊了四十分钟。几个核心话题:当前 AI 范式距离 AGI 还差什么、智能体的真实水平、AI 在科学领域的突破模式,以及给深科技创业者的建议。 原始视频:https://www.

website-logo

深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区

宝玉的博客

深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区 作者:Manthan Gupta I Read Hermes Agent's Memory System, and It Fixes What OpenClaw Got Wrong 如果你读过我之前关于 ChatGPT、Claude 以及 Clawdbot 记忆系统的文章,你就会知道我一直在钻研同一个问题:这些 AI 智能体(AI Agent)到底是怎么记事的? Hermes Agent 对我来说格外有趣,因为这次我不需要只靠观察它的行为来搞“逆向工程”。Hermes 是开源的,它的代码库和文档都是公开的。所

website-logo

Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering

宝玉的博客

Andrej Karpathy 说,他已经记不清上次修改 AI 生成的代码是什么时候了。 Karpathy 参与创建了 OpenAI,在 Tesla 领导过 Autopilot 视觉团队,去年一条推文发明了“凭感觉编程”(Vibe Coding)这个词,后来被 Collins 词典选为 2025 年度词汇。 2026 年 4 月,Karpathy 在 Sequoia Capital 的 AI Ascent 现场接受合伙人 Stephanie Zhan 的访谈。这场 30 分钟的对话覆盖了他对编程范式剧变的亲身感受、Software 3.0 的实质、AI 为什么在某些地方极强而在另一些地方离谱地

website-logo

为 Agent 设计产品

宝玉的博客

原文:Designing for Agents 如果你和我一样,经常混在 X 上同一个信息圈里刷动态,那么你大概也见过这种说法:用户界面已经死了。 你会一边刷到“我如何用 Obsidian 搭建第二大脑”,一边刷到“Anthropic 彻底杀死了某某行业”这类帖子。然后很快,你就会看到有人说:一个产品如果不能被 AI 智能体(AI Agent)通过 MCP、API、CLI,或者介于它们之间的方式使用,那它就活不下去。 这个趋势在 Ramp 已经很明显。过去三个月里,随着越来越多客户开始通过 Claude、ChatGPT 和其他 AI 智能体进入我们的产品,我们 MCP 上的每周活跃用户增长了

website-logo

Cat Wu 面试了几百个 PM 候选人,几乎没人答对一个问题:AI 产品经理到底应该干什么?

宝玉的博客

Cat Wu 是 Anthropic Claude Code 和 Cowork 的产品负责人,和 Boris Cherny 搭档,带着团队把产品功能的交付周期从半年压到了一天。在 Lenny's Podcast 最新一期中,Cat 聊了 Anthropic 内部的速度文化、PM 角色的剧变、源代码泄露的善后,以及那个让开源社区炸锅的 OpenClaw 封堵决定。 https://www.youtube.com/watch?v=PplmzlgE0kg 要点速览 大多数 PM 候选人仍然在用 6-12 个月路线图的思维找工作,Anthropic 的节奏是一周甚至一天发布一个功能 Claude

website-logo

两小时激辩:黄仁勋为什么不怕 TPU、不怕华为、不怕出口管制?

宝玉的博客

黄仁勋最近接受了 Dwarkesh Patel 长达两个小时的高密度专访。这场访谈没有客套寒暄,只有密集的观点碰撞。如果你没时间看完,那就记住这一句话——掌控全球 AI 基础设施命脉的老黄,用这样一句话定义了 Nvidia 的使命: “输入是电子,输出是 Token,中间是 Nvidia。” (“The input is electron, the output is tokens. That is in the middle, Nvidia.”) 整场对话的气氛激烈又直白。主持人 Dwarkesh 在每个话题都紧追不放,尤其涉及中国芯片出口时,两人更是直接“杠”了整整二十分钟。老黄强烈反对

website-logo

设计圈的 Claude Code 时刻来了

宝玉的博客

Anthropic 今天发布了 Claude Design,第一时间体验了一下,震惊程度不亚于当年第一次用 Claude Code 写代码。借用 flypig 老师一句话: 刚才用了一下,这么说:Claude Design 让 Google 那个 Stitch 看起来像个笑话。 这就是设计领域的 Claude Code 时刻。 我不会说“设计已死”、“设计师要被替代了”之类哗众取宠的话,只是想说: 从想法到高保真交互原型的差距已基本消失,非设计师终于能独立产出可交付设计;设计师生产力指数级提升,但设计外包和传统设计工具要大幅缩水了。 今天 Figma 股价大跌也侧面印证了这一点。 先看我的实测

website-logo

Vibe Coding 是中年男人的钓鱼

宝玉的博客

我发现 AI 对于很多中年男人来说,就跟钓鱼一样,是一种合法且体面的独处方式。 中年男人的生活,大多处在一种身份叠加的夹缝之中。白天,他可能是部门经理,需要照顾团队绩效与上下级关系;晚上回到家,他是丈夫、是爸爸,要操心家里的大事小情;到了周末或节假日,又得参加各种社交,应付朋友之间的人情往来。总之,他生命里的每一分钟,好像都属于别人,唯独不属于自己。 于是钓鱼成了一种奇妙的避难所。当男人坐在河边,拿着鱼竿凝视着水面的时候,他拥有了一个无可辩驳的理由拒绝外界的干扰:"我在钓鱼呢"。简简单单五个字,构筑起一道旁人难以跨越的屏障,彻底保护住那段名正言顺的孤独时光。 AI,其实也是同样的道理。 当深

website-logo

使用 Claude Code:会话管理与 100 万 上下文

宝玉的博客

作者:Thariq Using Claude Code: Session Management & 1M Context 【注:Thariq 是 Anthropic 员工,Claude Code 的核心对外布道者。这篇本质是产品使用指南,有官方推广成分,但操作建议确实实用。】 今天,我们为 /usage 命令推出了一项全新更新,旨在帮助你更清晰地了解自己在 Claude Code 中的使用情况。这个决定的背后,是我们近期与用户进行的多次深入交流。 在这些交流中,我们反复听到了一个现象:大家在管理会话时的习惯可谓是五花八门。尤其是最近 Claude Code 将上下文窗口(Context Win

website-logo

为什么你的"AI 优先"战略可能大错特错?

宝玉的博客

今天刷到《Why Your”AI-First”Strategy Is Probably Wrong》这篇文章(原文翻译我放到下面)几次,说点不一样的。与其说 AI First,不如说软件工程 First。 这篇文章看着在讲 AI,底下全是软件工程。 抛开后面讲组织和人的部分,原文前半段的重点简单总结一下: AI 时代,人成了瓶颈。 PM 花几周做需求,AI 两小时就能实现,PM 成了瓶颈。QA 测三天,AI 写代码只要两小时,QA 成了瓶颈。团队 25 个人,对手几百人,人力也是瓶颈。 怎么办?把人从链条里拿掉。 AI 写代码、AI 审查代码、AI 跑测试、AI 部署上线、AI 监控线上状态

website-logo

“多智能体协作指南:五种主流模式怎么选、怎么用?”

宝玉的博客

在之前的一篇文章中,我们探讨了多智能体 (Multi-agent) 系统何时能发挥最大价值,以及什么时候只用单个智能体 (Agent) 其实更好。这篇文章则是为那些已经决定采用“多智能体”路线的团队准备的:面对手头的问题,到底该选哪种协作模式? 我们常常看到,有些团队在挑选模式时,只顾着选听起来“高大上”的,却忽略了到底适不适合手头的问题。我们的建议是:从最简单的、能跑通的模式开始,观察它在哪里会遇到瓶颈,然后再逐步升级。 今天这篇文章,我们就来拆解五种常见模式的运作原理和局限性: 生成 - 验证者 (Generator-verifier):适用于看重输出质量、且有明确评估标准的场景。 调度