如何评价Rich Sutton关于「LLM是死路」的观点?
AI Summary1 min read
TL;DR
Rich Sutton认为强化学习是AI的基础,强调通过经验学习,而LLM仅模仿文本。他主张持续学习和可扩展方法将取代LLM,并批评当前AI泛化能力不足。
Rich Sutton近期的采访:https://www.youtube.com/watch?v=21EYKqUsPfg 主要观点: 1. RL是「基础AI」,核心在于理解世界并决定「做什么」(通过经验学习),而LLM则旨在模仿人类和文本 2. 尽管LLM的拥趸认为LLM是「苦涩教训」哲学的成功,但Sutton并不认为LLM真正遵循了这个原则。最终真正可扩展的、仅依赖经验和计算的方法将取代LLM 3. 萨顿强调了持续学习(continual learning)的重要性,这是所有哺乳动物都具备的能力,但目前AI系统缺乏。 4. RL的「经验流」范式:智能的基础是持续地调整行动以最大化奖励,知识内容必须能通过与经验流的比较来测试和学习。 5. 人类在工作中获取的巨量“背景”(Context)和信息,并不仅仅来自奖励。他认为目前的深度学习方法在跨状态或任务的良好泛化方面非常欠缺,当前的成功泛化往往是研究人员精心设计的结果,而非算法本身驱动。 6. 他认为AI历史上最大的胜利是「弱方法」(如搜索和学习)彻底战胜了「强方法」(注入人类知识的系统)。尽管AlphaGo/AlphaZero的成功引人注目,但从他的角度看,这更多是现有RL技术的规模化和应用,而非全新的突破。