搜索引擎对移动优先索引的执行力度持续加强。
Silver的核心判断源于其在DeepMind的长期实践。AlphaZero不依赖任何人类棋谱,仅通过试错与自我对弈,就在围棋、象棋等多领域达到超人类水平。这一经验让他坚信,当前大语言模型本质上是人类知识的压缩机,擅长重组已有内容,却难以真正发现全新知识。Ineffable Intelligence的“superlearner”正是要回归纯经验路径:AI像早期进化过程一样,从空白起点与环境交互,逐步构建智能。
Silver在DeepMind的经历提供了关键线索。他带领团队打造的AlphaZero,完全不依赖人类棋谱或策略记录,而是通过自我对弈和试错从零超越人类水平。这种纯经验驱动的方式,如今被他带到Ineffable Intelligence,目标是打造“superlearner”——一种通过trial and error从空白状态发现知识和技能的系统,而非简单压缩现有数据。
今天,这一模式以创业形式重现,反映出AI行业正从scaling laws主导的大模型路径,向依赖经验的新学习范式转型。Ineffable的阵容组建,正在把实验室十余年积累的强化学习人才优势,转化为创业动能,显著放大从基础研究到产业应用的转化效率。
这条路径的成败将深刻影响AI未来走向:成功则可能从“数据饥渴”转向“经验自给”,重塑行业资源分配与工具链演进;若奖励设计或探索效率问题持续,则大概率回归RL与LLM的混合模式。无论哪种结果,都值得持续跟踪Ineffable后续的技术论文与演示——尤其在奖励函数与高效模拟上的进展。目前下最终结论仍为时尚早,行业内对此路径的长期可行性仍有不同声音。
这一事件远不止融资新闻那么简单。它清晰地显示,AI顶尖人才正从大厂实验室向高估值创业公司加速流动。David Silver Ineffable的团队组建过程,成为观察这一趋势的关键切口。DeepMind十余年积累的强化学习专长,正在以创业形式快速向产业端转化。
DeepMind强化学习领域的领军人物David Silver创办Ineffable Intelligence后,短短几个月便完成1.1B美元种子轮融资,投后估值达51亿美元。这一规模在欧洲AI初创中堪称纪录,Sequoia和Lightspeed领投,Nvidia、Alphabet等巨头跟进。Silver的目标是打造不依赖人类数据的“超级学习者”,通过强化学习从自身经验中迭代知识。
这一点目前行业内仍有不同声音。数据支持强化学习在特定领域展现出独特优势,但现实世界的复杂性远超棋盘游戏,样本效率和奖励设计等问题仍需时间验证。值得持续跟踪的是,Ineffable Intelligence的具体技术路径尚未完全公开,其进展可能需要数年才能清晰显现。但从AlphaZero的过往成果和Silver的毕生追求看,这条经验驱动的路径,或许正预示着AI从“人类数据时代”向“经验时代”的潜在转向。
但主流讨论存在明显盲区。大家容易被成功案例的光环吸引,却较少触及从规则明确的游戏环境到开放现实世界的巨大鸿沟。AlphaZero的胜利建立在明确胜负信号和有限状态空间之上,而现实世界的奖励函数往往稀疏且难以定义,这一点目前行业内仍有不同声音。
Silver将这类系统称为“超级学习者”,其核心在于能持续生成自身经验,发现人类未知的知识边界,比如AlphaGo那手著名的第37手神来之笔——完全超出人类棋手长期积累的直觉。这条路径的潜力在于打破模仿的循环,实现从零构建智能的跃迁,但其样本效率低和现实世界奖励函数定义困难,仍是早期阶段的显著挑战。
模型本质上是站在人类肩膀上进行模仿,难以产生真正超越已有知识的新洞见,幻觉问题和数据质量见顶也随之而来。有意思的是,行业内对这一上限的判断仍有不同声音,但Silver的观点为我们提供了一个值得持续跟踪的框架。
这个领域的竞争格局正在重塑,早期布局者的优势正在逐步兑现。