AI无需人类数据就能学习?David Silver新公司Ineffable技术可行性分析
作者信息
作者:专题内容编辑
简介:内容运营编辑重点推进相关内容串联与同主题段落归纳,强调同类内容聚合与归档效率,主要负责内容归档与页面补料,保证文章具备基本的信息完整度和阅读路径,并根据当期话题做差异化补充。
发布时间:2026-04-28 05:19:24
文章热度
这也符合搜索引擎对内容“有用性”和“结构性”的双重要求。
当然,这条路径的挑战同样突出。样本效率低,现实世界的奖励函数难以精确定义,早期训练成本高且波动大。把复杂任务转化为可优化的信号,往往需要大量工程投入。数据支持这个方向,但样本量有限。相比LLM的“拿来主义”,强化学习更像从第一性原理重建智能,需要耐心和算力。值得持续跟踪,现在下结论为时尚早。
融资策略层面,Ineffable案例也值得拆解。David Silver不仅带来了DeepMind背景,还将Ineffable描述为“一生事业”,并公开表示未来个人从公司获得的收益将全部捐赠给高影响力慈善机构。这一表态将愿景提升到科学突破的高度,而非单纯商业回报。顶级VC往往被这类清晰、宏大的科学叙事打动,尤其当创始人有可验证的历史成就时。
Silver的核心判断源于其长期研究实践。在DeepMind时期,AlphaZero不吃任何人类棋谱,却通过纯trial and error超越人类,这证明AI能在空白起点上自发现规则。如今Ineffable Intelligence的“superlearner”延续这一逻辑,目标是让系统像达尔文式探索那样,从自身经验中构建全新知识,而非作为人类知识的压缩机。
长期看,若这一新范式取得实质突破,将重塑行业技术路线与人才估值。AI或摆脱纯人类数据依赖的瓶颈,走向更自主的创造性方向,强化学习专长研究员的稀缺性也将进一步凸显。当然,数据支持这个方向,但样本量仍有限,值得持续跟踪,现在下结论为时尚早。整个AI竞争格局,正在实验室与创业公司的双重博弈中悄然调整。
这一轮由Sequoia和Lightspeed联合领投,Nvidia、Google、DST Global、Index Ventures及英国主权AI基金等跟投,成为欧洲AI史上规模最大的早期融资案例之一。
年4月27日,TechCrunch报道了DeepMind强化学习元老David Silver创办Ineffable Intelligence的消息。这家伦敦实验室成立仅数月,便以51亿美元估值完成1.1亿美元种子轮融资,投资方包括Sequoia、Nvidia等重量级机构。公司核心目标是打造“超级学习者”,完全通过强化学习(RL)让AI从自身试错经验中自主发现知识,而非依赖人类生成的数据。
Silver将这类系统称为“超级学习者”,其核心在于能持续生成自身经验,发现人类未知的策略——正如AlphaGo那手著名的第37手,神来之笔往往超出人类棋手几百年积累的直觉。这种从第一性原理出发的自我迭代,让强化学习拥有理论上无限的突破潜力。
报道显示,多名前DeepMind staffers正被招募进入执行团队,这远不止是一次融资事件,而是AI顶尖人才从实验室向创业公司加速流动的最新信号。
Silver将这类系统称为“超级学习者”,其核心在于能持续生成自身经验,发现人类未知的知识边界,比如AlphaGo那手著名的第37手神来之笔——完全超出人类棋手长期积累的直觉。这条路径的潜力在于打破模仿的循环,实现从零构建智能的跃迁,但其样本效率低和现实世界奖励函数定义困难,仍是早期阶段的显著挑战。
媒体报道和业内初步反应多聚焦于融资规模与Silver的传奇背景。他主导开发的AlphaGo和AlphaZero曾在围棋、国际象棋等领域通过纯自对弈实现超人类水平,无需任何人类棋谱指导。公司网站强调这一雄心“媲美达尔文定律”,即从经验中构建所有智能。多数观点视其为RL路线对LLM的正面冲击,乐观者认为这可能开启通往超级智能的新路径。但大家往往只看到成功光环,较少提及从规则明确的游戏环境到现实开放世界的巨大适应鸿沟。
数据支持这个判断,但样本的覆盖面仍有局限。
固定链接:http://www5.name.ss7a.cn/images/6381.html
说明:本文为当前主题的频道整理页,正文与相关阅读会持续围绕同类信息展开。