强化学习 vs 大语言模型:David Silver 1.1B融资押注的新AI范式
- 发布时间:2026-04-28 05:19:29
- 来源:真人1元1分红中麻将群资讯中心
- 栏目:新闻资讯
SEO资讯站持续关注真人1元1分红中麻将群的进展。
AlphaGo之父David Silver从DeepMind离职创办Ineffable Intelligence,这一举动在2026年春季迅速引发行业震动。公司成立数月即完成1.1亿美元种子轮融资,估值达51亿美元,领投方包括Sequoia和Lightspeed,Nvidia等机构跟投。
短期内,这一趋势可能加剧大厂的留才压力。更多DeepMind等实验室研究员或跟随类似路径离职创业,或转向高估值新贵,导致薪酬与股权竞争进一步升级。伦敦凭借DeepMind的历史遗产,正加速成为欧洲AI枢纽,美资实验室也在此扩大布局,人才争夺战愈发激烈。但我的判断是——这一流动方向虽清晰,实际规模与速度仍需持续观察。
当然,强化学习并非没有短板。其样本效率较低,在现实世界中精确定义奖励函数难度极大,早期训练过程往往成本高昂且不稳定。将复杂任务转化为可优化的信号,需要大量工程投入,波动性也远高于LLM的“拿来主义”。Silver的Ineffable Intelligence目前细节尚未完全公开,但从他过往成就和公开表态看,这条路更像可再生能源:初期投入大,却能带来可持续的智能跃迁,而非一次性消耗人类知识存量。
我的判断是,短期内LLM仍将主导应用落地,但长期看,强化学习作为补充甚至潜在替代的潜力不容忽视。这个方向是对的,但执行起来会更慢、更难。
长期看,若这一新范式取得实质突破,将重塑行业技术路线与人才估值。AI或摆脱纯人类数据依赖的瓶颈,走向更自主的创造性方向,强化学习专长研究员的稀缺性也将进一步凸显。当然,数据支持这个方向,但样本量仍有限,值得持续跟踪,现在下结论为时尚早。整个AI竞争格局,正在实验室与创业公司的双重博弈中悄然调整。
David Silver在公开表态中将人类数据比作化石燃料——它提供了一次性捷径,却存在清晰的上限。LLM再强大,本质上仍是复用存量知识,难以生成真正原创的突破性洞见。
年4月,AI融资市场再次出现一笔引人注目的早期交易。前Google DeepMind强化学习团队核心负责人David Silver创办的Ineffable Intelligence,在成立短短几个月后,便完成了1.1亿美元规模的种子轮融资,估值达到51亿美元。
这一转变的必然性在于计算资源的持续增长与强化学习的 scalability。论文强调,当计算规模扩大时,经验生成的速度和质量会形成正反馈,而人类数据池的增长却日益受限。Silver将Ineffable的战略定位为落地这一判断:构建能像生物一样在数字世界中自主探索的superlearner,而不是继续堆砌更多人类文本或代码。这条路短期内可能在游戏、数学模拟等反馈清晰的领域率先见效。
但若只停留在名人效应与资本狂热层面,很容易错过更本质的信号。Silver的转向,实质是从“人类数据时代”迈向“经验时代”的尝试,这与AlphaZero从随机自对弈中超越人类棋谱的逻辑一脉相承。创业者需审视自家技术栈:是否能构建有效的trial-and-error闭环与世界模型,而非单纯堆积参数或标注数据。
一句话总结,2026年AI创业中真正值钱的,可能不是海量人类数据本身,而是让AI通过持续交互自主发现知识的能力。这一转变并非彻底否定LLM路径,而是对其形成必要补充或挑战。数据支持这个方向,但样本量仍有限,值得持续跟踪,现在下结论为时尚早。
对手预判的出现,让不少内容站开始调整自己的打法。
固定链接:http://www5.name.ss7a.cn/6401.html
说明:本页为频道内容整理与信息归档页面,便于围绕当前主题做连续查阅与延伸阅读。