这家公司用游戏训练机器人,估值 23 亿美元

来源:搜狐新闻 分类:体育
这家公司用游戏训练机器人,估值 23 亿美元

投资人被打动了。 作者|桦林舞王 编辑|靖宇

两年之前,OpenAI 投出 5 亿美元想要收购 Medal,那是一个做游戏录像分享的网站。创始人 Pim de Witte 没有答应。

当时这一决定或许显得有些冒失。

General Intuition 的创始人 Pim de Witte|图片来源:techcrunch

时光来到 2026 年 6 月,de Witte 肩负的 AI 公司 General Intuition 赢得了 3.2 亿美元的 A 轮资金,公司评估值攀升至 23 亿美元,领投方是 Khosla Ventures,Jeff Bezos、Eric Schmidt 以及 Google DeepMind 和 MIT 的学者也参与投资。假若加上去年 10 月首轮融资时的 1.34 亿美元,累计融资金额现已超过 4.54 亿美元。回想起 OpenAI 当初 5 亿的报价,如今的 General Intuition 估值已是这个数字的四近五倍。市场正用资本雄辩地说明:这些游戏录像,其价值远超多数人的预料。

01 游戏录像的奥秘

要明白 General Intuition 的业务模式,首先需要弄懂一个基本问题——机器智能训练究竟需要啥数据。

传统的机器人智能培育主要有两种途径。其一是实地采集数据,代价高昂且耗时漫长;其二是依赖模拟器训练,虽速度快,却也潜藏着个普遍难题:「模拟与现实的鸿沟」。在 Unity 或 Unreal 中训练的模型,一旦放到真正的地板和墙壁前,往往举止笨拙,像个迷路者。

General Intuition 瞄准的区间是:游戏数据既不是纯粹的模拟,亦非真实场景,但它或许能充当两者之间的媒介。Medal 作为游戏录像分享网站,囤积了数十亿小时的游戏画面,但这些画面跟寻常的视频不同。正如 Crypto Briefing 的研究揭示的,General Intuition 掌握的资料是「每帧画面都精确对应玩家实际操作——鼠标动向、按键行为、战略选择」的数据。

这种带玩家操作记录的游戏录像,具备普通录屏所欠缺的特质:你看到的不仅有人物活动,还能知晓玩家在那一刻做了怎样的决定。de Witte 在访谈中提及的一句话,点出了传统大模型路径的局限:「人类借助文字描绘世间万象,但在这一过程中,大量细节被忽略。」他们追求的是更本源、更贴近感知层的数据,而非人类经过语言概括的二手信息。

02 8 分钟的飞跃

在纽约的发布会现场,General Intuition 进行了一个令人印象深刻的演示,细节值得细细品味。他们运用游戏数据预先训练了一个空间推理模型,随后仅用 8 分钟的实体机器人运行数据完成微调。这个机器人曾在街道上采集了 8 分钟的资料,随后被送入一个从未涉足过的室内环境,依然能够顺畅导航。

8 分钟,这个数字至关重要。

游戏录像中汇集了海量的虚拟空间信息|图片来源:General Intuition

通常的机器人训练需要在既定环境中反复采集海量资料,或是在高度仿真的模拟器里进行成千上万次测试。而 General Intuition 的构思是:游戏数据已为模型奠定了足够扎实的空间推理根基,使其迁移至真实世界所需的「真实数据微调量」得以大幅削减。

这套逻辑听上去相当精妙。但现阶段仍有个疑问悬而未决——这种迁移的适用范围究竟有多广?从街道到办公室的演示虽属成功,但面对复杂的工业环境、多变的光影条件、地面材质的差异,这些场景能否同样通过 8 分钟的数据完成桥接?目前还没有公开的基准测试能给出答案。AI CERTs News 的分析也指出了这一点

相关推荐