国资密集押注,深圳又诞生一家具身独角兽

来源:搜狐新闻 分类:财经
国资密集押注,深圳又诞生一家具身独角兽

界面新闻记者 | 陆柯言

界面新闻编辑 | 刘方远

深圳地区,具身智能产业再添一家新晋独角兽企业。

6月30日,跨维智能宣布成功完成B轮融资,此次募集资本达10亿元,投后企业估值超过百亿元,公司计划后续启动IPO流程。

观察本轮融资的投资方构成,国资背景企业占比较大:深创投与贵阳数字经济基金连续两轮加大投资力度,前海母基金、蓝思科技、工银资本、恒健资产、诸瑞资本首次加入,南山战新投、成都科创投、四川院士基金等老股东也继续增持。

值得注意的是,股东名单中出现了蓝思科技董事长周群飞,这是她首次个人投资一家具身智能公司。此前,蓝思科技作为跨维智能的客户与之有过合作。

跨维智能正式公布融资消息的前一天,深圳两家具身智能企业——自变量机器人与智平方,被曝出企业估值均突破200亿元。其中,自变量在短短两个月内完成四轮融资并完成交割,投资方包括字节跳动、小米、美团等企业。智平方则获得了近50亿元新融资。几乎在同期,极佳视界、千寻智能等公司也密集完成了各自的多轮融资。

短短几个月时间,具身智能赛道快速成长出多家估值逾百亿的独角兽企业。据IT桔子统计,2026年上半年内,流入具身智能与机器人领域的投资资金总和超过460亿元,但其中七成资金集中在前20家企业,市场马太效应明显。

跨维智能也成功跻身这一轮投资热潮的前排阵营。该公司成立于2021年,创始人系香港中文大学(深圳)终身教授贾奎。贾奎此前长期从事科研工作,主要研究方向为三维空间中的AI应用,跨维智能是国内最早将AI技术应用于三维空间的企业团队之一。这也直接影响了公司的技术发展方向:通过合成数据与物理仿真训练机器人,再将训练好的模型部署在实际工作场景中。

这在早期并非主流看法。行业内部曾普遍认为,依靠真机远程操控积累的数据就能训练出通用的机器人大脑。但贾奎指出,一位远程操控员每天能采集有效数据约100至150条,按照这个采集效率,要达到具身智能所需的语义泛化能力,理论上需要耗费约10万年时间。

当真机数据采集的效率瓶颈逐渐显现,仿真合成数据的路线价值被重新评估,产业界开始形成新的共识。

跨维智能已经建立起从生成仿真数据、训练模型到部署真机的一体化流程,由公司自研的DexVerse™具身智能引擎提供支撑。贾奎表示,这套系统可以将机器人新场景的研发周期缩短九成:一项泛智能制造场景的新任务,从造数据到训模型到能够正常上线工作,仅需6至8小时即可完成;一项人形机器人商业服务任务,从立项到落地通常只需要几天时间。

今年具身智能行业最受关注的话题之一,是继VLA(视觉-语言-动作模型)出现后,几乎所有头部公司都开始重点讲述世界模型相关理念,跨维智能亦不例外。

贾奎的看法是,VLA本质上是一种“Shortcut Learning(捷径学习)”:机器人通过视觉感知、接收语言指令后直接输出动作,跳过了对场景背后物理规律的理解。尽管经过大量真机数据验证,这种端到端的建模方式在泛化能力上效率不高,遇到未见过的物体、环境或干扰时,模型容易失效。

不过,对于世界模型,行业并非全盘接受。智平方创始人郭彦东曾提到,当前被广泛讨论的世界模型本质上并非基于物理规律驱动,而是通过海量数据训练实现的。当数据量足够大,模型能知晓水杯会下落,但这并非物理规律的归纳总结,而是大数据学习的结果。

跨维智能近期推出的Dexterity-BEV,是其在世界模型上落地的具体方案。该方案借鉴了自动驾驶领域已经验证有效的BEV(Bird's-Eye View,鸟瞰视角)方法,将来自多个摄像头、多种传感器的原始观测数据统一压缩进一个可直接调用的物理坐标系,使系统能够在三维空间中理解世界,自动驾驶技术正是依靠这一步骤实现了重要技术突破。

跨维智能希望将这套逻辑应用于机器人领域:将视觉输入、机器人关节状态、末端执行器的目标动作,统一对齐到同一个BEV坐标

相关推荐