Vbot × AIFUT大会:AI有了身体之后会发生什么?

4月8日至9日,由虚实传媒主办的AI FUTURE未来大会在北京智慧电竞赛事中心举行。现场汇集了来自人工智能、游戏、影视等不同领域的企业家与创作者,通过密集的观点交锋、不同形态的AI表达,以

4月8日至9日,由虚实传媒主办的AI FUTURE未来大会在北京智慧电竞赛事中心举行。现场汇集了来自人工智能、游戏、影视等不同领域的企业家与创作者,通过密集的观点交锋、不同形态的AI表达,以多元化的方式分享了对于 AI未来的深刻思考。

开场,碳基生命与硅基生命破次元合作,演绎中国风赛博电音。伴随着“唢呐天王”孙明川的唢呐声,Vbot超能机器狗快步上台,跟随音乐节奏灵活摆动,与川子进行着亲切的互动。

川子唢呐与Vbot超能机器狗互动

AI歌姬Yuri尤栗与智元机器人也一同参与其中,当人类传统乐器的悠扬旋律,遇上AI时代机器人的灵动舞姿,传统技艺与未来科技在舞台碰撞,构成了震撼心灵的艺术表达《泥与电的咏叹调》。

在主论坛环节,Vbot维他动力创始人兼CEO余轶南博士受邀出席,与虚实传媒创始人兼CEO数字生命卡兹克围绕“当 AI走出屏幕、进入物理世界,它将以什么方式存在、演进,并真正产生价值”这一问题展开。

以下为现场精华内容摘录:

卡兹克:你在地平线工作了十年,为什么会从自动驾驶转向机器人?

余轶南:其实从做学生的时候,我就有一个梦想是做机器人。自动驾驶某种意义上,是AI在物理世界落地的第一个实例。

本质上是在解决:AI如何在真实物理世界中完成感知、规划和控制。所以如果我们从这个层面来去看,汽车是一个两自由度的机器人,而机器人具备更高自由度。从自动驾驶到做机器人,并不是转向一个完全不同的方向,而是把同一个问题放到了更广泛的场景中去解决。我更倾向于把它理解为技术的自然跃升。

活动现场:余轶南与数字生命卡兹克对谈

卡兹克:现在具身智能赛道这么热,从自动驾驶出来的团队,优势到底在哪?

余轶南:具身智能不是一个行业和领域的产品,它渗透千行百业。

如果说优势,更多是我们完整跑通过从感知、规划到控制的技术链条,从算法到系统再到产品,有过大规模落地经验;其次是很多人讲物理世界,但真正做过全流程的团队不多,我们是做过的;第三是对用户需求的理解,这件事是长期积累出来的。

卡兹克:你们为什么一开始就选择家庭这个方向?

余轶南:我们一直相信机器人应该为人提供端到端的服务。很多人会把机器人理解为替代某一个具体动作,但机器人真正的价值,是把整个服务链路跑通。比如洗衣服,不只是“洗”这一个动作,而是从取衣、分类、放入洗衣机,到晾晒、收纳的一整套流程。今天的家电其实只能完成其中的某一个环节,而机器人要解决的是把整个流程打通。

我们相信机器人在一些具体场景下能够代替部分人力,给用户提供24小时、高质量、一致性的服务。从这个角度来看,家庭场景是最能体现机器人价值的地方。

外展现场,很多AI爱好者第一次体验牵绳就能走的「赛博遛狗」

卡兹克:现在大模型进步很快,但落到具身智能,还有哪些关键问题需要解决?

余轶南:核心还是数据和硬件。数字世界的AI之所以今天能够这么蓬勃的发展,其实是整个互联网的数字世界的数据在支撑,整个互联网的clip如果测算下来,与今天具身智能最大的公司所有的clip存在百倍差距。

所以可以看到,今天数据事实上是第一个最大的gap。同时,物理世界数据的采集成本更高,也更难规模化。

在硬件方面,现在机器人的动力系统(电机)扭矩密度还不够,带来成本高、自重高以及一定的安全风险。但是,我们更加相信的是模型本身是具备能够去控制复杂长链条的任务的能力,但是它其实需要包括数据、算力、本体硬件的配合。这些反而是慢的,模型今天其实已经跑得飞快。本质上,这是一个系统性问题,需要数据、硬件与模型能力一起往前走。

卡兹克:现在行业里概念很多,有没有被高估的技术?

余轶南:每个阶段都会有新的概念,这是正常的。今天你觉得某个方向是炒作,可能过一段时间再看,会发现里面其实有很多有价值的东西。技术的发展速度很快,更重要的是持续去验证哪些东西是能真正落地的。

卡兹克:为什么Vbot先做四足机器人,而不是直接做双足?

余轶南:一个技术从出现到商业化,通常会经历两个阶段:从原理验证到技术成熟,再到工程化落地。当前阶段,我们认为四足机器人的基础技术已经具备较强的产品化条件,所以更适合作为第一步。

但从趋势来看,双足机器人的稳定性问题正在快速被解决。从今年上半年开始,人形机器人逐步带动新一轮技术发展。我认为2026年,双足的整个原理性技术包括稳定性,能够彻底解决。未来,机器人会有各种不同的构型,百花齐放。

活动现场:余轶南与Vbot超能机器狗

卡兹克:机器狗和未来的人形机器人,在家庭场景里有什么区别?

余轶南:机器狗更容易被接受,技术成熟也更高,所以更适合先进入家庭。人形机器人适用场景会更多,不只是家庭,还包括各种服务场景。从长期来看,人形会是一个更重要的方向。

卡兹克:你认为机器人是真的可以“理解世界”还是单纯的模仿人类?

余轶南:对机器人来说,模仿和理解其实是一件事的不同侧面:模型通过对大量场景进行压缩,形成知识表达,这一过程本身包含了对世界的理解;而最终输出的动作看起来像模仿,但本质上是基于这些知识去解决新的问题。

卡兹克:机器人未来的架构会更多依赖端侧还是云端?

余轶南:从长期来看,完全依赖端侧是不现实的。端侧算力不是无限的,你不可能把整个世界的信息都压缩在一台机器的本地算力和存储里。更合理的方式是端侧和云端两者形成协同。

卡兹克:Vbot超能机器狗接入小龙虾之后,最大的变化是什么?

余轶南:最大的变化在于长程任务能力的提升。过去,机器狗更多是基于指令进行单步执行;对于长程任务的拆解、推理和执行能力不足。

小龙虾这样的Agent架构部署上去以后,首先它具有长程的任务的拆解和推理能力。其次,我觉得更神奇的、非常amazing的事情是——比如有一项能力,当前机器狗上并不具备。小龙虾会自己上网去搜索、查询,然后通过代码或者软件部署的方式,部署在端侧,把整个链路打通。我们第一次把它部署上去的时候,我当时的感受就是——这个东西活了。

活动现场:Vbot超能机器狗

从舞台共演到现场对谈,这场交流所指向的,是同一个趋势——AI,正在走出屏幕,进入真实生活。

当交互从指令走向协同,能力从单点走向完整服务,具身智能也不再停留在概念,而是开始走入普通用户家庭,成为真正的消费级产品。

👇🏻点击小程序,进入交付序列


资料来源:微信公众号
发布时间:2026年4月10日 21:40
原文链接:https://mp.weixin.qq.com/s/yyIJnhqkjE6Cd30RV1pQ