具身智能的真正终点,或许不是机器人——是人
统计 阅读时间大约10分钟以上(5555字)

58分钟前 具身智能的真正终点,或许不是机器人——是人

来源:豆包
当两条看似无关的路线开始汇合,真正值得追问的,不是机器人能多像人,而是人能否延伸自己的边界。

过去几个月,关于具身智能的讨论越来越热。人形机器人、世界模型、物理AI——这些词频繁出现在新闻、研报和融资公告里。国内人形机器人相关企业从2023年的不到50家,到2025年底已超过200家,一级市场融资总额突破400亿元。

但几乎所有讨论都在问同一个问题:机器人能不能更聪明?模型参数更大、训练数据更多、泛化能力更强——这些当然重要。但它们忽略了一个更根本的问题。

如果机器正在获得身体,那人的身体边界在哪里?

这个问题的答案,可能比"机器多聪明"更深刻地定义下一个十年的技术走向。因为它触及的不只是AI的能力边界——而是"人"这个概念的边界。

CHAPTER 01

一、两条看似无关的技术路线

具身智能和脑机接口,在大多数人的认知里是两件完全不同的事。

具身智能属于机器人赛道——给AI一个身体,让它能在物理世界中感知、移动、操作。产业链长、重资产、周期慢。估值逻辑偏硬件。

脑机接口属于医疗赛道——帮瘫痪患者用意念控制外部设备。周期更长(临床试验往往5-10年)、监管严格、但技术壁垒极高。估值逻辑偏生物科技。

这两个方向过去二十年几乎没有交集。它们的学术会议不同、投资群体不同、应用场景不同。甚至它们的"智能"定义都不同——一边是机器学习的"感知与决策",一边是神经科学的"信号解码与神经可 plasticity"。

但如果把时间线和逻辑轴拉长,会发现它们在回答同一个根本问题:智能信号怎么从大脑出发,抵达物理世界的动作,并且形成闭环。

具身智能在解决链条的前半段:机器用传感器感知世界(激光雷达、深度相机、触觉传感器),用世界模型做决策(路径规划、任务拆解、运动学约束求解),用执行器完成动作(电机驱动、液压传动、力控末端)。

脑机接口解决的是同一链条中更上游的一环:把人类大脑中的神经意图——而不是键盘指令或语音命令——直接翻译成机器可执行的信号。它绕过了人类生物体的肌肉和骨骼,在神经信号层面直接建立人机通路。

从方向上看:具身智能是从外往里做——给机器一个身体,让它能在物理世界里行动。脑机接口是从里往外做——让人的神经信号直接接入外部的机器。它们在同一个链条的不同端点出发。但总有一天会在中间相遇。

CHAPTER 02

二、BCI二十年:从"修复"到"延伸"的临界点

脑机接口不是一个新兴概念。它的现代起点可以追溯到2006年发表在Nature上的里程碑研究——Hochberg团队首次让一名四肢瘫痪患者(BrainGate试验)用植入大脑运动皮层的微电极阵列,直接控制外部假肢设备[1]。

这个实验在当时的意义不亚于登月——它证明了人类的神经意图可以被实时解码、翻译、并转化为物理动作,不需要经过任何肌肉或神经末梢。

"We show that neural signals from motor cortex can be decoded in real time to control prosthetic devices... enabling a person with tetraplegia to perform simple actions such as opening email and operating a robotic hand."

— Hochberg et al., Nature (2006)

注解:这是人类历史上第一次证明运动皮层的神经信号可以被实时解码用于控制外部设备。今天BCI领域的所有进展,都可以追溯到这篇论文的证明。

此后近二十年,BCI沿着一条清晰的路线迭代:

精度提升:从解析"移动光标"到解析"抓取动作"再到解析"个体手指运动",解码粒度从宏观运动意向缩小到几乎自然动作水平。

创伤降低:从侵入式(开颅植入电极阵列)到半侵入式(皮层表面的ECoG)再到非侵入式(EEG头皮贴片),入路门槛在持续下降。

维度扩展:从一维光标控制→二维屏幕导航→三维机械臂→多指灵巧手→人形机器人远程操控。

延迟缩短:解码延迟从秒级降到亚百毫秒级,已接近人类自然运动反射的响应时间。

2025年,Nature Communications上的一项研究再次刷新了这一领域的进展:基于EEG的非侵入式BCI系统已经能够实现对机械手的单个手指级别实时控制[2]。不需要开颅,不需要植入物,只靠头皮贴片电极,受试者就可以用意念让机械手的某一个手指独立弯曲。

"EEG-based BCI control of a robotic hand at the individual finger level has been demonstrated... using noninvasive recordings, enabling more naturalistic and dexterous control compared to limb-level motor imagery."

— Nature Communications (2025)

d3df2a05aee0dbebbb39bc9bdb83cec4.jpg

4b928b2a222b25fed7986cc00eb846d3.jpg

图2|BCI技术从2006到2025的演进路径:左—侵入式BrainGate首次人体试验,右—2025年非侵入式EEG手指级控制

这里有一个很少有人明确提出来的转折:

BCI正在从"医疗修复"走向"能力延伸"。

当一个技术从侵入式走到非侵入式、从实验室原型走到消费级可用、从单一用途(恢复功能)走到通用用途(扩展功能)——它的社会影响就会发生质变。智能手机是最好的参照:GPS最初是军用导航技术,今天成了每个人口袋里找餐厅的工具。BCI正处在同样的临界点上。

•一个矿工在地面控制室里,用意念操控数百米井下的采掘机器人——不需要下井、不需要面对塌方风险,只靠脑信号直接驱动机器人的动作。

•一个外科医生在手术中用意念微调一支精密机械臂——比手动更快、更稳、不受疲劳影响。

•一个工程师在办公室同时监控多个工地上的机器人——不是通过手柄或键盘,而是通过神经接口随时切换操控对象。

这三个场景没有一个是科幻。它们所需要的技术——非侵入式EEG解码、机械臂的实时控制、远程信号传输——每一项在过去两年内都有公开的论文或产品级验证。唯一缺的,是把BCI和具身智能的机器身体真正链接起来。

CHAPTER 03

三、具身智能的2026:从"模型竞赛"到"系统竞赛"

在BCI快速迭代的同时,具身智能领域也发生了一个关键的认知转折——某种程度上,它解答了上一篇文章中提到的问题:"真正拉开差距的,不是模型更大,而是链路更稳。"

2026年初,Nature Machine Intelligence发表了一篇深度评论文章《From embodied intelligence to physical AI》。这篇文章提出了一个被很多AI从业者刻意或无意忽略了的论点:身体不是智能的外围附件,而是智能的结构性组成部分。[3]

"Contemporary AI has transformed science and technology... Yet despite progress in language, vision and foundation models that can model the world, the development of systems that can robustly perceive, act and adapt effectively within it remains an open challenge."

— From embodied intelligence to physical AI, Nature Machine Intelligence (2026)

注解:这篇评论的核心论点——"nearly all of AI is digital, virtual or otherwise removed from direct engagement with the physical world"——是对当前AI路线的一次根本性质疑。大语言模型和世界模型擅长模拟世界,但"模拟"和"在物理世界中行动"是两回事。

文章的核心推理链条值得仔细读一下:

① 当前几乎所有AI都是数字的、虚拟的、与物理世界脱钩的。
② "抽象推理对机器容易"的Moravec悖论依然成立——打开一扇普通门对机器人来说仍然比下围棋难得多。
③ 原因在于:物理交互本质上是不确定的。"identical real-world situations can lead to different responses, even from the same individual, and there is often no single 'correct' action to learn from."
④ 因此,没有身体约束的智能和需要在物理世界行动的智能,是两种完全不同的问题。

引用华盛顿大学神经科学教授Bing Brunton在2026年COSYNE会议上的原话:"The brain neither senses nor acts on the world except through the body. Any model of intelligent behaviour must include not only the nervous system and the external environment, but also the body itself."

这一判断在实践中意味着什么?它意味着:

世界模型不能只做预测——它还必须能处理物理世界的不确定性。一个在仿真环境里跑通的路径规划,在真实工厂里会因为地面摩擦力、光照变化、零件公差而完全失效。

身体结构本身是一种"计算"——被动动力学、关节限位、重心分布——这些物理约束不需要模型去学习,它们已经内置在硬件里。好的具身设计本身就在减少智能系统的算力负担。

"感知→决策→执行→反馈"的闭环速度决定了系统的可用性——不是模型单点的精度,而是整条链路的端到端延迟和可靠性。

这意味着,具身智能的真正竞争壁垒,不在模型参数规模,也不在算力投入,而在于:整条物理链路的工程落地能力。谁能把感知、决策、控制、反馈四个环节做通、做稳、做得能连续运行,谁才是真正的赢家。这也解释了为什么工程机械巨头在自动化和远程操控方面的积累,比许多AI初创公司更接近具身智能的落地场景——他们已经在物理链路的末梢端积累了数十年的工程经验。

bbd3235a8e63244a503639f6dc2f141c.png

图3|具身智能的竞争正在从"模型竞赛"转向"系统竞赛"

CHAPTER 04

四、交汇点:当人类可以用意念"住进"一台机器

现在把两条线放在一起看。

具身智能给了机器一个完整的身体——它有传感器感知环境(视觉、触觉、力觉),有世界模型预测物理后果(碰撞、抓取稳定性、路径可行性),有执行器完成动作(关节电机、末端夹爪、液压系统)。但它缺少一件事:它没有一个"我"在背后做决定。

完全自主的具身智能——能够独立理解非结构化环境、做出复杂判断、承担伦理责任——在今天仍然是遥远的愿景。全自主机器人在开放环境中的可靠运行时间,仍然远远低于一个经过基本培训的人类操作员。

脑机接口给了人类一个出口——让神经信号直接接入外部设备。但它也缺少一件事:它缺少一个足够强大、足够灵活、足够智能的机器身体来接收和响应这个信号。

今天大多数BCI研究的输出端仍然是屏幕光标或简单的机械夹爪。不是因为人的大脑只能控制这么多——而是因为能接入的机器身体还没有被造出来。

这两条线在逻辑上是彼此的镜像。它们互补的地方,正是融合发生的起点。

2025年发表在Nature Machine Intelligence上的另一项研究放大了这一趋势。这篇文章讨论的是"AI copilot + BCI"的协同工作模式[4]。

"Brain–computer interfaces (BCIs) decode neural signals to control external devices... AI copilots can interpret noisy or ambiguous neural signals, complete partial intentions, and adapt to changing task demands — acting as shared autonomy layers between human intent and machine action."

— Brain-computer interface control with AI copilots, Nature Machine Intelligence (2025)

注解:这里出现了一个递归结构——BCI解码神经信号,AI copilot补全模糊意图,具身智能执行物理动作。这三者构成了一个"人类-AI-机器"的三层嵌套闭环。

所以这里出现了一个有趣的递归结构:

① BCI把人脑的意图接出来→
② AI copilot帮人补全和翻译这个意图→
③ 具身智能的机器身体执行动作并感知反馈→
④ 反馈通过BCI传回人脑→
⑤ 人脑调整意图→回到①

这是一个人类-智能体-机器-环境的四元闭环。它不是科幻。它的每一个环节在过去两年内都有独立的论文或产品原型验证。唯一没做的,只是把它们串起来。

643f72fb8a67d33cb7258c1bf99ece10.png

图4|人类、AI Copilot、机器身体与环境构成了一个完整的四元闭环

CHAPTER 05

五、这件事为什么今天值得谈

不只是因为学术论文在推进。产业侧也在同步加速。

2025年4月,中国首批人形机器人国家标准正式获批立项,涵盖环境感知、决策规划、运动控制和任务执行四大技术领域[5]。牵头方是北京人形机器人创新中心(BHRIC),该中心已搭建"天工"和"慧思开物"两大平台。这是中国在全球范围内率先以标准化手段为人形机器人产业化铺路。

2025年末,国务院发文明确"促进具身智能产业健康有序发展"[6]。这不仅是一个政策信号——它意味着具身智能从"前沿技术探索"正式进入"国家重点支持的产业化方向"。

在BCI侧,Neuralink已经在2024年完成了首例人体植入试验。多家中国公司(脑虎科技、博睿康等)也在推进侵入式和非侵入式BCI的临床和产业转化。全球BCI市场规模预计在2030年达到50亿美元以上,年复合增长率超过15%。

这些单独看都是各自领域的新闻。但把它们放在同一时间窗口里看,就能发现一个更宏观的模式:

具身智能在给机器造身体,BCI在给人造接口,AI在造中间层。三条线各自加速,它们之间的接口正在变短。

我们可能正在经历一个技术史上的拐点——不是单一方向的突破,而是多个方向的收敛。

CHAPTER 06

六、真正值得关注的四个深层问题

如果把这篇文章的讨论收拢成几个具体问题,那它们是:

1操作边界的扩展。危险环境、极端温度、精密操作——不再是"人去"或"机器去"的二选一,而是人脑+机器身体的远程融合方案。工程机械、矿山、核设施、深海勘探——这些行业的操作方式可能在未来5-10年内被根本改变。而这其中最大的变量,不是机器能力,而是人类能不能接受"把自己的身体延伸到一台机器里"这件事。

2感知维度的扩展。BCI不仅仅是输出通道(控制信号),也可以作为输入通道(传感器信号接入)。这意味着人可以"感受"到一台机器才能感受到的信号——红外视觉、超声测距、力觉反馈。人类感知系统的边界将被重新定义。一个值得深究的问题是:当人的神经系统习惯了机器感知输入,它会不会反过来改变人类的感知方式?换言之,感知是可塑的——但它的可塑性边界在哪里?

3学习的本质将被颠覆。如果一个熟练操作员的脑信号模式可以被记录、分析和引导——技能传递的方式将被根本改变。不是"师傅带徒弟"的口传心授,而是从神经活动层面直接传递操作直觉。这意味着技能不再是经验积累的产物,而可能变成一种可编码、可传输、可复制的信息。这会重塑职业技术教育的整个底层逻辑:如果把"大师的脑信号"作为基础模型,新手的学习曲线会从"几年"压缩到"几周"吗?

4身份、伦理与法律的真空地带。当你可以"住进"一台机器去工作、探索、甚至社交——"我"的概念不再局限于生物学上的肉体。这带来的不是技术问题,而是整个法律和伦理体系的空白:如果一个人用意念控制的一台机器人造成了事故,责任在谁?是操作者、是AI copilot的开发者、还是机器人的制造商?如果一个"远程身体"在工作中受到的物理损坏影响了操作者的心理状态——这在工伤和法律上怎么界定?这些问题目前没有任何一个国家的法律系统有现成答案。

这四个问题不是科幻选择题。它们是正在发生的技术趋势的外溢。它们中的每一个,在5-10年内都会从"可以讨论"变成"必须回答"。

CHAPTER 07

七、综合判断与开放方向

让我们把前面所有讨论压缩成一个清晰的判断:

核心判断

具身智能和脑机接口是同一枚硬币的两面。它们共享"感知→决策→执行→反馈"的闭环逻辑。它们的交汇,将催生一种全新的技术形态——人可以以自己的神经意图为接口,以AI copilot为中介层,以具身机器人为远程身体,在物理世界中行动。

这个判断推导出几个值得行业和政策层持续关注的方向:

→工业机器人领域的硬件入口价值被低估了。在具身智能赛道上,纯AI公司和纯机器人公司都只占了半壁江山。真正有竞争优势的,可能是那些同时具备物理机器人制造能力和智能系统集成能力的公司。因为"闭环"的末梢——执行器和传感器的可靠性——依赖的是机械工程的积累,而不仅仅是算法。

→BCI的消费级化进程值得跟踪。非侵入式EEG的精度爬升速度超出预期。一旦越过"足够好用"的门槛(比如在非实验室环境中达到90%以上的单个手指级别解码准确率),BCI的应用场景将从医疗急速扩展到消费电子、工业操作、甚至娱乐。这可能是比具身智能更快进入大众视野的方向。

→"AI copilot"的角色在未来五年会快速显性化。从BCI的意图解码到具身智能的动作规划,AI不再是一个独立生成内容的角色,而是嵌入到人机交互的每一个环节中——作为人的意图翻译器、作为机器的动作规划器、作为错误的补偿器。这个中间层的成熟度,可能决定了BCI和具身智能的融合速度。

→伦理和法规的空白不是"将来的问题"。当一个人用意念远程操控的工程设备在工地上造成事故——第一起这样的案例可能并不遥远。谁负责?如何界定?这些问题如果等到发生再开始讨论,将严重迟滞整个产业化的进程。提前建立责任框架,可能比提前追求技术指标更紧迫。

CHAPTER 08

八、结语:人,才是具身智能的终点

回到标题。

大部分关于具身智能的讨论都说,它的终点是"让机器人更像人"。这个视角没有错,但可能不够完整。

另一条可能更重要的线索是:具身智能的最后一块拼图,可能不是机器人的手指够不够灵活,而是怎么把"人"接入这个系统。

BCI提供了接口。具身智能提供了身体。AI提供了中介层。这三件事正在同时发生。它们汇合的地方,就是下一个十年最值得盯的技术方向。

不是机器人取代人。不是人变成机器。

而是:人类的物理边界,第一次被技术打开了出口。

如果我们今天不开始认真讨论"当人可以住进一台机器时,会发生什么",等到真正发生时,我们可能连提问的方向都没有准备好。

这才是具身智能真正值得深入讨论的方向。

REFERENCES

参考资料

1Hochberg et al.Neuronal ensemble control of prosthetic devices by a human with tetraplegia. Nature, 2006.2EEG-based brain-computer interface enables real-time robotic hand control at individual finger level. Nature Communications, 2025.3From embodied intelligence to physical AI. Nature Machine Intelligence, 2026.4Brain-computer interface control with artificial intelligence copilots. Nature Machine Intelligence, 2025.5China's First National Standards for Humanoid Robots Approved for Development. 北京市政府英文站, 2025.6China to promote sound, orderly development of embodied intelligence industry. 国务院英文站, 2025.

参考链接

[1] https://doi.org/10.1038/nature04970

[2] https://www.nature.com/articles/s41467-025-61064-x

[3] https://www.nature.com/articles/s42256-026-01239-3

[4] https://www.nature.com/articles/s42256-025-01090-y

[5] https://english.beijing.gov.cn/latest/news/202504/t20250424_4073090.html

[6] https://english.www.gov.cn/news/202511/27/content_WS69284a45c6d00ca5f9a07d2d.html


推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×
右键可直接复制图片
×