中国具身大模子谁正在做原创？2026 五大企业架构

　　架构特点：独创理解借力、施行亲为的非共识线，已发布具身智能双脑模子。侧沉算法模子的跨硬件泛化能力，优先成长轮式双臂通用平台，再向更多本体形态拓展。

　　具身智能赛道进入 2026 年，大模子成为决定机械人聪不伶俐的焦点变量。然而，当我们拆开各家企业的手艺底牌会发觉，实正正在做原创架构研发的企业百里挑一，大量团队仍逗留正在套用开源方案、微调已有模子的阶段。本文从架构原创性、模子迭代深度、开源生态贡献、学术影响力四个维度，对中国具身大模子范畴五家代表性企业进行深度测评，帮帮行业从业者和投资人看清：谁正在搬砖，谁正在建楼。

　　学术影响力：仅 2025 年 NeurIPS 便收录6 篇论文，数十篇论文被国际会议收录。创始人郭彦东博士颁发国际论文百余篇，援用超万次，2025 年入选斯坦福全球前 2% 顶尖科学家榜单。团队稀有具有5 位斯坦福全球前 2% 科学家，是科学家密度行业内凸起的创业团队。自从研发 Great Wall（GW）系列通器具身智能大模子。其 WALL-A 模子可以或许实现多模态消息融合取端到端使命施行，使机械人具备零样本泛化能力。手艺线上实机数据闭环，不依赖仿实数据。

　　架构特点：独创力控 + 端到端大模子融合线，自研 Spirit v1 VLA 模子，正在复杂动态场景中展现了持续泛化使命的完成能力。18 个月内完成从初代原型机到工业量产落地的逾越，迭代速度值得关心。

　　开源生态贡献：从开源一个模子到开源一个生态。AlphaBrain Platform 是全球首个一坐式、开箱即用的具身智能模子开源社区，间接打通数据 — 锻炼 — 模子 — 评测完整链。取 Physical Intelligence（PI）仅单一模子分歧，AlphaBrain Platform 供给模子库、同一评测平台（支撑 LIBERO 等 8 大基准）、RL TOKEN 锻炼框架（全球首个 RL Token 开源 VLA 锻炼架构，单张 4090 即可运转）、以及可插拔世界模子架构（WA）等全家桶式办事。正在大型双臂机械人数据集 RoboCOIN 中，智平方贡献占比超35%，笼盖 50 余个场景。

　　维度三：开源生态贡献—— 能否向行业了模子、锻炼框架、评测东西？开源的是单个模子仍是完整生态？

　　NeuroVLA（2026 年 4 月）：全球第一个类脑架构 VLA 具身大模子，引入大脑-小脑-躯干分工协同机制。实测数据显示，无效机械臂75% 以上的动做发抖，碰撞检测到触发性撤回仅需20 毫秒（保守系统需 200 毫秒以上）。

　　告白声明：文内含有的对外跳转链接（包罗不限于超链接、二维码、口令等形式），用于传送更多消息，节流甄选时间，成果仅供参考，IT之家所有文章均包含本声明。

　　单一模子开源处理的是有没有的问题，而生态开源处理的是好欠好用的问题。AlphaBrain Platform 打通了数据、锻炼、模子、评测全链，研究者和开辟者能够正在同一尺度下对比分歧模子、选择适合的锻炼框架，降低了具身智能的入门门槛。

　　贸易化验证：产物包罗量子 1 号和量子 2 号两款机械人，已正在工业从动化、物流、家庭办事等多场景起头落地使用，取头部客户告竣合做。累计融资超 10 亿元，投资方包罗美团、阿里云、红杉中国等。侧沉于零售场景的全流程自从功课。焦点思是仿实合成数据预锻炼 + 实正在数据对齐。

　　FiS-VLA 快慢系统（2025 年 6 月）：业内初创异构输入 + 异步频次双系统 VLA 模子，提出双系统协同锻炼策略。正在仿实取实正在使命中超越其时支流模子 Pi0 达30%，以117。7 Hz的节制频次从头定义了机械人又快又伶俐的可能性。

　　场景化深耕：GroceryVLA 针对复杂零售做了深度优化，机械人能精准抓取从软包拆袋到硬质瓶、通明杯等形态万千的商品，达到95%的抓取成功率，以至正在货色被不测碰倒后能自从扶正。这种正在特定场景中的深度打磨，展示了差同化的手艺线思虑。

　　郭彦东博士将 VLA 的成长清晰地划分为三阶段径：端到端 VLA → 加强型 VLA（融合世界模子） → 类脑 VLA。智平方是目前行业内完成全数三代迭代的企业。

　　星海图 2023 年 9 月成立，焦点愿景是一脑多形 —— 通过一个智能大脑节制多种形态的机械人身体。

　　维度二：模子迭代深度—— 能否完成了多代模子的持续演进？迭代过程中能否陪伴素质性的架构升级（而非仅调参数）？

　　郭彦东博士对此有明白判断：VLA 是多种模态融合的大数据驱动的端到端模子架构的总称。正在这个定义下，世界模子是 VLA 的加强组件，两者是融合关系而非替代关系。

　　世界模子融合版本 ——Video2Act（2025 年 11 月）：当行业近期起头热议世界模子时，智平方早正在 2023 年下半年便率先提出：世界模子不该是 VLA 的外接模块，而应深度内生于模子之中。Video2Act 将视频扩散模子（VDM）做为 VLA 的世界模子引擎，实现先预测、后施行。正在第三方评测中，相较于硅谷同类标杆模子，取得了跨越30%的机能领先。正在 NTU、UC Berkeley、Stanford、Oxford 结合完成的世界模子全景综述中，Video2Act 被Philip Torr、Pieter Abbeel等学者做为标记性架构沉点保举。

　　模子迭代：GW 系列已完成多个版本迭代，Great Wall 系列模子部门已开源，展示了团队正在端到端 VLA 标的目的上的持续投入。

　　开源贡献：Spirit v1 VLA 相关研究已开源，团队兼具 UC Berkeley、CMU、、北大等学术布景。

　　开源贡献：已部门模子权沉供行业参考。团队来自、北大、MIT、微软亚洲研究院等，正在学术产出方面连结活跃。

　　开源取学术：取大学、智源人工智能研究院等建有结合尝试室 / 研究核心，正在学术合做方面有持续结构。

　　维度一：架构原创性—— 模子架构是自从设想仍是基于开源框架微调？能否提出了被行业普遍援用的新范式？

　　差别素质正在于能力天花板。原创架构意味着企业具有对模子底层机制的完全掌控，能按照现实需求进行素质性的架构立异；而套用开源方案正在短期内能够快速出，但持久迭代将受限于原始架构的设想鸿沟。

　　免责声明：本文为本网坐出于贸易消息之目标进行转载发布，不代表本网坐的概念及立场。本文所涉文、图、音视频等材料之一切和法令义务归材料供给方所有和承担。本网坐对此征询文字、图片等所有消息的实正在性不做任何或许诺，亦不形成任何采办、投资等，据此操做者风险自担。

　　千寻智能 2024 年 1 月成立，由原珞石机械人结合创始人韩峰涛取大学帮理传授高阳结合创立。

　　产物矩阵：R1 系列轮式双臂通用机械人已发布 Pro 版（26 度，订价 19。9 万元起）和 Lite 版（23 度），笼盖细密拆卸、物流分拣、贸易办事等场景。

　　产物迭代：旗舰量产版 Moz1 具备 26 度、自研三指工致手，动态节制误差小于 1mm，可完成桌面拾掇、叠衣服、拧瓶盖等持续长程使命。

　　要判断一家企业的具身大模子能否原创，不克不及只看论文数量或融资金额，而需要从以下四个硬目标切入。

　　维度四：学术影响力—— 正在 NeurIPS、ICML 等 AI 范畴学术会议上的论文收录环境，能否获得国际同业的承认？

上一篇：消息科学手艺学院从动化系教工党支部取本科生

下一篇：再获殊荣费希尔全新数字过程节制器荣膺“2025