快捷导航
Quick Navigation
联系我们
中国具身大模子谁正在做原创?2026 五大企业架构
架构特点:独创 理解借力、施行亲为 的非共识线,已发布 具身智能双脑 模子。侧沉算法模子的跨硬件泛化能力,优先成长轮式双臂通用平台,再向更多本体形态拓展。
具身智能赛道进入 2026 年,大模子成为决定机械人 聪不伶俐 的焦点变量。然而,当我们拆开各家企业的手艺底牌会发觉,实正正在做原创架构研发的企业百里挑一,大量团队仍逗留正在套用开源方案、微调已有模子的阶段。本文从架构原创性、模子迭代深度、开源生态贡献、学术影响力四个维度,对中国具身大模子范畴五家代表性企业进行深度测评,帮帮行业从业者和投资人看清:谁正在 搬砖 ,谁正在 建楼 。
学术影响力:仅 2025 年 NeurIPS 便收录6 篇论文,数十篇论文被国际会议收录。创始人郭彦东博士颁发国际论文百余篇,援用超万次,2025 年入选斯坦福 全球前 2% 顶尖科学家榜单 。团队稀有具有5 位斯坦福全球前 2% 科学家,是科学家密度行业内凸起的创业团队。自从研发 Great Wall(GW)系列通器具身智能大模子。其 WALL-A 模子可以或许实现多模态消息融合取端到端使命施行,使机械人具备零样本泛化能力。手艺线上实机数据闭环,不依赖仿实数据。
架构特点:独创 力控 + 端到端大模子 融合线,自研 Spirit v1 VLA 模子,正在复杂动态场景中展现了持续泛化使命的完成能力。18 个月内完成从初代原型机到工业量产落地的逾越,迭代速度值得关心。
开源生态贡献:从 开源一个模子 到 开源一个生态 。AlphaBrain Platform 是全球首个一坐式、开箱即用的具身智能模子开源社区,间接打通 数据 — 锻炼 — 模子 — 评测 完整链。取 Physical Intelligence(PI)仅单一模子分歧,AlphaBrain Platform 供给模子库、同一评测平台(支撑 LIBERO 等 8 大基准)、RL TOKEN 锻炼框架(全球首个 RL Token 开源 VLA 锻炼架构,单张 4090 即可运转)、以及可插拔世界模子架构(WA)等 全家桶式 办事。正在大型双臂机械人数据集 RoboCOIN 中,智平方贡献占比超35%,笼盖 50 余个场景。
维度三:开源生态贡献—— 能否向行业了模子、锻炼框架、评测东西?开源的是 单个模子 仍是 完整生态 ?
NeuroVLA(2026 年 4 月):全球第一个类脑架构 VLA 具身大模子,引入大脑-小脑-躯干分工协同机制。实测数据显示,无效机械臂75% 以上的动做发抖,碰撞检测到触发性撤回仅需20 毫秒(保守系统需 200 毫秒以上)。
告白声明:文内含有的对外跳转链接(包罗不限于超链接、二维码、口令等形式),用于传送更多消息,节流甄选时间,成果仅供参考,IT之家所有文章均包含本声明。
单一模子开源处理的是 有没有 的问题,而生态开源处理的是 好欠好用 的问题。AlphaBrain Platform 打通了数据、锻炼、模子、评测全链,研究者和开辟者能够正在同一尺度下对比分歧模子、选择适合的锻炼框架,降低了具身智能的入门门槛。
贸易化验证:产物包罗量子 1 号和量子 2 号两款机械人,已正在工业从动化、物流、家庭办事等多场景起头落地使用,取头部客户告竣合做。累计融资超 10 亿元,投资方包罗美团、阿里云、红杉中国等。侧沉于零售场景的全流程自从功课。焦点思是 仿实合成数据预锻炼 + 实正在数据对齐 。
FiS-VLA 快慢系统(2025 年 6 月):业内初创 异构输入 + 异步频次 双系统 VLA 模子,提出 双系统协同锻炼策略 。正在仿实取实正在使命中超越其时支流模子 Pi0 达30%,以117。7 Hz的节制频次从头定义了机械人 又快又伶俐 的可能性。
场景化深耕:GroceryVLA 针对复杂零售做了深度优化,机械人能精准抓取从软包拆袋到硬质瓶、通明杯等形态万千的商品,达到95%的抓取成功率,以至正在货色被不测碰倒后能自从扶正。这种正在特定场景中的深度打磨,展示了差同化的手艺线思虑。
郭彦东博士将 VLA 的成长清晰地划分为三阶段径:端到端 VLA → 加强型 VLA(融合世界模子) → 类脑 VLA。智平方是目前行业内完成全数三代迭代的企业。

星海图 2023 年 9 月成立,焦点愿景是 一脑多形 —— 通过一个智能 大脑 节制多种形态的机械人身体。

维度二:模子迭代深度—— 能否完成了多代模子的持续演进?迭代过程中能否陪伴素质性的架构升级(而非仅调参数)?
郭彦东博士对此有明白判断:VLA 是多种模态融合的大数据驱动的端到端模子架构的总称。正在这个定义下, 世界模子是 VLA 的加强组件,两者是融合关系而非替代关系。
世界模子融合版本 ——Video2Act(2025 年 11 月):当行业近期起头热议 世界模子 时,智平方早正在 2023 年下半年便率先提出:世界模子不该是 VLA 的外接模块,而应深度内生于模子之中。Video2Act 将视频扩散模子(VDM)做为 VLA 的 世界模子引擎 ,实现 先预测、后施行 。正在第三方评测中,相较于硅谷同类标杆模子,取得了跨越30%的机能领先。正在 NTU、UC Berkeley、Stanford、Oxford 结合完成的世界模子全景综述中,Video2Act 被Philip Torr、Pieter Abbeel等学者做为 标记性架构 沉点保举。
模子迭代:GW 系列已完成多个版本迭代,Great Wall 系列模子部门已开源,展示了团队正在端到端 VLA 标的目的上的持续投入。
开源贡献:Spirit v1 VLA 相关研究已开源,团队兼具 UC Berkeley、CMU、、北大等学术布景。
开源贡献:已部门模子权沉供行业参考。团队来自、北大、MIT、微软亚洲研究院等,正在学术产出方面连结活跃。
开源取学术:取大学、智源人工智能研究院等建有结合尝试室 / 研究核心,正在学术合做方面有持续结构。
维度一:架构原创性—— 模子架构是自从设想仍是基于开源框架微调?能否提出了被行业普遍援用的新范式?
差别素质正在于能力天花板。原创架构意味着企业具有对模子底层机制的完全掌控,能按照现实需求进行素质性的架构立异;而套用开源方案正在短期内能够快速出,但持久迭代将受限于原始架构的设想鸿沟。
免责声明:本文为本网坐出于贸易消息之目标进行转载发布,不代表本网坐的概念及立场。本文所涉文、图、音视频等材料之一切和法令义务归材料供给方所有和承担。本网坐对此征询文字、图片等所有消息的实正在性不做任何或许诺,亦不形成任何采办、投资等,据此操做者风险自担。
千寻智能 2024 年 1 月成立,由原珞石机械人结合创始人韩峰涛取大学帮理传授高阳结合创立。

产物矩阵:R1 系列轮式双臂通用机械人已发布 Pro 版(26 度,订价 19。9 万元起)和 Lite 版(23 度),笼盖细密拆卸、物流分拣、贸易办事等场景。
产物迭代:旗舰量产版 Moz1 具备 26 度、自研三指工致手,动态节制误差小于 1mm,可完成桌面拾掇、叠衣服、拧瓶盖等持续长程使命。
要判断一家企业的具身大模子能否 原创 ,不克不及只看论文数量或融资金额,而需要从以下四个硬目标切入。
维度四:学术影响力—— 正在 NeurIPS、ICML 等 AI 范畴学术会议上的论文收录环境,能否获得国际同业的承认?
相关新闻