“小参数、高性能、全开源。
9项全球第一,全栈开源。
2026开春,人形机器人第一股优必选正式开源其具身智能大模型Thinker的架构升级版。在英伟达、字节跳动、北京智源等全球顶尖梯队的混战中,Thinker以不到10B的小身板,横扫了空间理解、任务规划等9项核心权威基准。
优必选具身智能大模型Thinker在9项权威基准评测中排名全球第一
(数据更新至01/30/2026,结果基于flageval, evalscope框架评测)
这不是一次寻常的模型发布。当很多机器人还在实验室里摆弄衣服、分拣胶囊,拍着精美的演示视频时,优必选已经带着搭载Thinker的机器人走进了真正的工厂。
这也并不只是在榜单上拿个第一。它更意味着,整个行业正在重新思考什么是“智能”。过去我们看机器人会不会答题、会不会聊天,而现在我们更关心它能不能在真实环境里把活儿干明白、干踏实。
01.
性能标准:从追求“刷榜冠军”到产线“全勤长工”
在具身智能领域,我们必须戳破一个泡沫:参数量大,不代表脑子好使。
传统的VLA模型多基于互联网视频训练,它们看惯了第三人称的上帝视角,一旦切换到机器人的第一视角,往往会陷入“想得到但抓不准”的空间迷失。
这样的视角错位是致命的,因为现实产线要的不是那种空有逻辑、在试卷上考满分的“学霸”而是能在动态光影和嘈杂背景下,死磕0.1毫米定位偏差的硬核长工。
Thinker的逆袭,本质上是实干智能对表演智能的降维打击。
在涵盖Robovqa和Egoplan-bench2等核心基准的测试中,Thinker斩获了SOTA成果。它解决的是机器人最扎心的三个痛点:视角适配难、视频推理易断片、专属数据荒。
Thinker-4B 全球基准评测实测全榜单数据
这种对比极其犀利。相比Figure、宇树等侧重语言交互或实验室演示的模型,Thinker的每一行代码,目标都极为明确:不是为了在摄影棚里表演,而是为了让机器人在杂乱的工厂环境里精准稳定作业。
02.
Thinker解构:“小体积大能量”的通用大脑是如何炼成的?
为什么Thinker能以小博大?这绝非偶然。它不再单纯依赖暴力堆叠参数,而是重构了具身智能的推理路径。其高性能源于一套可复制的、以数据为中心的工业化训练体系。
优必选具身智能大模型Thinker技术架构图
突破一:数据炼金术,从20B原始荒原到10M黄金数据集
具身智能领域的共识是:数据决定上限。但行业长期面临数据贫血,互联网数据虽多,但大多是看客视角,缺乏物理世界的分寸感。
对此,优必选构建了一套全流程自动化的“精炼提纯”流水线。面对20B规模的原始数据,Thinker先通过定制规则筛选出1%的候选池,再引入大模型进行多维度深度评分。最终淬提炼成出约10M级别的高价值黄金数据集。
配合涵盖“任务-功能-分类-模态”的L4级精细标注标准,Thinker系统地强化了其多维度、高质量的数据供给,能够更精确地理解时空关系与动作序列。换句话说,它不再是站在旁边的看客,而是拥有了真正的三维直觉。
Thinker训练数据类型分布
突破二:极致效能架构,把大脑塞进指尖
在工业产线,0.1秒的延迟就意味着一次事故。Thinker死磕10B以下的小参数架构,核心目标只有一个:实时响应。
相比动辄百亿千亿参数的巨型模型,Thinker以更轻量的体量拿下了9项全球第一。这种精干的架构让部署成本更低,能直接在Walker S2本体算力上实现毫秒级响应。
为了弥合“想得到”与“做得到”之间的鸿沟,Thinker创新地采用“视频+关键帧”联合输入,强化了对动作末尾关键信息的捕捉。它治好了机器人容易遗漏结尾信息的健忘症,确保了操作的每一个微小环节都能精准闭环。
突破三:转动数据飞轮,让机器人越干越老练
真正的强大不是模型发布的瞬间,而是它进入工厂后的自我迭代能力。
优必选创新性打通数据回流机制,让数据飞轮真正转了起来。当Walker S2在工厂分拣工件时,一旦遇到光影畸变、非标件堆叠等失败案例,系统会自动捕获这些异常并反向注入训练集。为了让这种进化不被成本拖垮,优必选通过大模型辅助标注与多模型交叉验证,将人工参与率降至1%以下,成本直降99%。
在这种“标注-训练-反馈-迭代”的闭环中,Thinker进化成了一个深谙产线规则的数字大脑。得益于这颗大脑的精准调度,Walker S2 拥有了老技工般的直觉,在搬运、分拣等实战场景中,实现了99.99%的作业准确率。
具身智能大模型Thinker的应用闭环 编辑
03.
全栈开源:以通用底座,为产业按下加速键
优必选开源Thinker,远不止于发布一个模型。此举的核心,是“人形机器人第一股”在深化其软硬一体全栈布局的同时,为行业提供了一个经过工业验证的通用技术底座。
长期以来,具身智能领域评测标准不一,实验室性能与工业场景需求脱节。Thinker的开源,相当于为全球开发者提供了一把基于真实物理世界的标尺,推动技术研发从虚拟演示回归到务实执行。
更具价值的是,面对医疗、能源、物流等碎片化场景,Thinker这个经过工业验证的通用基座,让开发者与企业无需从零“造轮子”,可以“拎包入住”,将精力聚焦于解决行业特有难题,大幅缩短机器人从技术到产品的落地周期。
从更广的视野看,这亦是构建产业生态的关键一步。通过开源,优必选正将中国的制造业场景优势,转化为参与定义全球技术生态的主动权。
具身智能的终极愿景是让机器人融入千行百业,这绝非单一公司能实现。Thinker的开源,正是以开放协作的方式,为整个领域预留了持续迭代与进化的技术空间,为机器人真正走进人类生产与生活的进程,按下了加速键。
开源代码网址:
https://github.com/UBTECH-Robot/Thinker
权重链接:
https://huggingface.co/UBTECH-Robotics/Thinker-4B
论文链接:
https://arxiv.org/abs/2601.21199