博客 >

60万人在给AI表演生活

内容转载自微信公众号「银河叙事Pro」,作者:汤加,原文标题:[60万人在给AI表演生活],原文链接:[https://mp.weixin.qq.com/s/yh5caYADHBpNkRbwz6dr0Q]

这是一间被布置得很像“普通人家”的房子。

客厅处有放着抱枕的沙发,餐厅的餐桌上还插着一把可爱的小花。书房里,阅读灯以及一个放满了书的书架妥帖的被放在合适的角落,而卧室的大衣柜处还有正在等待熨烫的衣服。至于厨房,操作台面上的油盐酱醋罐更是一个都没少,甚至还有点像是刻意的生活痕迹。比如,一块随手丢在角落的抹布和正在工作的家用小电器。

但只要多看两眼,就会发现这里好像有点“不太对劲”。

“生活”其间的人无一例外,每个头部都戴着同一种碳灰色的设备,他们小心翼翼的进行着各种手部或脚部的动作,像是给身体套上了一层“外壳”。他们不说话,也不太交流,但都重复着自己“所属空间”生活时需要用到的一些动作。

像是从书架上取书,拧开调料的瓶盖等。有人正在使用空气炸锅,手停在半空中一瞬间,再继续往下。有人把餐桌认真地擦一遍又擦一遍。也有人开始熨烫起了衣服,挂烫机喷出的热气开始呼呼呼的传送。

但所有人的动作,都像是生活的“慢”倍速。怎么说呢?有一种不是在生活,而是在“演示生活”的感觉。而这些“拿”“取”“擦”“拧”……的动作也都一步步被拆解,像拼积木一样,被一点点的收集起来。

人们的头顶和房间布满了摄像头和传感器。“要让机器看懂,人是怎么擦干净一张桌子的。”

这里,是位于宿迁的京东机器人数据采集中心。

从“缺数据”开始的工程

过去时间里,关于具身智能(Embodied AI)的讨论越来越多。但相比语言模型在文本世界里的突飞猛进,机器人的发展始终显得有点迟缓。尽管近一年,机器人已经能够从跑步摔倒认不清轨道,到如今在春晚舞台上打个醉拳,但对于其他更广范围的应用,还是显得有点“杯水车薪”。

不过造成此问题的原因却并不复杂,和需要被大量数据训练的AI模型一样,具身智能机器发展稍慢的原因,也是因为没有足够的“身体经验”和数据“喂养”。一位此前参与过项目的算法工程师曾用过一个简单的比喻解释:“你可以让一个人看一万本书,但如果他从来没做过饭,那他还是有可能会把菜炒咸。”

而映射在具身智能行业的共识也就是,想要让具身智能完成更精细具体的工作,那当前的数据不够,尤其是真实生活世界的数据不够。

作为具身智能产业的核心“燃料”,真实场景数据直接决定着具身大模型的训练效果,也是当前产业从算法仿真走向实际落地的关键瓶颈。

(注:具身智能,简单来说就是能像人类一样,在物理世界中感知、决策并执行动作的智能,核心是让机器人拥有“感知—决策—行动”的闭环能力;具身大模型则是具身智能的“大脑”,负责处理数据、做出决策,其性能高度依赖真实场景数据的训练。)

中国信通院发布的《具身智能发展报告(2025年)》显示,具身智能正加速产业化,但数据集供给点状分散、采集成本高昂等问题,制约着技术规模化应用。换句话说,机器人运动控制的“小脑”能力虽然一直在不断提升,但决策核心的“大脑”,具身大模型,却因真实场景数据匮乏而训练不足,导致技术落地难以深入产业。

基于此,京东便把自己的优势完全的押注了上去。

零售门店、仓储物流、工业生产线、医疗场景、生活服务…这些遍布在京东运营过程中的场景几乎被同时打开。且为此,京东还搭建起了专门的“采集—标注—训练—验证”全流程数据流水线,就连计划的规模也近乎夸张,“两年内,1000万小时的人类真实视频,以及100万小时的机器人本体数据。”

这意味着,如果换算成时间,这将是超过一千年的连续影像。而在其间,人类的每一个动作,都将被不停地分解、记录以及标注。

一场正在发生的“经验复制”

长期以来,京东被定义为一家以供应链见长的公司。但在这项计划中,京东的角色再也不单是卖商品、提供物流和技术服务,而是成为“具身智能时代的坚实基础”。

尽管短期内,该项目意味着投入巨大、回报不确定。但另一方面,“数据资产”的想象空间也在迅速放大。毕竟,当数据被视为新的核心生产资料,谁掌握规模,谁就可能重写估值逻辑。

而为了实现“人类历史上最大规模的数据采集行动”这一新目标,京东计划发动约六十万人参与进来。其中,内部超10万名各类职业员工、外部最多50万各行业人员将共同参与。仅在宿迁,这个被视为起点的地方,就有接近10万人参与其中。在这里,有人做动作采集,有人做数据标注,也有人做质检,还有人负责设备维护和数据流转。

这些覆盖家庭、办公室、工厂、餐厅、环卫等超百个细分场景,共同构成了这场数据采集行动的底层模板。而这些参与其中的人,也不再只是简单的物流分拣员、工厂操作工,或者传统意义上的“蓝领”。他们在拥有这些身份的同时,还有了新的注脚,“一个为具身智能提供数据的数据生产者。”

就像在那间模拟家居的房子里,一个人反复擦桌子,看起来像是在做一件低效率、甚至有点荒诞的事情。但一旦放进产业链里,它就变了。这些动作被采集后,会进入京东数据的系统,参与到模型训练,最终反馈到真实的机器人应用中。

一个“擦桌子”的动作,可能会影响到未来某台清洁机器人的路径规划,甚至一整条生产线的效率。这或许就是具身智能和过去互联网产业一个很大的不同,不再只是简单的处理信息,而是直接作用在现实的生活世界里。

因为当“采集—标注—训练—验证”的流程被打通,数据模型、硬件和场景形成闭环,机器就也顺其自然开始具备了“迁移人动作行为”的可能。而那些在仓库,在数据采集中心学到的经验,也将借由具身智能可以被广泛用在工厂、医院,甚至城市街道小巷里。

普通人如何进入AI时代?

当然,如果把镜头从起初那间“慢动作的客厅”里再拉远一点,这件事的尺度或许会变得更加惊人。因为不止是全球最大的具身智能数据采集公司。更容易被忽略也更有现实感的,是那个“最多”。

“60万人参与”,听起来像一个简单的规模数字,但如果拆开来看,它其实对应着一整套新的就业结构。

在传统互联网时代,普通人很难直接参与到“核心生产资料”的生成中。代码、算法、平台,这些东西大多都只掌握在少数人手里。但在这套体系里,门槛被重新定义了。普通人不需要会编程,也不需要理解模型原理。甚至只需要把一个动作做得足够标准和清晰,这些最普通的生活技能,就可以转化为数据的价值。

就像在宿迁,不少参与者原本就是本地务工人员,但现在,他们的一天变成了对动作的拆解和重复。更有意思的,是它带来的社会层面的技术变化和进步。

此前,AI时代常常给人一种“门槛很高”的感觉,大多人提起来就是算法算力,高级工程师,科学家,好像都和普通人距离很远。然而在如今京东的体系中,它虽然没有让所有人都变成程序员,但是却让更多人以自己的身体经验参与了进来。

连会做饭打扫,整理物品,这些原本不被计价的能力,现在也可以被记录和利用。甚至在一些地方,这些“工作”正在形成新的“微型产业”。比如围绕数据采集,衍生出的培训外包、设备管理等一整套配套岗位。

而对更多地方来说,它不仅是一个科技项目,也是一种新的就业承载方式。

不过这件事也需要更为细化的考量和控制。

毕竟当人的动作被如此细致地记录,那些关于劳动价值、数据归属的问题,也会慢慢浮现。比如,一个人重复拧瓶盖的动作,最终被压缩进模型里,那它的价值如何分配?这些数据的边界又在哪里?

虽然这些问题,现在还没有明确答案。但京东也表示,对所有数据的采集,都将严格依法依规进行。

再回到那间“家居实验室”。一个人的打扫整理收纳被摄像头记录,被传感器捕捉。从表面看,这只是一次重复劳动。但它也说明了一件事,AI时代,并不是完全悬在空中的。普通人正在参与这场漫长的实践,并期待着更好的生活。