这项竞赛的目标井不是展示机器人已经能做什么,而是尽可能准确地界定它们暂时还做不到什么。 这正是产业决策最需要的信息。所以这次赛事,带来的不一定是榜单上的狂欢,但一定会帮助研究人员认清技术的真实状况。模型竟赛只是见证技术迅猛发展一方面, 如果 ManipArena 能够持续运行,它记录的将不仅是排行榜,更可能是具身智能走向产业化的时间刻度。 具身智能模型的结构性矛盾在于,一面是飞速迭代的模型,另一面则是滞后的基准线。 换句话说,具身模型一直没有一个科学、可靠的评测标准去让它从发散地“野蛮生长”到牟足劲儿地“向上生长”。 “木受绳以直”,具身模型也需要一个科学的 Benchmark 去精细地评估、诊断甚至是指导未来研究方向。但现状是,由于长期缺乏统一、高标准的真机测评体系,模型的迭代与产业化进程正深受制约。 事实上,任何产业从技术探索走向规模化,都会经历一个从“百花齐放”到“标准收敛”的阶段。 这是从多个万亿级市场规模的产业中验证过的成功路径,互联网时代,协议标准让全球网络互联互通;深度学习的爆发也离不开评测体系。它们并不直接创造产品,却决...
