华泰证券:RT-X提高机器人智能化水平 有望加快人形机器人产业化进程半岛全站app

 成功案例     |      2023-10-26 18:55:54    |      小编

  智通财经APP获悉,华泰证券发布研究报告称,10月4日DeepMind发布RT-X机器人大模型,并开放训练数据半岛全站app集Open X-Embodiment。RT-X由基于Transformer的RT-1-X模型和视觉语言动作模型RT-2-X组成。更大的模型容量与多种机器人数据的融合也使得R半岛全站appT-X泛化能力大大提高。该行认为智能化是影响通用人形机半岛全站app器人0-1的关键因素,RT-X模型的发展提高了机器人智能化水平,人形机器人产业化进程有望加快。

  涌现指大模型表现出模型较小时不具备的新能力。DeepMind开放的训练数据集Open X-Embodiment包含超过100万条真实的机器人轨迹数据,涵盖 22 种机器人。RT-X由基于Transformer的RT-1-X模型和视觉语言动作模型RT-2-X组成,庞大的数据集使其具有更强的性能。RT-2-X涌现能力约为RT-2的3倍,动作指令从传统的绝对位置拓展至相对位置。例如,之前机器人只能理解将苹果放在桌子的右上角的绝对位置指令,如今可以理解将苹果放在可乐和杯子中间的相对位置指令。RT-1-X模型在特定任务上(如开门等)的平均性能也比RT-1模型和原始模型提升50%。

  泛化是指模型在新场景下的适应能力。RT-2-X涌现能力约为原始模型的3倍,泛化能力从27.3%提高至75.8%。实验表明,更高的模型容量能够提高泛化能力,在其他条件如数据集和训练方式相同的情况下,55B的RT-2-X模型的泛化能力较5B模型从30%提高至61%。多种机器人数据的融合也提高了模型的泛化能力,RT-2-X模型在使用WidowX Bridge数据集后,掌握了原有数据集中不具备的额外技能,表现出了更好的工作性能和泛化能力。

  该行认为智能化是影响通用人形机器人0-1的关键因素,RT-X大模型的发展可提升机器人的智能化水平,多样化的数据集可大大提升模型的泛化与涌现能力。现阶段RT-X大模型仍存在改进空间,其没有考虑不同感知维度的数据,也没有精准实现正迁移的能力(加入新的机器人数据集后,模型泛半岛全站app化能力提高)。随着世界各地的实验室合作并共享数据资源,该行认为未来数据集将不断丰富,机器人大模型也将不断迭代,从而加速人形机器人产业化落地。

  风险提示:模型泛化能力不足,数据集训练结果不及预期,机器人通用性不及预期。