👁 善用AI洞察,成就专业投资,汇聚牛股名单。网络星期一限量抢!手慢无

国泰君安:2024年人形机器人最具突破性的进展主要体现在具身智能领域

发布时间 2024-8-22 09:32
更新时间 2024-8-22 10:35
© Reuters.  国泰君安:2024年人形机器人最具突破性的进展主要体现在具身智能领域
TSLA
-

智通财经APP获悉,国泰君安证券发布研报认为,2024年人形机器人最具突破性的进展主要体现在具身智能领域,各大研发厂商先后发布相关进展,特斯拉(TSLA.US)发布视频,展示Optimus精准分拣特斯拉电动车4680电池的场景。国内人形机器人产业硬件供应链优势明显,但在具身智能、数据采集、人才领域的短板需要补齐。分层端到端是目前具身智能的主要路径,一般分为三层:基础大模型(LLM或VLM)、决策大模型、操作大模型。其中在操作大模型领域,大多数厂商都刚起步。

2024年人形机器人最具突破性的进展主要体现在具身智能领域:3月,Covariant发布端到端具身大模型RFM-1,具身智能创业团队Sergey Levine和Chelsea Finn创立Pi(Physical Intelligence),Figure AI发布接入OpenAI GPT-4V的Figure 01 demo。4月,李飞飞创立World Labs,致力于解决AI在三维空间感知和理解方面的难题。5月,特斯拉发布视频,展示Optimus精准分拣特斯拉电动车4680电池的场景,使用完全端到端神经网络,只利用2D摄像头视频和机载自传感器,直接生成关节控制序列,完全靠视觉辅助和人类示范进行训练。国内人形机器人产业硬件供应链优势明显,在具身智能、数据采集、人才领域的短板需要补齐。

分层端到端是目前具身智能的主要路径。大模型分为非具身大模型(基础大模型)、具身智能大模型(机器人大模型),区别是能否生成运动姿态。非具身大模型如GPT、Sora等,输入和输出的模态都是语言、图片和视频。具身智能大模型输入视觉、语言信号,输出三维物理世界的操作,其中,端到端的具身大模型对数据和算力要求高,如Tesla FSD、谷歌RT模型;Figure AI等大多数公司都采取了分层端到端的具身大模型,一般分为三层:基础大模型(LLM或VLM)、决策大模型、操作大模型,其中决策大模型以ChatGPT for Robotics、谷歌PaLM-E为代表,技术方向从LLM 向强化学习(RL)演进,基于RL的范式可以使模型能够在不同环境和任务中学习和适应,实现更高级的决策能力。操作大模型根据决策大模型的输出执行具体动作,需要与机器人硬件深度集成,且必须通过数据采集来实现,技术方向从“MPC+WBC”向“RL+仿真”演进,MPC更适合具有精确模型和短期优化目标的场景,RL更适用于不确定性高、需要长期学习和自适应的环境。在操作大模型领域,大多数厂商都刚起步。

数据采集的主要方式:远程操作、仿真合成数据。互联网上各类文本、图像和视频数据集庞大,机器人的场景和交互有价值的数据量小,限制了AI模型在人形机器人上的泛化能力。特斯拉Tesla Bot开发团队使用人类的真实运动方式来训练机器人,英伟达推出MimicGen和Robocasa模型,通过真人的遥操作数据捕获,再通过生成合成运动数据和模拟环境,加速机器人技术的研发和应用。国内人形机器人创新中心加速建设人形机器人训练场。

具身智能估值逻辑:硬件、数据、模型、人才。硬件是一切的基础,如果没有自己的硬件,就无法根据算法和数据进行硬件的快速优化和修改。涉及数据的采集、组织管理以及与模型的闭环开发,需要有强大组织能力的团队,核心团队需要具备组织大规模工程师的经验;越来越多的算法陆续开源,开源算法可以提供基础的功能和技术,但要实现高质量、高性能的人形机器人,需要专业的算法团队进行深入研究和开发。

风险提示:1)竞争环境恶化;2)新技术的应用速度低于预期。

最新评论

风险批露: 交易股票、外汇、商品、期货、债券、基金等金融工具或加密货币属高风险行为,这些风险包括损失您的部分或全部投资金额,所以交易并非适合所有投资者。加密货币价格极易波动,可能受金融、监管或政治事件等外部因素的影响。保证金交易会放大金融风险。
在决定交易任何金融工具或加密货币前,您应当充分了解与金融市场交易相关的风险和成本,并谨慎考虑您的投资目标、经验水平以及风险偏好,必要时应当寻求专业意见。
Fusion Media提醒您,本网站所含数据未必实时、准确。本网站的数据和价格未必由市场或交易所提供,而可能由做市商提供,所以价格可能并不准确且可能与实际市场价格行情存在差异。即该价格仅为指示性价格,反映行情走势,不宜为交易目的使用。对于您因交易行为或依赖本网站所含信息所导致的任何损失,Fusion Media及本网站所含数据的提供商不承担责任。
未经Fusion Media及/或数据提供商书面许可,禁止使用、存储、复制、展现、修改、传播或分发本网站所含数据。提供本网站所含数据的供应商及交易所保留其所有知识产权。
本网站的广告客户可能会根据您与广告或广告主的互动情况,向Fusion Media支付费用。
本协议的英文版本系主要版本。如英文版本与中文版本存在差异,以英文版本为准。
© 2007-2024 - Fusion Media Limited | 粤ICP备17131071号 | 保留所有权利。