原标题:Figure首发人形机器人demo,星链卫星实现全球覆盖——全球产业趋势跟踪周报(0318)
近期市场交易热点主要围绕人工智能、金属、低空经济展开。产业趋势方面, OpenAI视觉语言大模型加持,Figure首发人形机器人demo;星链卫星实现全球覆盖,引领卫星互联网革命。政策端,设备更新、消费品以旧换新行动方案出台,建议持续关注。
【市场交易热点】近期市场交易热点主要围绕人工智能、金属、低空经济展开。热点一:人工智能。受益于全球AI算力旺盛需求,厂商产品结构优化、盈利持续提升。伴随海外大厂未来加大对云和AI基础设施资本开支,算力需求进一步旺盛。同时,本周英伟达将举办GTC2024大会,期间有望公布GB200、机器人等最新进展,形成催化。国内方面,当前,在海外限制下,我国国产算力发展具有急迫性与必要性,国产算力发展亦受到重视。热点二:金属。多因素驱动,铜带领金属板块本周全面走强。供给收缩情况下,中国有色协会召集国内头部铜冶炼厂开会,各冶炼厂未来或有减产计划,全球精炼铜供需平衡从小幅过剩提前转为短缺。商品的价值方面,伦敦铜持续上涨,突破9000美元/吨,为2023年4月以来最高水平。业绩方面,洛阳钼业等多家公司公布业绩,四季度业绩超预期证明行业景气度。多因素催化下,板块上周全面走强。热点三:低空经济。中央、地方齐发力,政策推动顶层设计完善,释放空域资源。低空经济作为新质生产力之一,近年来在政策端获得中央及地方的重点关注。综合来看,低空基础设施是重要支撑,应用场景拓展打开“低空+”想象空间,相关细分近期走强。
【主题与产业趋势】产业趋势一:OpenAI视觉语言大模型加持,Figure首发人形机器人demo。当地时间3月13日,机器人初创公司Figure发布了首个OpenAI大模型加持的机器人demo。视频显示,机器人整套操作的动作十分流畅。Figure创始人Brett Adcock表示,OpenAI与Figure的这场合作实现了人形机器人与人类进行端到端神经网络对线技术原理类似于Google在2023年3月发布的PaLM-E和RT-1的pipeline组合。产业趋势二:星链卫星实现全球覆盖,引领卫星互联网革命。北京时间3月11日从凌晨到中午,SpaceX在仅仅5个小时的时间内,连续两次发射星链卫星,总数已达5988颗,星座的运行空间激光器数量超过10,000个。星链卫星信号实现了真正的全球覆盖,地球上任何偏僻角落都可以用上星链的通讯服务了。星链通信频段迭代优化,发射技术创下多个新纪录,下游应用场景进一步拓宽。
【政策专题】设备更新、消费品以旧换新行动方案出台。我们认为,本次行动方案或为纲领性政策,根据以往政策经验来看,或至少需要1-2周时间,各主管部门有望根据《行动方案》出台政策细则,建议持续关注。今年在地方化债、房地产投资进一步筑底企稳的背景下,制造业投资有望成为投资端的主要抓手,设备更新或作为推动制造业投资发展的主要抓手,政策力度值得期待。对此,我们建议设备更新方面,重点关注行业设备更新(节能降碳-锂电设备、高端化/数字化-数控机床、智能电网),市政基建领域更新(工程机械板块),教育文旅医疗设备更新(手术机器人/医学影像等);消费品以旧换新方面,重点关注新能源汽车(整车及零部件)、家电、家装板块。
【重要资讯】经济数据:根据财联社3月12日报道,美国2月CPI同比上升3.2%,为去年12月以来新高,预估为3.1%,前值为3.1%;美国2月CPI环比上升0.4%,预估为0.4%,前值为0.3%。美国2月未季调核心CPI同比上升3.8%,为2021年5月以来新低,预估为3.70%,前值为3.90%;美国2月核心CPI环比上升0.4%,预估为0.30%,前值为0.40%。英伟达:英伟达将于3月18日至21日举办GTC2024大会,发布加速计算、生成式AI以及机器人领域的最新突破性成果。从备受期待的 NVIDIA CEO 黄仁勋的主题演讲到 900 多场鼓舞人心的会议、超过 200 家的展商、20 多场技术讲座,以及大量独特的交流活动, GTC 为不同技术水平和兴趣领域的参会者提供了丰富的内容。本次英伟达GTC2024大会议程中与游戏有关的演讲有11个,与传媒娱乐有关的演讲有34个,主要集中在以下几个方面:1、生成式AI辅助游戏开发和影视制作;2、文生图、文生视频模型,以及其他AI应用;3、3D内容生成;4、在云端创作游戏。
【短期产业趋势关注及建议】从短期角度,3月需要重点关注具备边际改善的五大赛道:人工智能(算力)、集成电路(半导体设备、存储)、机器人、新能源(光伏、氢能)、船舶(造船、干散)。
【中长期产业趋势关注及建议】从中长期角度,我们建议关注全球重视下碳中和全产业链崛起(光伏、风电、储能、氢能等),电动化智能化大趋势下电动智能汽车渗透率增加,以及数字经济、人工智能、元宇宙、自主可控等产业趋势。
【全球股市表现】上周全球股市涨跌分化,产业方面,A股涨幅较高的产业指数为:一体化压铸、动力电池、小米汽车。板块方面,能源、材料、日常消费表现较好,信息技术、电信服务、公共事业表现较差。过去一周大涨的200亿美元以上市值公司中,可选消费、信息技术、材料居多;过去一周领跌的200亿美元以上市值公司中,信息技术、金融、工业公司居多。
注:本文所涉及个股均为列示或者代表与相关产业链有关联,不代表个股投资建议,也不代表招商行业研究观点,具体个股推荐请以招商各行业研究组推荐为准。
受益于全球AI算力旺盛需求,厂商产品结构优化、盈利持续提升。伴随海外大厂未来加大对云和AI基础设施资本开支,算力需求进一步旺盛。同时,本周英伟达将举办GTC2024大会,期间有望公布GB200、机器人等最新进展,形成催化。国内方面,当前,在海外限制下,我国国产算力发展具有急迫性与必要性,国产算力发展亦受到重视。
多因素驱动,铜带领金属板块本周全面走强。供给收缩情况下,中国有色协会召集国内头部铜冶炼厂开会,各冶炼厂未来或有减产计划,全球精炼铜供需平衡从小幅过剩提前转为短缺。商品价格这一块,伦敦铜持续上涨,突破9000美元/吨,为2023年4月以来顶配水平。业绩方面,洛阳钼业等多家公司公布业绩,四季度业绩超预期证明行业景气度。多因素催化下,板块上周全面走强。
中央、地方齐发力,政策推动顶层设计完善,释放空域资源。低空经济作为新质生产力之一,近年来在政策端获得中央及地方的重点关注。1)中央:2023年中央经济工作会议将“低空经济”提升至“战略性新兴产业”的高度,2024年政府工作报告首次提及“低空经济”。2)地方:据不完全统计,目前全国已有二十多个省(自治区、直辖市)将低空经济有关内容写入地方2024年“政府工作报告”。另外,《无人驾驶航空器飞行管理暂行条例》的颁布促进了顶层设计完善,标志着我国无人机产业将进入“有法可依”的规范化发展新阶段;《国家空域基础分类方法》颁布,新增G/W非管制空域,推动释放空域资源。综合看来,低空基础设施是重要支撑,应用场景拓展打开“低空+”想象空间,相关细分近期走强。
3、主题与产业趋势变化:Figure首发人形机器人demo,星链卫星实现全球覆盖
(1)OpenAI视觉语言大模型加持,Figure首发人形机器人demo
巨头持续下场,人形机器人催化不断。人形机器人正成为多方竞逐未来产业的新赛道。2月24日,英伟达与微软、OpenAI、三星等其他大型科技公司将投资类人机器人初创公司Figure AI ,以期为人工智能寻找新的应用。该公司将在一轮融资中筹集约6.75亿美元,交易前估值约为20亿美元。贝佐斯通过其公司Explore Investments LLC承诺投资1亿美元,微软将投资9,500万美元,英伟达和一个亚马逊附属的基金将各提供5,000万美,英特尔的风险投资部门将投入2,500万美元,LG Innotek将提供850万美元。与此同时,三星的投资集团承诺出资500万美元,OpenAI将投资500万美元。巨头持续下场后,机器人进展有望全面加速。
OpenAI联合Figure开发出能听、能说、能自主决策的机器人。当地时间3月13日,机器人初创公司Figure发布了自己第一个OpenAI大模型加持的机器人demo。虽然只用到了一个神经网络,但却可以为听从人类的命令,递给人类苹果、将黑色塑料袋收拾进框子里、将杯子和盘子归置放在沥水架上。视频显示,机器人整套操作的动作十分流畅。Figure创始人Brett Adcock在社交平台上表示,OpenAI与Figure的这场合作实现了人形机器人与人类进行端到端神经网络对话;OpenAI 提供视觉推理和语言理解,而Figure 的神经网络提供快速、低层次、灵巧的机器人动作。这段视频以1.0倍速度持续拍摄,机器人的速度大大加快,慢慢的开始接近人类。Figure的机载摄像头输入到由OpenAI训练的大型视觉-语言模型(VLM)中,Figure的神经网络还通过机器人上的摄像头以10hz的频率获取图像,然后神经网络以每秒200帧的速率输出24个自由度的动作。除了构建领先的人工智能之外,Figure还基本上实现了垂直整合,如电机、固件、热力学等。
端到端大模型驱动,机器人的速度已经接近人类速度。原理上,机器人Figure 看起来类似于Google在2023年3月发布的PaLM-E和RT-1的pipeline组合,而不是Google于2023年7月发布的端到端模型 RT-2。Figure机器人操作高级AI工程师Corey Lynch深度剖析了此次Figure 01的技术原理。他表示,Figure 01具有以下功能:描述其视觉体验,规划未来行动,思考其记忆,用语言解释其推理过程。他再次强调,视频中机器人的所有行为都是通过学习而非遥控实现的,并以正常速度(1.0x)运行。在具体实现过程中,他们将机器人摄像头中的图像输入,并将机载麦克风捕获的语音文本转录到由 OpenAI训练的大型多模态模型中,该模型能够理解图像和文本。该模型对整个对话记录做处理,包括过去的图像,从而获得语言响应,然后通过文本到语音的方式将其回复给人类。同时该模型也负责决定在机器人上运行哪些已学习的闭环行为,以执行给定命令,将特定的神经网络权重加载到GPU并执行策略。具体而言,将 Figure 01 连接到一个大型预训练的多模态模型赋予了它一些有趣的新能力。Figure 01 + OpenAI 现在可以:描述其周围环境,在做出决策时运用常识推理,将模糊不清的、高层次的请求翻译成一些与上下文相关的行为,用简单明了的英语描述执行特定动作的原因。
OpenAI视觉语言大模型加持,“将人形机器人带进生活”。此外,理解对话历史的大型预训练模型为Figure 01提供了强大的短期记忆。关于学到的低级双手操作,所有行为均由神经网络视觉运动transformer策略驱动,将像素直接映射到动作。这些网络以10hz 的频率接收机载图像,并以200hz的频率生成 24-DOF 动作(手腕姿势和手指关节角度)。这些动作充当高速设定点,以供更高速率的全身控制器跟踪。这是一种有用的关注点分离,其中:互联网预训练模型对图像和文本进行常识推理,以得出高级规划;学习到的视觉运动策略执行计划,执行难以手动指定的快速反应行为;全身控制器确保安全、稳定的动力,例如保持平衡。OpenAI同时公开了与Figure更进一步合作的计划:将多模态大模型的能力扩展到机器人的感知、推理和交互上,“开发能够取代人类进行体力劳动的人形机器人”,即大力推进具身智能。
机器人有望成为AI重要载体,英伟达已成立新的研究部门专攻具身智能。当地时间2月23日,英伟达高级研究科学家、AI代理计划负责人Jim Fan透露英伟达将成立GEAR。GEAR全称为通用具身智能体研究Generalist Embodied Agent Research,由Jim Fan和 Yuke Zhu教授领导,旨在构建适用于虚拟与物理世界的具身智能体的基础模型,致力于实现跨多模态、多场景的智能应用。Jim Fan宣称,2024年是机器人之年、游戏人工智能之年和模拟技术之年。GEAR研究团队专注于四大关键领域:
▶多模态基础模型:开发基于大规模互联网数据源训练的LLMs(大型语言模型),用于规划与推理,视觉-语言模型以及世界模型,旨在打通不同模态信息间的壁垒;
▶通用型机器人研究:研发能适应复杂环境、实现稳健移动与灵巧操作的机器人模型与系统,以提升其在各类实际场景下的普适性与效;
▶虚拟世界中的基础智能体:创建能够在多种游戏与模拟环境中自主探索并持续自我提升能力的大型动作模型,为虚拟世界的智能交互设定新标;
▶模拟与合成数据技术:构建大规模学习所需的仿真基础设施及合成数据流水线,为智能体的学习过程提供有力支持。英伟达致力于发挥机器人、游戏AI和仿真技术之间相互促进的作用,一次性解决机器人基础模型、游戏基础模型和生成式模拟。
当前GEAR的主要项目亮点为:Eureka(通过编码大型语言模型实现人类水平的奖励设计)、Voyager(采用大型语言模型驱动的开放式具身智能体)、VIMA(利用多模态提示实现通用机器人操作能力)和Minedojo(借助互联网规模知识库构建开放式具身智能体)。
从目前已经发布的人形机器人中可以总结出,减速器(谐波减速器或行星减速器)、电机(力矩电机)、控制器、编码器(位置传感器)、力/力矩传感器和轴承是旋转执行器核心零部件。减速器方面,谐波减速器最适合人形机器人旋转执行器,行星减速器具备成本优势,部分方案中对谐波形成替代;无框力矩电机方面,力矩电机结构紧凑体积小、重量轻、无机械摩擦、精度长久保持。“无框”即没有轴、轴承、外壳、反馈或端盖,只包含定子和转子,其转子为中空结构,方便关节的内部走线。过去已在Cheetah、WALK-MAN等机器人上使用;编码器方面,光编精度更高但工作环境要求高,磁编更适合复杂工况。磁编随技术进步与精度提升或将更为适合人形机器人。双编码器方案可以同时监控电机和齿轮箱侧的速度和位置,相比单编码器可更高精度控制关节运动轨迹;轴承方面,轴承在机器人的关节连接处、减速器和电机中均有分布。在机器人的旋转关节处通常使用角接触轴承,而在直线关节处通常使用深沟球轴承和四点接触轴承。
星链(Starlink)是由美国太空探索技术公司(SpaceX)开发的卫星互联网项目。返回搜狐,查看更加多