取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
自动驾驶芯片行业研究:中央计算,大模型与领航辅助引领新一轮创新
来源:未来智库  作者: 佚名 2023-05-29 11:24:57
中短期来看,随着今年车企价格战的打响,前几年一味堆料堆硬件的趋势 将告一段落,务实和高性价比将是决赛圈存活的关键。

背景:汽车 EE 架构向集中化演进,催化智驾 SoC 芯片需求

汽车电子电气(E/E)架构从分布走向集中,自动驾驶芯片以 SoC 为主流。伴随着汽 车智能化、网联化、电气化的深入,低效的传统分布式架构已无法满足升级需求,汽车电 子电气架构逐渐从分布走向集中,以减少车辆线束,提高内部信息流转效率。传统分布式 架构下,汽车各功能模块相互独立,仅需 MCU 芯片即可满足所需算力。而当电子电气架 构向集中式演进,算力亦趋向于集中,仅依靠传统 MCU 已难以满足计算需求,也因此催 化了 SoC 芯片的发展。当前,自动驾驶芯片以 CPU、GPU 以及 NPU 等 AI 加速器组成的 SoC 芯片为主流,并作为算力平台集成在域控制器中,从而加速智能汽车走向跨域融合。 各大主机厂基于下一代电子电气架构的车型将于 2023 年起逐步推出。特斯拉在 EE 架构变革中是引领者,在定义 Model Y 车型时直接跳过“域集中式 EE 架构”,直接进化 至“中央+区域 EEA”的“准中央计算式”。2022 款 Model Y 为中央计算模块 CCM+左车 身控制模块+右车身控制模块设计,其中 CCM(Central Computing Module)模块整合 ADAS(Advanced driver-assistance system)域和座舱娱乐域。当前国内各大传统主机厂 与新势力均加速布局,总体看在硬件上采用中央计算+区域控制架构方案,软件上采用 SOA (Service-oriented architecture)软件架构的设计理念。

我们总结各电子电气架构的特点如下: 分布式:各模块功能划分明确,软硬件强耦合,各模块可独立开发,但无法共用 单个 SoC,且无法做到冗余,分布式架构需要大量线束支持内部通信,加剧线束 成本。此外,各子模块更新需要各供应商提供,迭代效率相对低下。 跨域集中式:将分散的 ECU 集中至底盘、动力、座舱、智驾域中,从而减少内部 通信所需的线束成本,未来将逐步简化为智驾域、座舱域、车控域。此外软硬件 可逐步解耦,具备一定后期 OTA 灵活性。 中央计算式:进一步简化架构,显著降低线束成本,引入 SOA 化设计开放软件平 台,实现软硬件解耦,各功能域共用一个中央计算平台。未来车载计算平台也有 望与云计算相结合,实现车-云一体化。同时,中央集中式架构也将真正实现“舱 驾一体”,这也对车载 SoC 芯片提出更高性能、安全等级与集成度的要求。

\

格局:行业格局未定,英伟达引领中高端市场,地平线异军突起

自动驾驶芯片历经 10 年发展演变,国内格局发生较大变化。我们对其发展历史及格 局变化进行复盘,从 2014 年至今可分为两大阶段:

2014-2018 年:玩家以 Mobileye、英伟达和传统 MCU 厂商为主,自动驾驶功 能尚处早期,行业内入局者较少。该阶段汽车仍以分布式 E/E 架构为主,自动驾 驶功能等级处于 L0-L2,用智能前视一体机即可实现智驾需求,对芯片算力需求 不高。Mobileye 长期深耕视觉 ADAS,自研“视觉算法+芯片”的软硬一体方案, 凭借 EyeQ3/Q4 迎合市场需求,在该阶段占据了 L1-L2 视觉 ADAS 芯片市场, 营收增速迅猛。同时,传统 MCU 厂商例如瑞萨、TI 等厂商搭载于博世方案,也 占据大量市场份额。英伟达以通用 GPU架构为基础,于2016年推出Tegra Parker SoC,搭载于特斯拉 HW 2.0 平台,正式将 GPU 路线的自动驾驶 SoC 推向市场, 但该阶段的智驾 SoC 技术迭代仍较慢。

2019-2022 年:行业发展提速,英伟达引领高算力市场,地平线抓住时间窗口进 行国产替代。2019 年,特斯拉第一代自研 FSD 芯片成功,车企开始重视打造软 硬结合的自动驾驶能力,自动驾驶芯片行业亦进入快速发展期。 在低算力(30TOPS 以下)市场,地平线抓住时间窗口进行国产替代,逐渐抢夺 Mobileye 的市场份额。2019 年,地平线抢先发布 J2 芯片(4 TOPS),并于 2020 年实现量产,搭载于长安主力车型 UNI-T。2021 年,汽车行业缺“芯”导致车 辆减产,国内车企开始重视国产芯片供应商的培养。地平线于当年实现了 J3 芯 片(5 TOPS)的量产,自此在自动驾驶领域积累了先发优势,并凭借更开放的 生态逐步侵蚀 Mobileye 在国内的市场份额。据高工智能汽车(微信公众号,除 非特别说明,下同)数据,2022 年 1-9 月,地平线在中国市场乘用车前装标配 智能驾驶域控制器芯片的出货量已跃居第二,仅次于特斯拉,Mobileye 则跌至第 三。除地平线和 Mobileye 外,TI、赛灵思、瑞萨等芯片厂商的 SoC 亦占有一席 之地。

在中高算力(30TOPS 及以上)市场,英伟达基于领先的 GPU 架构先声夺人, 地平线则有望将国产替代的脚步带向中高端市场。英伟达 2020 年针对 L2 市场 发布 Xavier 芯片(30TOPS),搭载于小鹏 P7/P5 等车型;2022 年又推出大算力 Orin 芯片(256 TOPS),再次引领行业占据主流中高端车型市场,是此前所有瞄 准 L2+高阶辅助驾驶车型的选择。而地平线于 2022 年推出 J5 芯片(128 TOPS) 并上车理想,希望以更高的性价比和更优的本土化服务与英伟达展开同台竞技。 此外,高通、黑芝麻、辉羲智能等一众玩家也将于今明两年正式加入中高算力芯 片的角逐赛。

\

展望:小算力芯片需求保持强劲,大算力芯片走向更 新架构

中短期车企智能化策略因产品定价出现分化,算力需求有所不同

我们认为,中短期来看,随着今年车企价格战的打响,前几年一味堆料堆硬件的趋势 将告一段落,务实和高性价比将是决赛圈存活的关键。也因此,车企智能化策略或因产品 定价出现分化:

1) 10-20 万元车型:追求高性价比智驾方案,算力需求在 5-30TOPS。特斯拉降价 导致国内车企成本压力倍增,加速行业洗牌。我们认为,成本压力下,10-20 万 元的低端车型倾向于追求高性价比智驾方案,中短期内仍将以传统的 L2 功能为 主,部分车型或可提供基本的高速领航功能,算力需求在 5-30TOPS。传统 L2 功能仅需 10TOPS 左右即可满足需求。而高速领航作为 L2+的代表功能,算力配 置亦在下探。例如 2021 款理想 ONE 和上汽第三代荣威 RX5 智驾版仅分别搭载 了 2 颗和 3 颗地平线征程 3 芯片,即 10 和 15TOPS 的算力。因此,高速领航功 能已开始渗透至吉利博越 L、上汽荣威 RX5 等 20 万元以下的车型。尽管在安全 冗余性和体验流畅度上或有所欠缺,但也可满足功能的基本需求。但业内普遍认 为,高速领航若想要“好用”,即提供更高的冗余性和更平滑流畅的驾驶体验, 仍需更高算力的支持,30-60TOPS 的中算力芯片或更为合适。

2) 20-30 万元车型:高速领航渐成标配,降本压力下车企对硬件配置趋于理性,判 断算力需求在 30-80TOPS。处于该价格带的车型,一方面面临特斯拉 Model 3/Y 的直接竞争,成本压力尤为明显;另一方面也需一定的智能化程度以打造差异化 特征。我们认为,高速领航有望逐渐成为此价格带车型标配,且相较于低端车型, 可以以相对更高的硬件配置提供更优的驾乘体验,但车企在降本压力下也将趋于 理性,不再一味堆砌硬件和算力,因此预计算力配置将普遍上升至 30-80TOPS, 中算力芯片有望成为主流选择。

3) 30 万元以上车型:追求更佳的智能化体验,芯片走向大算力&新架构。我们认为, 30 万元以上的高端车型受价格战影响相对较小,主机厂追求打造标杆性的智能 化标签,或将持续发力城区领航,当前算力配置普遍超 200TOPS。为了实现效 果更佳、体验更优的领航功能,“BEV + Transformer”开始引领自动驾驶感知范 式;长期看,“舱驾一体”也有望成为智能汽车 E/E 架构演变的终局。在上述两 大技术趋势的驱动下,自动驾驶芯片开始走向大算力&新架构。

小算力芯片:量产交付、安全稳定和性价比是关键,地平线和 TI 领先地位 较为稳固

中短期来看,小算力芯片有望伴随 L1-L2 功能的快速增长进入规模放量阶段。我们认 为,车企将更倾向于量产经验丰富、交付能力强、安全稳定性高且性价比突出的芯片厂商, 地平线和 TI 当前领先地位较为稳固,但仍有新玩家持续入场。 过往辅助驾驶以基础 L0-L2 功能为主,智能前视一体机即可实现,以 Mobileye、博世、 大陆、赛灵思的方案为主。而伴随轻量级行泊一体以及基础高速领航功能渗透率的提升, 我们认为,集成 SoC 芯片的小算力域控平台将成为主流。由于小算力芯片的技术壁垒和架 构难度较中高算力更低,因此我们认为,芯片厂商的量产交付能力、安全稳定性和性价比 将成为车企关注的重点。地平线凭借先发优势、生态圈建立和本土化服务有望持续走在国内小算力芯片市场的前列;TI 主推的 TDA4VM 在功能完整度和车规可靠性上有较大优势, 且实现了小算力芯片中少有的单 SoC 行泊一体方案,有望持续保持高竞争力。Mobileye 由于黑盒方案难以满足行泊一体等开发需求,未来或仍将主要针对 L1-L2 需求,将成熟的 感知算法内嵌至芯片中打包出售,对自研能力较弱的车企更为友好。此外,以芯驰科技、 寒武纪以及爱芯元智为代表的厂商,此前在其它应用场景积累了较为丰富的量产交付经验, 未来亦有机会切入智驾芯片市场,对地平线和 TI 形成竞争压力。

地平线:J2/J3 率先卡位小算力芯片市场,具有先发优势,有望持续受益于国产 替代浪潮,走在国内小算力芯片市场的前列。

抓住国产替代时间窗口,具有先发优势,本土化服务能力领先。地平线 J2/J3 芯 片分别具备 4/5 TOPS 算力,在推出时瞄准 Mobileye 所在的 ADAS 市场,且相 比于 Mobileye EyeQ4 具备更高算力与开放性,因此凭借芯片产品力、较完善的 工具链以及本土化服务能力,在供应链安全可控背景下,迅速受到众多有软件算 法自研需求的本土车企青睐。据高工智能汽车数据,2022 年 1-11 月,地平线芯 片在国内市场的出货量已位列第二,超越 Mobileye,仅次于特斯拉。 自研 NPU 架构,深度适配软件算法,实现高效的 AI 计算。针对 10 万-20 万元 价格带车型,主机厂追求高性价比方案,芯片需要平衡好性能、功耗与成本三者 关系。地平线 J3 基于自研 BPU 2.0 架构,CPU+ASIC 路线相较于英伟达为代表 的 GPU 方案,能够用仅 2.5W 的功耗,实现 5 TOPS 的算力,且公司主打软硬 协同开发,芯片的实际算力的利用率相对较高。BPU(Brain Processing Unit) 是地平线自研的创新性嵌入式人工智能处理器架构,即 ASIC,也是地平线征程 系列 AI 的核心竞争力,可将算法集成在智能计算平台上,提供设备端上完整开 放的软硬结合智能解决方案。

打造相对完善易用的工具链,并积极构建产业生态圈。地平线推出全链路 AI 开 发平台——Horizon OpenExplorer 天工开物与艾迪 AI 开发平台,兼顾高效与开 放两大原则,便于车企基于地平线的硬件平台开发软件与算法。其中,天工开物 AI 工具链基于地平线自研的 BPU 处理器架构,能够整合各异的计算需求,提供 与芯片架构结合的编译优化工具集,以保障计算资源的充分利用,提供对模型训 练、优化编译到应用部署的 AI 开发全流程支持,并支持 MXNet、TensorFlow、 Pytorch 等社区框架。同时,地平线还推出了 TogetherOS 车载操作系统,并开 放授权 BPU 技术架构 IP,允许车企开发部分芯片,打造开放的生态。

地平线市场份额测算:根据地平线披露的量产车型合作,我们测算地平线 2022 年在 10-20 万/20-30 万/30 万元以上车型(具备 L2 及以上智驾功能)的总市占 率分别约为 10%/15%/1%。但需要指出的是,当前大部分 L2 车型仍以瑞萨、 Mobileye 以及博世等传统低算力系统为主。如若只考虑搭载 L2+ NOA 功能的车 型,根据高工智能汽车数据,地平线 2022 年的市占率达到 49.05%,位列行业 第一。展望未来,地平线于 2023 年上海车展密集宣布与比亚迪、大陆集团、采 埃孚等新的合作。我们认为,地平线在 10-20 万元车型的领先地位较为稳固,未 来市占率将迅速提升,有望达到 30%-50%水平;而在中高端车型市场,地平线 也有望凭借大算力芯片先发优势与本土化适配能力,与英伟达等头部厂商竞争, 稳固提升市占率。 但也须注意的是,地平线 J2/J3 由于 CPU 算力较弱且缺乏 GPU,难以独立实现 行泊一体方案,而对比 TI 的 TDA4VM 已成功实现单 SoC 的轻量级行泊一体方 案,未来或将是小算力芯片领域地平线的最大竞品之一。

\

TI:TDA4VM 在架构完整度和功能安全性方面占优,有望成为 10-20 万车型轻 量级行泊一体方案的主流选择之一。 TDA4VM 算力高于 J3 和 EyeQ4,可实现单 SoC 轻量级行泊一体方案。TI 于 2020 年推出核心产品 TDA4VM,算力 8 TOPS,高于地平线 J3(5 TOPS)和 Mobileye EyeQ4(2.5 TOPS),且供货稳定。当前,大疆、MAXIEYE、Nullmax、 禾多科技、纵目科技等玩家都在基于 TDA4 开发行泊一体方案。

架构完整且集成度高,利于车企和方案商进行二次开发。TDA4 采用多核异构架 构,集成了 ARM CPU、数字信号处理器(DSP)、深度学习加速器(DLA)、MCU 等单元,由对应的核或者加速器处理如逻辑算力和 AI 算力等不同任务。TI 的 AI 算力来自于自研矩阵乘法加速器 MMA(可类比地平线的 BPU),能够提供较灵 活的矩阵乘法运算,通用性介于 GPU 和 ASIC 之间,因此拥有更强的可扩展性 与并行处理能力。值得一提的是,TDA4 是业内为数不多内置 ASIL-D 级 MCU 的 智驾 SoC。由于大多智驾 SoC 还无法满足高功能安全等级的要求,因此常见做 法是在智驾域控主板上外挂一颗独立的 MCU 芯片,比如英飞凌 TC297/397 等, 以提供状态监控、整车底盘控制、执行最小安全风险策略等。为了简化系统设计、 缩短通讯延时、节省硬件成本,部分芯片厂商开始在 SoC 内部内置 MCU 核心(功 能安全岛 Safety Island)。TI 的 TDA4 系列就是内置 MCU 的典型代表,其 MCU 为 ASIL-D 级 Arm Cortex-R5F,进行了单独电压和时钟设计,采用专用内存和接 口确保其与 SoC 其余部分隔离,因此车企无须再外接 MCU 进行开发。尽管内置 MCU 已成趋势,但与成熟稳定的传统外挂 MCU 相比,内置安全岛的功能安全性、 实时性和可靠性在实际应用中仍有一定差距。因此,域控厂商在使用地平线 J3、 黑芝麻 A1000 等芯片时,多数情况下仍会选择外挂一个 MCU 提供安全冗余,例 如宏景智驾为 2021 款理想 One 提供的域控制器就是“双 J3+MCU”的方案。

但 TI 的相对劣势在于,由于集成了 GPU、MMA、DSP 等众多处理单元,TDA4VM 在高负载下功耗可高至 20W,对 Tier 1 与主机厂在散热等方面的工程化能力提出 了较高的要求。此外,相比于纯 ASIC 路线,TI 在特定算法上的运算效率或不及 地平线。

\

Mobileye:传统视觉 ADAS 龙头,因黑盒模式和迭代较慢,市场份额正在被地 平线等其他玩家快速侵蚀。但其“视觉算法+芯片”的智能前视一体机方案具备 高性价比,未来或将主要针对 L1-L2 需求,对自研能力较弱的车企更为友好。 因黑盒模式和迭代较慢,市场份额正在被快速侵蚀。Mobileye 是昔日 ADAS 领 域的主要奠基者和引领者,提供算法+EyeQ 系列芯片组成的一体化软硬件解决方 案。在 Mobileye 方案的帮助下,车企可高效且高性价比地适配 L1-L2 级基础辅 助驾驶功能。但随着汽车智能化程度的提升,车企开始希望对自身的智能化方案 有更高的话语权和主动权,而 Mobileye 的全栈黑盒模式已无法满足大多数车企 的自研需求。此外,区别于主流 CPU 架构(ARM、X86),Mobileye 的 EyeQ4 芯片采用多 MIPS 处理器,导致其通用性和可开发性较差,难以形成良好的软件 生态。因此近年来,Mobileye 智能一体机方案吸引力开始下降。 面对危机积极寻变,逐步开放生态,但竞争格局远较此前激烈。2021 年,Mobileye 推出 EyeQ5 芯片,首次提供单芯片(silicon-only)版本,开放 SDK、OpenCL 环境和 TensorFlow,从而允许客户部署自研算法,但目前 EyeQ5 芯片也仅收获 极氪一家定点。自动驾驶芯片的竞争环境日益激烈,海内外众多车企正在将平台从 Mobileye EyeQ 系列迁移至英伟达、地平线、华为、高通等其它玩家。我们认 为,Mobileye“视觉算法+芯片”的智能前视一体机方案仍具备高性价优势,对 自研能力较弱的车企更为友好。但随着汽车智能化能力逐步提升,后续能否跟进 主机厂快速迭代的需求并进一步开放生态,将是 Mobileye 不掉队的关键。

黑芝麻:基于 A1000L 打造行泊一体方案,获一汽红旗下一代 FEEA3.0 架构车 型定点,但相关车型规划 2024 年 SOP,时间点上相较地平线和 TI 不占优。公 司早在 2020 年就推出了 A1000L 芯片,搭载 8 核 ARM Cortex A55 CPU、ARM GPU、3 核高性能 DSP、CV 加速引擎,以及自研 DynamAI NN 引擎,AI 算力 达 16 TOPS,具备业内领先的功能完整性与计算性能。基于 A1000L 芯片打造的 Drive Sensing 解决方案可实现单 SoC 芯片的行泊一体方案,支持 L2+高速领航 NOA、泊车 HPA/AVP、3D 360 环视全景、多路 DVR 等功能。2023 年 5 月,公 司宣布 A1000L 获得一汽红旗下一代 FEEA3.0 电子架构平台项目量产智驾芯片 定点。一汽红旗将基于 A1000L 打造非分时复用的行泊一体自动驾驶域控平台, 该平台将应用于一汽红旗 80%左右的车型,其中一汽红旗 E001 和 E202 两款车 型最快将于 2024 年量产落地。 核心竞争力来自两大自研 IP:图像信号处理 ISP 以及神经网络加速器 NPU。ISP 负责“看得清”,可处理摄像头采集的每一帧原始图像数据;NPU 负责“看得懂”, 通过集成图像分类、空间分割、特定目标分析等多个功能到单个神经网络,可实 现结构化剪裁,从而帮助黑芝麻芯片提升神经网络运算能力并降低功耗。

\

爱芯元智:在智慧城市领域积累了丰富的交付经验和完善的工具链,有望借此切 入小算力智驾芯片市场。爱芯元智成立于 2019 年,截至目前已成功推出了两代 四颗端侧、边缘侧 AI 视觉感知芯片,并实现大规模量产供货。目前爱芯元智的 主要下游为智慧城市业务,例如智慧物联领先方案商大华股份就是爱芯元智的重 要客户之一,爱芯元智自主研发的芯片 AX630A 和 AX620A 已作为主控 SoC 应 用于大华股份多个产品线,并获评大华股份 2021 年战略供应商。基于自有 ISP 与 NPU的联合架构设计,爱芯元智可大幅提升传统 ISP中多个关键模块的性能, 实现高能效比和高算力利用率。目前,公司也开始进军智能驾驶领域,2022 年 8 月参与投资 ADAS 解决方案商 MAXIEYE,后续二者或有上车合作。我们认为, 爱芯元智在智慧城市领域积累的量产经验和搭建的工具链可赋能智驾业务,尤其 是在小算力芯片市场,车企将更看重供应商的交付能力以及产品的易开发性。 2019 至 2022 年,爱芯元智完成了近 20 亿元的融资,投资方包括美团、美团龙 珠资本、腾讯投资、联想之星等互联网巨头,以及启明创投、GGV 纪源资本、 耀途资本等知名机构。

芯驰科技:座舱芯片对标高通,丰富的量产经验与车企合作生态有望助力智驾芯 片适配上车,但内部资源在不同产品线间的合理化分配是关键。芯驰科技成立于 2018 年,作为国内少有的“全场景、平台化”的芯片和技术解决方案供应商, 产品包括域控芯片 E3、座舱芯片 X9、智驾芯片 V9 和网关芯片 G9。公司当前除 智驾芯片外,其余三款芯片已实现大规模量产。尤其是在智能座舱芯片领域,公 司 X9 系列座舱芯片能够在性能上对标高通,截至 2022 年年初已获得超 50 个定 点,目前已上车上汽第三代荣威 RX5、奇瑞全新产品系列 OMODA 旗下首款车 型欧萌达和德国戴姆勒等。我们认为,芯驰在座舱芯片积累的量产交付经验与产 业链生态建设有望助力其智驾芯片的渗透,但座舱芯片和智驾芯片在产品架构和 软件算法上仍有较大不同,即使是高通目前在智驾领域的进展也并不如人意,且 作为初创公司,能否在不同产品间合理分配有限的资源目前来看仍待验证。

寒武纪行歌:母公司寒武纪丰富的 AI 芯片技术积累有望迁移至车端,云边端一 体化统一生态架构,有助于构建车端推理-云端训练闭环。寒武纪行歌成立于 2021 年,作为寒武纪控股的子公司,行歌专注于自动驾驶芯片研发,目前在研数款智 驾芯片,覆盖 L2-L4:1)已接近量产的 SD5223 针对 L2+行泊一体方案,具备 高能效比,相较于 TDA4VM 算力提升一倍(16 TOPS)。2)基于 SD5223,寒 武纪推出低算力低功耗的 SD5223C,算力 6 TOPS,支持 8M 前视一体机和自动 泊车功能,或有望渗透传统 Mobileye 占据的前视一体机市场。3)公司也表示未 来将推出面向 L4 市场的 SD5226,规划算力超 400 TOPS,300K+ DMIPS,采 用 7nm 制程,并支持车端训练,亦有望进军中高算力芯片市场,但也须留意公 司芯片代工或受地缘政治因素影响,从而影响实际量产时间。寒武纪行歌自成立 以来,已与经纬恒润、一汽等签订了自动驾驶合作协议,并累计获得了上汽、蔚 来、宁德时代、博世创投等重磅产业资本加持,待产品技术打磨成熟,芯片有望 快速实现量产。

\

中算力芯片:高速领航带来发展机遇,各玩家皆有突围可能

中算力芯片(30-100TOPS)市场此前相对空白,以英伟达 Xavier 为主。但随着车企 趋于理性,中端车型不再一味参与大算力芯片军备竞赛,但同时又希望实现较优的高速领 航功能,中算力芯片需求有所上升。目前来看,英伟达 Xavier 和 Orin NX/Nano、TI TDA4VH 以及黑芝麻 A1000 已瞄准该市场开始出击,但同时也不排除地平线等其他厂商未来推出对 应产品以完善产品矩阵的可能性。因此整体而言,我们认为,中算力芯片市场的较量才刚 刚开始。与小算力和大算力相比,中算力市场或对芯片厂商的综合能力有更高要求,场内 现有玩家皆有突围可能。

英伟达:Xavier 和 Orin NX 有望占据中算力市场较大份额。2020 年,英伟达针 对 L2 市场发布 Xavier 芯片(30 TOPS),搭载于小鹏 P7/P5 等车型;2022 年又 推出大算力 Orin 芯片(256 TOPS),再次引领行业占据主流中高端车型市场, 是此前所有瞄准 L2+高阶辅助驾驶车型的选择。但随着行业回归理性,Orin 对于 大部分 20 万-30 万元的中端车型配置或过高,英伟达也因此通过硬件陆续推出 Orin NX(70/100 TOPS)和 Orin Nano(20/40 TOPS),完善自身产品矩阵。鉴 于 Orin X 当前已成功上车众多车型,经过量产可靠性验证,我们认为,较低配的 Orin NX 和 Nano 系列也有望共享同一套英伟达开发工具链与生态,以切入主流 车企的中端车型市场。

\

黑芝麻:A1000 芯片算力 58TOPS,精准填补 50-100TOPS 芯片市场空缺,我 们预计 2023 年上车江淮思皓与领克 08。GPU 方面,A1000 自带 GPU,能够针 对泊车场景进行环视算法拼接,从而支持单芯片的行泊一体方案,对比地平线 J5 需外挂负责 3D 渲染的 GPU。CPU 方面,A1000 搭载八核 ARM Cortex A55, 具备多级缓存,能够适应大量数据的预处理工作。CV 加速方面,A1000 包含 5 核 DSP 芯片,其中 4 核可以供客户进行调用,因此释放给客户的 CPU 资源也更 为充裕,对比 J5 只含双核 DSP。由于很多算法设计需要大量用到 CPU 性能调 度,因此 A1000 或更利于客户灵活开发部署算法。得益于较高的功能完整性, A1000 打造的行泊一体等方案性价比较高。公司 2023 年 4 月宣布将推出 BOM 成本 3000 元以内的行泊一体域控方案,支持 10V配置和 50-100TOPS物理算力。

TI:TDA4 系列向中算力进军以完善产品矩阵,已与主流 Tier 1 达成合作。此前 行业众多 Tier 1 已基于 TDA4VM 顺利开发面向 L2 场景的域控,TDA4VM 也已 成为单 SoC 轻量级行泊一体方案的主流选择之一。TDA4VM 由于算力相对有限 (8 TOPS),因此实现的为“分时复用”的行泊一体方案,传感器配置为 5V5R 或 6V5R,而基于单 TDA4VH(32 TOPS)或 TDA4VM Plus(24 TOPS)可实现非分时复用行泊一体方案,支持例如 10V5R 的更高阶传感器方案,以帮助 TI 进一步渗透 L2+市场。我们认为,得益于 TDA4VM 在小算力市场的成功,TI 不 仅积累了丰富的量产经验,车企也可使用同一套工具链以实现更低的迁移和开发 成本,因此 TI 在中算力市场亦有一定优势。当前德赛西威、福瑞泰克、百度等 厂商已宣布将基于 TI 中算力 SoC 开发域控,其中福瑞泰克 ADC30 域控基于 2 颗 TDA4VH 和 3 颗地平线 J5,公司预计 2023 年量产。

大算力芯片:BEV/Transformer+舱驾一体驱动芯片走向大算力&新架构

在“BEV + Transformer”以及“舱驾一体”两大技术趋势的驱动下,自动驾驶芯片 开始走向大算力&新架构。目前来看,英伟达和高通走在变革前列,地平线量产进度领跑 国内市场,华为 MDC 或涅槃归来,架构变化下辉羲智能等国产厂商亦有突围机会。 趋势 1:城区领航年内开始上车,“BEV + Transformer”引领自动驾驶感知范式。在 此趋势下,算法复杂度、数据规模以及模型参数均呈指数级提升,由此对车载自动驾驶芯 片的 AI 算力、数据吞吐量与架构创新也提出了更高的要求。

小鹏、华为领衔,城区领航年内开始落地。目前,城区领航尚处发展早期,小鹏和华 为的方案已于 2022 年 9 月开始落地,并在逐步拓宽开放区域。小鹏城市 NGP(Navigation Guided Pilot)功能自 2022 年 9 月率先于广州进行试点,2022 年 10 月于广州全量推送; 2023 年 3 月 17 日,小鹏宣布城市 NGP 功能向深圳地区开放,后又拓展至上海。北汽极 狐和长安阿维塔均选择 HI(Huawei Inside)模式,依靠华为 ADS 高阶自动驾驶全栈解决 方案打造城区 NCA 功能,分别命名为α-Pilot 高阶智能驾驶辅助及 AVATRANS 智能领航 系统。极狐城区 NCA 已开通深圳、上海及广州三地,覆盖车型为极狐阿尔法 S 全新 HI 版。阿维塔也于2023年3月 9日宣布在上海及深圳开启城区NCA(Navigation Cruise Assis) 试驾体验,覆盖车型为阿维塔 11,广州、重庆两地也即将开放体验。除此之外,根据各公 司公告,理想、集度、长城等车企也计划在 2023 年推出各自的城区领航功能。

城区领航被视为 L4 级自动驾驶功能在乘用车上的极致演绎,实现难度和壁垒远高于 高速领航,当前算力需求普遍超 200TOPS。尽管在系统训练层面,自动驾驶 95%的底层 架构和基础问题已经解决,但最后 5%的长尾问题,也就是 corner cases 的存在,是制约 无人驾驶实现的最大瓶颈之一。与场景较为规则、工况较为单一的高速领航相比,城区领 航路口多、变道多、拥堵多,corner cases 的数量和复杂程度大幅提升,不仅涉及异型车、 行人、路障等多类别主体,且存在加塞、“鬼探头”、前车急停等非规律行车现象。据小鹏 在 2022 年 1024 科技日上的介绍,城市 NGP 的代码量是高速 NGP 的 6 倍,感知模型的 数据是高速 NGP 的 4 倍,预测/规划/控制相关的代码是高速 NGP 的 88 倍。

\

城区领航对自动驾驶感知算法提出了更高的要求,“BEV + Transformer”范式粉墨 登场。大模型是当前 AI 领域最为火热的前沿趋势之一,可赋能自动驾驶领域的感知、标注、 仿真训练等多个核心环节。在感知层,以特斯拉为首,“BEV+Transformer”范式已开始 在自动驾驶领域得到广泛使用,可有效提升感知精确度,利于后续规划控制算法的实施, 促进端到端自动驾驶框架的发展。

BEV 全称 Bird’s Eye View,即鸟瞰图,该算法旨在将多传感器收集的图像信息投 射至统一 3D 空间,再输入至单一大模型进行整体推理。相较于传统的摄像头图 像,BEV 提供了一个更贴近实际物理世界的统一空间,为后续的多传感器融合以 及规划控制模块开发提供了更大的便利和更多的可能。具体来说,BEV 感知的优 势在于:1)统一了多模态数据处理维度,将多个摄像头或雷达数据转换至 3D 视 角,再做目标检测与分割等任务,从而降低感知误差,并为下游预测和规划控制 模块提供更丰富的输出;2)实现时序信息融合,BEV 下的 3D 视角相较于 2D 信 息可有效减少尺度和遮挡问题,甚至可通过先验知识“脑补”被遮挡的物体,有 效提高自动驾驶安全性;3)感知和预测可在统一 3D 空间中实施,通过神经网络 直接完成端到端优化,可有效降低传统感知任务中感知与预测串行的误差累积。

Transformer 的注意力(Attention)机制可帮助实现 2D 图像数据至 3D BEV 空 间的转化。Transformer 是 Google Brian 团队在 2017 年提出的神经网络模型, 起初用于机器翻译,随着技术的发展开始进军图像视觉领域,目前已成功涉足分 类、检测和分割三大图像问题。据汽车之心微信公众号介绍,传统 CNN 模型的 原理是通过卷积层构造广义过滤器,从而对图像中的元素进行不断地筛选压缩, 因此其感受域一定程度上取决于过滤器的大小和卷积层的数量。随着训练数据量 的增长,CNN 模型的收益会呈现过饱和趋势。而 Transformer 的网络结构在嫁接 2D 图像和 3D 空间时借鉴了人脑的注意力(Attention)机制,在处理大量信息时 能够只选择关键信息处理,以提升神经网络的效率,因此 Transformer 的饱和区 间很大,更适宜于大规模数据训练的需求。在自动驾驶领域,Transformer 相比 于传统 CNN,具备更强的序列建模能力和全局信息感知能力,目前已广泛用于视 觉 2D 图像数据至 3D 空间的转化。

在“BEV + Transformer”趋势下,算法复杂度、数据规模以及模型参数均呈指数级 提升,推动自动驾驶芯片向着大算力、新架构以及存算一体等方向演进。

1) 大算力:向数百 TOPS 算力演进。传统 L1/L2 辅助驾驶所需处理的数据量小且算 法模型相对简单,因此以 Mobileye 为代表的单目视觉+芯片算法强耦合的一体机 方案即可满足需求。但领航功能作为高阶辅助驾驶的代表,需要“更强算力+软硬 件解耦的芯片+域控制器”来满足海量数据处理与后续持续 OTA 迭代的需求。高 速领航开始向 20 万元以下车型渗透,15-30TOPS 可满足基本需求,但若想要“好 用”或需要 30-80TOPS。城区领航的场景复杂程度和技术实现难度更高,目前普 遍需要搭载激光雷达,芯片以英伟达 Orin、华为 MDC 和地平线 J5 为主,算力配 置普遍超 200TOPS。而在应用“BEV + Transformer”技术后,多传感器前融合 以及 2D 至 3D 空间的转化需要 AI 芯片具备更强的推理能力,因此也需要比以往 更大的算力支撑,包括更高的 AI 算力、CPU 算力和 GPU 算力。

2) 新架构:加强并行计算能力和浮点运算能力。相较于 CNN/RNN,Transformer 具有更强的并行计算能力,可加入时间序列矢量,其数据流特征有显著差别,浮 点矢量矩阵乘法累加运算更适合采用 BF16 精度。Transformer 允许数据以并行的 形式进行计算,且保留了数据的全局视角,而 CNN/RNN 的数据流只能以串行方 式计算,不具备数据的全局记忆能力。传统 AI 推理专用芯片大多针对 CNN/RNN, 并行计算表现不佳,且普遍针对 INT8 精度,几乎不考虑浮点运算。因此想要更 好适配 Transformer 算法,就需要将 AI 推理芯片从硬件层面进行完整的架构革新, 加入专门针对 Transformer 的加速器,或使用更强的 CPU 算力来对数据整形,这 对芯片架构、ASIC 研发能力以及成本控制都提出了更高的要求。

3) 存算一体:SoC 芯片需配置高带宽存储器(HBM)或 SRAM,并加速向存算一 体靠拢,解决大算力下的数据吞吐量瓶颈。模型越大,内存对 AI 加速器就越重要, 以频繁地读取权重矩阵或训练好的模型参数。据佐思汽研介绍,Transformer 中 的权重模型超过 1GB,对比传统 CNN 的权重模型通常不超过 20MB。模型参数 越大,就需要更高的带宽,一次性读出更多参数。存算一体可分为近存计算(PNM)、 存内处理(PIM)以及存内计算(CIM),存内计算则接近存算一体。当前 PNM 已广泛用于高性能芯片,即采用 HBM 堆叠,2.5D 封装,从而与 CPU 集成,而 PIM 和 CIM 仍处在发展中。以特斯拉 FSD SoC 为例,其采用总带宽为 68GB/s 的 8 颗 LPDDR4 内存,而集成在 NPU 中的 SRAM 可达到 32MB L3 缓存,带宽 达 2TB/s,远超市面上同类芯片。而据汽车之心微信公众号,特斯拉在最新 HW 4.0 上的二代 FSD SoC 上使用了 16 颗 GDDR6,在内存用料上继续引领行业。

\

趋势 2:长期来看,伴随跨域融合+中央计算式趋势,支持“智能驾驶+智能座舱”的 舱驾一体多域计算控制架构或成为终局需求,我们预计 2025 年后开始初步量产上车。 舱驾一体可有效降低开发成本和通讯延时、优化算力利用率和功能体验,推动智能汽 车应用迈上新的台阶。高工智能汽车统计,2022 年 1-10 月中国乘用车前装同时标配“L2 级辅助驾驶+智能座舱+车联网+OTA”的搭载率达 18.01%;且预测至 2025 年同时标配“智 能驾驶+智能座舱”的交付车辆有望突破 350 万辆。我们总结舱驾一体的主要优势在于:

降低成本:物料方面,相比于多 SoC 方案,单芯片集成度更高、使用物料更少, 且共用一套散热系统带来散热成本下降。开发方面,当前智能化的实现仍需要车 企在不同的芯片组合之间进行挑选,由此带来硬件及软件开发的多平台成本消耗, 而使用单 SoC 可以节约此类额外的开发成本和多供应商的隐性采购管理成本,部 分底层软件的共用也可降低不同平台车型的上车速度和软件开发成本。

降低通讯延时,优化功能体验:使用单颗 SoC 可使舱和驾之间数据传输从板间通 讯变为片内通讯并共享内存,从而降低通讯延时,实现更流畅的舱驾功能。例如 英伟达 Thor SoC 支持所有显示器、传感器集成至单一 SoC,极大简化了汽车制 造的复杂程序,并有助于传感器数据更及时充分地复用,实现更流畅的汽车智能 化功能。

但“舱驾一体”距离真正实现仍有一定距离,软硬件技术和工程化皆面临挑战。一方 面,座舱和智驾面向的应用场景、功能定义、性能边界不一样,如若融合在一起,芯片选 型、外围电路设计、算力需求重点以及安全等级要求都不同,因此成本和性能的平衡难度 较大。另一方面,当前绝大部分厂商受限于软硬件技术、对整体架构的理解和供应链等因 素,在技术上难以实现单 SoC 集成座舱和智驾功能。因此当前,更多厂商仍采用“多颗 SoC+多域控制器”方案。部分厂商已在单个域控制器中将座舱和智驾 SoC 部署在不同主 板或同一个主板。例如特斯拉是“中央计算+区域控制”理念的最早实践者,基于全系统 架构自研,能够理清座舱、智驾和整车控制等系统之间的关联,并在前期充分预留接口。 早在 2019 年量产的 Model 3 车型中,中央计算单元 CCM 就融合了影音娱乐模块(座舱)、 驾驶辅助系统模块(智驾)以及车内外通信模块,共用一套液冷系统。但这三个模块仍分 别部署在不同的 PCB 板上,各自独立运行操作系统,因此并不算严格意义的舱驾一体核 中央集中式架构。想要实现真正的舱驾一体,即单 SoC 部署在单 PCB 板,仍需要软硬件 技术与工程化能力的不断提升。

我们认为,待 EE 架构进化到中央集成计算架构阶段,且业内逐渐完成底层软硬件铺 设,舱驾一体或有望在 2025 年后开始上车,同时推动自动驾驶 SoC 芯片走向以下趋势:

1) 大算力:向上千 TOPS 演进,包括 CPU 算力、GPU 算力与 AI 算力。CPU 主要 负责逻辑运算和决策控制,需要同时负责智驾域和座舱域系统调度、数据处理与 指令运算,随着舱驾一体化下数据处理量增大,CPU 需要更大的算力支撑。GPU 擅长图像渲染、图形处理以及大规模并行 AI 计算,随着自动驾驶等级不断提升、 座舱娱乐趋向大屏多屏化以及人机交互功能逐步强化的背景下,GPU 算力需求也 将不断提升。此外,当前自动驾驶 SoC 普遍会在 CPU 和 GPU 基础上搭载 AI 加 速器,例如神经网络处理器 NPU。根据公司公告,英伟达 Thor 和高通 Snapdragon Ride Flex SoX 均规划 2025 年左右量产,面向舱驾一体化场景,算力达 2000TOPS。

2) 先进制程:可能采用 Chiplet 技术。要实现舱驾一体需要高算力支撑(通常超 1000 TOPS),并需要将功耗控制在合理范围,自动驾驶芯片需要向更先进制程方向发 展,从而在相同面积晶圆下放置更多计算单元,提供额外的算力。当前车载 AI 芯片已下探到 5nm,但掌握先进工艺的企业较少,中国本土厂商还面临台积电产 能限制问题。例如地平线 J5 就仍采用 16nm,一方面是使用了功耗/算力比更优的 ASIC,另一方面或也做了国产代工的两手准备。在此背景下,Chiplet 技术有望 成为智驾芯片实现性能跨越的重要路径,满足算力、效率与功耗不断提升的需求。 Chiplet 又叫小芯片/芯粒,通过将多个小芯片与特殊封装技术相结合,构成更大的 IC。相比于直接生产单 SoC,使用小芯片生产有助于提升晶圆面积利用率,且小 芯片可以重复利用,从而降低产品总设计和验证成本。此外,采用 Chiplet 技术后, 各大厂商可以专注于自己的芯粒和 IP,省去多余的 IP 费用。小芯粒的流片良率也 普遍更高。但需要注意的是,Chiplet 技术仍面临产业链成熟问题和座舱和智驾融 合的工程化难题,当前仍处在发展过程中。而对于中国公司,Chiplet 技术中的小芯片仍大量采购自海外巨头,因此国产替代的逻辑相对有限。

3) 新架构:分域隔离。座舱和智驾域功能集成在单 SoC 时,由于两个域需求不同, 在做硬件资源分配时,既要定义应用的优先级,又要确保各自有足够的资源,这 对底层的芯片架构提出了更高要求。同时,智驾与座舱域安全等级不同,所跑的 操作系统也不同,需要做好安全隔离,确保不同应用的功能安全和信息安全,当 前座舱娱乐模块需要达到 ASIL A,仪表模块需要达到 ASIL B,而行车模块需要达 到 ASIL D,这对芯片底层的加速器资源如何进行有效隔离也是比较大的挑战,同 时舱驾融合需要在操作系统层面做虚拟化技术,也会带来额外硬件开销,但也确 保了各域之间功能与信息安全性。

\

英伟达:基于 GPU 高技术壁垒,长期引领智驾芯片技术革新。Orin X 是当前唯 一量产且算力超 200 TOPS 的大算力芯片,占据了主流中高端车型智驾芯片最大 市场份额。2022年9月,英伟达又发布Thor SoC,算力达到2000TFLOPS@FP8, 面向中央计算式架构设计,支持云端融合、一芯多用、跨域计算,被认为定义了 行业未来 3 年的发展方向,规划 2025 年量产,已宣布极氪为首发车型。 针对 BEV+Transformer:英伟达在 Hopper GPU 架构中加入 Transformer 推理 引擎,大幅提升 AI 运算效率。GPU 天生适合 Transformer 模型所需的浮点运算以及高带宽需求,而英伟达又在 Thor 的 Hopper GPU 架构中加入了 Transformer 推理引擎,进一步提升其 AI 运算效率。该 Transformer 引擎于 2022 年已被英伟 达集成于 H100 训练服务器中,采用英伟达 Hopper Tensor Core 技术,能够应用 FP8 和 FP16 混合精度,以大幅加速 Transformer 模型的 AI 计算,采用 FP8 的 Tensor Core 运算在吞吐量方面是 16 位运算的两倍。此外,Thor 也旨在统一训练 和推理端的精度,Transformer 引擎在用于推理时,无需进行任何数据格式转换, 能够以 FP8 输出结果。此前英伟达、英特尔与 ARM 三家联合推出 FP8 格式标准, 当前多数自动驾驶模型训练由英伟达芯片完成,若能够做到训练与推理端统一使 用 FP8,则效率和准确度将大幅超越 INT8,因此 Thor 有望成为英伟达训练芯片 客户的首选推理端 SoC。值得一提的是,英伟达取消了 2021 年 GTC 大会上所发 布的 Atlan,我们认为主要原因之一就在于 Atlan 或没有考虑 Transformer 专用引 擎且不支持 FP8 格式。

针对舱驾一体:英伟达 Thor SoC 提出“单芯片解决一切”,算力一骑绝尘,架构 持续引领行业。Thor 可以借助 NVLink-C2C 技术整合 Grace GPU、Hopper GPU 与次世代 GPU(ARM 最新服务器 CPU 架构 V2 或波塞冬平台),实现 2000 TOPS 的 FP8 效能,并支持单 SoC 实现座舱与智驾等功能。DRIVE Thor 能够进行多域 计算,可以将自动驾驶、车载信息娱乐等功能划分为不同任务区间,同时运行, 互不干扰,并能够将所有显示器、传感器计算需求集中至单 SoC。多计算域隔离 能力,可支持时间关键型的进程不间断同时运行,在单 SoC 上可以同时运行 Linux、 QNX 和 Android,未来主机厂可以借助 Thor 隔离特定任务的能力,告别分布式 的电子控制单元,整合全车功能。

\

高通:立足智能座舱,有望迅速跻身自动驾驶第一梯队。针对智能座舱市场,高 通凭借骁龙 SA8155 迅速抢占中高端市场,SA8295 继续代表座舱 SoC 最前沿技 术。而针对自动驾驶市场,高通凭借 Snapdragon Ride 自动驾驶平台以及去年发 布的 Snapdragon Ride Flex SoC 打响进军高性能自动驾驶芯片的发令枪。 针对 BEV+Transformer:基于消费电子与智能座舱领域积累的芯片开发经验, 在 CPU 算力、浮点运算能力以及内存带宽上持续突破,顺应 Transformer 上车 趋势。高通 2020 年初推出 Snapdragon Ride 自动驾驶平台,配备 SA8540P SoC 和 AI 加速器 SA9000P,提供若干 SoC 和 ASIC 组合的方案,可覆盖 ADAS 到 L4 的算力需求(10-700+TOPS)。据佐思汽车研究微信公众号上发表的文章《高 通自动驾驶平台 Snapdragon Ride 分析》(周彦武),Snapdragon Ride 中的 SA8540 或是骁龙 865 的车规版,而 S9000 或是云端加速芯片 Cloud AI 100 的车 规版。骁龙 865 搭载 Adreno 650 GPU,全面提升 16 位/32 位浮点运算能力,并 特别加入 Hexagon 698 张量加速器,具备 Transformer 模型下车端的高效 AI 推 理能力。而 Cloud AI 100 则特别针对 AI 大模型推理打造,能够提供 400 TOPS的算力,峰值性能是 Snapdragon 855 和 Snapdragon 820 的 3 到 50 倍,与传 统的 FPGA 相比推理速度提高约 10 倍,且在 AI 推理的每瓦能效上超越英伟达 A100。

地平线:当前最有望挑战英伟达领导地位的国产芯片厂商。地平线 J5 是目前唯 一规模化量产的国产大算力芯片,拥有 128TOPS 算力,30W 低功耗,领先同级 竞品的 1531 FPS(真实计算性能)以及 60ms 超低延迟感知能力。基于规模异构 近存计算、高灵活大并发数据桥及脉动张量计算核三大核心技术,J5 能以更少内 存、更高 MAC 利用率执行更多任务,将并行计算发挥到极致,提升算力有效利 用率。这也利于芯片在不堆叠面积和有限功耗下,发挥最多的实际 AI 性能。J5 在 EfficientNet 模型测试中,FPS 指标优于英伟达 Orin 和 Xavier。当前 J5 已经 上车理想 L7、L8 Pro 等高端车型,未来有望进一步占据英伟达 Orin 市场份额。 针对 BEV+Transformer:地平线开发适配 J5 的 Swin-Transformer 结构,可更 好发挥 J5 的算力优势,显著提升网络性能、减少访存时间。此外,在 3D 感知算 法领域,地平线参考算法集成了基于 Transformer 的纯视觉 BEV 模型、基于雷达点云的 3D 检测模型以及单目 3D 目标检测算法。地平线所提供的 BEV 感知模型 集成了目标检测和语义分割多重任务,可开放支持包括 IPM(Inverse Perspective Mapping)、Transformer 等多种转换方式,基于 Transformer 大模型,开放提供 包括 DETR 3D、GKT、PETR 在内的多类感知示例。地平线还于 2023 年上海车 展发布最新 3.0 BPU 架构纳什,专为大参数量 Transformer、大规模交互式博弈 设计,可灵活支持 Transformer 的细小算子。

\

黑芝麻:在功能完整性与性价比上具备一定优势,相比于部分 ASIC 路线公司产 品,或更能够适应 BEV + Transformer 新趋势。黑芝麻主要瞄准中高算力市场, 华山系列 A1000、A1000 Pro、A2000 的算力分别为 58、106 和 256TOPS。此 前,黑芝麻 A1000 的量产进程有所延迟,目前有望于今年上车江淮思皓与领克 08,正式开启商业化之路。 针对 BEV+Transformer:黑芝麻自研 NPU具有较好兼容性,可兼顾 Transformer 算法。黑芝麻自研神经网络加速器 NPU 以及图像信号处理 ISP 两大核心 IP,使 得 A1000 具备高性能&高能效,能够做到卷积层平均 80%的 MAC 阵列利用率, 有助于客户在大模型与复杂算法场景下更高效开发。

辉羲智能:瞄准 BEV + Transformer 行业新趋势,切入大算力芯片市场,有望抓 住软硬件尚未固化的窗口期,实现弯道超车。公司成立于 2022 年,创始团队具 备微软亚洲研究院、百度、商汤、上汽、蔚来以及上海交大等产学研背景,拥有 芯片&自动驾驶系统研发设计,以及量产适配上车的深厚经验积累。公司于 2023 年 2 月完成由顺为资本和小米联合领投的数亿元天使+轮融资。当前产品涵盖车端 智能驾驶芯片和计算平台、云端数据智能平台、城区 NOA 和 GPT 模型应用等全 栈式解决方案。 芯片层面,公司首款产品 R1 SoC 即针对 BEV+Transformer 以及舱驾一体新趋 势进行设计,规划算力超 260TOPS,有望于 2024H1 SOP,具备支持 BEV + Transformer 的最新架构。公司主打“数据闭环定义芯片”,基于自研大算力架构, 介于 ASIC 和 GPU 之间,因此算法灵活性与通用性较高,能够在 AI 算力、 CPU/GPU 性能、内存带宽以及整体架构上支持大模型算法以及跨域计算等需求。 工具链&生态层面,公司积极构建工具链生态,利于客户加速向国产化平台迁移。 辉羲提供完整工具链 RhinoRT,做到 CUDA Like,支持 BEV/Transformer 算法部 署,同时支持常见的 AI stack 以及客户的自定义算子,有利于加速现有英伟达产 品客户的迁移效率。

华为:定位 Tier 1,多维度赋能车企造车,自研 MDC 计算平台在架构与算力上 表现突出。我们认为,基于 MDC 计算平台、通信技术、大模型积累以及鸿蒙底 层生态,华为将持续引领自动驾驶基础软硬件行业,但目前仍主要面向智选车生 态合作伙伴,向更广泛车企拓展的能力仍待观察。 MDC 平台为自动驾驶提供可扩展且灵活的算力支持。华为 MDC 平台基于多颗鲲 鹏 CPU 与昇腾 AI 芯片的 SoC 组合,推出 MDC210、MDC300F、MDC610 和 MDC810,实现 48 TOPS – 400+ TOPS 的算力,覆盖 L2+至 L4 级别自动驾驶。 MDC 平台遵循平台化和标准化原则,能够以一套软件架构,支持不同硬件配置, 实现软硬件解耦。同时,MDC 平台充分考虑到感知、决策、规划、控制等不同环 节对 CPU 和 AI 算力的不同需求,由自研鲲鹏 SoC 提供 CPU 算力,昇腾 SoC 提 供 AI 算力。2021 年 4 月,华为宣布 MDC 810 已实现量产,并于 2022 年正式上 车北汽极狐阿尔法 S Hi 版以及长安阿维塔 11,MDC 610 也于 2022 年量产上车。

\

市场空间:中国自动驾驶芯片市场 2030 年有望超 700 亿元

我们认为,中短期来看,随着价格战打响,不同价位车型的智能化方案或有所分化, 进而产生对芯片算力和架构的不同需求。而长期来看,智能化渗透率决定需求,中央计算、 大模型等新范式决定技术路线,量产经验、工具链、性价比决定规模与竞争格局。自动驾 驶芯片将是全产业链格局最为稳固、集中度最高的环节,我们判断,全球市场 4-5 家、国 内市场 3-4 家寡头或有望占据行业 80%-90%以上的市场份额。 同时,我们对国内市场 2022-2030E 自动驾驶芯片市场规模进行测算,至 2025 年有 望超 100 亿元,至 2030 年有望超 700 亿元。我们测算的核心假设如下:

1) 乘用车销量:我们假设 2023 至 2030 年,中国乘用车销量以年平均 1%速度增长。 2) 功能渗透率:针对传统 L1/L2 功能,我们预计未来 2-3 年将是功能快速规模放量 的阶段,分别将于 2024 和 2026 年达到渗透率的最高点(25%/40%),随后开始 逐渐下降,预计至 2030 年分别约 3%和 30%。针对 NOA 功能,我们预计高速 NOA 将于 2023 年开始加速落地,而城区 NOA 今年才正式开始上车,且需要 3年左右的时间实现“从有到优”,因此我们假设至 2025 年高速/城区 NOA 渗透率 将分别达到 15%/1%,至 2030 年渗透率将分别达到 45%/20%。而 L4 距离真正 落地仍有较远距离,我们认为 Robotaxi 大规模铺开的前提是前装量产车型的推出, 而目前运行的车型仍为后装改造车。根据我们进行的产业链调研,头部 L4 玩家皆 规划在 2025 年前后推出前装量产车型,届时才有可能冲击万台规模,因此我们 测算至 2025/2030 年,L4 渗透率将分别约 0.05%/2.0%,对应车队规模超 1 万和 50 万台。

3) 芯片配置:我们假设,传统 L1/L2 功能单车配备 1/1.5 颗小算力自动驾驶芯片, 高速 NOA功能(L2+)单车配备 1颗中算力自动驾驶芯片,城区 NOA功能(L2++/L3) 单车配备 2 颗大算力芯片,L4/L5 等全无人自动驾驶单车则需要平均配备 4 颗大 算力芯片。 4) 芯片单价:L1/L2 等级自动驾驶系统通常配备以 Mobileye EyeQ3、地平线 J2/J3 为代表的中低算力芯片,以 J2 约 20-30 美元、J3 约 50 美元的价格测算,我们假 设 L1/L2 所配备的自动驾驶芯片单颗平均为 100/200 元。对于配置高速 NOA 功 能的车型,中算力芯片单价参考黑芝麻 A1000 约 100 美元、英伟达 Xaiver 约 150 美元,我们假设单颗平均价格为 1000 元。对于配置城区 NOA 以及 L4/L5 功能的 车型,我们参考英伟达 Orin X 约 400 美元的单价测算,假设单车配备的芯片平均 单颗为 2500 元。上述价格皆针对 2022 年进行假设,而伴随量产规模扩大,我们 认为芯片单价将呈逐步递减趋势,且在中低算力芯片上表现更为显著。

图片来源:未来智库

免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:刘婧
关键词:   芯片  自动驾驶  SOC  英伟达 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。