>新闻资讯
「芯」对话 | 奕行智能CEO刘珲:对乘用车ADAS芯片的几点思考
浏览量:1409     发布日期:2022.07.01

该文章转载自芯谋研究
责编:芯谋评论


6月25日,2022 中国·南沙国际集成电路产业论坛在广州南沙召开。本次峰会由广州南沙经济技术开发区管理委员会、广州市工业和信息化局主办;支持单位为广州湾区半导体产业集团有限公司、广东省集成电路行业协会、广州市半导体协会;广东省半导体及集成电路集群智库机构芯谋研究承办。广东省委常委、广州市委书记林克庆,广东省委常委、副省长王曦出席并致辞。




自动驾驶芯片的机会

新能源汽车近年来发展迅猛,自动驾驶技术发展日新月异。奕行智能科技(广州)有限公司CEO刘珲认为自动驾驶分为三个阶段,每一个阶段,乘用车自动驾驶芯片都拥有很多机会。

从时间轴来看,自动驾驶1.0阶段是发展原点,应用以L1和轻量级L2为主,自动驾驶芯片以简单的前向感知为主,功能也是简单的AI推理模式。此阶段车企希望在不花费过多资源的前提下,较快地将功能放到汽车中,这要求芯片厂商能提供有软件算法的整体解决方案。

自动驾驶2.0阶段是现在时,业界趋向理性,将L4拆分成单独的功能模块逐一攻克难点,诸如自动变道、自动超车、记忆泊车、代理泊车、红绿灯的直行/左转/右转等,这些功能算法复杂程度高、数据量丰富、长尾场景多,需要长时间打磨,不断提高系统安全性。此阶段车企希望将数据和算法掌握在自己手里,这要求芯片厂商能在满足L4算力需求和低成本的前提下,拥有开放底层的平台,供车企自主数据和算法开发。

自动驾驶3.0阶段是将来时,将各类功能模块串接在一起,接管率足够低、安全性超过人类驾驶,届时自动驾驶就会迎来真正的L4。在达到这一阶段之前,会经历很长时间的数据和算法迭代来甄别大量长尾场景,这一时间段就给了新晋芯片企业机会,如果能把产品做好会有很多机会。


(奕行智能CEO 刘珲)


数据、算法、算力是自动驾驶芯片的三驾马车,但行业在算力的认知上是存在偏差的。

其一,行业对算力的定义有偏差。行业普遍将算力和自动驾驶芯片性能等价,实际上借用芯片PPA(性能、功耗、面积)三个维度,算力在AI中是类似面积的资源性维度,因此衡量AI计算性能的最佳办法是看性能维度的算效。算效是单位算力和功耗下能达到的推理帧率。算力的代价是成本,所以应该在有限的成本框架尽可能丰富应用场景,途径就是提升算效,这需要做三个维度的事情:

  • 一是甄别软件高频出现的算子,将这些算子硬化,并更好地将计算颗粒度切割,做好并行化,以此提升硬件利用率;

  • 二是解决存储瓶颈,如参数的存储复用、多级流水线的存储、近存计算;

  • 三是泛化支持不同模型和算子,如在整个计算单元内置一些可编程的混合精度计算单元,更好地支持客户定制的算子。


其二,整个行业对标称算力是没有统一认知的,存在用稀疏化方式定义的情况。所谓稀疏化指的是AI神经网络中,对零或者接近零的值做软件层面的剪枝。这样的好处是轻量化AI神经网络,降低计算量。不过稀疏化不是万能的,而是有局限性的。一方面,稀疏化做了大量剪枝,网络结构被改变,网络精度会受到一定程度影响,对用户来讲需要重新训练;另一方面,稀疏化对某些神经网络并不适用,效果没有那么好。

如果用稀疏化方式定义标称算力,展现的硬件算力是包含软件层面压缩的效果的,这并不是一个非常好定义方式。从用户角度来看,如果网络不适配稀疏化,能感受到的算力和标称算力就会有差别。打个比方就像设计了100个车位的停车场,但租给200个用户,只有当200个用户不是任何时间都停在这里,车位才可能足够。这个方案不是任何场景都适用的,所以会出现问题。

对企业来说,如何提供最有竞争的自动驾驶底层芯片方案?刘珲分享了四点心得。

其一,自动驾驶芯片架构的发展趋势是异构。根据不同特点,现架构分为特定算法的专用架构和强调通用性的通用架构,但极端专用架构和极端通用架构专用都不能兼顾算效和灵活性。异构是处在专用和通用中间的架构,可兼顾算效和灵活性,它可根据不同计算场景和性质,适配到不同结构运算单元。打个比方就像交响乐中有很多不同演奏乐器,通过指挥协调,奏出美妙的交响乐。

其二,对于舱驾域融合如果不从舱内和舱外两个空间属性判断融合,而是以安全和娱乐属性进行切割,会让方案显得更加合理,这种方案既可以把安全做得更安全,也可以把娱乐做得更娱乐。舱驾域融合即为字面意思,将智驾域和座舱域融合在一起,舱驾域融合是要在操作系统层面做虚拟化的技术。但虚拟化并非解决问题的“圣杯”,虚拟化的代价是致使硬件部分额外增加10%以上的CPU开销,商业层面虚拟化也会引用更多授权和许可成本。

举个例子,将与安全相关的交互设施仪表盘、前向AR HUD和智驾域融合在一起,就无需引入虚拟化带来的额外硬件开销和商业成本,在感知可视化和近端渲染角度上也更合理,同时能把座舱的算力节省下来,在座舱做更丰富的生态和个性化的功能。

其三,用熵代表简单性和复杂性,要做的熵减而不是熵增。如今L2++级别的方案都是用在高配车上的,三年后这些方案可能就会应用到十几万到二十几万的车型上,这就对域控制器的成本提出很高要求。反观市场主流多芯片方案往往要上万,甚至数万的成本。从技术上来讲,用单芯片实现系统方案是较为靠谱的方式。

其四,自动驾驶芯片的性能需要在流量、带宽、存储方面不断优化,也需要在数据流通路上很多关键模块上做硬化加速。自动驾驶芯片不仅仅是一个AI芯片,从本质上来讲,它是一个针对视频数据和激光雷达的点云数据流处理芯片。传感器、数据流的处理很像一个河流流过的过程,AI就像蓄水池,假若和它相连的河流和河道太窄的话,整个性能都会体现不出来。