焉知汽车科技

  • 首页
  • 文章
  • 视频
  • 资料

年会 | 纯视觉方案是城市NOA的最佳选择么?

2024-08-15 17:53 1725
摘要:
2024年8月1~2号,第四届焉知汽车年会在上海龙之梦大酒店圆满召开。在年会的主论坛上,广汽研究院首席科学家、自动驾驶实验室主任陈学文分享了主题为《大模型下的自动驾驶:挑战和机会》的演讲。

图片

出品 | 焉知汽车


2024年8月1~2号,第四届焉知汽车年会在上海龙之梦大酒店圆满召开。在年会的主论坛上,广汽研究院首席科学家、自动驾驶实验室主任陈学文分享了主题为《大模型下的自动驾驶:挑战和机会》的演讲。


演讲内容主要分为三大部分:1)智能化汽车时代的到来;2)AI+数据驱动下的自动驾驶;3)大模型落地的机遇和挑战。


在演讲中,陈博士提到,在中国做城市NOA,其中,最大的挑战之一就是:为自动驾驶系统构建“博弈大脑”。现在自动驾驶车辆还是处于人车混合的交通之中,系统可能随时都要面对那种不遵守交通规则的随心所欲的切入,以及极度拥堵情况下的变道等场景。城市NOA系统只有能够处理好这种复杂的“博弈”场景,用户才能够安心地去使用。


图片

自动驾驶能力要素


同时,在大会期间,焉知汽车对广汽研究院首席科学家陈学文博士进行了专访,针对城市NOA相关话题就行了深度访谈。以下内容是焉知汽车在不改变受访者原意的基础上,对访谈的核心内容进行了整理和提炼,以供业内人士参考。


焉知汽车:广汽在智能驾驶技术领域同时布局了“多传感融合技术”和“无图纯视觉技术”两条技术路线,而且两条路线都将摆脱对高精度地图的依赖。


“随着算法和模型升级,基于AI视觉大模型的感知能力和基于多视角摄像头可满足复杂场景下环境感知的需求,逐渐摆脱对多种复杂传感器的依赖。广汽选择双路线是基于技术发展趋势和策略的多重考量。”有相关技术专家提到。


您如何看待这两条技术路线之间的关系?


陈学文:我们可以把它归纳为两条技术路线 —— 融合路线和非融合路线。然而,从技术实现的本质来看,两种路线并无太大差异,主要区别在于是否带有激光雷达。


如果纯视觉方案能做到带激光雷达的效果 ,那么激光雷达所能带来的增量效果就会变得很低。在这种情况下,激光雷达可能不再是必需的,除非涉及到L3级或更高级别的自动驾驶方案,此时激光雷达可以作为冗余传感器提供额外的安全保障。


对主机厂来讲,成本是最关键的考量因素。基于成本考虑,纯视觉方案在成本效益上具有明显优势。虽然激光雷达的价格已从最初的数万元大幅降至约1000元,但随着成本的显著降低,激光雷达的性能也是在无形中被弱化了,也就是说成本的降低在一定程度上是以牺牲了一部分性能为代价的,例如,早期的激光雷达能够实现360°全方位扫描,而现在低成本雷达的扫描范围通常只有100多度。


焉知汽车:在自动驾驶技术尚未从L2级别跨越到L3级别之前,根据现行法律规定,驾驶员是不允许完全“脱手”和“脱眼”的。随着视觉感知技术和算法能力的提高,加之特斯拉采用纯视觉方案的成功案例,业界普遍认为纯视觉系统在成本和技术可行性方面都是一个相对理想的选择。


然而,当自动驾驶技术跨越到L3级别,需要实现能够“脱手”和“脱眼”驾驶时,业界倾向于引入激光雷达,以增加系统的冗余性和安全性。您怎么看?


陈学文:在L3级及以上的自动驾驶系统中,为了实现冗余,通常需要配备两套独立的传感器系统。激光雷达可以充当冗余传感器,同样,4D毫米波雷达也有潜力作为冗余传感器,激光雷达并非唯一的选择。冗余传感器是作为与主传感器系统相独立的备用系统。所谓的冗余与当前讨论的融合方案是两个不同的概念。


各类传感器都有其性能边界,冗余传感器的作用是在主传感器的性能边界之外提供补充。然而,融合方案可能无法提供这种补充性优势。融合方案看似能解决众多问题,但实际上,有时单一传感器能处理的问题,在融合后反而可能变得难以解决。


事实上,视觉系统在很多方面都优于激光雷达。比如,视觉系统能够提供语义理解、文字识别、符号识别和信号灯识别等功能,这些反而都是激光雷达所不擅长或不具备的能力。


总之,仅依赖视觉传感器的自动驾驶系统在技术上是有可能实现的;然而,如果缺少视觉传感器,仅依靠激光雷达却是不足以支持复杂自动驾驶任务的实现。


焉知汽车:现在多数业内人士认为,纯视觉方案在某些极端天气环境下还是会存在一些有待克服的挑战。但您曾对外谈到:“雨天、晚上我们都跑过,都不是问题,以前别人都说纯视觉方案会存在的问题,其实都不是问题。”


那么,在大雨天,雾天或进出隧道时,摄像头目标检测普遍会存在一些问题,比如图像失真、传感器性能下降导致感知距离下降等问题,目前是否有好的解决方法?


陈学文:目前,即使配备激光雷达的量产车在大雨中进行行驶时,通常也是不会允许启动自动驾驶模式,因为这种极端天气条件超出了设计运行域(ODD)。


原因在于,雨滴对激光的散射和吸收作用,导致信号衰减或误检,影响激光雷达的测量精度和探测距离,使得系统难以在这种条件下正常工作。在极端恶劣天气条件下,当前传感器技术其实都还难以提供可靠的解决方案。


在雨天的情况下,由于我们依赖感知系统而非高精地图来识别车道线,我们发现系统能比较准确识别本车道的车道线,但对邻近车道的识别则不够准确。雨水的飞溅和飘散会遮盖车道线,有时甚至连肉眼也难以辨认。我们的目标是实现100至150米的视觉范围,但在大雨天,这一范围可能会缩减至大约四五十米。


对于进出隧道场景,我们也进行了测试,并没有发现太大的问题。人类的眼睛视线范围是有限的,而车上却可以配置有不同朝向的摄像头,在出隧道时,它们不会全部直接对准光源,因此,相比人类驾驶员,自动驾驶系统反而能够更好地适应光线变化,进而更好地应对进出隧道的场景。


根据我的评估,纯视觉系统能够解决大部分问题。 虽然我们在城区和高速公路上的有些测试中没有需要人工接管的情况,但随着测试次数的增加,肯定不会每次都能同样顺利。不过至少从目前的经验来看,在非极端的雨天或夜间条件下,我们的系统都能够妥善应对。但为了确保可靠性,我们认为还需要收集更多数据进行验证。


焉知汽车:采用端到端的技术路线将会面临着多方面的挑战,包括算力、数据获取等。事实上,端到端的技术路线并不一定适用于所有的车企。那么,车企应该如何选择适合自己的技术路线呢?


对大多数车企而言,我不认为端到端一定是最佳的路线选择。即使是特斯拉,也尚未完全证明端到端一定是自动驾驶的终局方案。端到端不仅要求企业具备大量的AI训练芯片,而且对数据也有极为严格的需求 ——  数据不仅要有充足的量,还要有足够的多样性,这对数据采集提出了很高的标准。


在现实世界中,面对那些未经过数据训练过的场景,系统应如何做出反应?端到端可以指导系统如何驾驶,但它不能明确指出哪些驾驶行为是不被允许的。期望单一的模型在经过大量数据训练后就能解决所有问题,我认为这本身就是一个“bug”。


当前自动驾驶技术的核心挑战在于如何构建其“大脑”。构建这样一个“大脑”本质上涉及两部分内容:规则驱动和数据驱动。完全抛弃规则的做法,我不太认同。在开发自动驾驶技术时,安全是最重要的前提,因此规则是不可或缺的。但这并不意味着我们要像过去那样完全依赖规则。我们将数据模型整合进来,与规则相结合,以指导系统输出更合理的驾驶轨迹。


焉知汽车:广汽的无图纯视觉智驾系统方案,在决策及执行层面还能“主动思考”,不仅“识别准”,还能更进一步实现“决策准”,最终实现复杂多变全场景的智能驾驶;即使遇到紧急情况,也能够提前预判,完美避让,像老司机一样从容驾驶,为智能出行带来更高的安全保障。


在决策和执行方面,广汽无图纯视觉智驾系统对外宣传有三大创新点:


1)对动态交通物体的实时跟踪、意图识别和轨迹预测;2)建立了数据驱动与专家规则协同的指挥大脑;3)首创了流体式时空联合规划技术。


所谓的流体式联合规划又是怎样的技术?能解决什么样的问题?


陈学文:对于车辆的路径规划,在早期,横向和纵向是分开处理的。我们可以首先解决横向问题,然后是纵向问题,或者相反。不同的主机厂可能采取不同的策略,比如,首先解决空间路径问题,即确定如何行驶;在此基础上,再解决时间问题,例如在不同时间点应采用何种加速度。然而,这种方法仍有局限性,因此后来发展出了时空联合规划技术。它能够在空间和时间两个维度上同时进行路径规划和决策制定。这项技术的核心优势在于它能够直接求解最优轨迹,同时控制车辆的方向和速度,以适应复杂的交通环境和实时变化的路况。


但是,这种方法并没有充分考虑到其他车辆对本车的影响,仅将前方车辆视为障碍物。如果遇到一辆压线行驶且距离本车很近的大型卡车,应该如何应对?


时空联合规划可能难以解决这类问题,因此我们引入了流体式时空联合规划技术。旨在解决车辆与其他交通参与者之间的博弈问题。这项技术的核心在于将动态变化的交通场景视为一个"流场",“流场”中的每个障碍物都会产生扰动,根据扰动的大小,系统会即时产生远离信号或进行预防性避让。


可以简单理解为:其它车辆距离本车越近,其影响力越大;距离越远,影响力越小。这样,在车辆交汇和博弈场景中,我们通过在时空联合规划中结合流体动力学的概念,可以使得系统规划出的轨迹能够像流水一样流畅地绕开危险并灵活处理不同的扰动因素,有效解决了自动驾驶中的决策难题。


焉知汽车:现在国内头部的主机厂都在加快速度推动城市NOA的量产落地,您认为目前要量产一个“好用”的城市NOA功能的挑战和机会是什么?


陈学文:目前,城市NOA并不需要立即解决所有问题。仅仅在拥堵场景中,如果能够让用户安心地将驾驶权交给系统,我也愿意为此付费。通勤时的交通拥堵确实令人烦恼。通勤拥堵场景可以说是实践城市NOA落地的最佳环境之一。


城市NOA是否"好用"的一个关键指标是能否让用户感到安心——即使偶尔发生小事故,用户依然能够安心使用。我们的团队目前正在解决这一问题。我向团队,尤其是产品工程师提出,在设计城市NOA功能时,应着重体现“安全”和"安心"这些要素。目前,对于什么样的城市NOA能让用户感到"安心"使用,并没有一个统一的评价标准。不过,目前行业内也都在积极地去制定相关的评价标准。

另外,个人认为,大家持续地去“卷成本”是件令人痛心的事情。虽然许多企业声称拥有低成本的智能驾驶方案,但自动驾驶最终关乎到人的生命安全。我们应致力于技术上的“打磨”和精益求精,并最终为用户提供既"安心"又"好用"的自动驾驶产品,这才是行业共同努力的目标和方向。

评论 0

请先 登录 后再发表评论~

Bella

362

获赞

9

粉丝

2

关注

热门文章

百度 ANP 3.0,算是技术最牛的智能驾驶方案了吗?
百度 ANP 3.0,算是技术最牛的智能驾驶方案了吗?
知车视界:智能电动汽车6月大事解析(75页PPT,附下载).pdf
知车视界:智能电动汽车6月大事解析(75页PPT,附下载).pdf
嬴彻科技《自动驾驶卡车量产白皮书》102页
嬴彻科技《自动驾驶卡车量产白皮书》102页
知车视界:智能电动汽车7月大事解析(53页,附下载)
知车视界:智能电动汽车7月大事解析(53页,附下载)
焉知月刊:知车视界202205.pdf
焉知月刊:知车视界202205.pdf
面向车载中央计算平台的智能芯片发展趋势
面向车载中央计算平台的智能芯片发展趋势
知车视界:智能电动汽车8月大事解析(62页,附下载)
知车视界:智能电动汽车8月大事解析(62页,附下载)
汽车行业数字化转型白皮书:绸缪御风之术,臻于至善,业数合力创新,步步为营
汽车行业数字化转型白皮书:绸缪御风之术,臻于至善,业数合力创新,步步为营
知课 国六汽油机OBD控制策略总览
知课  国六汽油机OBD控制策略总览
百度汽车云3.0 ,为端到端自动驾驶量产落地提速
百度汽车云3.0 ,为端到端自动驾驶量产落地提速

更多精华美文扫码阅读

焉知汽车

焉知汽车

希骥电池与储能

希骥电池与储能

© 2018-2025 焉知 All Right Reserved · 沪ICP备15043037号-5 沪公网安备 31011502007507号