解析百度智能汽车业务：如何做到纯视觉，轻地图？

众所周知，电动化、智能化正在重塑汽车行业格局。目前，行业电动化转型已经进入高潮期，智能化成了下半场竞争的焦点。百度IDG智驾融通创新部总经理苏坦表示，到2026年，智能化的竞争会接近尾声，没有跟上的企业会与头部公司拉开比较大的差距。

智驾行业供应商的竞争也比较激烈，入局的玩家众多，包括老牌Tier 1、跨界科技公司、从L4降维的Robotaxi公司等。

百度是比较早的从L4降维做前装量产的企业。2021年，百度成立了智能汽车事业部，目前已经推出城市域领航辅助驾驶Apollo City Driving Max、行泊一体Apollo Highway Driving Pro、自主泊车Apollo Parking产品。

图片来源：百度

做L4级Robotaxi和L2级前装量产辅助驾驶是两个完全不同的逻辑，前者要求多重冗余，要堆叠最好的硬件保证驾驶的安全性，后者则强调性价比，要用尽可能低的成本，实现能让用户感知到的智能驾驶，所以玩家正在逐渐减轻对一些昂贵配件的依赖。

从L4降维入局的玩家，无不遵循这样的行业逻辑，百度也是如此。百度的智能驾驶解决方案有两个关键词：纯视觉、轻地图。

如何做到纯视觉、轻地图？

2023年以来，汽车终端的价格战传导至上游的智驾产业链，降本成为每个玩家迫切需要解决的问题。在感知端，由于激光雷达成本居高不下，部分玩家进而转向纯视觉方案。

百度在纯视觉领域的探索比较早，其智能驾驶解决方案ANP3.0可以算是国内唯一能依靠视觉跑通城市多场景的智驾方案。传感器方面，ANP3.0使用了7颗800万像素高清摄像头、4颗300万像素高感光环视专用摄像头，以及5颗毫米波雷达和12颗超声波雷达。2颗毫米波雷达是作为冗余方案可选择性搭载。

图片来源：百度

这背后的技术主要是百度第二代纯视觉感知系统Lite＋＋。它通过Transformer把前视特征转到BEV，在特征层面对相机观测进行前融合后，直接输出三维感知结果，也就是用BEV在线学习地图和道路元素属性。

BEV是当下非常流行的一种感知算法，2021年特斯拉FSD Beta便采用了BEV技术，近期国内的造车新势力和自动驾驶方案供应商们也都用上了BEV，包括小鹏、理想、蔚来、毫末等。

简单理解BEV的原理，就是系统将所有摄像头和其他传感器采集图像通过矫正后统一输入到神经网络来提取特征，然后将这些特征进行关联，投影到一个向量空间之中，最终能拿到一张反映周围环境的鸟瞰图。

BEV算法虽然好用，但有一定的门槛，最重要的就是数据获取能力和数据标注能力。毕竟前端采集到的图像数据越多，生成的鸟瞰图才越精确，另外数据标注价格高昂，如何用较低成本提高标注效率成了一个重要的竞争点。

对标特斯拉，特斯拉有如此强大的视觉得益于无法被轻易超越的数据优势，包括：百万级车队数据回传、成熟的3D数据标注工具链、规模达上千人的数据标注团队。

再看百度，百度的优势在于，其从2013年便开始研究自动驾驶，积累了大量的终端数据。官方数据显示，百度L4 Robotaxi已经累积了4000万公里测试里程，覆盖了不同城市、不同季节和时间段，测试运营过程中实时传感器数据全量落盘上云，这些都可以直接为百度的Lite＋＋所用。

数据处理方面，针对原始传感器记录的4D数据，百度专门搭建了离线pipeline，进行感知计算。全计算流程在云上完成，自动化率达到90％以上，数据生产速度可达到每周数百万帧，以支撑BEV模型研发。

当然，相比于激光雷达，视觉摄像头在强光和弱光环境下会有一些感知缺陷，百度如何应对这个问题？

对此，百度智能驾驶事业群组技术委员会主席王亮解释道，在极端环境下视觉或许很难检测到障碍物是什么，但识别到有障碍物有这件事情并不难，此外，数据和算法也可以在一定程度上弥补感知的缺陷。

此外，王亮表示，百度做纯视觉还有一个优势，就是其决策规划能和视觉感知相匹配，这主要得益于百度丰富的视觉感知技术研究经验。公开资料显示，百度从2019年就开始启动Apollo Lite项目。

“这些模型背后，不只是一个大家看到的BEV算法，用惯了激光雷达的厂商，没有那么容易把决策规划和视觉感知结果去适配。我个人感觉近三年，没有哪家国内自动驾驶企业，做到百度这样的能力。在辅助驾驶这个赛道，百度在国内最有机会，先把激光雷达拿掉。”王亮说。

传感器路线之外，是否要使用高精地图也是业内讨论度比较高的话题。高精地图能为自动驾驶车辆提供非常精准的路况信息，但是成本高、铺设进展慢、数据更新慢，无法满足正迅速落地的辅助驾驶的需求。因此，不少企业开始走“重感知、轻地图”的路线，百度则是研发了轻量化的自动驾驶地图，降低地图的制作成本。

主要措施如下：

1.采集阶段对地图数据减负。

原先同路段需要通过反复采集的方式来降低误差，成本高，效率低。百度通过线上PNC算法优化和地图点云拼接算法的升级，提升对地图精度误差的容错力，每条路线仅需要采集1次即可制图，大幅降低了地图生产的外业成本。

2.定位图层降维。

此前，一份高精地图至少需要特征点、激光点云反射值和Landmark三份图层数据才能成图。现在定位算法降低对点云和特征点的依赖，仅依靠Landmark定位图层即可支撑ANP3．0的城市道路高精自定位。

3.地图元素标注瘦身。

高精地图包含静态，动态多个层面的实物参与。最典型的就是路口红绿灯识别，此前需要对每个灯头都进行单独标注，并且灯头也需要与其对应的车道线进行绑定关联，标注人员的操作极为繁复，容易出错。

现在，百度通过提升感知红绿灯的能力以及提升对场景语义的理解能力，瘦身后的标注仅需要标注一个框，且仅需要和停止线建立一条绑定关系，降低了人工标注出错的概率和成本。

总结

当前，自动驾驶已经进入落地的深水期。百度认为，虽然自动驾驶已经发展了这么多年，但一直没有出现一个符合大众想象的自动驾驶。其核心在于，用户没有用到有“高度获得感”的产品，所谓高度获得感，就是能够解决日常通勤这一主流且高频的场景。

目前，已经有越来越多的企业意识到这个问题，带来的一个利好讯号是，摒弃了一些昂贵的部件之后，自动驾驶，或许真的要进入寻常百姓家了。