基于统一BEV表征的多任务多传感器融合技术

发布者:真诚友爱最新更新时间:2024-04-15 来源: elecfans关键字:融合技术 手机看文章 扫描二维码
随时随地手机看文章

为了实现多传感器数据的统一表达(Unified Representation),以前常规的方法:


1)Lidar-To-Camera: 将激光雷达点云投影到图像上,使用2D CNN算法来完成数据处理。它会造成严重的几何扭曲(如下图a),影响3D Object Recognition等Geometric-Oriented任务的效果。

2)Camera-To-Lidar: 用Semantic Labels、CNN特征等信息增强点云,然后使用LiDAR-based Detector来预测3D Bounding Boxes。这种Point-Level Fusion的方法丢失了语义信息,在Semantic-Oriented任务中表现不佳(如下图b)。

b7d30632-5353-11ee-a25d-92fbcf53809c.png

BEV Fusion Method

BEVFusion在BEV空间实现了统一的多模态特征表达,同时保留几何结构和语义信息。

wKgaomUDu9KAC1j-AAH81g37uCE276.png

BEVFusion对不同模态的输入采取不同的编码器(Encodes)来提取Features,这种方法既保留了几何信息,又保留了语义特征信息;然后使用Fully-Convolutional BEV Encoder融合多模态的Features,缓解不用特征之间的局部偏准(Local Misalignment);最后添加一些特定Head来支持不同的3D场景理解。

BEVFusion优化后的BEV Pooling实现了40x的速度提升;它比Camera-Only的模型实现了6%的mIOU提升,比Lidar-Only的模型实现了13.6%的mIOU的提升。

Camera-to-BEV Transformation

Camera-to-BEV的变换首先要解决每个像素的Depth问题,文中采用了与论文LSS(Lift, Splat, Shoot)的方法来预测每个像素的离散深度分布。

wKgaomUDu6yAMniuAAId-ZXlUhw732.png

如下图所示,对每个Feature Pixel沿射线假设D个离散点(每个像素对应D个空间位置),每个离散点的可能性对应一个归一化的概率。

所有的Camera特征组合在一起,形成NHWD的Camera Feature点云,N是Camera的个数,HW是每个Camera Feature Map的大小。

沿着x,y两个方向,按照rxr的BEV网格,使用BEV Pooling对Camera Feature点云进行聚合量化。

最后,沿z轴Flatten这些特征。

这个过程中的BEV Pooling耗时严重,作者提出了Precomputation和Interval Reduction解决这个问题。

Precomputation

b8261f70-5353-11ee-a25d-92fbcf53809c.png

相机的外参是固定的,内参也是固定的,相机的射线上采样的D个离散点的采样间隔也是已知的,因此Camera Feature点云的每个点的x和y坐标是固定的,每个点在哪个BEV Grid中也是不变的。因此可以通过预计算的方式提前计算好,之后直接用即可。

Interval Reduction

b8542834-5353-11ee-a25d-92fbcf53809c.png

LSS使用Prefix Sum计算每个BEV Grid的聚合结果。

如上图所示,index是网格的编号,BEV Pooling的目标是将相同index的Value加起来,即将同一个网格内的特征聚合在一起。

Pref.sum是一个累加和。1=1,4=1+3,11=1+3+7,10=1+3+7+(-1),…

Pref.sum只是一个中间结果,用来辅助计算最终的聚合值。在Index变化时,减去前一个index的Pref.sum值,得到聚合结果result。

LSS的Prefix Sum可以看做是单线程的计算过程,本文直接使用Specialized GPU Kernel对多个BEV Grid独立并发计算,没有计算和存储前缀和的开销,大大加速了计算过程。

优化后的BEV Pooling将Camera-To-BEV Transformation提升了40倍,Latency从500+ms降低到12ms。

Fully-Convolutional Fusion

Lidar和Camera的BEV Features可以简单的用Elementwise Operator(比如Concatenation)来做Fusion。

由于Depth估计的误差,Lidar BEV Features和Camera BEV Features可能会存在Spatially Misaligned的问题,因此需要Convolution-based BEV Encoder来解决这类问题。

class ConvFuser(nn.Sequential):
    def __init__(self, in_channels: int, out_channels: int) -> None:
        self.in_channels = in_channels
        self.out_channels = out_channels
        super().__init__(
            nn.Conv2d(sum(in_channels), out_channels, 3, padding=1, bias=False),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(True),
        )

    def forward(self, inputs: List[torch.Tensor]) -> torch.Tensor:
        return super().forward(torch.cat(inputs, dim=1))

效果测试

b874ccba-5353-11ee-a25d-92fbcf53809c.png

C是camera模态,L是LiDAR模态,MACs用于评估计算量,Latency是延时,BEVFusion结合了Camera模态和LiDAR模态,达到了SOTA,并且计算量和Latency也比较低。

b8aa2932-5353-11ee-a25d-92fbcf53809c.png

在nuScenes的BEV Map Segmentation中,BEVFusion达到了SOTA,并且对不同的地图元素的Segmentation Performance都有提升。

b8dabda4-5353-11ee-a25d-92fbcf53809c.png

在晴天、雨天、白天、夜晚场景下,BEVFusion都有不错的表现。

b8f77354-5353-11ee-a25d-92fbcf53809c.png

BEVFusion对于大物体、小物体、远处的物体、近处的物体的Performance都有提升;并且它在稀疏的Lidar波束上仍有不错的表现。


关键字:融合技术 引用地址:基于统一BEV表征的多任务多传感器融合技术

上一篇:新能源汽车分类及优缺点分析
下一篇:CAN L与CAN H导线相互反接

推荐阅读最新更新时间:2024-11-02 15:01

2015“云”里“物”里看安防技术融合
    2015,之于中国安防,注定不平凡。或许多年以后,永久被记载。当我们在不绝于耳谈论行业过冬术的同时,也真切感受到,中国安防因产业升级和市场转变跨入了技术新阶段——云技术、物联网与监控的大融合。   漫步云端,畅想改变   忽如一夜春风来,千树万树梨花开!云监控,一股技术浪潮席卷2015年的中国安防。从技术上看它促进了数据的集中,加强了视频数据的共享服务,这为后续的大数据应用奠定坚实的基础。如此一来,摄像机的视频可以发送到云端进行监控,这一监控过程可以私下操作,运营商观或者管理方随时随地、随心所欲查看视频进行判定和识别,来采取正确的防范措施措施。比如,某家公司提供在线监测解决方案,可以为企业的注册会员提供商
[安防电子]
传感器融合感知技术 带来全新互动操控体验
随着物联网成为市场追逐热点,所有电子产品的智能化程度都在逐步提升,这归功于电子系统大规模引入嵌入式感知技术、数字管理和联网功能。据分析机构预测,未来几年传感器特别是MEMS产品将是半导体市场上最有前景的技术。鉴于此,智能感知技术与传感器走向进行融合,传感器智能感知技术是现实“模拟”世界与电子数字世界之间的交互界面。意法半导体大中华暨南亚区模拟,微电机系统&传感器市场部总监吴卫东表示,我们的目标是让传感器融入我们的日常生活,让普通消费者达到更互动的操控体验、更优质健康的生活质量、更高效的工作方式。     意法半导体大中华暨南亚区模拟,微电机系统&传感器市场部总监吴卫东   传感器的发展趋势将呈现集成化、小型化和智能化。新型类别
[模拟电子]
<font color='red'>传感器</font><font color='red'>融合</font>感知<font color='red'>技术</font> 带来全新互动操控体验
两种设计技术融合,Sequence、Synfora抱团共谋SoC功率结构
Sequence Design公司和 Synfora 公司日前宣布,双方已创建了一个合成流程,该流程结合了Sequence的PowerTheater RTL功率分析工具和Synfora的PICO Express Application Engine Synthesis( AES )。为了促进双方的合作,Synfora加入了 InSequence 的技术伙伴计划,以便推广 EDA 互用性和先进设计方法。 Synfora公司总裁兼CEO Simon Napper表示:“加入InSequence计划后,我们可以结合两种设计技术,使彼此的客户能够在结构级别上实现功率优化。这种结合让用户可以在设计早期对高端SoC的性
[焦点新闻]
破界 融合 | 2023国自智慧物流产品&技术发布会详解
2月16日下午,“2023国自智慧物流产品&技术发布会”与大家如约在线相会,本次发布会以“破界 融合”为主题,全面展示国自智能物流发展规划及部分全新产品,为更多客户实现从 数字化 到智能化发展,建设全面智慧物流体系提供新的思路和方向。 国自 机器人 副总裁王文斐以“从数字化到智能化,构建智能物流标准化新时代”为主题,从宏观角度为大家全面梳理了国自智能物流物流的发展规划。 国自的智能物流业务总体上分为三个阶段,第一阶段阶段是单产品、单场景的业务逻辑实现,我们拥有了重载、移载、潜伏顶升等全面的业务线,满足客户单场景的物流需求。在第二阶段,我们用多产品、多场景来实现客户的整体解决方案,并在一些行业里进行了完整的落地。例如重工和光伏行
[机器人]
哈曼Ready Vision融合增强现实抬头显示技术,为用户带来高阶驾驶体验
哈曼国际作为汽车领域先进的科技公司与三星电子有限公司旗下全资子公司,专注打造消费级体验,汽车级品质。今日,哈曼宣布推出集增强现实抬头显示(AR-HUD)硬件和增强现实(AR)软件产品为一体的Ready Vision解决方案,用以提升驾驶员安全和注意力。Ready Vision的AR软件能够与汽车传感器集成,在不影响行驶的情况下,通过音频和视觉预警及时、准确地为驾驶员提供关键信息。 哈曼Ready Vision通过在挡风玻璃上直观显示对前方线路的转向指引,打破了现实世界和数字世界的边界,提升了驾驶员对行车信息的感知。Ready Vision还能通过计算机视觉技术和机器学习进行3D目标检测,向驾驶员提供高精确性的碰撞预警、盲区预警
[汽车电子]
哈曼Ready Vision<font color='red'>融合</font>增强现实抬头显示<font color='red'>技术</font>,为用户带来高阶驾驶体验
晨星机器人“吸睛”:高度融合新IT技术的智能制造新实践
2021世界制造业大会于11月22日在合肥落下帷幕。为期四天的大会中,作为向世界展示智能制造全面能力的窗口,联想展示了一系列让人惊喜的创新产品。现场展示的ThinkPad X1 Fold整体重量仅有1公斤,折叠起来之后的厚度大约为24毫米。当保持半开状态时,可以像拿本书一样握住,并且能同时运行两个应用程序。使用固定在中间的键盘之后,瞬间变成一台小巧迷你的笔记本电脑,屏幕尺寸为7英寸,基本上相当于现在的旗舰级大屏手机。 另一个颇受瞩目的“黑科技”便是联想晨星机器人,它会用机械臂向参观者挥手问好,现场参观者可以戴上AR眼镜,使用手柄控制,它的机械臂就会模仿体验者的动作,从而达到人机协同。 在世界制造业大会期间,这些“黑科技”也受到
[机器人]
晨星机器人“吸睛”:高度<font color='red'>融合</font>新IT<font color='red'>技术</font>的智能制造新实践
HFC使用EPON技术是实现三网融合最佳途径
     一、前言     2005年10月11日《中共中央关于制定国民经济和社会发展第十一个五年规划的建议》中指出“宽带通信网、数字电视网和下一代互联网等信息基础设施建设,推进‘三网融合’,健全信息安全保障体系。”虽是一句话,但引起了社会的广泛关注,它给了通信界一个重大的政策信号。     “三网融合”是指电信网、计算机网、广播电视网在技术上趋向一致;在网络层上互联互通;在业务层上互相渗透和交叉;在应用层上趋向统一的通信协议,有利于网络资源实现最大程度共享;在经营上互相竞争,互相合作。整个网络向下一代网络演进,这是网络发展的必然趋势。同时也揭开了各通信网络运营商从单向业务竞争转向全业务竞争,乃至网络间各个层面的全方位的
[嵌入式]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved