近年來,中汽數據有限公司(以下簡稱“中汽數據”),基于多傳感器融合采集硬件平臺,開展了基于高速公路、城市道路,和停車場場景的數據采集和數據平臺搭建工作,積累了大量的原始采集數據和場景采集數據。同時,基于這些數據,開發了對應的包括數據清洗、數據標注、數據提取、數據分析、場景算法開發、數據庫接口開發的一整套駕駛場景工具鏈平臺。這其中,數據清洗是整個工具鏈中的第一步,也是非常重要的步驟和功能。數據清洗的主要功能是對攝像頭、毫米波雷達、激光雷達、高精度慣導組合四大類車載傳感器采集的原始數據,進行數據清洗和去噪。同時數據清洗軟件既包含傳感器原始數據解析、傳感器數據同步、傳感器數據融合的上游工具集,又包含目標數據可視化、數據批量格式轉化與二次存儲的下游工具集。數據清洗軟件是中汽數據有限公司自主研發的具備獨立架構和功能的軟件平臺。
各種車載傳感器系統,基于不同的硬件構造、數據收發方式、與周圍環境的交互方式、不同的工況場景,都會產生相應的統計噪聲數據和系統噪聲數據,針對每種傳感器類別,我們將數據噪聲做如下分類:
毫米波雷達噪聲數據來源:毫米波雷達因其所處波段特性(10mm~100mm),極易發生波的反射,衍射等物理現象,而且不同工況下產生噪聲數據的原因不同,噪聲數據的種類也不同。主要包括以下6類:
①無效值噪聲數據;
②虛點毫米波噪聲數據;
③重影毫米波噪聲數據;
④有明顯橫向漂移速度的噪聲數據;
⑤有明顯縱向漂移速度的噪聲數據;
⑥頻閃毫米波噪聲數據;
激光雷達噪聲數據來源:激光雷達具有數據量龐大,掃描頻率低,具有地面反射點等特性,依據上述特性,激光雷達主要包括以下3類噪聲數據:
①激光雷達地面數據反射噪聲;
②激光雷達離群點噪聲數據;
③激光雷達運動畸變;
低速狀態LiDAR數據的畸變 高速狀態LiDAR數據的嚴重畸變
慣性導航噪聲數據來源:在GNSS電磁波傳播的路徑上,針對密集的高樓、地下停車場、立體橋等場景的遮擋和多次信號反射效應,原始定位數據中會存在統計誤差和系統定位不準確的噪聲數據,噪聲數據主要包括以下4類:
①GPS數據處于丟失狀態下的無效數據;
②GPS數據處于初始化狀態下的溢出數據;
③GPS數據處于粗對準狀態下的數據噪聲;
④GPS數據處于粗定向狀態下的數據噪聲;
中汽數據開發的數據清洗平臺的工具套件,主要實現了以下6大類功能:車載攝像頭系統、毫米波雷達系統、激光雷達系統、高精度慣導組合四大類車載傳感器的原始數據的數據解析,不同數據源之間的時間同步,目標級別數據的可視化,數據清洗功能,數據融合功能,數據批量格式轉換與存儲功能。數據清洗軟件實現駕駛場景原始數據的數據預處理工具鏈的完整應用生態。
清洗軟件的登錄界面
A.清洗軟件傳感器數據解析模塊:基于攝像頭傳感器采集系統,實現Ethernet接口、LVDS接口、USB接口、IEEE1394標準接口攝像頭的數據解析功能模塊;基于毫米波傳感器采集系統,實現CAN總線接口毫米波數據解析功能模塊;基于激光雷達傳感器采集系統,實現網口TCP/UDP通信的激光雷達原始數據解析模塊;基于慣性導航采集系統,實現CAN口、RS232、RS422串口的慣性導航組合的數據解析模塊;
清洗軟件毫米波雷達數據解析功能
B. 清洗軟件的數據同步模塊:利用傳感器自身的時間戳信息,基于相同品牌,相同數據刷新頻率的傳感器,實現同頻率傳感器之間的時間同步功能,基于不同品牌與款型,不同數據刷新頻率的傳感器(比如100HZ的IMU和20HZ的RADAR之間的數據同步),實現不同頻率傳感器之間的最近幀同步功能;
C.目標級別數據的可視化模塊:基于高清攝像頭與其他目標傳感器間的3向距離和3向歐拉角的空間平移與旋轉標定結果,實現RADAR傳感器,mobileye傳感器在高清攝像頭上的可視化功能,同時可以實時顯示每個目標物的ID,距離,速度,加速度等物理信息;
D.傳感器數據清洗模塊:基于對傳感器自身數據的輸出特點,并融合其他傳感器數據,完成相應的算法開發(例如多變量二分類機器學習模型),實現了對毫米波雷達系統,激光雷達系統,慣性導航系統,智能視覺攝像頭系統的噪聲數據的清洗與去除功能;
基于Boost Decision Tree模型對毫米波雷達的噪聲處理
E.傳感器數據融合模塊:基于精確的外參標定結果旋轉投影算法,實現了毫米波雷達與高清攝像頭的融合模塊,mobileye與激光雷達鳥瞰圖方向的融合模塊,基于非線性卡爾曼濾波算法,實現了毫米波雷達與mobileye的數據融合模塊;
清洗軟件清洗功能,可視化功能,融合功能,和數據轉換功能
F:數據批量轉換模塊:基于PYTHON代碼和Shell Script腳本,實現對數以萬計的原始數據表格的自動化批量處理,以及自動化格式轉換功能,基于企業級服務器的作業拆分,并行的提交JOB,實現對TB級的原始數據(視頻數據,點云數據)的批量程序處理,同時,基于SATA接口的服務器存儲介質,實現對清洗后的數據的快速實時存儲,以及流暢的壓縮、解壓縮、和拷貝功能;
清洗軟件批量處理原始數據表格 清洗軟件批量處理源代碼片段
未來,中汽數據將不斷完善駕駛場景傳感器原始數據清洗軟件模塊,豐富和擴展可處理的車載傳感器品牌和類型、逐步開放數據清洗算法參數調節接口、加入清洗數據的二次開發套件和SDK使用說明文檔、并提供清洗軟件的定制化的服務和升級,打造一款功能全面,擴展性強,兼容性高,可支撐智能網聯汽車數據標準法規平臺,并支持自動駕駛技術發展和產業落地的軟件工具集。
業務聯系人:陳超
電話:18502232312
郵箱:chenchao2017@catarc.ac.cn
文/智能網聯數據部