近日,大華股份基于深度學(xué)習(xí)技術(shù)研發(fā)的3D目標(biāo)檢測(cè)技術(shù),刷新了The KITTI Vision Benchmark Suite中3D車輛類目檢測(cè)任務(wù)(3D Object Detection Evaluation)排行榜,取得了3D車輛類目檢測(cè)第一名,這標(biāo)志著大華股份的人工智能技術(shù)在3D目標(biāo)檢測(cè)領(lǐng)域處于國(guó)際領(lǐng)先水平。
大華股份在人工智能的核心技術(shù)領(lǐng)域持續(xù)耕耘,不斷提升智能算法、算力的核心競(jìng)爭(zhēng)力。這是大華股份繼取得字符識(shí)別、場(chǎng)景流識(shí)別、目標(biāo)跟蹤、2D目標(biāo)檢測(cè)、行人重識(shí)別等多項(xiàng)國(guó)際競(jìng)賽第一之后,再次在3D目標(biāo)檢測(cè)領(lǐng)域取得突破。
源自:http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d
關(guān)于KITTI:
KITTI數(shù)據(jù)集由德國(guó)卡爾斯魯厄理工學(xué)院和豐田美國(guó)技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國(guó)際上最大的計(jì)算機(jī)視覺算法評(píng)測(cè)數(shù)據(jù)集之一。數(shù)據(jù)集用于評(píng)測(cè)立體匹配(stereo)、光流(flow)、場(chǎng)景流(sceneflow)、視覺里程計(jì)(visual odometry)、物體檢測(cè)(object detection)和跟蹤(tracking)、道路分割(road)、語義分割(semantics)等計(jì)算機(jī)視覺技術(shù)的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場(chǎng)景采集的真實(shí)圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個(gè)行人,且存在不同程度的遮擋與截?cái)唷?/p>
3D目標(biāo)檢測(cè)
3D目標(biāo)檢測(cè)是自動(dòng)駕駛領(lǐng)域的核心技術(shù)之一,自動(dòng)駕駛的汽車需要實(shí)時(shí)檢測(cè)周圍所有交通參與者,包括機(jī)動(dòng)車、非機(jī)動(dòng)車、行人,并準(zhǔn)確地檢測(cè)出各個(gè)目標(biāo)的位置、大小和運(yùn)動(dòng)方向。由于2D圖像缺少深度信息,難以準(zhǔn)確地估計(jì)目標(biāo)的距離,加上天氣、光照、陰影等因素的影響,基于視覺的2D目標(biāo)檢測(cè)技術(shù)難以應(yīng)對(duì)復(fù)雜的道路環(huán)境,因此自動(dòng)駕駛技術(shù)中主要依靠基于雷達(dá)設(shè)備所采集的點(diǎn)云數(shù)據(jù)進(jìn)行3D目標(biāo)檢測(cè),同時(shí)采用基于2D的圖像識(shí)別技術(shù)提高3D目標(biāo)檢測(cè)的準(zhǔn)確性。
本次競(jìng)賽在大華自主研發(fā)的深度學(xué)習(xí)平臺(tái)上,汲取了2D目標(biāo)檢測(cè)、場(chǎng)景流識(shí)別等算法的優(yōu)點(diǎn),研發(fā)了一套基于圖模型和神經(jīng)網(wǎng)絡(luò)的3D目標(biāo)檢測(cè)框架,使用3D點(diǎn)云數(shù)據(jù)與2D圖像數(shù)據(jù),從多個(gè)視角進(jìn)行目標(biāo)檢測(cè),并將多視角的檢測(cè)結(jié)果進(jìn)行融合,有效地提升了3D目標(biāo)檢測(cè)的準(zhǔn)確性。
該項(xiàng)國(guó)際競(jìng)賽數(shù)據(jù)集的車輛3D檢測(cè)效果圖
圖1 3D檢測(cè)效果圖
圖2 點(diǎn)云數(shù)據(jù)的鳥瞰圖效果