文/興創(chuàng)知能股份有限公司
人工智能已成為近幾年來最火熱的科技代名詞,而將AI技術(shù)結(jié)合地理信息系統(tǒng)(Geographic Information System,
GIS),創(chuàng)造智慧空間信息(Geospatial AI,
Geo-AI),更扮演未來生活應(yīng)用不可或缺的科技角色。在各類型巨量數(shù)據(jù)萃取與快速累積的當(dāng)今,硬件的強力支援以及AI算法的不斷創(chuàng)新,為人類社會拓展出許多成功的AI數(shù)據(jù)應(yīng)用服務(wù),并且構(gòu)筑于GIS基礎(chǔ)上,提升至數(shù)字孿生地球(Digital
Twin of Earth)的虛實結(jié)合。
實際上,Geo-AI透過地球科學(xué)數(shù)字數(shù)據(jù)庫的概念,囊括了所有與3D空間信息有關(guān)的議題,包含多元時空維度的影像應(yīng)用、地理空間信息整合、三維點云、都市建模與物聯(lián)網(wǎng)設(shè)備監(jiān)測…等。興創(chuàng)知能股份有限公司專注于圖資、影像與點云的AI辨識(Image Recognition)技術(shù)應(yīng)用多年,將在本文帶大家挖掘,有別于過去Geo-AI影像辨識技術(shù)應(yīng)用的新契機。
要能飛天遁地,你得要有多維度影像的幫忙
人類本是視覺動物,長久以來總需仰賴雙眼看到的事物來進行各種判斷,而這也真實反映了現(xiàn)代社會人們對于影像辨識的依賴。拜感光元件IC技術(shù)快速發(fā)展之賜,今日影像采集來源和效率,相比于19世紀早期相機才剛普及的時代,早已不可同日而語,甚至依據(jù)各領(lǐng)域五花八門的應(yīng)用場景,造就了多維度的影像來源。由遠距離至近距離包含了太空維度的衛(wèi)星遙測、高空中的航空攝影、近地表的無人機攝影,再到布滿大街小巷無所不在的CCTV;若改由單鏡頭到多鏡頭來區(qū)分,則包含了再普遍不過的單攝相機、用于立體視覺的雙目相機,以及街景常用的全景相機等。
顯然,搭配著上述不同尺度的影像來源與拍攝場景,影像辨識的應(yīng)用也將不再侷限于那些傳統(tǒng)計算機視覺(Computer Vision)常見的物件辨識議題,更甚以Geo-AI的思維來看,這些可能帶有地理空間位置信息的多維度影像數(shù)據(jù),無疑是未來創(chuàng)造智慧空間信息生態(tài)系的重要基礎(chǔ)。
選對模型架構(gòu),做好Geo-AI影像辨識
人工智能最早出現(xiàn)于1956年,時至今日發(fā)展超過一甲子,從傳統(tǒng)的機器學(xué)習(xí)(Machine Learning),演化至深度學(xué)習(xí)(Deep Learning),不斷支撐著計算機視覺技術(shù)的進步,創(chuàng)造了許多影像辨識的突破與應(yīng)用。從最基礎(chǔ)的觀點來看,影像辨識即是一種判斷影像中是否包含特定目標(biāo)的應(yīng)用??此坪唵蔚膯栴},其實應(yīng)可拆分為四種辨識場景,包含影像分類(Classification)、物件偵測(Objection Detection)、語意分割(Semantic Segmentation)與實體切割(Instance Segmentation)等,這也分別代表著不同難易程度的影像處理邏輯。
從算法的角度切入,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是影像辨識場景中最為常見的基礎(chǔ)架構(gòu),透過卷積層(Convolutional)、池化層(Pooling)與全連接層(Fully-onnected)串流設(shè)計,將大量二維影像轉(zhuǎn)化為單一維度特征排列組合方式,并有效萃取目標(biāo)物的特征值。隨著影像分割問題變得過于復(fù)雜,在不同應(yīng)用情境的驅(qū)使下,計算機視覺的領(lǐng)域仍持續(xù)誕生許多表現(xiàn)亮眼的算法,例如U-Net、VGG-16、DeepLab、RetinaNet及FasterRCNN等模型。值得一提的是,在追求實時動態(tài)影像辨識的應(yīng)用上,近期最受推崇的YOLO(You Only Look Once)系列算法,在2020年也有了突破性的發(fā)展,由中研院團隊與俄羅斯學(xué)者共同研發(fā)的YOLOv4以優(yōu)異的運算效率,成為當(dāng)前最廣為使用的影像物件偵測模型。
實際上,AI影像辨識模型百百種,面對不同的影像尺度與應(yīng)用情境,我們可能會選擇不同的算法架構(gòu),但從無到有的打造模型過程,除了把關(guān)訓(xùn)練資料質(zhì)量,模型訓(xùn)練流程(參見圖3)一般包含了影像采集、影像標(biāo)記、模型建構(gòu)、訓(xùn)練與驗證,通過評價的模型才得以進行布署接續(xù)上線服務(wù)的任務(wù)。影像辨識模型訓(xùn)練與服務(wù)流程
經(jīng)驗豐富,打造Geo-AI跨領(lǐng)域應(yīng)用服務(wù)
興創(chuàng)知能AI技術(shù)研發(fā)團隊近年來致力于Geo-AI影像辨識技術(shù)整合應(yīng)用的發(fā)展,打造TronGisPy開源程序碼成為業(yè)界首創(chuàng),至今涉足多維度影像辨識服務(wù)(參見圖4),包含衛(wèi)星遙測(農(nóng)業(yè))、航空照片(森林)、無人機(交通)、CCTV(水務(wù))、全景相機(交通)、單攝相機(交通)、雙目相機(營建)等議題,都值得帶大家深究其奧妙。
精準(zhǔn)農(nóng)業(yè)資料服務(wù):使用光學(xué)衛(wèi)星(Sentinel-2)【注】影像,配合歷年水稻分布調(diào)查作為標(biāo)記圖資,建立AI作物辨識模型(模型架構(gòu)包含CNN與LightGBM),提供水稻田分布調(diào)查云端資料基礎(chǔ)服務(wù)。
森林資源調(diào)查輔助: 使用航空照片,配合森林資源長期圖資調(diào)查,建立AI森林覆蓋辨識模型(模型架構(gòu)為CNN),提供分類結(jié)果建議,改善人工數(shù)化效率與正確性。
車輛物件辨識應(yīng)用: 使用UAV無人機影像,配合既有的AI開源模型(模型架構(gòu)為YOLOv4),完成白天與夜間情境下,車輛位置辨識與移動軌跡偵測之應(yīng)用。
橋墩水位辨識應(yīng)用: 使用既有的橋墩監(jiān)控CCTV影像,配合OpenCV的特征萃取方法,完成墩柱水尺影像辨識應(yīng)用,偵測白天與夜間的實時水位變化,確保橋墩行駛安全。
道路物件資源盤整: 在產(chǎn)制高精度地圖(High Definition Maps, HD Map)的過程中,善用裝載于測繪車上的環(huán)景影像,配合人工標(biāo)記的投入,建立AI道路物件辨識模型(模型架構(gòu)為YOLOv4),加速道路人工物件盤點之效率。
道路鋪面破損辨識:使用裝載于車上的單攝相機,配合高質(zhì)量的專業(yè)標(biāo)記數(shù)據(jù),建立AI道路破損辨識模型(模型架構(gòu)為CNN),完成實時辨識、實時傳輸之服務(wù),以提升人工巡查道路質(zhì)量之效率。
文史甬道形變監(jiān)測:使用雙目相機全天候監(jiān)控,配合OpenCV的特征萃取方法,完成狹小甬道兩側(cè)墻面固定點位的時序形變監(jiān)測,并以LINE Notify為媒介實時推播墻面是否有位移之?dāng)?shù)據(jù)。
興創(chuàng)知能Geo-AI影像辨識應(yīng)用服務(wù)
讓平面影像擁有空間意義,成就Geo-AI浪潮的重要關(guān)鍵
影像資料的系統(tǒng)整合:面對多維度影像辨識議題,勢必得處理多樣且復(fù)雜的影像的來源與規(guī)格,從資料面的采集、清理、標(biāo)記、訓(xùn)練,衍伸到應(yīng)用面的自動化與專業(yè)的數(shù)據(jù)解讀,均考驗著團隊?wèi)?yīng)付每一個環(huán)節(jié)的整合能力。
領(lǐng)域知識的問題拆解:僅有數(shù)據(jù)處理的能力依然不夠,為了精準(zhǔn)掌握跨領(lǐng)域的應(yīng)用場景,必須要有專業(yè)領(lǐng)域的知識投入,才能有效加速應(yīng)用程序的開發(fā),從痛點的理解,客制化設(shè)計解決方案。
影像的空間信息意義:在Geo-AI的架構(gòu)下,影像不再只是一張圖片如此簡單,如何讓影像辨識的結(jié)果帶有地理空間位置信息,考驗著團隊在空間信息與攝影測量的整合能力。
高空機載攝影容易理解,但地表上那些各式各樣的影像又該如何讓它們也同樣賦予空間信息的意義呢?我們期待各種跨領(lǐng)域的議題討論與合作,一同打造飛天遁地的智慧空間應(yīng)用服務(wù)愿景。
【注】Sentinel-2衛(wèi)星:為歐洲太空總署(European Space Agency, ESA)發(fā)射的繞極軌道衛(wèi)星,最短5日的再訪觀測頻率,與13個光學(xué)波段的支援,已是現(xiàn)今高分辨率(10公尺)光衛(wèi)星觀測中極具優(yōu)勢的免費國際影像資源,因此不論是在環(huán)境監(jiān)測、森林農(nóng)業(yè)、海洋資源、冰川監(jiān)控或洪水災(zāi)害等議題,都有相當(dāng)廣泛的應(yīng)用成果。
?。ū疚膩碓窗卜乐R網(wǎng)臺灣站全球安防科技網(wǎng))