一、工作背景
計算機(jī)視覺指通過電子化的方式來感知和認(rèn)知影像,以達(dá)到甚至超越人類視覺智能的效果,是人工智能領(lǐng)域最受關(guān)注的方向之一。得益于深度學(xué)習(xí)算法的成熟和應(yīng)用,計算機(jī)視覺技術(shù)已經(jīng)廣泛應(yīng)用于工業(yè)制造、安防、交通、金融等產(chǎn)業(yè),涌現(xiàn)出工業(yè)視覺、工業(yè)安全監(jiān)控、車輛識別、OCR等多種產(chǎn)品,在相關(guān)產(chǎn)業(yè)的智能化方面發(fā)揮重要的作用。然而,業(yè)界缺乏對計算機(jī)視覺系統(tǒng)性、全面性的測評方法,一定程度上影響著該技術(shù)的廣泛應(yīng)用與健康發(fā)展。
為解決計算機(jī)視覺產(chǎn)品良莠不齊的現(xiàn)狀,助力用戶提升計算機(jī)視覺產(chǎn)品的技術(shù)和應(yīng)用水平,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(以下簡稱“AIIA”)與中國信息通信研究院(以下簡稱“信通院”)聯(lián)合北京百度網(wǎng)訊科技有限公司、京東方科技集團(tuán)股份有限公司、上海商湯智能科技有限公司等20余家產(chǎn)業(yè)界單位聯(lián)合完成了《計算機(jī)視覺技術(shù)要求 第1部分:計算機(jī)視覺開放平臺通用能力要求》、《計算機(jī)視覺技術(shù)要求 第2部分:圖像識別與處理能力要求》、《計算機(jī)視覺技術(shù)要求 第3部分:視頻識別與處理能力要求》、《工業(yè)機(jī)器視覺開放平臺通用能力要求》系列標(biāo)準(zhǔn)。
二、標(biāo)準(zhǔn)解讀
本標(biāo)準(zhǔn)體系目前分為四部分,分別針對計算機(jī)視覺開放平臺以及擁有產(chǎn)品形態(tài)最多的圖像識別與處理、視頻識別與處理、工業(yè)機(jī)器視覺開放平臺而制定。
1)計算機(jī)視覺技術(shù)要求 第1部分:計算機(jī)視覺開放平臺通用能力要求
本部分面向提供計算機(jī)視覺能力的開放平臺,以計算機(jī)視覺開放提供的功能全面程度為側(cè)重點,圍繞功能實現(xiàn)程度、信息披露情況、是否私有化部署等情況進(jìn)行規(guī)范,包含3大能力域、21個能力項。
2)計算機(jī)視覺技術(shù)要求 第2部分:圖像識別與處理能力要求
本部分面向計算機(jī)視覺平臺或計算機(jī)視覺產(chǎn)品制定,對計算機(jī)視覺平臺或產(chǎn)品的圖像識別與處理能力從目標(biāo)識別、目標(biāo)檢測、目標(biāo)分割、目標(biāo)跟蹤4個維度進(jìn)行評估。
3)計算機(jī)視覺技術(shù)要求 第3部分:視頻識別與處理能力要求
本部分面向計算機(jī)視覺平臺或計算機(jī)視覺產(chǎn)品制定,將對計算機(jī)視覺平臺或產(chǎn)品的視頻識別與處理能力從視頻信息提取、視頻內(nèi)容理解、視頻內(nèi)容處理三個大維度進(jìn)行評估。
4)工業(yè)機(jī)器視覺開放平臺通用能力要求
本部分面向工業(yè)機(jī)器視覺開放平臺制定。工業(yè)機(jī)器視覺是指在39大工業(yè)門類中對智能化機(jī)器視覺的應(yīng)用。本部分將從識別能力、定位能力、測量能力、檢測能力四部分能力域?qū)I(yè)機(jī)器視覺開放平臺的通用能力進(jìn)行評估。