近年來(lái),機(jī)器視覺(jué)一直在重構(gòu)著行業(yè)的產(chǎn)業(yè)鏈,扎了“AI”這劑強(qiáng)心針,百行百業(yè)數(shù)字化轉(zhuǎn)型正在加速落地。一個(gè)屬于AI視覺(jué)的大時(shí)代,正在呼嘯而來(lái),智能算法與澎湃算力開(kāi)始了不斷演進(jìn)的步伐。
很多人認(rèn)為,智能算法已經(jīng)開(kāi)始趨于同質(zhì)化,精度差別也只有幾個(gè)百分點(diǎn),算法已經(jīng)無(wú)法成為企業(yè)的核心競(jìng)爭(zhēng)力。但事實(shí)并非如此,在許多場(chǎng)景與實(shí)際運(yùn)用中,例如碰到千萬(wàn)級(jí)別以上的數(shù)據(jù),這些百分點(diǎn)的差別便會(huì)非常的顯著,并且對(duì)整體的應(yīng)用及落地產(chǎn)生較大的影響,這就是算法的價(jià)值。
紫光華智自去年在MIT Scene Parsing Benchmark場(chǎng)景解析評(píng)測(cè)中獲得榜首成績(jī)后,今年在全球權(quán)威的ICDAR Robust Reading大賽榜單中,憑借領(lǐng)先的AI技術(shù)優(yōu)勢(shì),在文本行檢測(cè)與識(shí)別兩項(xiàng)任務(wù)中均斬獲第一,一舉刷新榜單記錄。
▲紫光華智分別位居文本行檢測(cè)榜單&文本行識(shí)別榜單No.1
紫光華智CTO周斌表示:“此次成績(jī)打榜并不是我們的目的,實(shí)屬無(wú)心之舉。紫光華智一直以滿足客戶需求為導(dǎo)向和使命,將領(lǐng)先的AI技術(shù)落地到客戶實(shí)際應(yīng)用中,給客戶帶去實(shí)實(shí)在在的效能與效率,助力各行各業(yè)的智能化轉(zhuǎn)型,普惠AI技術(shù),賦能各行各業(yè),這是我們持續(xù)投入研發(fā)AI技術(shù)的目的,也是我們紫光華智的戰(zhàn)略目標(biāo)。”
雖然紫光華智成立僅僅三年時(shí)間,但其繼承著紫光集團(tuán)、新華三在AI、芯片、存儲(chǔ)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等領(lǐng)域的多種強(qiáng)大基因,換句話而言,在其AI視覺(jué)的“槍”里,早已經(jīng)裝滿了賦能百行百業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型升級(jí)的“彈藥”。
理解了這點(diǎn),再回過(guò)頭看紫光華智對(duì)于視覺(jué)技術(shù)的執(zhí)著與投入,戰(zhàn)略便能更加的清晰——智能化轉(zhuǎn)型上半場(chǎng)是AI蓄能,企業(yè)在算法、算力、數(shù)據(jù)等維度搶占制高點(diǎn),下半場(chǎng)是AI產(chǎn)業(yè)化落地,智能化的技術(shù)及應(yīng)用滲透到各行各業(yè)中,只有保持技術(shù)不斷迭代,才能生存下來(lái)。
中國(guó)的商業(yè)環(huán)境一向殘酷,有的企業(yè)站穩(wěn)腳跟,有的企業(yè)就會(huì)被對(duì)手?jǐn)D掉,只有圍繞著用戶需求做技術(shù)創(chuàng)新才能決定未來(lái)的話語(yǔ)權(quán)。
如何破解算法落地難問(wèn)題
在AI賦能傳統(tǒng)產(chǎn)業(yè)中,真要打磨出可用的產(chǎn)品,既需要團(tuán)隊(duì)掌握AI視覺(jué)算法等核心技術(shù),又需了解到百行百業(yè)各場(chǎng)景的真實(shí)需求,在這種背景下,落地成了AI企業(yè)當(dāng)前最大的難題,既要回答“什么是用戶需要的”,又要審視“什么是企業(yè)可以提供的”,用戶端與技術(shù)端必須協(xié)調(diào)一致,才能讓AI落地創(chuàng)造價(jià)值。
對(duì)于當(dāng)前智能算法的落地,周斌認(rèn)為落地難可以分為以下三種情況:
一是場(chǎng)景的多樣性問(wèn)題,算法訓(xùn)練的場(chǎng)景難以完全覆蓋算法部署的場(chǎng)景,一個(gè)算法在當(dāng)前場(chǎng)景中表現(xiàn)不錯(cuò),但換了另外一個(gè)場(chǎng)景可能就會(huì)有各種問(wèn)題,場(chǎng)景的多樣性包括場(chǎng)景背景不同、目標(biāo)視角不同、目標(biāo)自身的差異性等因素,這些因素的變化可能對(duì)算法指標(biāo)都會(huì)帶來(lái)影響;
二是需求的碎片化,尤其像泛行業(yè)的算法需求,市場(chǎng)是細(xì)分的,需求是碎片化的,因此算法定制化程度很高,通用性較差,這無(wú)形中就增加了研發(fā)投入成本;
三是針對(duì)不同芯片平臺(tái)的適配部署,當(dāng)前算法技術(shù)發(fā)展速度遠(yuǎn)快于芯片工具鏈適配的速度,例如新出來(lái)的一項(xiàng)技術(shù)效果提升很明顯,但想落地時(shí)卻發(fā)現(xiàn)某些芯片平臺(tái)并不支持該算法中的新算子,或者支持,但效率較低,難以實(shí)際部署,這顯然就阻礙了該算法落地的進(jìn)程。
為了解決這些問(wèn)題,紫光華智針對(duì)性地提出應(yīng)對(duì)之策:
針對(duì)場(chǎng)景多樣性的問(wèn)題,首先要從數(shù)據(jù)上入手,通過(guò)多種方式、多個(gè)渠道來(lái)獲取盡量豐富的數(shù)據(jù),擴(kuò)充訓(xùn)練集和測(cè)試集;再通過(guò)算法和模型的優(yōu)化,來(lái)增加算法模型的泛化能力,防止過(guò)擬合到某些特定場(chǎng)景;通過(guò)設(shè)置合理的工勘指導(dǎo),提供在各種場(chǎng)景中最合適的部署、安裝、調(diào)試參數(shù),以發(fā)揮出算法的最優(yōu)效果;
針對(duì)碎片化的算法需求,紫光華智推出了AI開(kāi)放平臺(tái),該平臺(tái)為用戶開(kāi)放模型訓(xùn)練、算法構(gòu)建與部署能力,同時(shí)為第三方算法開(kāi)放接入能力,幫助用戶快速落地定制化算法,縮短AI應(yīng)用開(kāi)發(fā)周期,降低算法開(kāi)發(fā)、使用成本;
針對(duì)不同芯片的適配部署,紫光華智與多家芯片廠商建立了長(zhǎng)期合作關(guān)系,協(xié)同開(kāi)發(fā),在不同芯片上快速適配新算子的支持,以加速新算法的落地。
解除了算法落地難的后顧之憂,算法才有了長(zhǎng)足發(fā)展的土壤。
▲非機(jī)動(dòng)車牌智能識(shí)別
算法進(jìn)步強(qiáng)化AI實(shí)戰(zhàn)?
算法的進(jìn)步,是技術(shù)創(chuàng)新的量變。文本行檢測(cè)、識(shí)別與我們的生活場(chǎng)景息息相關(guān),如視頻圖片上文字審核,票據(jù)識(shí)別,手寫體識(shí)別,車牌識(shí)別等,在榜首的“皇冠”下,隨著業(yè)務(wù)的拓展,有著需要攻克眾多難題的“重”。周斌透露,在具體的應(yīng)用中,算法的表現(xiàn)跟場(chǎng)景息息相關(guān),例如如圖像分辨率、光照情況等不同,都會(huì)有不同的表現(xiàn)。為了提升在落地項(xiàng)目中算法的表現(xiàn),紫光華智往往會(huì)采取相應(yīng)的措施:
一是調(diào)整相機(jī)的位置、角度、視場(chǎng)角,或者增加一些配置來(lái)達(dá)到最優(yōu)的效果;
二是從一開(kāi)始便對(duì)模型的泛化性提出了相應(yīng)的要求,支撐各種場(chǎng)景設(shè)備的接入分析?!拔覀兊乃惴P歪槍?duì)各類場(chǎng)景構(gòu)建了充分的測(cè)試集和訓(xùn)練集,以及一個(gè)強(qiáng)大的數(shù)據(jù)管理團(tuán)隊(duì),使模型泛化性能足夠應(yīng)對(duì)各類場(chǎng)景需求。” 周斌介紹道。
算法的落地,是技術(shù)創(chuàng)新的質(zhì)變。產(chǎn)品技術(shù)的成熟度與場(chǎng)景應(yīng)用的吻合度的結(jié)合,攻克下來(lái)的難題,能給企業(yè)帶來(lái)技術(shù)領(lǐng)先的窗口期,技術(shù)的世界沒(méi)有太多捷徑,需要持續(xù)的投入與時(shí)間方能有所收獲。
▲機(jī)動(dòng)車牌智能識(shí)別
尋找差異點(diǎn)持續(xù)推進(jìn)
從另一個(gè)維度看,紫光華智作為行業(yè)后來(lái)者,要想在傳統(tǒng)巨頭近身肉搏大打價(jià)格戰(zhàn)與新巨頭跨界整合夾擊中生存下來(lái),要尋找自身能力與競(jìng)爭(zhēng)對(duì)手的差距,不斷的提升自身能力,彌補(bǔ)自身的不足,才能在實(shí)際業(yè)務(wù)中更好的滿足客戶需求。
“OCR技術(shù)便是其中一個(gè)差異點(diǎn),通過(guò)技術(shù)的打磨與提升,華智將領(lǐng)先的文本檢測(cè)和識(shí)別技術(shù)充分應(yīng)用到各個(gè)領(lǐng)域?!敝鼙笱a(bǔ)充道:
在道路交通場(chǎng)景,非機(jī)動(dòng)車管理費(fèi)神費(fèi)力,不同地區(qū)非機(jī)動(dòng)車牌格式和文本字符差異巨大,紫光華智車牌識(shí)別算法可自動(dòng)讀取車牌信息,實(shí)現(xiàn)非機(jī)動(dòng)車的智能化管理,同時(shí)有效遏制了非機(jī)動(dòng)車偷盜事件的發(fā)生。針對(duì)機(jī)動(dòng)車管理,紫車牌識(shí)別算法為監(jiān)管部門在交通違法識(shí)別、高速違停等違法事件管理提供了有效幫助;
在教育、金融等場(chǎng)景,不同證件票據(jù)格式不一,字符類型多樣,字段長(zhǎng)短不一,識(shí)別難度巨大。紫光華智文本識(shí)別算法可精確讀取證件票據(jù)的文本信息,避免了人工手動(dòng)錄入產(chǎn)生的錯(cuò)誤,同時(shí)大幅提升了輸入工作效率,提高了工作智能化水平;
在城市管理場(chǎng)景,城市街道中沿街商鋪為了吸引客戶存在設(shè)置多個(gè)招牌、招牌顏色各異、招牌大小不一、隨意變更招牌等問(wèn)題,不僅影響市容市貌也存在安全隱患。紫光華智街面OCR識(shí)別算法可準(zhǔn)確識(shí)別不同招牌的文本和語(yǔ)義信息,提升城市智能化管理能力和效率,助力城市精細(xì)化管理……
這是一個(gè)“如果用戶體驗(yàn)不到差異性,所有的技術(shù)都不存在”的時(shí)代。在此次專訪中,周斌多次提及“持續(xù)”、“用戶”,這也是紫光華智未來(lái)市場(chǎng)策略的主心骨,圍繞用戶需求,持續(xù)創(chuàng)新。
客觀地說(shuō),算法的持續(xù)投入是場(chǎng)持久戰(zhàn),它的潛力原本就被低估。在當(dāng)前AI視覺(jué)的產(chǎn)業(yè)中,仍然缺少真正意義上的領(lǐng)軍者,紫光華智對(duì)智能算法及AI視覺(jué)的加碼投入,勢(shì)必會(huì)開(kāi)發(fā)出新的市場(chǎng)潛能。