中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

a&s專業(yè)的自動化&安全生態(tài)服務(wù)平臺
公眾號
安全自動化

安全自動化

安防知識網(wǎng)

安防知識網(wǎng)

手機(jī)站
手機(jī)站

手機(jī)站

大安防供需平臺
大安防供需平臺

大安防供需平臺

資訊頻道橫幅A1
首頁 > 資訊 > 正文

OCR文本識別,場景雖小,大有乾坤

伴隨著算法的日趨成熟,作為AI賦能千行百業(yè)的又一個(gè)典型,文本識別場景雖小,卻大有乾坤!
資訊頻道文章B

  AI賦能千行百業(yè)的口號如今正在逐步落地實(shí)踐,普羅大眾在日常生活的衣食住行之中也越來越多的感受到AI帶來的智能和快捷。

  比如社區(qū)場景中出入口的人臉識別通道、社區(qū)智能垃圾分類、電瓶車禁入電梯系統(tǒng);辦公場景中人臉識別門禁考勤、票證識別;包裹收寄場景中圖片轉(zhuǎn)文本的一系列應(yīng)用等等。

  如此來看,不知不覺中,除了人臉識別的應(yīng)用外,文本識別也已經(jīng)深入滲透到大眾生活當(dāng)中,并為我們帶來了諸多便利。

  關(guān)于文本識別技術(shù),其是計(jì)算機(jī)視覺和目標(biāo)識別的基礎(chǔ)研究之一,可以將圖片、掃描件中的文字識別成可以編輯的文本,代替人工手動錄入,近年在深度卷積神經(jīng)網(wǎng)絡(luò)的推波助瀾下飛速進(jìn)展。

  文本識別技術(shù) 秒識萬千字符

  從目前市場上文本識別技術(shù)的應(yīng)用情況來看,文本識別技術(shù)適用于多種應(yīng)用場景,其實(shí)用性完全不亞于名聲在外的人臉識別。

  平安科技就曾表示,文本識別技術(shù)的研究價(jià)值巨大,對人工智能在地圖導(dǎo)航、智能交通、信息檢索、機(jī)器視覺等領(lǐng)域的發(fā)展有較強(qiáng)推動作用,具有廣闊的應(yīng)用空間和重要的研究意義。

  隨著各行各業(yè)信息化程度的提升,很多需要文字信息錄入的場合如今也在實(shí)現(xiàn)業(yè)務(wù)流程的數(shù)智升級。傳統(tǒng)的票據(jù)錄入、單據(jù)錄入、各種證件執(zhí)照等文件信息的錄入以往基本只能人工手動輸入,不僅效率低下,還容易出錯(cuò)。如今在AI技術(shù)賦能之下,卡證票據(jù)文檔識別技術(shù)的投入使用,可迅速提升文本信息的錄入效率,并且識別準(zhǔn)確率基本可達(dá)99%以上。

  為了讓這項(xiàng)技術(shù)能夠更方便的為人所用,目前不少企業(yè)已經(jīng)開發(fā)了相當(dāng)成熟的票證識別應(yīng)用程序,嵌在各種業(yè)務(wù)辦理平臺的輔助功能當(dāng)中,方便隨點(diǎn)隨用。

  比如平安科技專門研發(fā)的“平安票證識別通”,目前已接入平安產(chǎn)險(xiǎn)、平安壽險(xiǎn)、平安信托等企業(yè)中,廣泛應(yīng)用于移動開戶、移動投保、銀行票據(jù)錄入、醫(yī)療單據(jù)錄入等場景,可準(zhǔn)確識別身份證、行駛證、駕駛證、營業(yè)執(zhí)照、醫(yī)療發(fā)票等證件票據(jù)。

  復(fù)雜且個(gè)性化的文字和各類字符豐富著我們的日常生活,不過,這也給文本識別帶來挑戰(zhàn)。

  比如在城市治理場景中,城市街道沿街商鋪各類個(gè)性化的招牌,招牌顏色各異、招牌大小不一、隨意變更招牌以及小廣告粘貼等問題,這不僅影響市容市貌也存在安全隱患。紫光華智推出的街面OCR識別算法可準(zhǔn)確識別不同招牌的文本和語義信息,提升城市智能化管理能力和效率,助力城市精細(xì)化管理。

  而在大華股份針對文本識別技術(shù)的應(yīng)用案例中,我們還看到了文本識別在在鋼鐵、能源、交通等行業(yè)的應(yīng)用。比如在鋼鐵、能源領(lǐng)域,通過編號識別算法自動獲取車輛、集裝箱、鋼卷等目標(biāo)上的編號信息,助力高效管理;在交通運(yùn)輸安全管理領(lǐng)域,運(yùn)用然場景文字識別算法自動讀取車身文字信息,智能篩選出重點(diǎn)管理車輛,以便針對不同車型采取不同管理方案。

  又或者在醫(yī)療領(lǐng)域,幫助公司識別藥品說明書,幫助公司快速構(gòu)建藥品說明書的信息庫;在物流領(lǐng)域,通過文本識別技術(shù)快速完成各類單據(jù)自動識別,提效降本效果顯著……文本識別技術(shù)可適用場景相當(dāng)廣泛,有了文本識別算法,也藉由機(jī)器之“眼”,讓我們從此告別繁瑣的手動輸入低效率方式。

  文本識別技術(shù)的難點(diǎn)和挑戰(zhàn)

  文本識別應(yīng)用的普及,得益于OCR(Optical Character Recognition)文字識別算法的日趨成熟,不過,從目前市場的文本識別應(yīng)用情況來看,由于應(yīng)用場景的多樣性,文本識別也還面臨著一些挑戰(zhàn):

  1、掃描的單據(jù)往往存在虛線干擾、版面缺失、傾斜、暗光、扭曲、噪聲等情況,定位難度大。

  2、文字千變?nèi)f化,例如字體、字號、顏色、筆畫寬度等不固定,方向任意;小數(shù)點(diǎn)、近似英文數(shù)字、特殊符號、連接詞、藝術(shù)字等,容易被漏檢或誤識別。

  3、語言種類繁多,經(jīng)常是中英文混合,多種語言混合等場景,識別難度加大。

  4、表格單據(jù)經(jīng)常存在蓋章(印章覆蓋文字)、錯(cuò)行(文字溢出表格單元,與表格線交叉)的情況,也造成文字識別干擾,極大影響識別準(zhǔn)確率。

  5、拍照上傳的圖片存在噪聲、模糊、光線變化、形變、復(fù)雜背景干擾等問題,對文字定位和識別的準(zhǔn)確度是巨大的挑戰(zhàn)。

  機(jī)器不同于人眼,尤其在現(xiàn)實(shí)場景中,字體設(shè)計(jì)、文本背板、語種以及外部的光線環(huán)境等各類因素都可能對機(jī)器識別造成干擾,而這也正是當(dāng)前AI視覺企業(yè)在文本識別算法上需要攻破的技術(shù)方向。

  當(dāng)然,我們也看到了相關(guān)企業(yè)在算法研究上取得的進(jìn)展。比如針對低質(zhì)量圖像、生僻字、藝術(shù)字的識別。

  大華依托自研的“巨靈”人工智能平臺,對識別算法進(jìn)行深度改進(jìn),運(yùn)用多尺度融合、跨層鏈接等先進(jìn)技術(shù),提高了算法對這類文本的識別效果;紫光華智則結(jié)合多尺度融合、注意力機(jī)制、多模型融合等先進(jìn)技術(shù)及基礎(chǔ)數(shù)據(jù)分析,對難例樣本進(jìn)行數(shù)據(jù)增強(qiáng),實(shí)現(xiàn)了對圖片像素低、質(zhì)量差、藝術(shù)字體等識別效果的大幅提升; 華為云采用了黑邊處理、自動糾偏、去噪、圖像自動旋轉(zhuǎn)、多種二值化等方法處理圖像,從而提高了扭曲、復(fù)雜背景、光照、模糊場景下的文字檢測識別準(zhǔn)確率。

  在AI視覺企業(yè)的持續(xù)探索之下,文本識別算法也得以不斷演進(jìn),而伴隨著算法的日趨成熟,作為AI賦能千行百業(yè)的又一個(gè)典型,文本識別場景雖小,卻大有乾坤!

參與評論
回復(fù):
0/300
文明上網(wǎng)理性發(fā)言,評論區(qū)僅供其表達(dá)個(gè)人看法,并不表明a&s觀點(diǎn)。
0
關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺,自1994年品牌成立以來,一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗(yàn),提供媒體、活動、展會等整合營銷服務(wù)。

免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號 粵公網(wǎng)安備 44030402000264號
用戶
反饋