一文盤點(diǎn)合合信(頭孢孟多)息圖像處理“黑科技”

  • A+
光學(xué)字符識(shí)別OCR技術(shù)是指從圖像中自動(dòng)提取文字信息的技術(shù),這項(xiàng)技術(shù)橫跨了人工智能里的兩大領(lǐng)域:CV(計(jì)算機(jī)視覺(jué))和NLP(自然語(yǔ)言處理),綜合使用了這兩大領(lǐng)域中的很多技術(shù)成果。在過(guò)往的發(fā)展歷程中,OCR始終具備很強(qiáng)的產(chǎn)業(yè)應(yīng)用背景,是計(jì)算機(jī)領(lǐng)域里少數(shù)幾個(gè)一開(kāi)始就由工業(yè)界和學(xué)術(shù)界雙輪驅(qū)動(dòng)的領(lǐng)域。不過(guò),盡管OCR技術(shù)已走過(guò)一個(gè)世紀(jì)的發(fā)展,現(xiàn)今卻仍存在文檔圖像質(zhì)量退化嚴(yán)重、文字檢測(cè)及版面分析困難、非限定條件文字識(shí)別率低、結(jié)構(gòu)化智能理解能力差等亟待解決的問(wèn)題。OCR技術(shù)的進(jìn)階之路上,文檔圖像質(zhì)量的增強(qiáng)是重要的研究方向,需克服頁(yè)面彎曲、陰影遮擋、摩爾紋、圖片模糊等現(xiàn)代文本圖像處理中常見(jiàn)的干擾狀況。合合信息基于自研的計(jì)算機(jī)圖形圖像技術(shù),推出多種圖像智能處理引擎,可實(shí)現(xiàn)圖像切邊增強(qiáng)、形變矯正、PS篡改檢測(cè)、去摩爾紋、水印去除、陰影處理、手寫文字擦除、圖像質(zhì)檢等多種圖像智能處理效果,規(guī)范圖像采集,提升圖像質(zhì)量,幫助各應(yīng)用領(lǐng)域簡(jiǎn)化下游文檔處理任務(wù),通過(guò)圖像預(yù)處理提升文字識(shí)別效率與準(zhǔn)確性。切邊增強(qiáng)智能判斷圖像中的主體邊緣并切除多余背景,同時(shí)通過(guò)增強(qiáng)銳化提升圖像質(zhì)量、突出文字。通過(guò)合合信息的切邊增強(qiáng)技術(shù),可自動(dòng)裁切出圖像主體區(qū)域,并增強(qiáng)圖像質(zhì)量,經(jīng)過(guò)該項(xiàng)處理后再進(jìn)入后續(xù)的文字識(shí)別、信息提取、材料審核等業(yè)務(wù)。彎曲矯正&透視矯正合合信息采用基于位移場(chǎng)網(wǎng)絡(luò)學(xué)習(xí)方法的系統(tǒng)構(gòu)架,可對(duì)形變文檔進(jìn)行智能矯正,包括彎曲矯正與透視矯正,同時(shí)智能定位文檔邊緣,切除多余背景。依托合合信息的圖像形變矯正技術(shù)與圖像增強(qiáng)能力,可將手機(jī)、相機(jī)等設(shè)備拍攝的文檔、書籍圖像優(yōu)化為如同平面掃描儀獲得的圖像。而對(duì)于本身就存在于彎曲載體上的文字,通過(guò)彎曲矯正技術(shù),可自動(dòng)“拉平”圖像,提升各類非常規(guī)載體文字的識(shí)別效率與質(zhì)量。PS篡改檢測(cè)合合信息自研了基于深度學(xué)習(xí)的圖像篡改檢測(cè)方法,采用神經(jīng)網(wǎng)絡(luò)模型捕捉圖像在篡改過(guò)程中留下的細(xì)微痕跡,基于百萬(wàn)級(jí)的數(shù)據(jù)學(xué)習(xí)圖像被篡改后統(tǒng)計(jì)特征的變化,可智能判斷圖片是否被篡改,支持檢測(cè)復(fù)制粘貼、拼接、擦除等多種篡改形式與混合篡改,還可定位修改區(qū)域,以熱力圖形式展示圖像區(qū)域篡改置信度。去摩爾紋合合信息采用多重神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)分析暗角、摩爾紋的形成原理,對(duì)圖像中存在的干擾因素進(jìn)行對(duì)應(yīng)處理,可去除所有樣式的摩爾紋,同時(shí)保證圖像信息完整、顏色不失真。水印去除合合信息基于全卷積網(wǎng)絡(luò)搭建圖像水印去除模型,支持對(duì)圖像中日期、logo、文字等形式的水印進(jìn)行自動(dòng)擦除,高保真處理,無(wú)痕還原圖像。陰影處理智能消除圖像中存在的各類形狀的陰影,解決圖像因光線條件復(fù)雜產(chǎn)生的有陰影、亮度不均勻問(wèn)題。手寫文字擦除合合信息融合了內(nèi)容切分、手寫字跡分離網(wǎng)絡(luò)、文檔質(zhì)量增強(qiáng)等技術(shù),將待處理圖像劃分為手寫的“擦除區(qū)域”和印刷的“非擦除區(qū)域”,快速識(shí)別與自動(dòng)擦除手寫文字,并對(duì)噪點(diǎn)、陰影、背景雜亂等復(fù)雜場(chǎng)景進(jìn)行處理,將文檔圖像恢復(fù)至手寫前的狀態(tài)。圖像質(zhì)檢智能判斷圖像是否內(nèi)容完整、拍攝清晰、光線充足等,對(duì)圖像質(zhì)量進(jìn)行自動(dòng)化的準(zhǔn)入判斷與實(shí)時(shí)反饋。目前,合合信息相關(guān)智能文字識(shí)別及圖像處理技術(shù)已被應(yīng)用于公司旗下掃描全能王等C端APP中及行業(yè)解決方案中,輻射全球百余個(gè)國(guó)家和地區(qū)的億級(jí)用戶。
相關(guān)話題(文章)