1 需求背景: 長(zhǎng)期以來,銀行憑證管理工作因管理手段落后而造成的一系列麻煩和困惑,一直困擾著銀行界,在票據(jù)處理方面,多數(shù)銀行仍停留在"人工分散處理+紙質(zhì)庫(kù)房保存+人工查詢"的階段,成為阻礙金融電子化的薄弱環(huán)節(jié)。因此,建設(shè)"集中、統(tǒng)一、規(guī)范、高效"的電子化票據(jù)處理中心,已成為銀行亟待解決的問題。
2 產(chǎn)品簡(jiǎn)介 :
文通銀行票據(jù)識(shí)別引擎是針對(duì)銀行巨大的票據(jù)業(yè)務(wù),使用票據(jù)OCR技術(shù)提取票據(jù)影像上的關(guān)鍵字段要素,自動(dòng)建立索引,從而完成金融領(lǐng)域風(fēng)險(xiǎn)監(jiān)督、票據(jù)自動(dòng)存檔。銀行票據(jù)識(shí)別引擎(SDK)由兩部份組成:模板編輯器和分類識(shí)別核心。其中模板編輯器完成票據(jù)模板的規(guī)則定制工作,并由識(shí)別模板指導(dǎo)識(shí)別核心進(jìn)行影像分類和識(shí)別。
3 產(chǎn)品概述:文通銀行票據(jù)識(shí)別引擎主要由以下功能模塊組成
銀行票據(jù)識(shí)別模板編輯器 圖像預(yù)處理模塊 票據(jù)分類核心模塊 字符識(shí)別核心模塊
工作原理如下圖:
3.1 模板編輯器文通銀行票據(jù)識(shí)別系統(tǒng)提供了便捷的模板制作工具——模板編輯器。模板為識(shí)別過程提供指導(dǎo),包括分類標(biāo)識(shí)、定位標(biāo)識(shí)、識(shí)別要素等詳細(xì)信息。分類標(biāo)識(shí)信息包括:圖像大小、版面特征文件、框線信息、標(biāo)題信息、文本信息等多種分類信息。在識(shí)別過程中具體采用的分類算法可以通過模板編輯器在主模板中配置。
3.2 圖像預(yù)處理模塊文通銀行票據(jù)識(shí)別系統(tǒng)在對(duì)影像進(jìn)行識(shí)別前做了多項(xiàng)預(yù)處理操作,為之后識(shí)別輸出最優(yōu)的圖像質(zhì)量,具體有糾偏、偏色校正、濾色、降噪、二值化、增強(qiáng)識(shí)別單元對(duì)比度等功能。這些預(yù)處理功能均可通過參數(shù)靈活配置、自由組合。
3.3 票據(jù)分類模塊文通銀行票據(jù)識(shí)別系統(tǒng)票據(jù)分類功能強(qiáng)大:系統(tǒng)同時(shí)支持表格框線(位置、顏色)分類、標(biāo)題單元(標(biāo)題內(nèi)容、標(biāo)題顏色)分類、文本區(qū)域(文本內(nèi)容、文本顏色)分類等,以最大限度發(fā)掘不同憑證之間的差異。如框線顏色、標(biāo)題顏色均可以用來區(qū)分多聯(lián)憑證的不同聯(lián);文本內(nèi)容可以區(qū)分同一憑證打印多種交易的影像;文本顏色可以用來區(qū)分同一種憑證分多聯(lián)并且不同聯(lián)之間框線顏色和標(biāo)題顏色均相同的影像。
3.4 字符識(shí)別核心模塊系統(tǒng)支持印刷漢字識(shí)別、印刷英文識(shí)別、印刷數(shù)字識(shí)別、手寫漢字識(shí)別、手寫英文識(shí)別、手寫數(shù)字識(shí)別、磁碼識(shí)別、條形碼識(shí)別、客戶簽字檢測(cè)、附件章檢測(cè)等多個(gè)識(shí)別引擎。
4 票據(jù)識(shí)別引擎的特性
1. 適應(yīng)性強(qiáng)文通銀行票據(jù)識(shí)別系統(tǒng)簡(jiǎn)體中文識(shí)別核心支持常用的宋體、仿宋、楷體、黑體、隸書、幼圓等漢字字體。印刷體英文和數(shù)字同樣支持多種字體包括常見的:Arial、Times New Roman、Avant Garde、Bookman Old Style、 Helvetica、Verdana等多種字體。
2.票據(jù)分類精準(zhǔn)
文通銀行票據(jù)識(shí)別系統(tǒng)有很強(qiáng)的版面區(qū)分能力,充分利于框線、框線顏色、標(biāo)題內(nèi)容、標(biāo)題顏色、文本內(nèi)容、文本顏色等多種特征來進(jìn)行版面的區(qū)分,版面識(shí)別的準(zhǔn)確率在99%以上。
3.識(shí)別速度快
經(jīng)過實(shí)際生產(chǎn)線運(yùn)行計(jì)算,單張票據(jù)識(shí)別時(shí)間為300ms~900ms,平均識(shí)別時(shí)間約為500ms。
4.識(shí)別率高
印刷體漢字識(shí)別率達(dá)99.5%;
印刷體英文和數(shù)字識(shí)別率>99.6%;
規(guī)范手寫數(shù)字識(shí)別率達(dá)99%;
一維條碼、二維條碼(PDF417、DataMatrix)識(shí)別率>99%。
5 我們的技術(shù)服務(wù)
我們的宗旨:為客戶提供企業(yè)級(jí)的數(shù)據(jù)采集技術(shù)
我們的技術(shù)服務(wù)內(nèi)容:
1、識(shí)別需求評(píng)估;
2、二次開發(fā)技術(shù)支持,在企事業(yè)客戶開發(fā)應(yīng)用系統(tǒng)的過程中,我們將全程跟蹤,為客戶方提供專業(yè)團(tuán)隊(duì)的技術(shù)服務(wù);
3、持續(xù)的軟件升級(jí)服務(wù);
6 應(yīng)用領(lǐng)域/解決方案
銀行票據(jù)事后監(jiān)督系統(tǒng) 流程銀行(無紙化辦公)