日常辦公經(jīng)常需要將紙質(zhì)文本變成電子文稿,重新手輸太麻煩,在實(shí)現(xiàn)了高科技辦公的今天,當(dāng)然要選擇漢字掃描識別了。不過說實(shí)話,目前市場上的一些漢字識別系統(tǒng)識別率不是很高,用起來總是不太順手。
經(jīng)過摸索,特別是向老同事虛心請教,最近找到了一種可以接近100%識別率的漢字掃描識別方法,那就是使用掃描儀將文本掃描保存為TIFF格式的圖片,然后使用微軟Office自帶的Document Imaging軟件進(jìn)行識別。
文本掃描
以比較常見的愛普生V3580掃描儀為例,將紙張放入掃描平臺后啟動掃描儀自帶的EPSON Scan軟件(我用的版本是V3.04sc)。
使用“專業(yè)模式”,點(diǎn)擊“掃描”右側(cè)的“文檔保存設(shè)置”按鈕,打開一個新對話框進(jìn)行設(shè)置(圖1),這里關(guān)鍵一步是把“圖像格式”設(shè)置為TIFF(*.tif)。點(diǎn)擊“確定”后返回。為了提高掃描速度,此時可以將“圖像類型”設(shè)置為“16位-灰度”,將分辨率設(shè)置為150dpi即可(圖2),不需要彩色和高分辨率。
此時,關(guān)鍵部位已經(jīng)設(shè)置完畢,點(diǎn)擊“掃描”按鈕,將需要識別的文本逐一掃描保存為tif格式的圖片。 漢字識別 如果已經(jīng)安裝了Office套裝中的Document Imaging組件(未安裝的可以用Office光盤安裝),可以通過開始菜單直接啟動。 啟動后,點(diǎn)擊“打開”按鈕,將剛才掃描保存的圖片文件讀入(圖3)。點(diǎn)擊工具欄中的“將文本發(fā)送到Word”,片刻后識別完成并產(chǎn)生了一個類似于網(wǎng)頁的新文件(圖4)。
重復(fù)這一步驟,將需掃描的文本逐一掃描,最后將所有產(chǎn)生的新文件內(nèi)容進(jìn)行剪貼、校正、排版,就可以實(shí)現(xiàn)快速而非常準(zhǔn)確的漢字識別。 經(jīng)過檢測,剛才這篇文本的識別率接近100%,需要改動的僅僅只是幾個標(biāo)點(diǎn)和幾處格式。 掃描儀、識別軟件雙劍合璧,可以最大限度地將雙手解放出來,實(shí)現(xiàn)高效率、輕松自如的辦公。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報(bào)。