對於一個組織的行政人員來講,雖然部分公文流程都已經電子化,也有電子簽核的機制設計,但

是大老板習慣用紙本批閱的習慣,恐怕不是一時可以轉換過來。因此,大量的簽核文件管理及儲

存一直是個頭痛的問題。

Acrobat PDF一直是最便於跨平台閱讀的文件格式,大家或許會想,用具饋紙功能的Scanner

掃描後製成PDF,不就可以存到硬碟裡了?我過去也是這麼做,事實上這種處理方式存在一個盲

點,用於少量文件或許還可以,文件數量一多起來,除非你分門別類歸到相關檔案資料夾,且檔

名取得足以辨識其內容,不然在搜尋上會有很大的問題,原因在於影像型PDF裡並沒有關鍵字。

過去曾經下載國外期刊,發現其PDF檔雖然是將舊期刊加以掃描電子化,看來古色古香也帶點斑

駁,卻也有內嵌文字的訊息在內(就是可以copy-paste)。於是乎就開始在Acrobat 中找尋如何

讓這些以影像轉檔的文件,能更加informative的工具及方法。

我所使用的軟體是公司的 Acrobat 7.0 Pro 英文版本,首先將手邊的影像-PDF檔開啟,其文字是無法被選取的(不好意思,游標沒法被snapshot下來)。

Acrobat 文字辨識及問題

接著選取Document-->Recognize Text Using OCR-->Start-->OK,開始辨識

Acrobat 文字辨識及問題

完成辨識後,試著選取文字看看,可以選取也可以複製 or貼上了。

Acrobat 文字辨識及問題

用google desktop搜尋看看! 可以被搜尋到了!

Acrobat 文字辨識及問題

進入正題,以上簡單分享,主要是為了要問一個問題:

1.敝人公司採購的版本為英文版,目前支援的OCR語言多為西歐字元,不知道各位的Acrobat

Pro中文版是否能支援中文OCR,有試過的各位大大,告知是否可行,謝謝!


辨識選項中沒有出現繁體中文
或是簡體中文等選項
還是以英文或是其他語言為主要辨識主角....
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!