Acrobat 文字辨識及問題

對於一個組織的行政人員來講，雖然部分公文流程都已經電子化，也有電子簽核的機制設計，但

是大老板習慣用紙本批閱的習慣，恐怕不是一時可以轉換過來。因此，大量的簽核文件管理及儲

存一直是個頭痛的問題。

Acrobat PDF一直是最便於跨平台閱讀的文件格式，大家或許會想，用具饋紙功能的Scanner

掃描後製成PDF，不就可以存到硬碟裡了?我過去也是這麼做，事實上這種處理方式存在一個盲

點，用於少量文件或許還可以，文件數量一多起來，除非你分門別類歸到相關檔案資料夾，且檔

名取得足以辨識其內容，不然在搜尋上會有很大的問題，原因在於影像型PDF裡並沒有關鍵字。

過去曾經下載國外期刊，發現其PDF檔雖然是將舊期刊加以掃描電子化，看來古色古香也帶點斑

駁，卻也有內嵌文字的訊息在內(就是可以copy-paste)。於是乎就開始在Acrobat 中找尋如何

讓這些以影像轉檔的文件，能更加informative的工具及方法。

我所使用的軟體是公司的 Acrobat 7.0 Pro 英文版本，首先將手邊的影像-PDF檔開啟，其文字是無法被選取的(不好意思，游標沒法被snapshot下來)。

Acrobat 文字辨識及問題