怎嘛將大量的資料,書本,筆記轉成數位檔

最近老闆出了一個難題~
也不知道是突然想到還是異想天開~
就是要將公司內部大量的客戶資料跟往來信件以及資料都變成數位檔以便管理..

我知道有一種專門掃描書籍可以自動翻頁的機器,
請問市面上是不是有這樣的服務或是要採購怎樣的設備才會好呢?
機器掃描後的檔案為圖形檔,得再經過OCR處理後,資料才能善用(如編輯、搜尋、計算...)。
單純存為圖檔,意義應該不大,除非檔名系統化。
個人認為,還是從現在開始將文件電子化較為適當,現有的舊資料則由人工鍵檔重新整理較好。

建議先釐清老闆的需求,瞭解數位化的目的為何再來找方法解決,畢竟人力/時間/金錢的花費都不是件小事。
行路難,難重陳。行路難,難於山,險於水。行路難,不在水,不在山,只在人情反覆間。

vane wrote:
機器掃描後的檔案為圖...(恕刪)


謝謝vane大大的回覆~

老闆的想法是覺得目前全部都是文件形式的資料,
再找舊資料的時候實在很不方便,而且每天大家事情太多,經常會將資料亂夾,
有時候a客戶的資料不小心就會夾到b客戶的檔案夾裡面去,
一放進檔案庫之後就有如放到森林裡面一樣,再也找不回來了..
另外也有數年前的資料,爾後有朝一日如果想要查詢,
例如:199x年客戶訂單資料...往往又會因為年代以久不易查詢,要重新尋找..
找了之後又過一段時間又找不到了...要避免諸如此類的情形...

目前我自己的資料也是有小部分的電子化當中..
例如自己經手過的資料,可能有空就會將其掃描成圖檔存下..
因為雖然客戶來信皆為email形式,但是往往開會時會在上面做筆記或是速記..
所以還是要將其掃描保存起來...

感覺起來好像是一個很龐大的工作..
因為小弟目前的工作是出社會的第一個工作,也沒有在別的公司工作過..
不知道別的公司的文件數位化的情形..
不知道各位大大有沒有人可以說一下,自己公司在這方面的做法...
我爸的公司就是在幫人家的資料掃描建檔
不過好像都是接公家機關的案子
主要流程是分類以後掃描
掃描用的軟體會幫你取好檔名
然後是QC把雜質去掉
就你的回覆來看,單單的圖形檔是無法滿足你們公司的需求。
各個客戶的相關資料可能就包含:客戶公司基本資料、訂單、詢價單、出貨記錄等等...
掃描後的圖形檔,若要達到基本的查詢功能,頂多就是在檔名動手腳,
如:a公司基本資料.jpg、a公司20080101訂單.jpg、a公司20080102訂單.jpg,且要訂定一套命名規則,這些作業基本上也是要由人工逐筆建檔才行,而人工建檔又會有錯誤產生,這又與人員的訓練、素質有關了。
再者,文件上若有手寫字,又增加了OCR的困難度。
還有一些問題得考量,有些需人員簽署的文件,在電子化時該如何保留簽署?走電子簽章制度嗎?電子化文件雖然方便、省成本,但有可靠度、安全性、保密性等問題...

我沒這方面的經驗可供你參考,或許你可找專業公司討論看看。
行路難,難重陳。行路難,難於山,險於水。行路難,不在水,不在山,只在人情反覆間。
alexykh wrote:
我知道有一種專門掃描書籍可以自動翻頁的機器,
請問市面上是不是有這樣的服務或是要採購怎樣的設備才會好呢?

那機器價值9000

但重點是要OCR(光學辨識)成文字檔呀
還有檔名要一一更名

我現在也在把我得書一一掃描
用epc當電子書來看
但有時要OCR的時候就會瘋掉
你問我會什麼?我想我什麼都不會!
小弟從事的是相關行業

重點不在掃描成圖檔

而是在於怎樣讓這些圖檔日後可以被順利找到

一般還需要建置所謂的METADATA(詮釋資料)

就像我們在利用資料庫的搜尋功能時

引擎會尋找您所KEY的關鍵字

但這些關鍵字其實是建置在一個與圖檔不同的檔案裡

而搜尋引擎是先去METADATA找到關鍵字再將對應的圖檔(或是連結)呈現出來

因此重點其實在於詮釋資料的建置

要有哪些欄位?要設定哪些關鍵字等?

通常文件數位化要搭配一個系統才敷使用

若僅將數位化之後的圖檔儲存在硬碟裡

那可能還是會造成日後查找使用上的困難
您們需要的不是掃成文字檔!!

而是需要一套適合的客戶管理程式,而這套程式如果市面上套裝軟體可以符合

我想幾萬元買套軟體,再請人輸入之前的資料,如果您們的行業或是資料較特殊

就得考慮請人家寫程式囉,依照需求...很可能是要數萬元甚至十萬起跳!!

該擔心的,是老闆腦袋轉不過來,又要數位化,又要便宜,又要合用!!

至於您說的將文件等等轉成圖檔,檔案再轉成文字!! 轉文字過程或許不是那麼必要!!

但是適當的說明檔案是需要的!!

前提還是得有個客戶檔案.... 真有需要可以討論一下!!

因為店內的客戶資料都是我在用的,也找過很多套套裝軟體,用起來還是依行業別設計的

軟體最好用,找找看或許有人有寫好的也不一定!!
PRCO wrote:
小弟從事的是相關行業...(恕刪)


請教 PRCO:
若要對文件的數字做運算或文字做搜尋,除了文件重新建檔外,是否有其它方法?
METADATA的建置是否由人工作業?
謝謝!
行路難,難重陳。行路難,難於山,險於水。行路難,不在水,不在山,只在人情反覆間。
您如果要針對文件中的數字或文字再做另外的運用,

那還要看是怎樣的運用?

如果有很多種可能的用途,

例如要計算不同文件裡的數值,

那您先前單純地「數位化」想法恐怕就行不通。

目前比較常見的作法,

是把文件掃描後經過OCR(光學辨識)產生文件的文字檔,

再將文字檔嵌在本文件的影像PDF檔,

但這還有正確率的問題,

因為OCR的正確率目前大約只有60-70%。

如果要確保文件的內容都能被找到,

那就要以人工校正的方式來讓文字檔達到100%的正確率,

如此也才能達到「全文檢索」的功能,

而不是僅能搜尋到「關鍵字」。



回到您所提的,

日後若對於這些文件內的資料還有大量運用的可能,

最好的作法還是直接購置一套系統,

將文件內容依系統欄位重新建置進去,

另外也將文件掃描後的影像檔同時儲存以方便使用時對照。

但購置系統的費用絕對不低,

一個基本的「數位典藏系統」動輒三五十萬,

而且通常還要加上部分客製化的費用。



說到底,

還是要看貴公司將文件數位化後可能的使用跟需求有哪些,

才好評估該用怎麼樣的數位方式。

◎METADATA通常由人工建於EXCEL檔再匯入系統以供使用
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!