201212131        「中國基本古籍庫」大概是從事史學研究必備的資料庫,但愛如生公司可能為了避免內容被大量複製,因此設定「一次最多只能複製或剪切200個字」的限制,使得要複製比較長的材料時,稍嫌麻煩。我認為這可以透過修改程式內的編碼來破解,可惜難度太高,現在沒那麼多心思進行反編譯。

      其實更簡單的方法就是透過「螢幕文字抓取工具」來抓文字,「Aqua Deskperience 」這套軟體相當適合進行這項工作,下載安裝後執行程式。先點選「基本古籍庫」的「下載編輯」選項,然後按「ctrl+alt+R」可以框選畫面,把要下載的史料框起來,如下圖:

201212142

 

框選完畫面後會自動顯示出功能表,接下來只要點選「文本捕獲」→「編輯純文本」,或是「編輯富文本」就可以了。

201212141

 

如果點選「編輯純文」會出現記事本的畫面,若是「編輯富文本」則會出現word檔,以下是「編輯純文呈現的畫面,可以看到剛剛框起來的文字都已經複製下來了。

201212143 

這個方法大概可以複製300至400字,且省去原本複製、貼上的時間,速度較原先的200字限制約快一半左右。如果僅只要抓600字,原本的方法顯然比較方便,但若要抓6000字,這個方法會有效率的多。

       不想安裝軟體,也可以用Microsoft Office內建的功能,可是這個方法對於冷僻字的辨識度稍差,首先你要確定有安裝「光學字元辨識」(Microsoft Office 2010 版以前叫做Document Imaging),檢查的方法就是到「控制台」→程式與功能Microsoft Office變更→Office工具」,如果圖案前面打一個叉叉,就是沒安裝的意思。

201212135

 

接下來就打開 「Microsoft OneNote 2010」這套軟體,點選「插入」→畫面編輯→選擇「基本古籍庫」的史料畫面→右鍵→複製圖片文字→到記事本或word貼上。

201212136

 

上圖僅是步驟示意,正常的話,也是跟前面的步驟一樣,先點選「基本古籍庫」的「下載編輯」選項,如此才能正確辨識文字,如下圖:

201212146

 

看起來好像有點複雜,用上兩、三次就很順手了,像我昨天也是第一次用,但今天已經複製了20卷地方志了。

 

其他圖片轉換文字的服務或軟體

1.〈利用 Google Drive 雲端硬碟進行圖片文字辨識(OCR) 〉(點此連結)

2.JOCR 軟體

 

創作者介紹

漫遊於歷史與現代之間

okplaymayday 發表在 痞客邦 PIXNET 留言(0) 人氣()