pdf can't copy text 無法複製文字

有些 pdf 是通過圖片弄出來的,或者被 protect 了. 我們會無法 copy 裡面的字. 

這個時候可以用 OCR (Optical character recognition) 就是從圖片中識別出字的魔力.

做法可以是這樣 

1. pdf -> images -> word -> merge word 
http://pdftoimage.com (pdf -> images)
https://www.onlineocr.net (image -> word)
https://support.microsoft.com/en-us/help/2665750/how-to-merge-multiple-word-documents-into-one---eeekb (merge word)

 

就是把 pdf 轉換成圖,然後轉換成 microsof word, 最後把多個 word merge 起來就可以了。 

 

關鍵詞:pdf word copy 無法 merge 可以 text 複製 文字 can't

相關推薦:

gb_tree平衡樹原始碼

如何「優雅」地標資料

python 影象庫PIL詳解

Jupyter Notebook 快速入門

C# 使用 wkhtmltopdf 把HTML文字或文件轉換為PDF

Excel文件轉為其他格式文件

【FAQ】Excel元件Spire.XLS 技術FAQ彙總 | 附下載

word,excel,ppt轉Pdf,Pdf轉Swf,通過flexpaper+swftools實現線上預覽

High Dynamic Range (HDR) Imaging using OpenCV (C++/Python)

R語言學習 - 熱圖繪製heatmap