テキストのコピーが禁止されているPDFのテキストをなんとかコピーする方法2008年07月25日 13時41分

普通のPDFファイルであればテキスト選択ツールなどで文字を選択し、右クリックすればクリップボードにコピーでき、そのままワードやエクセルなどに文字を貼り付けることができる。しかしたまにテキストのコピーが禁止されているPDFファイルもある。PDFから引用したい場合などいちいち書き写すのは面倒くさいし・・・。なんとかコピーできないものか。

ネットで調べてみると色々とPDFファイルからテキストを抜き出すソフトが公開されている。試しに「xdoc2txt」というソフトを使ってみた。コマンドプロンプトから起動してリダイレクトで出力したテキストファイルをメモ帳で開いてみると、化けてしまって全く読めなかった。他にもいくつか試してみたが、どうもうまくいかない。

他の方法がないか探してみると、どうやら最終的にはOCRで読み取るしかないようだ。そこで「クロセReader ZERO」というOCRソフトを試してみた。まずソフトを起動しセキュリティ保護されているPDFファイルを読み込む。次に「OCR変換」というボタンを押すと、元のPDFを読み取り新しいPDFファイルを作成する。新しいPDFファイルはテキストのコピー禁止などの保護が当然かかっていないため、普通にコピーすることができた。しかも180日間無料!すばらしい。

OCRというと、スキャナで読み込んだ画像から文字を読み取るものでなかなかうまく変換できないというイメージがあったが、進化してるなぁ。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※投稿には管理者が設定した質問に答える必要があります。

名前:
メールアドレス:
URL:
次の質問に答えてください:
↓に「sakanade」と入力してください。

コメント:

トラックバック