第47回
紙の書類をスキャナで取り込んで
PDFで管理する その2 ~Clear Scan~Adobe Acrobat(アドビ アクロバット)とPDFを活用する連載記事
今回は前回の続きで『紙の書類をスキャナで取り込んでPDFで管理する その2 ~ClearScan~』をご紹介します。
今回の機能
ClearScan
ClearScanとは、OCRテキスト認識の際に設定できる機能です。
スキャン画像にスキャン元のフォントと酷似したフォントを重ね合わせる読み取り技術で、この設定を加えるだけでスキャンした文字が読みやすくなるメリットがあります。
OCRテキスト認識についての基本操作については、第30回でご紹介した内容にプラスしてClearScanの設定を加えます。
操作方法
- 画像として認識されたPDFファイルを開きます。選択ツールで画面をクリックすると全体が選択されます。

- この状態で、[文書]-[OCRテキスト認識]-[OCRを使用してテキストを認識]を選択します。
![[OCRを使用してテキストを認識]を選択](image/047/ocr02.gif)
- テキスト認識で、[編集]ボタンをクリックします。

- [テキスト認識設定]の、[PDFの出力形式]から[ClearScan]を選択して[OK]ボタンをクリックします。
- OCRテキスト認識が実行されます。実行後に選択ツールで文章をドラッグするとテキストが選択されます。

[ClearScanを実行したときの選択結果]
自然な形で選択が可能になる。

[検索可能な画像を実行したときの選択結果]
選択はできているが、部分的に選択範囲にガタつきがある。

- 活用法
-
- この方法を使用することによって、過去に画像として読み込まれているPDFデータでも、検索可能なPDFに変えることができ、読みやすい形で管理できます。
次回はちょっと便利な活用方法、『任意のところをPDFに変換する』を紹介します。


