第47回
紙の書類をスキャナで取り込んで
PDFで管理する その2 ~Clear Scan~Adobe Acrobat(アドビ アクロバット)とPDFを活用する連載記事

今回は前回の続きで『紙の書類をスキャナで取り込んでPDFで管理する その2 ~ClearScan~』をご紹介します。

今回の機能

ClearScan

ClearScanとは、OCRテキスト認識の際に設定できる機能です。

スキャン画像にスキャン元のフォントと酷似したフォントを重ね合わせる読み取り技術で、この設定を加えるだけでスキャンした文字が読みやすくなるメリットがあります。

OCRテキスト認識についての基本操作については、第30回でご紹介した内容にプラスしてClearScanの設定を加えます。

操作方法

  1. 画像として認識されたPDFファイルを開きます。選択ツールで画面をクリックすると全体が選択されます。
    画像として認識されたPDFファイルを開く
  2. この状態で、[文書]-[OCRテキスト認識]-[OCRを使用してテキストを認識]を選択します。
    [OCRを使用してテキストを認識]を選択
  3. テキスト認識で、[編集]ボタンをクリックします。
    テキスト認識
  4. [テキスト認識設定]の、[PDFの出力形式]から[ClearScan]を選択して[OK]ボタンをクリックします。
    [ClearScan]を選択
  5. OCRテキスト認識が実行されます。実行後に選択ツールで文章をドラッグするとテキストが選択されます。
    文章をドラッグするとテキストが選択される

[ClearScanを実行したときの選択結果]

自然な形で選択が可能になる。
ClearScanだと自然な形で選択できる

[検索可能な画像を実行したときの選択結果]

選択はできているが、部分的に選択範囲にガタつきがある。
選択範囲にガタつきがある

活用法
  • この方法を使用することによって、過去に画像として読み込まれているPDFデータでも、検索可能なPDFに変えることができ、読みやすい形で管理できます。

次回はちょっと便利な活用方法、『任意のところをPDFに変換する』を紹介します。

次のページは…
任意のところをPDFに変換する
関連リンク
遠藤 明久 (えんどう あきひさ)
遠藤 明久 (えんどう あきひさ)
Adobe認定インストラクター

Dreamweaver、Acrobat、CaptivateなどのACI(アドビ認定インストラクター)を保有し、多岐にわたり講師をつとめる。2005年に「パソコン教科書 Flash 8」を執筆。

今さら聞けない Adobe Acrobat & PDF

RSSフィードで
最新情報を購読