画像内のテキストをコピペしたい時の2つのOCRツール

画像内にかかれているテキストは厳密にはテキスト形式ではないためコピーできません。

「画像にかかれているテキストをコピペしたい」

そんな時は、OCR（光学文字認識）ツールが便利です。今回はデスクトップ用として、Adobe Acrobat ProとGoogle DriveをのOCR機能を利用してその結果を比較してみました。

1 Acrobat ProとAcrobat StandardのOCR機能の違いは編集の有無？
2 Adobe Acrobat ProにおけるOCRの手順
3 Google Driveを使用したOCR
4 OCR結果の比較
5 まとめ

Acrobat ProとAcrobat StandardのOCR機能の違いは編集の有無？

そもそもとして、AdobeのOCR機能は、どちらも有料のAcrobat Proと、Acrobat Standard の両バージョンで提供されていますが、機能に違いがあるようです。自分の環境ではProしか確認できないため具体的にどのように異なるのかのチェックができませんが、公式では編集機能が制限されるとあります。

Acrobat Standard は OCR モードの「検索可能な画像」および「検索可能な画像とテキスト」をサポートしています。スキャンされた文書では、OCR モードの「編集可能なテキストと画像」はサポートされていません。

Acrobat Pro は、スキャンされた文書で次の 3 つの OCR モードをサポートしています。

検索可能な画像

検索可能な画像とテキスト

編集可能なテキストと画像

Acrobat STD で、OCR またはテキスト認識を使用できますか？

おそらく、通常の画像のテキストを検出したいという場合であれば、Pro / Standard どちらでも利用できるかと思います。もしStandardで画像のOCRができるというのがわかればコメント欄でお知らせいただけると助かります。

Creative CloudコンプリートプランであればAcrobat Proが含まれています。OCRだけ使いたいというのであれば、Acrobat Pro / Standard 単体のプランも有り。

Adobe Acrobat ProにおけるOCRの手順

Adobe Acrobat Pro環境で話を進めます。Acrobat ProはPDF編集ツールの決定版となり、強力なOCR機能を搭載しています。以下の手順で、画像からテキストを抽出しました。

Acrobat Proを開き、「ファイル」メニューから「作成」→「ファイルからPDF」を選択して、画像ファイルを選択すると、PDFとして読み込まれる。
サイドバー「すべてのツール」から「スキャンとOCR」を選択し、「このファイル」から言語が日本語になっていることを確認して「テキストを認識」を実行する。
OCRが完了すると、テキストが選択可能になり、コピーして別のドキュメントにペーストできます。

「このファイル」をクリックし、「言語」が「日本語」になっていることを確認して「テキストを認識」する。もしOCR対象が別の言語なら合わせる。

後に詳しく解説しますが、Adobe Acrobat ProのOCR精度は非常に高く、ほとんどのテキストが正確に読み取られました。テキストの順番が少し入れ替わりましたが、これは今回使ったサンプル画像が縦書き（右から左に読む形式）だったからと言えます。

Google Driveを使用したOCR

Google DriveもまたOCR機能を備えており、以下の手順で実行しました。

Googleドライブにログインし、左上にある「新規+」より「ファイルのアップロード」を選択し、OCRを行いたい画像ファイルを選択してドライブにアップロードする。
アップロードが完了後、画像ファイルを右クリックし、「アプリで開く」より「Googleドキュメント」を選択。
別タブが開き、自動的に画像のテキストが読み取られ、編集可能な状態でGoogleドキュメントが生成される。