はじめる前に
アドビは、より直感的で新しい製品エクスペリエンスの提供を開始します。表示された画面が製品インターフェイスと一致していない場合は、現在の機能のヘルプを選択してください。
紙の文書をスキャンし、Acrobat を使用して、選択可能なテキストを含むスマートで検索可能な PDF に変換します。
はじめる前に
アドビは、より直感的で新しい製品エクスペリエンスの提供を開始します。表示された画面が製品インターフェイスと一致していない場合は、現在の機能のヘルプを選択してください。
スキャナーと Acrobat を使用して、紙の文書から直接 PDF ファイルを作成できます。Windows では、Acrobat は TWAIN スキャナードライバーおよび Windows Image Acquisition(WIA)ドライバーをサポートしています。Mac OS では、Acrobat は TWAIN および Image Capture(ICA)をサポートしています。
Windows では、「カラーモードを自動検出」を使用して、Acrobat で紙の文書のコンテンツタイプを判断するか、またはその他のプリセット(白黒文書、グレースケール文書、カラー画像およびカラー文書)を使用できます。スキャンプリセットを設定するか、または、「カスタムスキャン」オプションを使用して選択した設定でスキャンできます。
スキャンプリセットは、「スキャナーのネイティブインターフェイスを非表示」モードをサポートするスキャナードライバーでのみ使用できます。スキャンプリセットは、Mac OS 上では使用できません。
Windows で、スキャナーの WIA ドライバーがインストールされている場合は、スキャンボタンを使用して PDF を作成できます。スキャンボタンを押し、Windows の登録されたアプリケーションの一覧から Adobe Acrobat を選択します。次に、Acrobat のスキャンインターフェイスで、スキャナーと文書プリセットを選択するか、「カスタムスキャン」を選択します。
Acrobat で紙の文書をスキャンして PDF にするには、すべてのツール/PDF を作成を選択します。「任意の形式から PDF を作成」インターフェイスが表示されます。利用可能なオプションを表示するには、「スキャナー」を選択します。
Windows の場合:
Mac の場合:
すべてのツール/PDF を作成/スキャナー/カラーモードを自動検出を選択します。
これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。
複数のファイルをスキャンして PDF に変換するには、設定 アイコンを選択します。「カスタムスキャン」インターフェイスが表示されます。「追加のページをスキャンするように指示」を選択します。
「スキャン」を選択します。
他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」を選択します。
ツール/PDF を作成/スキャナー/「ドキュメントプリセット」を選択します。
これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。
複数のファイルをスキャンして PDF に変換するには、設定 アイコンを選択します。「カスタムスキャン」インターフェイスが表示されます。「追加のページをスキャンするように指示」を選択します。
「スキャン」を選択します。
他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」を選択します。
すべてのツールを表示/PDF を作成/スキャナー/デフォルト設定またはカスタム設定 を選択します。
これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。
設定を変更したい場合は、設定 アイコンを選択します。「カスタムスキャン」インターフェイスが表示されます。必要に応じてスキャンオプションを選択します。
複数のファイルをスキャンして PDF に変換するには、「追加のページをスキャンするように指示」を選択します。
Acrobat ユーザーインターフェイスでなくスキャナーのユーザーインターフェイス表示を使用すると指定した場合は、他のウィンドウやダイアログボックスが表示されます。利用可能なオプションについて詳しくは、スキャナーのマニュアルを参照してください。Mac OS では、スキャナーのユーザーインターフェイスが常に表示されます。
「スキャン」を選択します。
他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」を選択します。
すべてのツール/スキャンと OCR/スキャンされたファイルを補正を選択します。
第 2 ツールバーでオプションを選択します。設定 アイコンを選択し、スキャンされた PDF を補正ダイアログボックスで適切なオプションを選択し、「OK」を選択します。
このダイアログボックスに表示されるオプションについて詳しくは、スキャンされた PDF を補正ダイアログボックスを参照してください。
すべてのツール/PDF を作成/スキャナーを選択します。
事前定義されたスキャン設定(カラーモード自動検出、白黒文書、カラー文書、グレースケール文書またはカラー写真)を選択します。
プリセットの横にある設定 アイコンを選択します。選択に基づいて、「カスタムスキャン」または「事前定義された設定を構成」インターフェイスが表示されます。
複数のファイルをスキャンして PDF に変換するには、「追加のページをスキャンするように指示」を選択します。
設定を保存を選択してプリセットを保存します。
スキャナーを選択したら、要件に合わせて様々なスキャンオプションの選択や調整をおこなえます。
スキャナー
インストールされたスキャナーを選択します。コンピューターにスキャナーの製造元のスキャンソフトウェアをインストールしておく必要があります。Windows でのみ、「オプション」ボタンをクリックしてスキャナーオプションを指定します。
スキャナーのユーザーインターフェイスを表示
スキャナーの製造元のウィンドウやダイアログボックスを使用して設定を表示したい場合のみ、このオプションを選択してください。オプションが選択されていない場合は、「カスタムスキャン」または「事前定義された設定を構成」インターフェイスで指定された設定でスキャンがすぐに始まります。
ページ
スキャン方法を片面または両面に指定します。Acrobat で「両面」を選択し、スキャナーの設定を片面のみにした場合、スキャナーの設定の方が Acrobat よりも優先されます。
両面スキャンをサポートしていないスキャナーでも、ページの両面をスキャンできます。「両面」を選択している場合、最初の面をスキャンした後、ダイアログボックスが表示されます。次に、元の紙の文書を裏返しにしてトレイにセットし、そのダイアログボックスの「裏面をスキャン(ページの裏)」を選択します。この方法により、全ページ正しい順序で PDF が作成されます。
カラーモード(Windows のみ)
スキャナーでサポートされている基本的なカラーモード(自動検出、カラー、白黒、グレースケール)を選択します。このオプションは、スキャナーアプリケーションではなく Acrobat スキャンダイアログボックスを使用するように「スキャナー」のオプションが設定されている場合に有効になります。
解像度(Windows のみ)
スキャナーでサポートされている解像度を選択します。このオプションは、スキャナーアプリケーションではなく Acrobat スキャンダイアログボックスを使用するように「スキャナー」のオプションが設定されている場合に有効になります。
スキャナーでサポートされていないカラーモードや解像度を選択すると、メッセージが表示され、スキャナーアプリケーションのウィンドウが開きます。スキャナーアプリケーションのウィンドウで別のオプションを選択します。
用紙サイズ(Windows のみ)
用紙サイズを選択するか、カスタムの幅と高さを指定します。
追加のページをスキャンするように指示されます
このオプションを選択すると、すべてのスキャンセッション後に他のページをスキャンするかどうかを確認するダイアログボックスが表示されます。
品質/画像を最適化
PDF に最適化プロセスを実行するには、このオプションを選択します。このオプションは、スキャンされた PDF 内の画像を圧縮して、フィルタリングするために使用されます。設定 アイコンを選択すると、特定のファイル圧縮設定およびフィルタリング設定をカスタマイズして最適化できます。
品質/画像を最適化/高圧縮/高品質
このスライダーをドラッグして、ファイルサイズの圧縮率と画質のバランスを設定します。
出力/既存のファイルに追加
既存の PDF に変換したスキャンを追加します。ドロップダウンリストから開いているファイルを選択するか、または PDF ファイルを参照して選択します。
出力/新規 PDF を作成
PDF を作成します。
出力/複数のファイルを保存
複数の紙の文書から複数のファイルを作成します。設定 アイコンを選択し、ファイルの PDF ポートフォリオを作成するかどうかと、各ファイルのページ数、ファイル名の接頭辞を指定します。
テキスト認識 (OCR)
PDF のテキスト画像を検索および選択可能なテキストに変換する場合は、このオプションを選択します。テキスト画像に対して OCR(光学式文字認識)およびフォントとページ認識が適用されます。設定 アイコンを選択し、テキスト認識 - 設定ダイアログボックスの設定を指定します。詳しくは、スキャンした文書内のテキストの認識を表示してください。
メタデータを追加
選択すると、スキャン後に文書のプロパティダイアログボックスが表示されます。文書のプロパティダイアログボックスで、スキャンした文書に関する情報(メタデータ)を PDF ファイルに追加できます。複数のファイルを作成する場合は、すべてのファイルに共通のメタデータを入力できます。
PDF/A 準拠にする
このオプションを選択すると、PDF を PDF/A-1b 用の ISO 標準に準拠させることができます。
スキャンされた PDF を補正ダイアログボックスでは、スキャンされた画像を PDF 用にフィルタリングおよび圧縮する画像設定を制御します。通常はデフォルト設定で十分ですが、設定をカスタマイズして、画像の品質を向上させたり、ファイルサイズを小さくしたり、スキャンの問題を解決したりできます。
アダプティブ圧縮を適用
各ページを白黒、グレースケール、カラーの領域に分割し、種類別に高い圧縮率で圧縮する一方で、見た目をほとんど変えずに表示します。推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。
カラー/グレースケールスキャン
カラーまたはグレースケールのページをスキャンするときは、次のいずれかを選択します。
JPEG2000
JPEG2000 圧縮をカラー画像コンテンツに適用します(この設定は、PDF/A ファイルを作成する場合はお勧めしません。代わりに JPEG を使用してください)。
ZIP
ZIP 圧縮をカラー画像コンテンツに適用します。
JPEG
JPEG 圧縮をカラー画像コンテンツに適用します。
選択した「カラー / グレースケール」オプションまたは選択した「白黒」オプションがスキャナーで使用されます。使用されるオプションは、Acrobat スキャンダイアログボックスまたはスキャナーの TWAIN インターフェイスで選択した設定によって変わります。スキャナーの TWAIN インターフェイスは、Acrobat スキャンダイアログボックスで「スキャン」をクリックした後に表示されます(デフォルトでは、スキャナーアプリケーションのダイアログボックスは表示されません)。
白黒スキャン
白黒(モノトーン)の画像をスキャンするときは、次のいずれかを選択します。
JBIG2 (劣化なし) と JBIG2 (劣化あり)
白黒ページに JBIG2 圧縮方式を適用します。最高品質レベルでは、劣化しない方法が使用され、より低い設定にするとテキストが高圧縮されます。通常、テキストページは CCITT Group 4 で圧縮したページよりサイズが 60% 小さくなりますが、処理も遅くなります。Acrobat 5.0(PDF 1.4)以降と互換性があります。
Acrobat 4.0 に対応させるには、JBIG2 以外の圧縮方法を使用してください。
CCITT Group 4
白黒ページの画像に CCITT Group 4 圧縮を適用します。この高速で、データ損失を伴わない圧縮方式は Acrobat 3.0(PDF 1.2)以降に対応しています。
高圧縮/高品質
ファイルサイズの圧縮率と画質のバランスを設定します。
ゆがみ補正
スキャナーのガラス面の両端に対してページが平行に置かれていない場合、スキャンで生成される PDF ページがまっすぐになるように傾きを補正します。「オン」または「オフ」を選択します。
背景を除去
グレースケール画像やカラー画像を取り込むときに、白に近い色を白くします(白黒の画像には影響しません)。
最適な結果を得るには、通常の白黒ページのテキストが濃い灰色または黒で、背景が白になるように、スキャナーのコントラストと明るさの設定をキャリブレーションします。次に、オプションを「オフ」または「低」にすると、適切な結果が得られます。オフホワイトの用紙または新聞用紙の場合は、「中」または「高」を選択します。
モアレフィルター
JPEG 圧縮率を低下させ、モアレパターンを生じ、テキストを読みづらくする原因となるハーフトーンのドットを除去します。200 ~ 400 dpi のグレースケール画像か RGB 画像に適しています。また、アダプティブ圧縮の場合、400 ~ 600 dpi の白黒画像に適しています。「オン」の設定(推奨)は 300 dpi 以上のグレースケール画像と RGB 画像のフィルターに適用します。画像や塗りつぶされた領域がないページをスキャンするとき、または有効な範囲より高い解像度でスキャンするときは、「オフ」を選択します。
テキストシャープニング
スキャンされた PDF ファイルのテキストを鮮明にします。デフォルト値は「低」で、多くの文書に適してします。印刷された文書の品質が低く、テキストが不明瞭な場合は「中」または「高」にあげます。
文書の言語
デフォルトでは、OCR の言語は、デフォルトのロケールから選択されます。言語を変更するには、「編集」をクリックし、別の言語を選択します。
出力
「検索可能な画像」または「編集可能なテキストと画像」のどちらかです。
Acrobat では、10 ~ 3000 dpi のスキャン画像を使用できます。「PDF の出力形式」で「検索可能な画像」または「ClearScan」を選択した場合、72 dpi 以上の解像度を入力する必要があります。また、600 dpi より大きい解像度を入力すると、600 dpi 以下にダウンサンプリングされます。
劣化なし圧縮は白黒画像にのみ適用可能です。スキャン画像に劣化なし圧縮を適用するには、スキャンされた PDF を最適化ダイアログボックスの最適化オプションで、白黒画像の CCITT グループ 4 または JBIG2(劣化なし)のいずれかのオプションを選択します。この画像を PDF 文書に追加して、ファイルを「保存」オプションで保存すると、画像は非圧縮のまま保持されます。「名前を付けて保存」を使用して PDF を保存すると、スキャンした画像は圧縮されることがあります。
ほとんどのページでは、300 dpi の白黒スキャンで変換に最適なテキストが生成されます。150 dpi では、OCR の精度が少し低下し、フォント認識エラーが増えます。400 dpi 以上の解像度では、処理が遅くなり、圧縮ページのサイズが大きくなります。ページに判読不可能なテキストや 9 ポイント以下の小さい文字が多数含まれている場合は、解像度を上げてスキャンします。可能であれば、白黒でスキャンします。
「OCR を使用してテキストを認識」を無効にした場合は、10~3000 dpi の解像度でスキャンできますが、推奨される解像度は 72 dpi 以上です。アダプティブ圧縮の場合、推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。
24-bit カラー、300 dpi、8-1/2 x 11 インチ(21.59 x 27.94 センチ)でスキャンしたページは、圧縮前で 25MB という大きなサイズになります。画像のスキャンには、50 MB 以上の仮想メモリが必要になります。600 dpi では、300 dpi の場合と比べてスキャンおよび処理に約 4 倍の時間がかかります。
スキャナーのディザやハーフトーンの設定は使用しません。これらの設定によって写真の画質は向上しますが、テキストは判読が難しくなります。
色付きの紙に印刷されているテキストの場合は、明るさとコントラストを 10% 程度上げてみます。スキャナーがカラーフィルター機能を備えている場合は、フィルターまたはランプを使用して背景色をドロップアウトすることを検討します。テキストが鮮明でないかドロップアウトしたときに不鮮明になる場合は、スキャナーのコントラストと明るさを調整して鮮明にします。
スキャナーの明るさを手動で調整できる場合は、文字がはっきり正しく読み取られるように調整します。文字と文字がつながっている場合は、明るさの設定を高くします。文字がばらばらになってしまう場合は、明るさの設定を低くします。
スキャナーのエラーや問題を解決するには、トラブルシューティングに関する以下の文書を参照してください。
Acrobat を使用して、以前スキャンして PDF に変換した文書のテキストを認識できます。OCR ソフトウェアを使用して、スキャンした PDF に含まれるテキストの検索、修正、コピーを行うことができます。OCR を PDF に適用するには、元のスキャナー解像度が 72 dpi 以上に設定されている必要があります。
300 dpi でスキャンすると、変換に最適なテキストが生成されます。150 dpi では OCR の精度がわずかに低くなります。
すべてのツール/スキャンと OCR/このファイル内を選択します。
第 2 ツールバーに「テキスト認識」オプションが表示されます。
第 2 ツールバーで、テキスト認識のページ範囲と言語を選択します。
必要に応じて、「設定」をクリックしてテキスト認識ダイアログボックスを開き、オプションを指定します。
テキスト認識を選択します。Acrobat によって、検索可能な(新しい文書にコピー&ペースト可能な)PDF にテキストレイヤーが作成されます。
すべてのツール/スキャンと OCR/複数のファイル内を選択します。
テキスト認識ダイアログボックスで「ファイルを追加」を選択してから、「ファイルを追加」、「フォルダーを追加」、「開いているファイルを追加」のいずれかを選択します。次に、ファイルまたはフォルダーを選択します。出力オプションダイアログボックスが表示されます。
出力オプションダイアログボックスで、出力ファイルのターゲットフォルダーとファイル名の設定を指定します。「OK」を選択します。
テキスト認識 - 一般設定ダイアログボックスで、オプションを指定し、「OK」を選択します。
Acrobat によって、検索可能な(新しい文書にコピー&ペースト可能な)PDF にテキストレイヤーが作成されます。
文書の言語
文字を認識するために使用する OCR エンジンの言語を指定します。
出力(PDF 出力形式)
作成する PDF の種類を指定します。どのオプションも、72 ppi 以上(推奨)の入力解像度が必要です。どの形式でも、テキスト画像に対して OCR およびフォントとページ認識が適用され、通常のテキストに変換されます。
検索可能な画像
テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、必要に応じてゆがみが補正され、その上に非表示のテキストレイヤーが配置されます。同じダイアログボックスの「画像のダウンサンプリング」の選択項目では、画像をダウンサンプルするかどうかや、ダウンサンプリングのレベルを指定します。
検索可能な画像(非圧縮)
テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、その上に非表示のテキストレイヤーが配置されます。元の画像を忠実に再現する必要がある場合は、このオプションを選択することをお勧めします。
編集可能なテキストと画像
元のフォントに似た新しいカスタムフォントを合成し、低解像度のコピーを使用してページの背景を保持します。
ダウンサンプル
OCR が完了した後に、カラー、グレースケール、白黒の各画像のピクセル数を減らします。適用するダウンサンプリングのレベルを選択します。オプションの数値を高くすると、ダウンサンプリングがあまり適用されず、高い解像度の PDF が作成されます。
スキャンした出力上で OCR を実行する場合、Acrobat ではテキストのビットマップを分析し、これらのビットマップ領域を単語および文字に置き換えます。最適な置き換え語句が不明の場合、Acrobat はその単語を不明テキストとしてマークします。不明テキストは、ビップマップ上は元のテキストとして PDF に表示され、テキストのビットマップの背後の非表示のレイヤーにも含まれています。この方法により、ビットマップとして表示されている単語も検索可能になります。
注意:OCR を適用せずにスキャンした PDF でテキストを選択しようとした場合、または画像ファイルに対して読み上げ操作を実行しようとした場合、Acrobat は、OCR を実行するかどうかを確認するメッセージを表示します。「OK」を選択すると、テキスト認識ダイアログボックスが表示され、オプションを選択できるようになります。これらのオプションについては、前のトピックで詳しく説明しています。
すべてのツール/スキャンと OCR/認識されたテキストを修正を選択します。
Acrobat は、エラーの可能性のあるテキストを識別し、画像とテキストを第 2 ツールバーに横に並べて表示しますページ上のすべての不明テキストの周囲にボックスが表示されます。
文書内のハイライト表示されたオブジェクトまたはボックスを選択して、次に第 2 ツールバーの「次として認識」ボックスで修正します。「同意する」を選択します。
次の不明テキストが強調表示されます。必要に応じて、ミスを修正します。修正ごとに、「同意する」を選択します。
作業が完了したら、第 2 ツールバーの「閉じる」を選択します。