准备事项
我们将推出全新、更直观的产品体验。 如果此处显示的屏幕与您的产品界面不匹配,请选择“帮助”以了解您的当前体验。
将纸质文档扫描为 PDF,然后使用 Acrobat 将其转换为包含可选文本的智能、可搜索 PDF 文件。
准备事项
我们将推出全新、更直观的产品体验。 如果此处显示的屏幕与您的产品界面不匹配,请选择“帮助”以了解您的当前体验。
Acrobat 支持 TWAIN 和 WIA 驱动程序 (Windows) 以及 ICA 驱动程序 (macOS)。Windows 用户可以选择“自动检测颜色模式”以自动检测内容,也可以从“黑白文档”、“灰度文档”或“彩色文档”等预设中进行选择。自定义扫描选项允许进行个性化设置。
预设扫描需要支持隐藏扫描仪的本机界面模式的驱动程序,该模式在 macOS 上不可用。
从全局栏中选择创建,然后选择扫描仪。
选择扫描仪以查看可用选项。
如果 Acrobat 无法识别您的扫描仪,请参阅无法识别扫描仪。
选择下面提到的设置,然后选择扫描。
设置 |
适用于 |
详细信息 |
---|---|---|
扫描时使用 |
Windows |
|
预定义的扫描设置 |
Windows |
选择扫描仪或打印机的工作模式:自动检测颜色模式、扫描黑白文档、彩色文档、灰度文档或彩色照片。 |
自定义扫描设置 |
||
页面 |
Windows、macOS |
|
颜色模式 |
Windows |
选择您的扫描仪所支持的基本颜色模式(“自动检测”、“彩色”、“黑白”或“灰度”)。如果“扫描仪选项”设置为使用 Acrobat 扫描对话框,而不是扫描仪应用程序的扫描对话框,将启用此选项。 |
分辨率 |
Windows |
选择您的扫描仪支持的分辨率。 如果“扫描仪选项”设置为使用 Acrobat 扫描对话框,而不是扫描仪应用程序的扫描对话框,将启用此选项。 |
纸张大小 |
Windows |
选择纸张大小,或者指定自定义宽度和高度。 |
质量 |
Windows、macOS |
|
输出 |
Windows、macOS |
|
如果系统提示扫描更多页面,请选择扫描更多页面、扫描背面或扫描已完成,然后选择确定。
请参阅扫描仪手册,了解有关使用文档进纸扫描仪或平板扫描仪(具体取决于您的型号)扫描更多页面的说明。
您可以使用打印机或扫描仪以及 Acrobat 从纸质文档创建 PDF 文件。如果您的扫描仪安装了 WIA 驱动程序,则可以使用扫描按钮创建 PDF。
按打印机或扫描仪上的扫描按钮,然后从已注册的应用程序列表中选择 Adobe Acrobat。
在 Acrobat 扫描界面中,选择扫描仪,然后选择文档预设或自定义扫描。
要解决扫描仪错误或问题,请参阅以下故障排除文档:
您可使用 Acrobat 识别以前已转换为 PDF 扫描文档的文本。 光学字符识别(OCR)软件允许您搜索、更正和复制扫描的 PDF 中的文本。 要将 OCR 应用于 PDF,原始扫描仪分辨率必须设置为 72 dpi 或更高。
以 300 dpi 扫描会生成最适合转换的文本。 以 150 dpi 扫描时,OCR 精度会略有降低。
选择所有工具 > 扫描和 OCR > 在本文件中。
“识别文本”选项显示在弹出对话框中。
在弹出对话框中,选择文本识别的页面范围和语言。
(可选)选择“设置”
可打开“识别文本”对话框,然后根据需要指定选项。选择识别文本。 Acrobat 会在您的 PDF 中创建一个可进行搜索或者可复制并粘贴到新文档中的文本图层。
选择所有工具 > 扫描和 OCR > 在多个文件中。
在识别文本对话框中,选择添加文件,然后选择添加文件、添加文件夹或添加打开的文件。 接着,选择相应的文件或文件夹。 此时将显示输出选项对话框。
在“输出选项”对话框中,指定输出文件的目标文件夹以及文件名首选项。 选择确定。
在识别文本 - 一般设置对话框中,指定选项,然后选择确定。
Acrobat 会在您的 PDF 中创建一个可进行搜索或者可复制并粘贴到新文档中的文本图层。
文档语言
为 OCR 引擎指定用于识别字符的语言。
输出(PDF 输出样式)
确定要生成的 PDF 的类型。 所有选项都需要 72 dpi 或更高(建议)的输入分辨率。 所有的格式应用 OCR 和字体和页面识别于文本图像并将其转换为正常文本。
可搜索的图像
确保文本是可搜索和可选择的。 此选项将保留原始图像,根据需要对其进行扭曲校正,并在其上放置一个不可见的文本图层。在同一对话框中选择“对图像缩减像素采样”可确定是否对图像缩减像素采样以及缩减的程度。
可搜索的图像(精确)
确保文本是可搜索和可选择的。 此选项将保留原始图像,并在其上放置一个不可见的文本图层。建议用于要求原始图像最大保真度的情况。
可编辑的文本和图像
合成一个与原始字体非常接近的新的自定义字体,并使用低分辨率副本保留页面背景。
缩减像素采样至
在 OCR 完成后减少彩色、灰度和单色图像的像素数。 选择要应用的缩减像素采样的程度。 更高的选项使用较少的缩减像素采样,产生更高分辨率的 PDF。
在扫描输出中运行 OCR 时,Acrobat 会对文本位图进行分析,并使用单词和字符替代这些位图区域。 如果不确定最佳替代,Acrobat 会将其标记为可疑元素。 可疑元素在 PDF 中显示为单词的原始位图,但是文本包含在单词位图后的不可见图层中。 采用这种方法,即使单词显示为位图,也可以搜索。
注意:如果您尝试在未应用 OCR 的扫描 PDF 中选择文本,或者尝试在图像文件中执行朗读操作,Acrobat 会询问您是否要运行 OCR。 如果选择“确定”,将会打开文本识别对话框,您可以在其中选择相关选项,这些选项在上一个主题中有详细说明。
选择所有工具 > 扫描和 OCR > 更正识别的文本。
Acrobat 会识别可疑的文本错误,并在弹出对话框中显示图像和文本。页面中所有可疑单词都会框出。
选择文档中突出显示的对象或框,然后在弹出对话框的识别为框中更正该内容。选择接受。
这将会突出显示下一个可疑错误。 根据需要,更正错误。 每次更正后,选择接受。
任务完成后,选择关闭。