怎么样导出pdf里面的文字 | 您所在的位置:网站首页 › pdf文件怎么导出 › 怎么样导出pdf里面的文字 |
http://www.pdftoword.com/ 网站提供在线转换服务,只需要将待转换的 文档上传到这个网站,网站就会将载转换成的 Word 文档发到你的电子信箱 里。
特别要说明的是,如果是通过扫描纸质文件生成的 文档,转换成 Word 文档以后得到的每一页都是插在 Word 文档里的图片,无法进行编辑。即便是由 Word 等其它可以编辑的电子文档生成的 文档,转换成 Word 文档以后,文字 也是分布在一个个图文框里,如果版面稍复杂一些,文字还有可能重叠在一起, 重新编辑的工作量还很大。
二、怎样从 文档里导出文字
假如 文档是由 Word 等其它可以编辑的电子文档生成的, 用 adobe reader 或 adobe acrobat 的“选择工具”选中文字后按“Ctrl”+“C”键, 就可以将文 字复制到剪贴板里,随便你粘贴到那里。 adobe reader 在安装后的默认状态下, “选择工具”是看不见的, 需要操作菜单“工具”→“自定义工具栏”, 在“选 择工具”前打上钩,将它显现出来。
若要将整篇 文档的文字都导出来, 在 adobe reader 里只要操作菜单“文 件”→“另存为文本”,导出的文字就存到了一个文本文件里了。在 adobe acrobat 里则是操作菜单“文件”→“另存为”,保存类型选择“纯文本”,或 者点击“导出”工具按钮,导出文件类型选择“更多格式”→“纯文本”。
三、使用 OCR 文本识别技术导出文字
如果 文档是通过扫描纸质文件生成的, 就不能够用上述简单的方法导出 文字了,但也可以借助 OCR 文本识别技术来导出文字。
在 adobe acrobat 里可以操作菜单“文档”→“OCR 文本识别”→“使用 OCR 识别文本”,经过识别以后,就可以用“选择工具”选中文字进行复制了。
adobe reader 没有自带 OCR 文本识别功能, 但可以这样操作, 操作菜单“文 件”→“打印”,打印机名称选择“Microsoft Office Docu ment Image Writer”,这是一个随 Microsoft Office 2003 一起安装到计算机里的虚拟打印 机, 它将 文档打印到后缀为“mdi”的文件里, 并自动打开, 在打开的“mdi” 文件里依次操作菜单“工具”→“使用 OCR 识别文本”和“工具”→“将文本 发送到 word”就可以将文字导出到一个 Word 文档里。
OCR 文本识别技术的识别率取决于创建 文档时的扫描精度, 那些字迹模 |
CopyRight 2018-2019 实验室设备网 版权所有 |