PDF 转 Word

上传 PDF,自动识别电子版/扫描版,转换后下载 Word 文档

选择文件

或上传多个 PDF(批量转换将打包为 zip,zip 内为 Word 文档 .docx,解压后用 Word 打开)

选择文件夹后,将对该文件夹内全部 PDF 转换并打包为一个 zip,下载解压即得到一文件夹的 .docx

选项

仅扫描版使用 Paddle 可用

仅移除约 20×20 像素以下的极小图(多为 OCR 噪点),一般不会影响正文与正常插图;若有极小图标需保留可取消勾选。

勾选后,单文件转换时会生成「文本块/图片块」顺序与 PDF 的差异报告,在下方转换状态中查看;不勾选则不进行比对。不影响 Word 文件内容。

仅当已勾选「图文顺序比对」且为单文件时有效。会生成「原名_adjusted.docx」供下载,不覆盖原 Word 文件。

说明:本功能只调整图片在文档流中的先后顺序(谁先谁后),不改变图片在页面上的位置、版式。若出现「图片覆盖在文字上」「位置乱」等,主要来自转换环节的版式还原,需在 Word 中手动拖拽或调整版式,或从转换参数/引擎上优化。

转化选项建议(减少缺图与失真)
  • 嵌入对象/图片:保留并嵌入,不将图形当文字 OCR
  • 版式:尽量保留表格、多栏、图与文的相对位置
  • 扫描件:保留图片,OCR 主要针对正文;符号表、几何图、公式区域易失真,可优先按图片保留
  • 公式:尽量保留为公式或整段转成一张图嵌入
  • 版式:希望无损保持图文相对位置时,转换后请自检是否有错位或重叠,复杂版式可在 Word 中微调(见 docs/转化规范与自检.md)