为什么有些 PDF 不支持搜索?
2 种 PDF 类型
原来,PDF 分为 2 种类型:
- 文字格式的 PDF
- 图片格式的 PDF
通常,通过 Wrod 转化为的 PDF,机打字体,都为文字格式的 PDF。这种 PDF,可以直接复制其中的内容,也可以直接搜索。
还有一种 PDF,是通过扫描仪扫描或者相机拍照,由图片合并成的 PDF,这种图片格式的 PDF 是不能直接进行搜索的。怎么办呢?
学会使用 Adobe
大多数检察院的案卷之所以能够直接搜索,是因为他们做了整卷的 OCR(文字识别)。
所以,我们的解决方案就是对这类图片格式的 PDF,做一个整卷的 OCR(文字识别)。
用到的工具是 Adobe,这是最好的选择。