将复杂PDF文档中的公式轻松转换为Markdown格式，只需OCR和GPT-4！

admin · 发表于 2024-8-6 04:06:37

## PDF OCR 转换工具
这是一个使用AI模型将PDF文件转换为Markdown格式的工具。它可以识别PDF中的文本和公式，并将其转换为Markdown和LaTeX格式。
**功能:**
* 将PDF转换为图像
* 使用OCR识别图像中的文本和公式
* 将识别结果转换为Markdown和LaTeX
* 支持批量处理多个PDF
* 提供图形界面选择输入和输出文件夹
**安装依赖:**
```
pip install asyncio aiohttp PyMuPDF tkinter
```
**配置:**
* `API_BASE_URL`: OpenAI API基础URL
* `api_key`: 你的OpenAI API密钥
* `MODEL`: 使用的OpenAI模型名称（例如："gpt-4"）
**使用方法:**
1. 运行程序: `python script_name.py`
2. 选择包含PDF文件的输入文件夹
3. 选择保存转换结果的输出文件夹
4. 程序将开始处理PDF并显示进度
**注意事项:**
* 使用异步处理提高效率，可以同时处理多个页面
* 处理过程中出现错误，程序会自动重试
* 输出文件将以原PDF文件名保存为.md格式
* 如果输出文件已存在，程序将跳过处理
**限制:**
* 依赖于OpenAI的API，请确保你有足够的API使用额度
* OCR识别的准确性取决于PDF的质量和模型性能
* 处理大型PDF文件可能需要较长时间
**效果:**
效果取决于你使用的模型。GPT-4效果最好，Gemini 1.5pro次之。其他模型可以尝试一下。

		自动登录	找回密码
密码			立即注册