开始新的任务
配置多种OCR 引擎与 AI 翻译模型。上传文档后,Paper Burner X将给您流畅的阅读与处理体验。
OCR 文档解析
翻译与分析
若列表为空,请先点击上方“检测可用模型”。
默认模板会在占位符位置插入当前使用的 API Key,例如 https://api.deeplx.org/<api-key>/translate。如需自建代理,可在此输入自定义地址。
若列表为空,请先点击上方“检测可用模型”。
若列表为空,请先点击上方“检测可用模型”。
若列表为空,请手动输入或在设置中选择。
支持维护多套术语库,命中时自动注入翻译提示,帮助保持术语一致性。可按项目导入导出,灵活协同。
高级设置
性能与流程
同时处理的文件数量。默认 1。
同时进行的翻译 API 调用数量。默认 15。
长文档翻译时,按此限制分段。默认 2000。
翻译提示词管理
选择翻译提示词的使用方式。提示词池提供多样表达且保持风格一致。
可用占位符:${targetLangName}, ${content}
参考提示词 (AI生成基础)
必须包含 ${targetLangName} 和 ${content} 占位符
最多 10;总生成量 = 生成数量 × 并发数
用于替换生成器提示词中的 ${genlanguage}
自动使用已配置的API密钥
暂无提示词
请先填写参考提示词,然后点击"AI生成变体"
文件上传
点击或拖拽文件到此处
支持 PDF, Markdown, Word, PowerPoint, HTML, EPUB 等常见文档格式
可用变量:{original_name}、{original_type}、{output_language}、{processing_time} (支持 {processing_time:YYYYMMDD-HHmmss} 等格式)。
处理进度
处理完成
所有任务已完成
您可以下载包含所有结果的 ZIP 文件,或在历史记录中查看详情。
注意:AI 模型翻译结果仅供参考,最终内容请以原文为准
历史记录
查看和管理您处理过的文档
清空历史记录
清除操作不可恢复,请谨慎确认
即将永久删除所有历史记录(包括所有批次、译文、文件夹分配)。请确认是否继续。
请在下方输入 确定删除 以确认操作。
必须准确输入 “确定删除” 才能继续。
最终确认:
历史记录一旦清空,将无法恢复。请确保已备份需要的数据。
选择模型
未找到匹配的模型
模型与密钥配置
集中管理所有 AI 服务的连接信息
关于 Paper Burner X
这是一款开源的、在浏览器中即开即用的 AI 工作站,专为扫除海量的 PDF 文献、复杂的公式和跨语言的障碍。
它为需要进行精细、长文本阅读的研究人员和深度学习者设计,致力于将复杂的文档处理、翻译和分析流程整合到单一、流畅的体验中。
GitHub: github.com/Feather-2/paper-burner
在线体验: paperburner.viwoplus.site
目前实现了:
前端 Agent 驱动的智能检索
我们在前端实现了一个 Agentic RAG 系统。通过赋予 AI 全局的文章结构和一系列工具(如 grep, vector search, fetch等等),AI 能够自主决策、多步推理,并在长文本中实现复杂的分析和信息提取任务。
高性能批量处理
支持多种文档格式(PDF/DOCX/EPUB 等)和代码库的直接导入。利用并发 OCR 和翻译,并结合术语库(支持数万词条快速匹配),显著提升了文献处理效率。
高可扩展性与本地化
目前所有数据均在浏览器本地,支持用户接入自定义 AI 模型端点,并提供了配套的 OCR Server 和 Docker 部署选项(开发中),让用户未来可以实现完全离线的本地化使用。
希望这个工具能成为研究人员和知识工作者的得力助手,欢迎试用和提出宝贵意见!
具体介绍
一体化的文档处理引擎
- 广泛的格式支持:能够处理 PDF、DOCX、PPTX、EPUB、Markdown 甚至代码注释等多种格式,并支持导出为 DOCX、MD 等常用格式。
- 智能导入与处理:不仅支持本地文件上传,更可一键从 GitHub 仓库或任意 URL 导入内容,自动完成解析。PDF可以使用OCR (支持mineru/doc2x等) 与翻译引擎,并实现保留原文格式翻译功能(基于mineru,目前优化中,并会支持更多模型)。
- 术语备择库:进行了性能优化,支持一次性导入数万条术语并进行快速匹配。
- 支持自定义模型端点,可以支持检测、多key、快捷导出等机制,使用灵活。
为深度阅读优化的交互体验
- 沉浸式对照阅读:提供智能对齐的段落级原译文对照、文档结构目录(TOC)、高亮与标注功能,先进行无障碍的阅读,再进行AI总结。
- 增强学术内容展示:针对学术场景,特别优化了复杂公式的渲染。
- 结构化信息提取:内置了"文献矩阵"等实用工具,能够将非结构化的论文内容,智能提取为清晰的结构化数据,方便进行横向对比和分析。
不止于问答:前端 Agent 驱动的智能分析
我们在纯前端环境中,实现了一个长文本Agent。少量文本下,将使用全量的策略;而当提供长文本时候,使用长文本Agent。
- 赋予 AI 全局视野:我们为 AI 构建了"分层意群/地图",让它在处理长文本时拥有对全文结构的整体认知。
- 为 AI 配备工具箱:我们给予 AI 一系列工具,如精确匹配的 grep、向量搜索 vector search、内容抓取 fetch 等。AI 会根据你的问题,自主分析并决定调用哪种工具组合来寻找最佳答案。
- 上述皆在纯前端实现,浏览器打开即用
项目正在活跃地迭代
- 完全本地化部署:正在开发Docker 部署方案,还提供了可自托管的 OCR Server,最终目标是让用户可以完全在离线环境中使用全部功能。
- 从单文档到多文档:下一个里程碑是将能力从分析单篇文献,扩展到处理多篇文献,并基于此开发能自动生成文献综述的综述 Agent,成为真正的 AI 研究助理。
基于 AGPL 3.0 开源
本项目基于 baoyudu/paper-burner(该项目是基于mistral ocr的pdf极简翻译工具),并已在原始项目上进行了重构和各方面极多内容的扩充。为避免和Paper Burner原项目名称产生重复,为示尊重和区分,该分支项目改名Paper Burner X。
探索本分支的更多细节或贡献您的智慧:
您的每一个建议对我们都至关重要!欢迎前往新分支的 Issue 区 分享您的想法或参与讨论。
致敬 Paper Burner 开源项目,Paper Burner X 在社区基础上持续扩展与迭代。