Doc2X
论文里的公式表格,一键转可编辑
支持Word、LaTeX、Markdown等格式,自带多模型双语翻译,API日吞吐量千万页以上

核心功能
公式精准识别
不管是印刷体还是手写体公式,都能精准转为LaTeX,直接复制进Word或Markdown,不乱码不崩坏
版面条理识别
自动识别多栏排版、段落、标题、图片层级关系,转出来的Word不会像WPS那样从左栏跑到右栏
多模型翻译
接入GPT、Deepseek、GLM、Qwen、Yi-Lightning等模型,支持双语对照和一键跳转原文
批量处理与API
提供高速API接口,已累计处理数亿页文档,日吞吐量千万页以上,可集成至既有流程
多种输出格式
支持导出Word、LaTeX、HTML、Markdown、JSON,图片识别可转为Txt或结构化数据
图片式文档识别
无论是扫描件还是截图,拍照的笔记也能识别公式和排版,将图像内容一比一提取成文本
产品特色
- 01
公式识别的功底真的很硬
跟Mathpix比起来不相上下,有些内联公式和复杂矩阵甚至能压一头,手写数学笔记也能转成LaTeX,这在市面上不太多见
- 02
成本比想象的低
有研究者算过账,相比同类方案成本能降100倍左右。每天签到送解析额度,轻度使用者几乎等于免费
- 03
不只是PDF,图片也能搞定
文档图片、扫描件、截图、随手拍的笔记照片,都能精准识别出公式和表格,转换成可直接编辑的文档
- 04
有多家大牌机构在背后实际使用
华中科技大学课题组反馈数据整理时间缩短一半,清华北大也接入使用,已经有实际业务场景验证过能力
- 05
中文开发者团队,响应速度快
团队在武汉,能用母语沟通。遇到奇怪的多栏排版或特殊符号问题直接反馈就行,迭代比国际竞品要快不少
应用场景
✅ 学术论文整理
把PDF论文的公式、表格提取成LaTeX或Word格式,直接拿来写自己的论文,不用手动重新敲一遍公式
✅ 教师建题库
将教辅材料、教材习题中的内容数字化,制作电子课件和在线题库,尤其适合数学、物理这类公式密集的学科
✅ 企业知识库
把财报、国家标准PDF中的表格数据提取成结构化文本,用于知识库建设和数据统计,无需人工转录
✅ 出版社转档
将旧版书籍、古籍的扫描件转为可编辑的Word或Markdown,用于再版或数字出版
✅ 大模型语料准备
用API批量清洗和处理PDF文档,把非结构化数据变成训练语料,数据格式统一后再喂给模型
常见问题
解答您关于"Doc2X"的常见疑问,让您更好地使用这款AI工具
-
每天有一定额度的免费解析页数,具体额度随活动调整,足够个人日常使用。签到还能叠加,重度使用者再考虑付费
-
尝鲜4.9元/500页+100张图,Pro月费9.9元/1000页+250张图,年费98.9元。还有小额积分包3元2000积分
-
公开报价0.02元/页,单次调用费用很低,适合有批量文档处理需求的机构或开发者
-
处理多栏、复杂表格、矩阵公式时基本没问题。用户群反馈多数场景下识别准确率与竞品相当,在某些细节上还稍好一些
-
支持。大模型翻译准确度较高,还能做双语对照并实现双向跳转,对阅读外文文献的人来说很友好
-
目前不提供私有化本地部署,全部通过云端服务调用。API方式已经把大部分需求覆盖了,个人用户在线用也很方便
立即体验 Doc2X
Doc2X由武汉智识无垠科技推出,主打高精度PDF文档识别与转换。无论是学术论文里的复杂矩阵公式、企业财报里的合并表格,还是教辅资料中的多栏排版,Doc2X都能精准还原为Word、LaTeX、Markdown等可编辑格式。内置GPT、Deepseek、GLM等多模型双语对照翻译,支持API批量处理和每日签到免费额度。目前包括清华、北大在内的多所高校和机构都在使用。