PaddleOCR 超越 Tesseract,成为 GitHub 星标最高的 OCR 项目

PaddleOCR

百度旗下的 PaddleOCR 已超过 Tesseract,成为 GitHub 上星标数最高的 OCR 开源项目。截至 2026 年 3 月,该项目已获得超过 6 万个 star。

从 OCR 工具到文档 AI 引擎

PaddleOCR 最初定位为轻量级 OCR 工具包,经过数年迭代,目前已扩展为面向生产环境的文档 AI 引擎。3.0 版本引入了多项重大接口更新,功能覆盖从基础文字识别到复杂文档结构化解析。

在模型层面,PaddleOCR 近期推出了 PaddleOCR-VL-1.5,这是一个仅 0.9B 参数的多模态模型,支持 111 种语言,在文档解析和文字检测任务上表现领先。项目还提供了 PP-ChatOCRv4,原生集成 ERNIE 4.5 实现智能信息提取。

生态系统

PaddleOCR 已被 MinerU、RAGFlow、cherry-studio 等多个知名开源项目深度集成,覆盖从 PDF 解析到 RAG 应用的工作流。官方还提供了 MCP Server,可直接接入 Claude Desktop 等 Agent 应用。

在工具链方面,PaddleOCR 3.0 提供了从模型训练、推理到服务部署的全套工具,降低了开发者将 OCR 能力落地到生产环境的门槛。项目官方网站也已上线 Beta 版,提供在线体验、大规模 PDF 解析和免费 API 服务。

Tesseract 的交接

Tesseract 的历史可以追溯到 1985 年惠普实验室,2005 年开源后由 Google 接手维护至 2017 年。作为 OCR 领域最知名的开源项目,Tesseract 长期占据该领域 GitHub star 榜首。

PaddleOCR 的超越,某种程度上反映了中国 AI 开源工具在全球开发者社区中的渗透速度。从框架(PaddlePaddle)到应用层工具(PaddleOCR),国内项目的社区影响力正在逐步兑现。

相关推荐