PaddleOCR 超越 Tesseract,成为 GitHub 星标最高的 OCR 项目

百度旗下的 PaddleOCR 已超过 Tesseract,成为 GitHub 上星标数最高的 OCR 开源项目。截至 2026 年 3 月,该项目已获得超过 6 万个 star。
从 OCR 工具到文档 AI 引擎
PaddleOCR 最初定位为轻量级 OCR 工具包,经过数年迭代,目前已扩展为面向生产环境的文档 AI 引擎。3.0 版本引入了多项重大接口更新,功能覆盖从基础文字识别到复杂文档结构化解析。
在模型层面,PaddleOCR 近期推出了 PaddleOCR-VL-1.5,这是一个仅 0.9B 参数的多模态模型,支持 111 种语言,在文档解析和文字检测任务上表现领先。项目还提供了 PP-ChatOCRv4,原生集成 ERNIE 4.5 实现智能信息提取。
生态系统
PaddleOCR 已被 MinerU、RAGFlow、cherry-studio 等多个知名开源项目深度集成,覆盖从 PDF 解析到 RAG 应用的工作流。官方还提供了 MCP Server,可直接接入 Claude Desktop 等 Agent 应用。
在工具链方面,PaddleOCR 3.0 提供了从模型训练、推理到服务部署的全套工具,降低了开发者将 OCR 能力落地到生产环境的门槛。项目官方网站也已上线 Beta 版,提供在线体验、大规模 PDF 解析和免费 API 服务。
Tesseract 的交接
Tesseract 的历史可以追溯到 1985 年惠普实验室,2005 年开源后由 Google 接手维护至 2017 年。作为 OCR 领域最知名的开源项目,Tesseract 长期占据该领域 GitHub star 榜首。
PaddleOCR 的超越,某种程度上反映了中国 AI 开源工具在全球开发者社区中的渗透速度。从框架(PaddlePaddle)到应用层工具(PaddleOCR),国内项目的社区影响力正在逐步兑现。
- 鸿海 Q4 利润不及预期,给 AI 硬件热泼了一盆冷水3/16/2026
- 据路透:华虹旗下华力微电子拟量产 7 纳米,华虹或成中国第二家 7nm 代工厂3/16/2026
- OpenAI 发布 GPT-5.4 mini 与 nano:小模型加速冲刺3/17/2026
- 《华盛顿邮报》把 AI 用到订阅定价上,媒体的个性化收费又往前走了一步3/17/2026
- 据报道,微软搁置 Windows 11 多项 Copilot 系统级整合计划3/16/2026
- ChatGPT App 的模型切换入口,突然变得很难找3/17/2026
- Google 把 Stitch 升级成 AI 原生设计画布3/19/2026
- Firefox 149 内置免费 VPN:50GB 月流量,首批限四国3/19/2026
- iOS 26.4 RC 发布:Apple Music 有 AI 歌单,Podcasts 支持视频3/18/2026
- 椰树集团相关公司招标 50 台人形机器人剥椰子,产线开始提具体指标了3/19/2026
- Google AI Studio 升级全栈 vibe coding:Antigravity 代理来了3/20/2026
- 中国加大对 Meta 收购 Manus 审查:高管限制离境,审查升至国家层面3/18/2026
- 欧盟推去衣AI禁令:3月26日表决,执法难在哪3/19/2026
- 营收涨三倍,宇树科技冲刺科创板3/20/2026
- Claude Code 上线 Channels:用 Telegram 和 Discord 操控本地编程任务3/20/2026
- Anthropic 超 8 万用户调研:81% 认为 AI 正兑现预期3/19/2026
- 小米推理模型 MiMo-V2-Pro 上线:智能指数 49,榜单排第 103/18/2026
- OpenAI 收购 Astral:Python 工具链收编加速3/19/2026
- 小米三款大模型齐发:MiMo-V2-Pro、Omni、TTS 完整解读3/19/2026
- 谷歌 Gemini Mac 版内测:桌面端补课正式开始3/20/2026
- 多地试点一人公司:免费公寓+办公空间,能否激活个体创新?3/19/2026
- MiniMax 发布 M2.7:国内首个公开的模型自我进化方案3/18/2026
- Kimi 员工指称 MiniMax 沿用其 Office Skill 代码始末3/19/2026
- DLSS 5 引发的争议:老黄说批评者完全错误3/19/2026
- 通义开源影视级配音大模型 Fun-CineForge,关键变化是把“时间”也做进了模型3/16/2026
- 英伟达把 DLSS 5 说清楚了:输入只有 2D 帧和运动矢量3/21/2026
- Google 测试改写搜索结果网页标题,网站对标题的控制权又退了一步3/20/2026
- Hugging Face 最大开源仓库快被 AI 垃圾 PR 淹没了3/19/2026
- GrapheneOS 警告起诉:安卓统一认证标准背后的生态之争3/18/2026
- 短视频内容标注,准备进入统一规则阶段3/21/2026