分享一则好消息: 文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,首次超越谷歌旗下开源OCR标杆产品Tesseract OCR(73.2K),成为全球Star数最高的OCR项目🌟。 🥸Tesseract OCR是资深的老前辈: 诞生于1985年,最初由惠普实验室研发,2005年开源后由Google接手维护并持续迭代,是OCR领域延续近四十年的技术标杆,长期位居GitHub OCR项目Star数榜首。 🤓PaddleOCR则是快速崛起的新星: ● 基于文心大模型训练而来,支持超100种语言识别,用户覆盖160个国家和地区,是文心大模型多模态能力的重要组成部分。 ● 2024年起,在GitHub上的Star爆发式增长,如今成为中国开源项目首次在OCR领域超越谷歌主导的标杆产品。 ● 1月29日发布的最新版PaddleOCR-VL-1.5,在 OmniDocBench V1.5 榜单中取得了全球SOTA成绩。 与此同时,还有两则好消息: 1. 🫶🏻PaddleOCR同步升级服务能力: 官网免费每日解析页数由1万提升至2万,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取高精度PDF解析能力。 2. 🤝PaddleOCR OCEAN生态联盟正式成立: 面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,将共同推动OCR技术在更广泛场景中的应用落地。

