众力资讯网

Datalab-to团队宣布推出Surya OCR 2:这是一个650M参数的文

Datalab-to团队宣布推出Surya OCR 2:这是一个650M参数的文档OCR模型,在olmOCR基准上取得83.3%成绩(3B参数以下顶级),内部91语言基准达87%;在RTX 5090上处理速度达5页/秒,支持CPU、GPU、MPS等多种硬件。用户只需pip install surya-ocr即可快速上手,通过简单命令处理PDF等文件,后端依赖llama.cpp(CPU)或Docker(GPU)。