[环球网科技综合报道]11月16日消息,据科技媒体golem报道,谷歌AIStudio平台测试的一款未命名AI模型,在破译难辨认历史手稿领域取得重大突破,核心字符错误率仅0.56%,性能已接近人类专业研究者水平。

历史学家MarkHumphries通过专门开发的基准数据集,对该模型展开系统性测试。在处理五份18至19世纪的高难度历史手稿时,模型整体字符错误率约为1.7%,且多数错误集中在标点符号和大小写规范上,未涉及单词本身的识别偏差。若剔除这类非核心错误,模型字符错误率将降至0.56%,相当于每转写200个字符仅出现1处失误,其准确度已能与专注历史文献转写的专业工作者相媲美。
此次测试的手稿涵盖多种手写风格,不乏字迹潦草、拼写不规范、语法不一致等复杂样本,充分验证了模型的适应能力。更值得关注的是,该模型超越了单纯的文字转写功能,展现出较强的推理能力。在处理一份18世纪商人日记时,面对未标注计量单位的购糖记录“145”,模型通过反向核算账本总价,结合当时英国货币与重量单位的对应关系,成功推断出“14磅5盎司”的准确含义。
不过,Humphries也指出当前评估存在局限性。由于该模型以A/B测试形式零星亮相,大规模系统性测试难以开展,目前仅完成基准数据集中约10%样本的评估工作。(纯钧)