众力资讯网

研究显示,人工智能可以极大加快自然历史藏品的数字化

北卡罗来纳大学教堂山分校的研究人员的一项新研究表明,先进的人工智能工具,特别是大型语言模型(LLM),能够准确确定植物标

北卡罗来纳大学教堂山分校的研究人员的一项新研究表明,先进的人工智能工具,特别是大型语言模型(LLM),能够准确确定植物标本最初采集的位置,这一过程称为地理定位。

这项工作历来缓慢、昂贵且依赖大量人工劳动。团队发现,LLMs能够以接近人类的准确度完成这项工作,同时速度更快且更具成本效益。

“我们的研究探讨了大型语言模型如何应对植物收藏数字化中最大的瓶颈之一,”北卡大学生物学系第一作者兼博士后研究员谢宇阳说。“我们正在开创利用这些工具进行地理定位,这将加速植物标本的数字化进程,并开启生态研究的新可能。”

该研究旨在回答一个核心问题:人工智能能否自动化数字化自然历史藏品中最耗时的步骤之一?卡罗莱纳队发现,是的,它能做到。LLM不仅能以不到10公里的误差范围进行地理定位,优于传统方法,而且完成任务的时间和成本都极低。

“大型语言模型的最新进展有望改变地理定位过程,使其更快更准确,”北卡大学生物学系通讯作者兼助理教授肖峰表示。“这为研究人员提供了前所未有的机会,推进我们对全球生物多样性分布的理解。”

其影响深远。全球估计有20至30亿份标本,但数字化的只有一小部分。没有数字记录和空间数据,研究人员在追踪生物多样性丧失、理解气候变化下物种迁移和分析生态系统变化方面面临重大局限。通过部署AI驱动的地理定位技术,科学家们很快有望快速数字化那些长期难以访问的庞大自然历史藏品。

“这项技术让我们能够解锁目前存放在柜子里的数百万条记录,”谢说。“借助大型语言模型的力量,我们可以快速数字化植物标本数据,这些数据将对应对全球环境挑战至关重要。”

传统的地理定位方法依赖于人工解读、专业软件或多轮专家评审。UNC的研究是最早将LLM应用于该任务的项目之一,并证明它们在准确性、效率和可扩展性方面能够超越现有方法。这一新方法为数字化自然历史藏品打开了前所未有的大门。

勇编撰自论文"Using large language models to address the bottleneck of georeferencing natural history collections".Nature Plants.2025相关信息,文中配图若未特别标注出处,均来源于自绘或公开图库。