iNaturalist:借助普通人拍摄的照片准确识别物种

下一篇文章

代码伦理的未来才是人工智能的未来

有朝一日,我们将拥有一款应用,只要你指向奇特的虫子或是陌生的蕨类植物,该应用就能告诉你它们属于什么物种。但是, 计算机视觉系统 现在并不能胜任这项工作。为了帮助解决这些问题,研究人员已经汇集了成千上万张普通人在真实环境下拍摄的生物照片——通过研究这些照片,我们的人工智能助手就能深入了解生物多样性。

许多计算机视觉算法基于某个拥有大量图像的数据库进行了培训,这些图像可能包含从人到家用物品再到水果和蔬菜等各种各样的东西。这是粗略了解许多东西的绝佳办法,但如果你想深入研究特定主题或图像类型,此时又该怎么办呢?你就需要大量有关此类图像的数据。

对于某些物种来说,我们已经有了这样的技术:例如,FaceNet 便是学习如何识别或复制面部的标准设置。但是,尽管电脑在识别面部时可能会存在问题,但我们很少这么做,而另一方面,我永远不会记住某个春天落在喂食器上的鸟的名字。

幸运的是,我并不是唯一遭遇这种困惑的人,多年来,iNaturalist 应用社区一直在收集常见和罕见动物的图片进行身份识别。事实证明,这些图像其实就是教会系统如何识别野生动植物的完美方法。

你或许认为,我们可以从电脑上获取生物学教科书、野外指南和《国家地理》杂志上记载的一切知识。但是,当我们拍摄海狮的照片时,它看起来与专业摄影截然不同:背景不同,角度也不完美,对焦可能还关闭了,照片中甚至可能还会出现其他动物。即便是精确的计算机视觉算法,可能在两者之间也看不到太多共同之处。

你能分辨出它们之间的不同之处吗?

虽然通过 iNaturalist 应用拍摄的照片都属于业余类型,但它们都得到专业人士的验证和识别,而这些专业人员的表现要远远超过任何一台计算机,因此,即使在被遮挡、光线不好或周围模糊的情况下,该应用也能准确识别物种。

iNaturalist 应用的数据库中存有超过 160 万张照片,加州理工学院、谷歌、康奈尔大学和 iNaturalist 的研究人员从中挑选出一定数量的精选照片。研究人员认为,若想让这些照片保持稳健的表现,就应该有很多不同的角度和情况,所以他们搜索了一些动植物种类,这些种类至少是由 20 个不同的人发现的。研究人员本周在犹他州盐湖城举行的 计算机视觉和模式识别(CVPR) 大会上介绍了这款应用。

即便是 精选图片集(PDF),它们的数量仍然超过 85.9 万张,涉及 5000 多个类别。在这些图像上,研究人员让人们在图像中的小动物周围绘制小框进行标注,这样计算机就能知道要注意哪些东西。一组图像专门用于训练系统,另一组则用于测试系统。

图像上的边界框示例

颇具讽刺意味的是,这些系统在物体识别方面表现得相当突出,因为现有图像识别引擎在这方面的表现非常差劲,初次推测的准确率甚至没有达到 70%。这种使图像本身看起来非常业余且难以分析的特性,反而让它们作为原始数据显得颇具价值;这些图像没有经过处理或设置,让算法更容易进行筛选。

即使是研究人员用 iNat2017 创建的系统,表现也没有这么好。但这并不是太大问题——找到可以改进的空间,是确定问题的一部分。

与其他数据子集一样,iNat2017 应用精选图像数据库正在扩大。研究人员指出,自从他们开始编写这个数据集以来,经由 20 个独立观测角度汇集的物种数量增加了一多倍。这意味着,已在开发中的 iNat2018 的数据容量会更大,可能会造就更强大的识别系统。

该研究小组表示,他们正努力给该数据集增加更多属性,使得一套系统不仅能提供物种报告,还能识别性别、生命阶段、栖息地和其他元数据。如果它未能确定某个物种是什么,那么它将来至少可以猜测它的属性,或是它较有把握确定的任何分类级别——例如,它可能无法确定某个物种是襟疣海葵还是 黄海葵 ,但它可以认定这种物种是海葵。

这只是改善计算机视觉在自然环境状态下的众多努力之一;点击这里,你可以了解更多与 iNat 数据集有关的数据收集工作和竞争;点击这里,你可以了解到与某个物种类别更相关的其他挑战。

翻译:皓岳

Species-identifying AI gets a boost from images snapped by citizen naturalists