中国构建全球最大卫星图像数据库
中国发布了包含100多万个目标详细信息的卫星图像数据集,用以帮助减少人工智能从太空识别物体时犯错误。
中国科学院表示,遥感图像细粒度目标识别数据集(FAIRIM)比其他国家使用的类似数据集要大几十倍甚至上百倍。
中国科学院空天信息创新研究院FAIRIM项目首席科学家付琨教授说,人工智能卫星图像识别训练中数据库相对较小影响了实际应用的准确性。
近年来,人工智能技术的迅速发展使平民能够从商业卫星图像中获取有价值的信息。
例如,清点一座城市乃至一个国家公路上的货车数量就能了解其经济活动、交通运输和基础设施。
中国的一些研究人员利用这项技术追踪新疆的城市扩张速度、青藏高原的野生动物行踪以及“一带一路”倡议下的全球基础设施建设。
然而,现有的人工智能算法有时难以识别卫星图像中的物体。大多数民用工具都是使用日常生活中拍摄的照片进行训练的,但比如说,游客拍摄的埃菲尔铁塔照片与卫星从300公里高空拍摄的照片有着天壤之别。
训练用的数据库越大,人工智能就会变得越聪明。但是,由于卫星图像,尤其是高清图像的数量相对有限,有时还相当昂贵,民用人工智能的准确度一直很低。
在中国国家自然科学基金的资助下,借助全新的“高分”观测卫星,付琨和同事们构建了一个包含超过1.5万幅图像、覆盖100万个带标注“场景”的高清卫星图像数据集。法国的VEDAI数据库只覆盖约3600个场景。
中科院网站宣布,中国的整个数据集将于6月向国际社会开放。总部设在德国的国际摄影测量与遥感协会已将它作为评估物体识别算法好坏的标准数据集。
中国的这个新数据库可以教人工智能识别飞机的准确型号,比如波音777。
此前中国人工智能图像识别技术的发展主要依靠其他国家的数据库。现在,中国拥有了世界上两个最大的卫星图像数据集,在该领域取得或保持领先地位的概率更大了。
过去,收集卫星图像的大多是西方国家。近来,中国搭建了全球最大的地球观测网络之一,其“高分”系列等卫星搭载了尖端摄像头和传感器。