哈佛和史密森尼天体物理中心的一组天文学家,正在用人工智能对超新星爆炸进行分类,而不使用传统的光谱。得出的完整的数据集和分类结果分类是公开的,可以公开使用。
通过训练机器学习模型根据可见特征对超新星进行分类,天文学家无需使用光谱就可以对Pan-STARRS1中深层调查的2315个超新星的真实数据进行分类,准确率可以达到82%。
天文学家开发了一个软件程序,该程序根据其光曲线或亮度随时间的变化对不同类型的超新星进行分类。
CfA的博士后研究员,第一篇论文的主要作者格里芬·侯赛因扎德(Griffin Hosseinzadeh)说:“我们有大约2500个带有Pan-STARRS1中型深层探测的光曲线的超新星,其中有500个具有可用于分类的光谱的超新星。”发表在“天体物理学期刊”上的两篇论文。“我们使用这500颗超新星训练了分类器,以对我们无法观察光谱的其余超新星进行分类。”
CfA的天文学家Edo Berger解释说,通过要求人工智能回答特定问题,结果变得越来越准确。“机器学习正在寻找与原始500个光谱学标记的相关性。我们要求它比较不同类别的超新星:颜色,进化速率或亮度。通过向其提供真实的现有知识,可以得出最高的准确度, 80%。”
尽管这不是第一个用于超新星分类的机器学习项目,但这是天文学家第一次访问足够大的真实数据集,以训练基于人工智能的超新星分类器,这使得创建无需使用模拟。
Hosseinzadeh说:“如果创建模拟的光曲线,则意味着您正在假设超新星的外观,然后您的分类器也会学习这些假设。” “自然总是会带来一些其他复杂的问题,因为您没有考虑到这些问题,这意味着分类器在真实数据上的表现不如在模拟数据上好。因为我们使用真实数据来训练分类器,这意味着我们测得的准确性可能更能代表我们的分类器在其他调查中的表现。” Berger说,当分类器对超新星进行分类时,“我们将能够回顾和实时研究它们,以找出最有趣的事件以进行详细的跟进。我们将使用该算法来帮助我们找出针头还要看大海捞针。”
该项目不仅对档案数据有影响,而且对将来的望远镜将收集的数据也有影响。维拉·鲁宾天文台预计将于2023年上线,并将每年发现数百万颗新超新星。对于天体物理学家而言,这既带来了机遇,也带来了挑战,因为有限的望远镜时间导致有限的光谱分类。
哥伦比亚大学西蒙斯初级研究员阿什利·比利亚尔(Ashley Villar)说:“当鲁宾天文台上线时,它将使我们的超新星发现率增加100倍,但是我们的光谱资源不会增加。”并补充说,虽然目前每年发现约10,000颗超新星,但科学家只能拍摄到这些物体的10%的光谱。“如果这是真的,那就意味着鲁宾天文台每年仅发现0.1%的超新星将获得光谱标签。如果没有像我们这样的方法,其余99.9%超新星的数据将无法使用。”
与过去所做的努力不同,过去的工作中仅有限数量的天文学家可以获得数据集和分类,而来自新机器学习算法的数据集将公开提供。天文学家已经创建了易于使用的可访问软件,还发布了Pan-STARRS1中层深度调查的所有数据以及用于其他项目的新分类。Hosseinzadeh说:“对我们而言,这些项目对整个超新星社区有用,而不仅仅是对我们的团队非常重要。可以利用这些数据完成许多项目,我们永远无法自己完成。” 伯杰补充说:“这些项目是开放科学的开放数据。”
该项目部分由国家科学基金会(NSF)和哈佛数据科学计划(HDSI)资助。