一个由IBM和辉瑞公司的人工智能研究人员组成的团队已经开发出了人工智能算法,通过分析人们的书写和发现语言模式,可以潜在地检测出老年痴呆症的迹象。
其他人工智能研究人员已经开发出模型,通过分析PET扫描或解释临床测试数据来预测老年痴呆症的发展。这些其他模型都是根据最近的数据进行训练的,但是IBM-辉瑞团队开发的模型是根据Framingham心脏研究的数据进行训练的,该研究包括来自三代人和六十年的14000多人的数据。数据的长期性很重要,研究人员有可能比当前的诊断技术提前几年预测老年痴呆症的表现。此外,它可能是一种可靠的诊断方法,不需要使用扫描技术或侵入性测试,从而增加了可以使用的场景范围。
据IBM负责医疗保健和生命科学的副总裁Ajay Royyuru称,研究团队开发的人工智能模型可以作为一种工具发挥作用,帮助医疗从业者在临床试验之前获得有关老年痴呆症可能发展的线索。这些模型基本上可以起到预警系统的作用,促使医生进行更广泛的测试。
为了训练人工智能模型,研究小组使用了对各种问题的手写回答的转录本。弗雷明翰心脏研究的参与者被要求用他们的自然语言描述一幅场景的图片。被调查者生成的答案被数字化,并将记录作为训练数据输入到机器学习算法中。根据IBM的说法,这些模型能够捕捉到与神经退行性疾病发展相关的某些语言特征。长期以来,临床医生发现,重复使用单词、拼写错误以及偏好简单短语而非更复杂的句子都可能预示着老年痴呆症发病的可能性,人工智能模型也发现了这些相同的特征。
根据研究结果,主模型在预测最初研究的参与者中,哪一个在85岁时最终患上老年痴呆症的准确率达到了70%。这些模型和结果都是根据原始研究中的历史数据得出的。他们并没有真正预测未来的事件。此外,人工智能模型是在弗雷明翰人口中最古老的一部分中训练出来的。这一人群主要是非西班牙裔白人,因此,对于世界各地的其他种族和其他人群,结果的普遍性存在局限性。这项研究的样本量也相当小,只有40个患痴呆症的人和40个没有痴呆症的人组成。
尽管有这些局限性,该研究还是有价值的,因为它是第一个分析长期收集的大规模真实数据的研究之一。如果研究中遗漏的某些特征被纳入未来的训练数据中,比如笔迹,模型的准确性可能会提高。类似的方法也可以用于语音录音。
根据Royyuru的说法,使用语言样本的好处在于,不管样本是口头还是书面,它们都是确定人们认知状况的无创方法。收集语言数据可以通过利用互联网远程和相对便宜地完成,尽管在收集这些数据时,隐私保护和知情同意是很重要的。
这项研究的合著者、IBM神经影像学和计算精神病学研究员吉列尔莫·塞奇向《科学美国人》解释说,这一过程也正在被调整以了解其他形式的疾病:
“我们正在利用这项技术来更好地了解精神分裂症、肌萎缩性侧索硬化症和帕金森氏症等疾病,并正在进行前瞻性研究。”