假如给你一段5min的录音,你最多能从这段录音里够获得多少信息?
根据威斯康星大学麦迪逊威丝曼中心(University of Wisconsin–Madison’s Waisman Center)和威斯康星发现研究院( Wisconsin Institute for Discovery)的最新研究,依靠5min的录音就足以判断某个人是否容易罹患与基因相关的遗传性疾病。
1 机器学习识别脆性X染色体综合征
近日,这项研究以“Automated screening for Fragile X premutation carriers based on linguistic and cognitive computational phenotypes”为题公开发表在Scientific Reports上。研究人员利用机器学习能力分析了数百种语音记录,并能够准确地识别处于突变前期的脆性X染色体,具有这种特征的染色体会增加神经退行性疾病、不孕不育等病症的风险,携带该染色体的人群的后代容易发生脆性X染色体综合征(fragile X syndrome)。
脆性X染色体综合征是由于在人体内X染色体的形成过程中的一段DNA突变所导致,主要特征是智力障碍和身体残疾导致患者,目前全世界数以百万计人都具有早期脆性X染色体突变。
2 机器学习—人工智能计算程序,让诊断更便捷
参与研究的威斯康星大学研究生院副院长Marsha Mailick教授表示,目前这些处于突变前期的病症仍并没有有效的诊断方式,很多情况下患者对自己的发病风险并不知情。
诊断早期脆性X染色体突变是一项极为耗时、需要大量的资源并且价格昂贵的工作。为此,Marsha Mailick教授团队希望开发一种快速、经济、有效筛选方法。
于是乎,他们开发了机器学习—人工智能计算程序。据悉,这种新型的人工智能机器人可以通过现有数据进行“训练”,随后去分析新信息。
威斯康星大学生物医学工程系副教授Kris Saha补充道,一开始他们要花费数小时的时间来分析和注释每个记录,通过大量重复工作后不到1s就能搞定。
3 机器学习的过往应用
2012年,该研究的共同通讯作者、威斯康星大学副校长Jan Greenberg教授领导的一项研究,分析了母亲谈论患有早期脆性X染色体综合征孩子的5min语音记录。研究显示:父母营造的温暖、积极的家庭氛围能够减少孩子的行为问题。
威斯康星大学通讯科学与病症学副教授Audra Sterling选用了相同的录音进行研究,结果表明:在具有突变前期脆性X染色体的中年和老年妇女群体中,年龄和言语障碍有强烈的相关性。
上述研究结果表明,录音可以跟踪患有早期脆性X染色体突变老年人的疾病发展进程;系统的进行语音记录分析,可以产生有价值的关于具有突变前期脆性X染色体的家庭的信息。
不过以往进行语音特征编码十分耗时且需要临床专业知识,但新的研究中所使用的方法不需要这些特性。
4 创建语言认知功能模块
Kris Saha教授、Jan Greenberg教授、Audra Sterling教授、Marsha Mailick教授和研究生Arezoo Movaghar联合设计了初始的机器学习算法,该算法可以智能的将患者区分为两组:患者有携带脆弱X染色体的母亲和未携带的母亲。
研究人员基于录音和机器学习算法还创建了语言和认知功能的列表,例如记录中句子的平均长度或填充暂停的数量,例如“嗯”“啊”或“哦”(“um,” “ah,” or “oh.” )的发音方法,这些特征可以非常有效的区分两组的不同。
研究人员先分析了100个5min母亲谈论患有脆性X染色体综合征子女的录音,随后分析了另外100个自闭症谱系障碍儿童的母亲的录音。目前根据这些显著的特征,机器学习算法准确度可以高达81%。
根据研究人员的测算,与单独使用基因检测相比,使用机器学习的筛查方法在人群中诊断出1000名早期脆性X染色体突变患者可以节省超过1100万美元。
5 不止于脆性X染色体诊断
在Marsha Mailick教授看来,该项研究是迈向更快、更具成本效益的筛选过程的第一步,他们计划扩大对其他人群的筛选,例如具有脆弱X染色体的男性。
Kris Saha教授则表示,这项研究中开发的机器学习算法不局限于脆性X染色体诊断,未来也可以用于诊断其他与遗传相关的疾病。
研究生Arezoo Movaghar则希望简化收集数据的方式,他正在开发个人医疗问题的APP,可以追踪5min的语音样本、数据甚至可以来自手机或家庭小型音响的音频记录,然后让机器学习算法工作,以完成数据收集的目标。(原题目:厉害了我的AI!5min录音即可诊断遗传疾病,比仅使用基因检测要便宜)
参考资料:1)Machine learning can detect a genetic disorder from speech recordings2)Automated screening for Fragile X premutation carriers based on linguistic and cognitive computational phenotypes