科学家发现,Netflix、亚马逊和 Facebook 使用的强大算法可以 “预测 “癌症和阿尔茨海默氏症等神经退行性疾病的生物语言。科学家将数十年研究过程中产生的大数据被输入到一个计算机语言模型中,看看人工智能是否能比人类做出更先进的发现。位于剑桥大学圣约翰学院的学者们发现,机器学习技术可以解读癌症、阿尔茨海默氏症和其他神经退行性疾病的 “生物语言”。
们的突破性研究已于 2021 年 4 月 8 日发表在科学杂志《PNAS》上,未来可用于纠正细胞内部导致疾病的语法错误。论文的主要作者、圣约翰学院的研究员 Tuomas Knowles 教授表示:”将机器学习技术引入到神经退行性疾病和癌症的研究中,绝对是一个游戏规则的改变。最终,我们的目标将是利用人工智能开发出有针对性的药物,以极大地缓解症状或根本防止痴呆症的发生。”
每当 Netflix 推荐观看一部连续剧,或者 Facebook 推荐某个人做朋友时,这些平台都在使用强大的机器学习算法,对人们下一步会做什么进行高度猜测。像 Alexa 和 Siri 这样的语音助手甚至可以识别出个别的人,并立即与你 “对话”。
论文第一作者、圣约翰学院研究员卡迪-利斯-萨尔博士使用类似的机器学习技术训练了一个大规模的语言模型,来研究当人体内的蛋白质出现问题导致疾病时,会发生什么。人体是成千上万种蛋白质的家园,科学家们还不知道其中许多蛋白质的功能。研究人员要求一个基于神经网络的语言模型来学习蛋白质的语言。他们特别要求该程序学习形变生物分子凝结物的语言,即在细胞中发现的蛋白质液滴,科学家们真正需要了解这些语言,才能破解导致癌症和阿尔茨海默氏症等神经退行性疾病的生物功能和故障。
蛋白质是大而复杂的分子,在体内发挥着许多关键作用。它们在细胞中做着大部分的工作,是人体组织和器官的结构、功能和调节所必需的,比如抗体就是一种蛋白质,其功能是保护身体。阿尔茨海默氏症、帕金森氏症和亨廷顿氏症是最常见的三种神经退行性疾病,但科学家认为有几百种。
在影响全球 5000 万人的阿尔茨海默病中,蛋白质会变质,形成团块,杀死健康的神经细胞。健康的大脑有一个质量控制系统,可以有效地处理这些潜在危险的大量蛋白质,即所谓的聚合体。科学家们现在认为,一些无序的蛋白质也会形成液体状的蛋白液滴,称为聚结物,它们没有膜,相互之间自由融合。蛋白质凝结物最近引起了科学界的广泛关注,因为它们控制着细胞中的关键事件,如基因表达。
任何与这些蛋白滴相关的缺陷都可能导致癌症等疾病。这就是为什么将自然语言处理技术引入到蛋白质功能失常的分子起源研究中是至关重。研究人员给算法输入了所有已知蛋白质上持有的数据,这样它就能够学习和预测蛋白质的语言,就像这些模型学习人类语言一样,WhatsApp 知道如何为你推荐词语。然后,研究人员能够向它询问有关特定语法的问题,这些语法只导致一些蛋白质在细胞内形成凝结物。这是一个非常具有挑战性的问题,解开它将帮助研究人员学习疾病语言的规则。
机器学习的进一步使用可以改变未来的癌症和神经退行性疾病研究。如果没有机器学习的帮助,发现可能会超出目前科学家对疾病的了解和推测,甚至可能会超出人类大脑所能理解的范围。机器学习可以摆脱研究人员认为的科学探索目标的限制,它将意味着会发现我们甚至还没有设想过的新的联系。
共有 0 条评论