20 世纪,DNA 测序、PCR 和新成像方法等突破性生物技术永久地改变了医疗保健的面貌。现在,我们可以看到人工智能开始做同样的事情。它具有处理技术生成的巨大生物数据集的潜力,甚至可以预测蛋白质的结构,从而有可能治愈数百种疾病。
就在上周,谷歌的 DeepMinds 发布了 AlphaFold3。这个更新的软件使用人工智能来预测蛋白质结构。这些预测达到了前所未有的准确度。 DNA 具有特定的碱基序列,就像使用说明书一样,编码氨基酸序列。这些氨基酸按编码顺序连接在一起,并以特定方式折叠形成蛋白质。蛋白质是生命和所有细胞过程的基础。 AlphaFold3 可以仅根据输入的氨基酸序列来预测其 3D 结构以及相关的残基或核苷酸。
“立方毫米包含大约 1.5 亿个突触,因此如果没有人工智能,这几乎是不可能的”
了解蛋白质结构对于更好地治疗包括癌症在内的许多疾病至关重要。 “癌症”是指细胞分裂调节出现问题并因此变得无法控制的任何疾病,因此是一种极其多样化的疾病。这也是导致治疗如此困难的部分原因。了解细胞分裂信号通路中涉及的蛋白质结构以及它们如何出错可以导致更具体的药物靶向。此外,利用这种工具,可以改善阿尔茨海默氏症和帕金森氏症等蛋白质错误折叠疾病的生物分子理解,使它们更容易治疗。 AlphaFold 3 只是人工智能在药物开发中的作用之一。
以前,生物数据需要手工完成,分析需要很长时间;使用机器学习工具可以极大地提高效率并降低成本。例如,成像通常会产生大量数据。最近,人工智能被用来根据图像切片创建患者大脑部分的 3D 地图。每立方毫米包含大约 1.5 亿个突触,因此如果没有人工智能,这几乎是不可能的。研究这一点可以帮助科学家更好地了解影响数百万人的脑部疾病,例如痴呆症。
人工智能的快速发展理所当然地引发了许多关于其潜力的伦理问题。在医疗保健领域,数据保护是一个问题,因为患者信息非常敏感。尽管如此,无论是否经过人工智能研究,这些数据都已经存在。另一个问题是机器学习的好坏取决于它所训练的数据集,这很容易导致偏差。例如,如果使用人工智能工具来比较不同人群的 SNP(通常用于追踪疾病遗传的 DNA 短片段),则需要根据种族区分更可能与特定疾病相关的 SNP患者的血统。此外,特定特征的预期健康范围可能取决于患者性别等属性,因此人工智能必须在具有均匀表示的数据集上进行训练。然而,获得完全具有代表性的数据样本是非常困难的。
“AlphaFold3 试验显示准确度高达 76%。虽然这是开创性的,但专家仍然需要根据他们的知识或实验手动过滤人工智能结果”
确保有足够大的手动标记数据集供人工智能借鉴是非常耗时的。一些项目使用开源平台只是为了为其机器学习工具提供大量手动“培训师”:Zooniverse 是一个在线平台,任何人都可以为科学项目做出贡献,包括帮助培训人工智能。
当人工智能应用于医疗领域时,考虑这些缺点非常重要,因为错误诊断或漏诊疾病等不准确可能是致命的。这就是为什么在不久的将来人工智能看起来只会成为医疗专业人员工具箱的一小部分,仍然需要手动操作员。 AlphaFold3 试验显示准确度高达 76%。虽然这是开创性的,但专家仍然需要根据他们的知识或实验手动过滤人工智能结果。
但这种不准确性可能会被利用。例如,如果人工智能在识别某种特定疾病方面过于敏感,它作为预警系统仍然可能是有益的,该系统向医疗专业人员表明他们可能需要进行更多测试,例如最近的心电图(ECG)试验由台湾国防医学中心进行。人工智能研究心电图并将其标记给医疗专业人员。与对照组相比,这导致高危患者的死亡率较低。
人工智能在医疗保健领域的潜力是无限的。在我们的一生中,机器学习将改变疾病的诊断和研究水平。然而,距离医疗专业人员不再做出最终决定还有很长的路要走。