Nature子刊:新的人工智能可以通过查看图像来揭示细胞生物学

发布时间:2022-08-24

在看到上面的那组狗狗的照片后,我们通常会根据长相(品种)、毛色、耳朵大小、脸型等特征对它们进行快速地比较和分类。这似乎是人类所擅长的。然而,如果针对狗狗下面那组蛋白质图像进行细胞分析,那显然那不是人眼人脑能胜任的工作;但一种新的人工智能就可以做到。

众所周知,细胞功能失调是许多人类疾病的根源,包括心血管疾病、神经退行性疾病、糖尿病和癌症等。因此,解释蛋白质定位的多样性和复杂性对于充分理解细胞结构和功能至关重要。它不仅可以揭示出健康细胞的工作方式;更重要的是,当疾病来临时,它还可以让科学家知道细胞内部发生了什么。

2022年7月25日,发表在《Nature Methods》上的一项新研究中,来自陈·扎克伯格生物中心(简称CZ Biohub)的研究团队开发了这种名为“Cytoself”的完全自监督的深度学习方法,可以在没有预存知识、类别或注释的情况下从荧光显微镜图像中分类和比较不同的人类蛋白质,从而揭示出高分辨率的蛋白质亚细胞定位图谱。

每个细胞包含大约10000种不同类型的蛋白质,它们中的一些单独工作,另一些协同工作以保持细胞健康。蛋白质在细胞中定位的所有可能方式是什么?它可能存在于任何位置,以及位置的各种组合。这是一个最基本的问题。几十年来,生物学家们一直试图建立细胞内蛋白质所有可能的位置和可能的结构。但这一直都是通过人工查看数据的方式来实现的。问题是,人类的局限性和偏见在很大程度上会使这一过程产生瑕疵。

Cytoself要比人类做得更好。它可以找到更精细的类别,并在极其精细的图像中看到差异。

在这篇论文中,Cytoself不仅展示了机器学习算法的威力,还深入了解了细胞和蛋白质,提供了细胞内蛋白质定位丰富且详细的信息。由于蛋白质的定位与其细胞功能高度相关,因此,Cytoself将是一个宝贵的工具,可以对未知的或研究不多的蛋白质进行初步的功能预测,并定量研究细胞扰动和细胞状态变化对蛋白质亚细胞定位的影响。这将进一步加快细胞生物学的研究进度,并最终用于加速药物发现和药物筛选过程。

Cytoself是一个自监督学习的例子,这意味着人类不会像监督式学习那样教授关于蛋白质图像算法的任何内容。

在监督学习中,研究人员必须一个例子接一个例子地去教授机器学习算法,这需要大量繁琐枯燥的工作;而且,如果机器仅限于人类训练给它的知识类别,那么它可能会在系统中引入偏差。

该研究第一作者Hirofumi Kobayashi说:“我们相信信息已经在图像中了。我们想看看这台人工智能自己能学会什么。”

他们发现,Cytoself从图像中提取的信息量着实令人感到惊讶。

该研究共同通讯作者Manuel Leonetti说:“蛋白质定位的详细程度比我们想象的要高得多。机器将每个蛋白质图像转换成一个数学向量。然后你可以开始对看起来相同的图像进行排序。我们意识到,Cytoself可以让我们以高特异性预测蛋白质在细胞中的协同作用,这着实令人惊讶。”

虽然以前也有一些研究使用了自监督或无监督模型对蛋白质图像进行了研究工作;但该团队表示,能在如此大的数据集上且如此成功地使用自监督学习还是首次。该数据集包含100多万张图像,涵盖了从活体人类细胞中测量的超过1300种蛋白质。

这些图像是CZ Biohub开发的OpenCell项目的一部分,该项目旨在创建人类细胞的完整图谱,包括最终描述驱动细胞的20000种左右的蛋白质。

与CZ Biohub开发的所有工具一样,cytoself是开源的,所有人都可以使用。该团队望这将激励更多研究人员使用类似的算法来解决自己的图像分析问题。

今年早些时候,他们在《Science》上发表了第一批1310种蛋白质的特征,包括每种蛋白质的图像以及它们之间相互作用的映射。

Cytoself是OpenCell成功的关键(所有图像可在OpenCell.czbiohub.org上获得),提供了关于蛋白质定位的非常精细和定量的信息。

Cytoself团队的下一个目标是如何利用对蛋白质定位的微小变化进行跟踪来识别不同的细胞状态,例如,正常细胞与癌细胞。这可能是更好地了解许多疾病和促进药物发现的关键。

Kobayashi说:“药物筛选基本上是试错的过程。但对于Cytoself,这是一个巨大的飞跃,因为你不需要对数千种蛋白质逐一进行实验。这是一种低成本的方法,可以大大提高研究速度。”

该团队表示,Cytoself是关于人体细胞如何连接的重要生物学结果。同时,他们还在将该算法应用于新的问题,并且在继续完善人类已知的一切和未知问题。未来,他们会将Cytoself应用于不同类型的图像,从而开辟出更多的可能性。

论文链接:

https://www.nature.com/articles/s41592-022-01541-z

https://www.science.org/doi/10.1126/science.abi6983

https://opencell.czbiohub.org/

来源:中国生物技术网