AlphaFold2|AI时代,让我们一起体验科研中开盲盒的快乐!

  • 来源:北京索莱宝科技有限公司
  • 时间: 2021/8/6
  • 浏览人数: 436

     

    图片

     

     

    AlphaFold2

    AlphaFold刷屏

    dianfu生命科学

    AlphaFold2,再登Nature

    从业者都懵了

    AlphaFold2开源

    它来了,它带着源代码过来了

    人类98.5%蛋白质全都被预测

    生命科学领域或迎来巨变

     


    1.png


    2.png

     

    图片

    DeepMind创始人兼执行官Demis Hassabis在《Nature》期刊上分享AlphaFold的开源代码,并发表了系统的完整方,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。

    更加令人振奋的是,在AlphaFold2开源仅仅一周后,DeepMind震撼公布了AlphaFold数据集。开放的数据集不仅包括人类蛋白质组,还有大肠杆菌、酵母、果蝇、小鼠、水稻、拟南芥等模式物种在内的20多种物种的大部分蛋白的预测结构,总计超过35万个蛋白质的结构。DeepMind还与欧洲生物信息研究所(EMBL-EBI)合作建立了一个平台—AlphaFold DB(AlphaFold蛋白质结构数据库),将他们的预测结果免费开放给公众,AlphaFold2模型的目标是为所有具有已知序列的蛋白提供预测结构。DeepMind计划在年底将预测数量增加到1.3亿。EMBL-EBI主任Ewan Birney博士将其称之为“继人类基因组图谱之后最重要的数据集”。


    3(1).png

    数十年的时间里,研究人员一直在用X射线晶体学和冷冻电镜这类实验技术解析蛋白质结构。但是,这类方法存在费时耗钱的问题,对一些蛋白也不适用。为满足科研工作者对于蛋白与多肽设计,高效的抗体定制以及蛋白结构与功能分析等需求,索莱宝紧跟科技前沿,深入解析这个基于神经网络的新模型AlphaFold2。AlphaFold2不仅可以做到精确预测蛋白质3D结构,而且准确度能达到原子水平。AlphaFold2不仅达到了空前的准确度,还远超解析新蛋白质结构的其他方法。现小编和大家一起,初步体验AlphaFold2在蛋白结构预测中带来的这份快乐

     

    操作步骤

    ◆ 点击(https://www.alphafold.ebi.ac.uk/);


    4(1).jpg

     

    ◆ 在Search栏输入蛋白名称、UniProt号或基因ID,比如:植物蛋白PHYB;

    5(1).png

     

    ◆ 在左边选择目标物种,就可以显示该物种中的PHYB蛋白,比如选择“Oryza sativa subsp. Japonica”,就可以显示水稻的PHYB蛋白;

    6(1).png

     

    ◆ 点击进去,就会显示PHYB的预测结构,其中不同颜色代表不同的预测可信度。蓝色越深,可信度越高,橙色越深,可信度越低。可以看出,PHYB的预测结构具有很高的可信度,结构的细节也可以点击图片进一步查看;

    7(1).png

    8(1).png

     

    数据对比

    Uniprot数据库,并没有提供这一蛋白的可以利用的结构注释信息(见下图)。

    9(1).png

     

    使用SWISS-MODEL建模预测蛋白结构(见下图),通常需要花费很长时间(短则10分钟,长则数小时),且预测的结构完整度受限于同源蛋白的相似度(很多时候仅有部分蛋白片段给出预测结果)。

    10(1).png

     

    评论:

    AlphaFold可以看到蛋白的预测结构,并且将待预测蛋白的全序列结构描摹出来。据报道AlphaFold2的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。

     

    总结与展望

     最近,关于AlphaFold2的爆炸性信息也高频冲击着眼球。这是号称困扰生物学家50年的问题,这是DeepMind在“蛋白质折叠问题”的突破性成果。不可否认,AI进军生命科学研究领域,可以称得上一次里程碑式的创举,是继X射线晶体学、核磁共振、冷冻电子显微镜(CryoEM)等实验技术之后的伟大创新。

    纵观科学史,每次科学家在所在领域内取得重大的进步,都离不开当时技术的支持。在AI时代,因为算力和算法模型的极大提升,我们见证了蛋白质结构预测的历史时刻。AlphaFold2的数据库现已开源并且还在不断地增加新蛋白质结构预测,这成为了科学家进行蛋白质研究的宝藏数据库。这个成果极大地推动了科学家的研究与发展,拓展了对蛋白质进行结构解析与功能分析、以及下游应用的范围,比如一些癌症、病毒类感染的疾病研究,抗生素、靶向药的开发,研发新效率的酶等。让我们在生命科学研究中体验开盲盒的快乐,期待下一个想不到的惊喜,期待未来。

     

    多肽/重组蛋白设计与抗体定制服务

    索莱宝在紧跟科技前沿的同时,也可提供从基因,多肽设计合成,蛋白表达纯化到科研抗体的制备与后续检测验证等一站式的解决方案与定制服务。本服务项目依托于先进的研发平台,专业的服务开发团队和国际品牌的仪器设备,为客户抗体的定制与检测服务提供了保障。我们将在高效率的满足科研工作者对抗体多样化和深层次需求的道路上继续前行。

    11(1).png

     

    参考文献

     

    Jumper, J et al. Highly accurate protein structure prediction with AlphaFold (Nature 2021).   

    Tunyasuvunakool, K et al.Highly accurate protein structure prediction for the human proteome (Nature 2021).

北京索莱宝科技有限公司

地址:北京市通州区马驹桥镇联东U谷景盛南四街15号85A三层
邮政编码:101102
联系人:张净花
电话:010-50973129 13720003930
传真:010-56371281
Email:405465416@qq.com
展台:点击进入