资讯中心

资讯中心

资讯中心

科研动态 | 周耀旗课题组及合作者最新成果:SPOT-Disorder2在蛋白质固有无序区预测比赛名列第一

2021.04.22

湾豆说.png

周耀旗与格里菲斯大学的Paliwal课题组的合作成功地利用最新深度学习手段把蛋白质固有无序区预测的精确度推到了新高度。固有无序蛋白质是蛋白质里的“暗物质”,对它们进一步的研究和发现是完成蛋白质功能研究的这个拼图所需要的最后碎片,必将增加我们对疾病机制进一步的了解。



谷歌AlphaFold2在去年底第14届蛋白质结构预测的比赛(CASP14)中对大部分的蛋白实现了原子精度或者接近原子精度的结构预测,把学术界的预测远远甩在后面,一举震惊了计算生物学家和实验结构生物学家。多数人可能没有注意到的是结构没有被AlphaFold2预测好的蛋白质往往是固有无序的,也就是说它们本来没有结构,只有形成复合物或者说在外界的帮助下才能具有结构。还有些固有无序的蛋白一直以无结构的状态在生命和各种疾病过程中起着各种作用,据估计,51%人源蛋白质是完全固有无序或者有较长的一段是固有无序的,我们对它们的了解还很少。所以怎样预测、发现这些固有无序的蛋白质对优化结构测定与预测、挖掘新功能、发现药物新靶点有着重要意义。

最近,类似于CASP,科学家们利用642个人工新标注的固有无序蛋白,组织了蛋白质固有无序预测比赛(CAID),一共32个方法参加了比赛,比赛结果刚刚发表在Nature Methods (2021)上,其中周耀旗组与格里菲斯大学Paliwal组合作的SPOT-Disorder2获得了第一名。

图片1.png

【精确召回曲线,摘自Nature Methods, (2021), 图三D】

SPOT-Disorder2是通过多个不同深度学习模型的聚合来实现上述的成果。这些模型包括长短期记忆(LSTM)双向神经网络以及挤压和激励剩余开始(Squeeze-and-Excitation residual inception)神经网络的组合。文章发表在Genomics Proteomics Bioinformatics, 17, 645 (2019)[1]. SPOT-Disorder2预测工具(服务器和独立程序)以及后续开发的无序功能区预测(SPOT-MoRF,Bioinformatics, 36: 1106-1107 (2020)[2]可以从https://sparks-lab.org/上获取。

周耀旗教授从今年3月起全职加入了深圳湾实验室系统与物理生物学研究所,他是1984年中国科技大学近代化学系的学士,1990年美国纽约州立石溪大学化学物理的博士,1994-2000年北卡州立大学、哈佛大学的博士后,2000年任纽约州立布法罗大学助理教授,2004年升为终身副教授,2006年成为印第安纳大学信息学院和医学院终身正教授,2013-2021年任澳大利亚格里菲斯大学糖组学研究所正教授。他长期在结构生物信息学方面工作,曾经多次在国际蛋白质结构预测和功能预测比赛中名列前茅。到目前为止共发表论文200余篇,引用1万多次,H因子61。目前,周耀旗课题组通过计算和实验的结合,从事蛋白质/RNA的序列、结构与功能关系方面的基础研究和生物分子检测、药物开发方面的应用研究。希望有AI深度学习和计算方法发展这方面经验的科研助理、博士后、助理研究员加入他的团队。


论文标题

Critical assessment of protein intrinsic disorder prediction

论文全文

https://www.nature.com/articles/s41592-021-01117-3    

招聘信息

深圳湾实验室周耀旗资深研究员课题组诚聘研究助理、工程师、博士后及助理研究员

供稿 | 周耀旗课题组

编辑 | 鲍 啦

延伸阅读

[1] J. Hanson, T. Litfin, K. Paliwal, and Y. Zhou. SPOT-Disorder2: Improved Protein Intrinsic Disorder Prediction by Ensembled Deep Learning. [J] Genomics Proteomics Bioinformatics, 17 (2019) 645-656

论文全文 

https://www.sciencedirect.com/science/article/pii/S1672022920300243

[2] J. Hanson, T. Litfin, K. Paliwal, and Y. Zhou. Identifying molecular recognition features in intrinsically disordered regions of proteins by transfer learning. [J] Bioinformatics, 36(4), 2020, 1107-1113

论文全文 

https://academic.oup.com/bioinformatics/article/36/4/1107/5560335