蛋白结构建模与优化_这 11 个可以预测蛋白质结构的网站,通通都安利给你!...

蛋白质是生命活动的体现者,其结构决定着功能。由线性氨基酸组成的蛋白质需要折叠成特定的空间结构才具有相应的生理活性和生物学功能。

解析蛋白质的空间结构对于认识蛋白质的功能、功能的执行、生物大分子间的相互作用,以及医学和药学的发展(如药物靶点的设计等)具有重要意义。为了更快速地了解蛋白质功能,不能只等待蛋白质的测定结果,尤其是对未知蛋白质开展研究之前,通过对蛋白质结构进行预测具有明显的优势。

理论基础

蛋白质的高级结构由其一级结构序列决定,蛋白质可以自发地折叠成它们的天然结构,特别是结构简单的蛋白质小分子。

  • 序列相似的蛋白质具有相似的三维结构;
  • 不同的蛋白质中相同的结构域(domain)具有相似的功能。
1dec64f4931192231435662ba042ce80.png蛋白质结构预测流程 蛋白质理化性质和一级结构分析 1. 分析蛋白质的 pI、Mw、氨基酸组成、消光系数、稳定系数等 (1)进入 Expasy 主页:

http://web.expasy.org/protparam/

49ca911c925aabe97cb79a7e200908ba.png(2)点击 Resource A…Z (3)查找「ProtParam」(protein physical and chemical parameters) (4)粘贴序列进行分析。37c0ed3f84d78d33ba4fd900abaecd3d.png2. 分析蛋白质的亲水性和疏水性 (1)进入 Expasy 主页: http://web.expasy.org/protscale/ (2)点击 Resource A…Z (3)查找「ProtScale」(protein profile computation and representation) (4)粘贴序列,选择分析方法,进行分析。 (5)蛋白质的亲水和疏水性分析结果,图形显示(亲水用负值表示,疏水用正值表示)。 3. 分析蛋白质的跨膜区 (1)Tmpred 法分析蛋白质的跨膜区: 基于对 Tmbase 数据库的统计分析来预测蛋白质跨膜区和跨膜方向。 http://www.ch.embnet.org/software/TMPRED_form.htmlbafbba0809fde43d142eefb0fbbb8ac6.png9c319b691d9e3c994dbbd7d2181cd792.png(2)TMHMM 法分析蛋白质的跨膜区: 基于 HMM 方法的蛋白质跨膜区预测工具。 http://www.cbs.dtu.dk/services/TMHMM/19f88fa0505af68eba3975dae2abe4fb.png

3398ace5f04a85989bfa7432a4ef499d.png

4. 信号肽预测 SignalP 预测的是分泌型的信号肽,而不是参与细胞内信号传递的蛋白。 准确性高于 90%。 http://www.cbs.dtu.dk/services/SignalP78eb36d508223d45376027655cc18395.png蛋白质二级结构预测 1. CFSSP http://cho-fas.sourceforge.net/a982124599fa4404929339c923e66d20.png2. PSIPRED http://bioinf.cs.ucl.ac.uk/psipred/c579467a6130e4bc17a2dc37533915b2.pngdfc696b3ebdb425f23fcf58ce05061d0.png蛋白质结构域预测 1. InterPro http://www.ebi.ac.uk/interpro/scan.htmlde79f60778b62156600fd79c98d49b03.png2e54513efc50f58b2ba7833cd8e7bc81.png2. Pfam http://pfam.xfam.org/20694f6f73800c4b91d010d00c087427.png蛋白质三级结构预测 1. 同源建模(SWISS-MODEL) 蛋白质结构同源模建(又称同源模拟、同源建模)的理论基础是蛋白质的三级结构比蛋白质的一级结构更为保守。f725f6955edfbd65587d65e1510f1f5c.png

15d5822b0f9160b011d1a2db3565a571.png

da4bb5161e50c5964552b74014283138.png

2083f5e31d8e903e3cd9c1178e790b19.png

2. 折叠识别 基本原理: 从蛋白质结构数据库中识别与待测序列具有相似折叠类型,进而实现对待测序列的空间结构预测。 自然界中蛋白质折叠类型的数目是有限的,许多蛋白质虽然享有很低的序列相似性,但它们仍可能具有相同的折叠类型,这就是折叠识别的理论依据。 软件 1:pGenThreader http://bioinf.cs.ucl.ac.uk/psipred/db72f2b76fb901c48f61c9a18c2b7215.png4ae5605a16b1bdc95b78b8ba188fdf73.png472b23c11f34d2704eaebe06352061d5.png软件 2:Phyre2 http://www.sbg.bio.ic.ac.uk/phyre2c9353311034a2d3d5f6e4767f5018ec2.png3. 从头计算法 原理: 蛋白质的天然构象对应其能量最低的构象 (热力学理论),因此通过构造合适的能量函数及优化方法,实现从蛋白质序列直接预测其三维结构的目的。 软件:I-TASSER http://zhanglab.ccmb.med.umich.edu/I-TASSER/7f4bd667aeed0416b50724d48ea30a56.png一周左右,结果将发到注册邮箱,进入邮箱打开连接,下载结果。f494e46c54011acde27d1abcbac45adc.pngXX.pdp 文件用PyMOL 软件打开: http://pan.baidu.com/s/1kUXOhIff74b36c2da7dca1462754214439c6b02.png

封面来源:站酷海洛 Plus

图片来源:作者提供

365604a666db98e9dbf7e2812a0948a2.png

版权声明:本文为weixin_42385265原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。