基于Web技术的蛋白质复合物识别系统的设计与实现文献综述
2020-05-01 08:43:13
选题目的及意义:识别蛋白质复合物是一项理解细胞中蛋白质作用机制的必要任务。很多计算方法因此被应用于识别蛋白质-蛋白质相互作用网络中的蛋白质复合物。除了可以被计算方法采用用于识别蛋白质复合物的信息外,还有PPI网络中的图拓扑结构,把蛋白质的功能信息考虑在内现在变得很流行。相关的方法实现依赖于这样的思想:同一个蛋白质复合物中的蛋白质和相似的功能信息有关系。然而,我们在以前的研究中发现对于大多数蛋白质复合物来说他们的蛋白质只是在一些功能种类的子集类似而不是所有功能,因此如果识别蛋白质复合物的时候把每个功能种类的参数考虑在内,结果准确性将会提升。
国内外研究现状:
最早蛋白质复合物的识别方法分为两类:基于实验室的方法、计算方法。
-
基于实验室的方法。基于实验室的方法已经发展到用实验室里的各种实验来识别蛋白质复合物,例如化学交联,亲和纯化,双杂交等方法。虽然很有潜力,但是基于实验室的方法在效率方面却不能令人满意。就拿亲和纯化法来说,识别不同的蛋白质复合物要求用很多使用不同引诱蛋白的实验。而且对于基于实验室的方法来说,能被它们识别的蛋白质复合物通常是不能完成的,因为有些蛋白质复合物在现有的实验设施下可能不会被发现。
-
计算方法。为了避免基于实验室方法出现的问题,一些不同的计算方法被提议用来作为识别蛋白质复合物的互补工具。它们大多数都是基于使用各种不同图表的聚类算法。通常来说,为了把PPI网络表示成图表的形式,用图的顶点表示蛋白质,图的边则表示蛋白质之间的相互作用,因此而形成的簇被认为是识别出来的蛋白质复合物。纯粹依赖于蛋白质-蛋白质相互作用网络中的图表的拓扑结构的计算方法通过下列拓扑结构来识别簇:例如密度,k-紧密连接子网和边缘结构。
最近,由于蛋白质的功能信息变得更容易得到,因此提供了一种新的识别蛋白质复合物的方法。对于同样的蛋白质复合物中的蛋白质,它们或许有相似的蛋白质功能信息,所以现在有很多方法都是把蛋白质功能信息考虑在内来识别蛋白质复合物。