蛋白质复合物由一组具有特定生物功能的蛋白质组成。使用计算方法从生物网络中预测蛋白质复合物对于理解生物活动的机制和疾病的发病机理具有重要的现实意义。传统的复合物识别算法通常仅基于网络拓扑结构,忽略生物特征和噪声数据对复合物识别性能的影响。针对该问题,本文提出一种基因本体和核-附属结构的蛋白质复合物识别算法,首先通过语义相似性融合蛋白质相互作用网络和基因本体信息构建有权图模型;其次,设计以局部子图直径和密度为聚类条件的核-附属结构的复合物识别算法GCA。最后,GCA和三个经典的方法在两个复合物数据集中进行比较和分析。实验结果表明,GCA在召回率、f度量和功能富集分析方面的表现均显著优于CFinder,MCode和MCL。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !