Nucleic Acids Res | 基于卷积自动编码器的RNA表征及相互作用研究

604次阅读
没有评论

今天介绍浙江大学药学院朱峰教授课题组在生化与分子生物学权威期刊Nucleic Acids Research上发表的最新工作。该研究提出了一种基于卷积自动编码器表征RNA及其相互作用分子的新方法CORAIN,提供了全面的RNA编码特征,并基于卷积自动编码器自动提取并整合RNA编码特征来准确表征RNA相互作用,能够针对多种不同的RNA相关任务生成预测性能最佳的RNA表征特征,提高RNA相关预测任务的准确性。该工作有望进一步加深人们对RNA参与生理病理机制的理解,推动RNA药物的研发。

Nucleic Acids Res | 基于卷积自动编码器的RNA表征及相互作用研究

RNA通过与其他分子相互作用,在多种生理和病理过程中发挥重要作用。人们构建了各种计算方法来识别RNA相关的相互作用。然而,现有工具提供的编码功能仅限于某些类型,这限制了编码功能的全面性。此外,现有工具经常采用直接连接的简单策略,这并不能平等地评估两个相互作用分子的特征维度。换句话说,迫切需要一种RNA编码方法,不仅提供全面的编码特征覆盖,而且还提供一种连接策略,使不同特征维度的相互作用分子能够对下游分类器起到相同的贡献。因此,本研究开发了一种针对RNA和RNA相关相互作用的编码方法,如下图所示。该方法的独特之处在于通过引入大量新特征实现RNA的全面编码,以及基于自动编码器生产特征实现特定任务的相互作用分子集成。基于该方法建立了在线服务工具为https://idrblab.org/corain/。

Nucleic Acids Res | 基于卷积自动编码器的RNA表征及相互作用研究

基于多种不同RNA相关的相互作用案例研究全面验证CORAIN的有效性。与已发表文章中的应用策略相比,CORAIN产生的编码特征能够结合现有研究中的不同分类器更有效地预测RNA相关相互作用。在RNA-RNA相互作用(RRIs)的跨物种预测研究中,如下图a横坐标所示,建立了6个跨物种预测任务。具体来说,使用一个物种的RRIs来训练模型,然后将其应用于预测另一个物种的RRIs。使用与原始研究相同的分类器,对CORAIN提供的特征性能进行评估,并与已发表文章中提出的原始特征进行比较。如下图a所示,使用基于自编码器的嵌入特征(橙色虚线)的CORAIN在所有六个跨物种任务中都优于原始研究(灰色虚线)的策略。在所有任务上都取得了实质性的改进,这表明CORAIN能够成功提取信息量丰富的RNA特征,有效增强了其预测RRIs的能力。为了评估CORAIN提出的新编码特征的贡献,本研究计算了所有编码特征的重要性,以反映它们在最终RNA表示中的贡献。如下图b、c和d所示,CORAIN提出的新特征(红色部分)排名高于已有文献中的特征(绿色部分)。这表明它们是对现有方法的有效补充,提高了跨物种RNA-RNA相互作用的预测性能。

Nucleic Acids Res | 基于卷积自动编码器的RNA表征及相互作用研究

在RNA-蛋白质相互作用的跨数据集预测研究中,构建了5个跨数据集预测任务,如下图a所示。具体来说,使用每个数据集作为测试集,其他四个数据集用作训练集,迭代生成了五个跨数据集预测任务。使用与原始研究相同的分类器,将CORAIN提供的特征与已发表研究的特征进行比较。如下图a所示,在五个跨数据集任务中,CORAIN(橙色虚线)优于已发表研究(灰色虚线)。和RRIs研究中使用相同的方法,本研究计算了所有编码特征的重要性。如下图b、c、d、e和f所示,CORAIN提出的新特征(红色部分)排名高于已有文献中的特征(绿色部分)。这再次表明它们对现有方法的有效补充,提高了跨数据集RNA-蛋白质相互作用的预测性能。

Nucleic Acids Res | 基于卷积自动编码器的RNA表征及相互作用研究

在本研究中,开发了一种针对RNA和RNA相关相互作用的编码方法。该方法的创新之处在于通过引入许多新特征实现全面的RNA特征编码,以及使用自动编码器生成特征实现相互作用分子的准确预测。与现有工具相比,这种新方法不仅在预测RNA相关相互作用方面表现出了优越的能力,而且还揭示了RNA编码潜力。

参考资料

Yunxia Wang, Ziqi Pan, Minjie Mou, Weiqi Xia, Hongning Zhang, Hanyu Zhang, Jin Liu, Lingyan Zheng, Yongchao Luo, Hanqi Zheng, Xinyuan Yu, Xichen Lian, Zhenyu Zeng, Zhaorong Li, Bing Zhang, Mingyue Zheng, Honglin Li, Tingjun Hou, Feng Zhu, A task-specific encoding algorithm for RNAs and RNA-associated interactions based on convolutional autoencoder, Nucleic Acids Research, 2023;, gkad929, https://doi.org/10.1093/nar/gkad929

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy