生信分析、meta分析、数据挖掘
TCGA、GEO、SEER、Oncomine

lncRNA数据库专题-NONCODE

简介更新操作

在上一周我们对lncRNA的相关信息进行了专题介绍,相信大家头脑大概都有了一个基本的知识框架。还记得”lncRNA介绍专题:一文带你了解lncRNA“中的lncRNA数据库介绍吗,本周我们将选择其中一些数据库进行介绍,今天给大家带来NONCODE的介绍。

简介

官方主页:http://www.noncode.org/

NONCODE 数据库是国际著名的 ncRNA (尤其是 lncRNA)及相关注释数据库。第一版本发布于 2004 年。 2005 年 1 月,NONCODE 数据库被 Science 杂志报道。截止到 2017 年11 月,数据库在线十四年,升级五次(相关文章SCI 引用次数达 672,据网站统计 NONCODE 点击数已经过亿,用户遍布全球各地,其中 1/4 的用户来自美国。 NONCODE 被 ISI 数据收录,已经有两大国际联盟Genecards 和 RNAcentral 主动邀请 NONCODE 数据库加入其组织,并与 NONCODE数据库建立互引机制。

NONCODE DB是一款综合性的数据库,该数据库是一个比较全面的ncRNA相关注释的数据库,尤其是lncRNA信息,不仅支持常用lncRNA的name、NONCODE ID搜索,大部分lncRNA还支持其他数据库名字进行搜索。

更新

在官方主页的News,可以看到,NONCODE数据库已经更新到NONCODEv5版本,在这里推荐一篇文章,微信后台回复9,即可获得。

NONCODE DB是一款综合性的数据库,该数据库是一个比较全面的ncRNA相关注释的数据库,尤其是lncRNA信息,不仅支持常用lncRNA的name、NONCODE ID(NONHSAG000001.2)搜索,大部分lncRNA还支持其他数据库名字进行搜索。

NONCODEv5收集了自2015年9月以来新鉴定的非编码RNA,非编码转录本总数据量从527 336增长到548 640,目前包含17个物种(物种包括人、小鼠、牛、大鼠、黑猩猩、大猩猩、红毛猩猩、恒河猴、负鼠、鸭嘴兽、鸡、猪、斑马鱼、果蝇、线虫、酵母、拟南芥和猪),并注释了相关表达谱信息,功能信息及保守性信息等内容。

新版本的数据库还引入了三个重要的新注释信息

(1)人lncRNA与疾病的相互关系

数据库收集了四个关于lncRNAs与疾病的相关数据库:LncRNADisease, Lnc2Cancer, MNDR 和LncRNAWiki。 NONCODE从这四个数据库中整合收集了疾病相关的lncRNAs。但通过计算方法预测的与疾病相关的lncRNAs因其不确定性,没有被NONCODEv5收录。因此,NONCODEv5只包含了实验验证的lncRNAs。最终,NONCODEv5收录了32 226 lncRNA和疾病相关信息的记录。

(2)描绘了人非编码RNA在外泌体中的表达情况

NONCODEv5从NCBI GEO数据库中收集了6个外泌体相关的RNA测序数据,外泌体来源包括6个细胞系(A431, BJ, HepG2, HUVEC, MCF7 and MDA-MB-231)和4个组织(invasive non-functional pituitary adenomas (NFPAs), non-invasive NFPAs, tuberculosis patient serum and blood from normal individuals)。在这10个测序数据中对NONCODEv5人转录本进行表达定量,并展示在网站供用户查阅,

(3)预测人非编码转录本的二级结构信息

NONCODE研究组与清华大学鲁志实验室合作对lncRNA二级结构进行预测。分别选择了两种代表性的测序方法PARS和DMS-seq,并挑选了两个对应的数据集。使用RME对NONCODE数据库人转录本的结构进行了预测。并使用可视化框架将预测得到的二级结构信息展示在NONCODE人转录本的页面。并可以通过切换数据集查看基于不同数据集预测的二级结构信息。

操作

可以看见该数据库具有多种功能,这里简单提一下,若有问题请看官网的FAQhttp://www.noncode.org/faq.php

  • 已知某lncRNA 的序列信息,想知道该lncRNA基因组上位置信息,功能如何?

只需要将序列信息粘贴到blast模块,(参数默认)搜索结果如下:

图一:参考文献及该lncRNA的NONCODE等信息

图二:具体的比对结果

选择得分最高的第一个比对结果,将相似性比较高的转录本ID  NONHSAT002796.2在search中搜索可以获得如下信息:

序列信息:

表达谱信息:

数据来源等:

  • 对于刚刚搜索的比较感兴趣的lncRNA进行功能的注释如下:

   只需将lncRNA 的基因ID 输入到Function模块即可。

  • lncRNA的保守性分析:

在concervation模块中输入基因ID即可得到保守性分析树,如下所示:

除了以上分析,还可以将整个物种的lncRNA的数据下载下来;若是您在NCBI上找到了一个很感兴趣的lncRNA,直接在搜索栏进行检索。

参考内容

(1)http://www.noncode.org/introduce.php

(2)NONCODEV5: a comprehensive annotation database for long non-coding RNAs

(3)百迈客基因:NONCODE数据库使用指南|一款好用的lncRNA数据库

猜你喜欢

生信基础知识100讲

还有更多文章,请移步公众号阅读

如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。

赞(0) 打赏
未经允许不得转载:医学SCI科研之家 » lncRNA数据库专题-NONCODE
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

meta分析、生信分析

meta、生信交流群综合科研交流群