banner

LncRNA研究套路 Lesson 13 查询LncRNA序列

  • Home
  • 解螺旋·套路课
Scroll down
TIP

这些是本篇文章的标签,来发现更多感兴趣的内容吧
科研
解螺旋
套路课
LncRNA

使用的文献:Long Noncoding RNA PICSAR Promotes Growth of Cutaneous Squamous Cell Carcinoma by Regulating ERK1/2 Activity

NCBI

  • 搜索栏选Nucleotide数据库
  • 在这个数据库中,展示的数据格式是GeneBank格式,可以点击网页左上角的数据格式按钮,选择你喜欢的数据格式
  • 除了GenBank之外,最常用的格式是FASTA
  • 在Gene数据库中,可以提供目标基因相关的更多信息,比如分子在不同组织中的表达水平
  • 查找某一基因在不同物种中的保守性:在Gene数据库里找到这个基因在不同物种中的序列,然后进行BLAST分析

Ensembl

  • 注意把物种选成人
  • 我们通过前面所说的NCBI数据库也能进入Ensembl的网页
  • 导航栏中蓝色字体的条目是可以点击的,黑色字体的条目是没有信息的
  • 正文部份的”Show Transcript Table”按钮可以显示所有的转录本信息,对于PICSAR而言,只有一个基因转录本
  • Ensembl的命名规则:Ensembl对于编码分子的基因和对应的转录本的命名规则是有所不同的
    • 对于编码LncRNA的基因的编号:以ENSG开头,其中ENS表示Ensembl,G表示Gene
    • 对于转录本:开头的四个字母是ENST,T-Transcript
    • 有很多其他查询LncRNA的数据库,会要求输入Ensembl编号,如果没有特别说明,这个Ensembl编号指的是Gene编号,不是转录本编号
  • RefSeq编号可以带我们进入NCBI数据库的对应界面
  • 转录本的转录方向:”>”表示从左至右,”<”表示从右至左
  • Flags项:转录本的证据等级,其中TSL指transcript support level,转录本支持证据等级,1是证据最强的,数字越大等级越低,越不可靠。
  • 获取序列信息的方法
    • 点击RefSeq,进入NCBI的对应页面获取信息
    • Ensembl的序列呈现方法比较令人迷惑,下面的行是转录本的序列信息,上面行是某个位置的单核苷酸多态性信息

LncRNAdb

  • 是经典数据库,但体量小,数据的更新也慢,不是很推荐

LNCipedia

  • LncRNA专业性网站
  • 简单search可以找到结果
  • 网站直接把RNA序列信息列在了RNA sequence对话框内,直接复制黏贴信息就好
  • 数据不一定更新及时,在遇到更新不够及时的时候,以Ensembl和NCBI的信息为准

Protein Coding Potential板块

  • 网站给出了5种算法,分别给出了对LncRNA编码蛋白的能力
  • 除了最下面的Bazzini法会关注较小的ORF外,其他算法主要关注大的ORF(300bp以上)

Locus Conservation板块

  • 主要分析PICSAR所在的基因座的保守性,不是PICSAR的保守性
  • 基因座的保守性:分析不同物种间,PICSAR基因所在的位置、及其周边的编码和非编码基因所在的位置,以及基因间的相互关系等
  • 举例来说,如果人的PICSAR基因上游有一个编码基因A,在小鼠的PICSAR基因的上游也同样有这个编码基因A的同源基因的话,那就说明人类的基因座和小鼠的有比较高的保守性,反之较低,当然真实的算法不会如此简单
  • 只有人的基因座和小鼠的基因座在60%以上,或者人的基因座和斑马鱼的基因座在25%以上,才会被认为是具有保守型的

Secondary Structure Information板块

  • 通过计算核苷酸的吉布斯自由能,给出一个二级结构的模型
  • RNAfold Image后的download按钮提供了对应模型的下载

Targeting miRNAs板块

  • 预测与这个LncRNA可以相互结合的miRNA

Noncode

  • 有自己的命名系统,对于转录本而言,以”NON”开头,意为NONCODE ID,后为”HSA”-homo sapiens,T-transript或G-gene
  • CNCI score:conding non-coding index,用以表征序列的编码/非编码特征,对于PICSAR而言,CNCI是负数,表明PICSAR不能编码蛋白,是非编码RNA
  • PICSAR的数据以fasta格式展示在Sequence板块,可以直接拷贝使用,这一点和LNCipedia相似,也非常的方便

Expression Profile板块

  • 展示了不同组织和肿瘤细胞内表达水平的高低,相比于NCBI数据库Gene部份Expression内容不同的是,在Noncode中不仅有组织,而且有肿瘤细胞内的PICSAR水平表达高低,而且即便都是组织内表达水平的高低
  • 非常特殊地,Noncode提供了PICSAR在肿瘤细胞外泌体中的表达数据,

Structure Visualization板块

  • 提供了LncRNA分子的二级结构模型,并提供下载
  • Noncode提供的二级结构模型和LNCipedia提供的存在着较大的差异,这些基于生物信息学的结构模型仅供参考

Data Sources板块

  • Noncode与其他网站之间的相互数据引用
Other Articles
Article table of contents TOP
  1. 1. NCBI
  2. 2. Ensembl
  3. 3. LncRNAdb
  4. 4. LNCipedia
    1. 4.1. Protein Coding Potential板块
    2. 4.2. Locus Conservation板块
    3. 4.3. Secondary Structure Information板块
    4. 4.4. Targeting miRNAs板块
  5. 5. Noncode
    1. 5.1. Expression Profile板块
    2. 5.2. Structure Visualization板块
    3. 5.3. Data Sources板块
Find Something Special?