使用的文献:Long Noncoding RNA PICSAR Promotes Growth of Cutaneous Squamous Cell Carcinoma by Regulating ERK1/2 Activity

NCBI
- 搜索栏选Nucleotide数据库

- 在这个数据库中,展示的数据格式是GeneBank格式,可以点击网页左上角的数据格式按钮,选择你喜欢的数据格式

- 除了GenBank之外,最常用的格式是FASTA
- 在Gene数据库中,可以提供目标基因相关的更多信息,比如分子在不同组织中的表达水平
- 查找某一基因在不同物种中的保守性:在Gene数据库里找到这个基因在不同物种中的序列,然后进行BLAST分析
Ensembl
- 注意把物种选成人

- 我们通过前面所说的NCBI数据库也能进入Ensembl的网页
- 导航栏中蓝色字体的条目是可以点击的,黑色字体的条目是没有信息的

- 正文部份的”Show Transcript Table”按钮可以显示所有的转录本信息,对于PICSAR而言,只有一个基因转录本

- Ensembl的命名规则:Ensembl对于编码分子的基因和对应的转录本的命名规则是有所不同的
- 对于编码LncRNA的基因的编号:以ENSG开头,其中ENS表示Ensembl,G表示Gene
- 对于转录本:开头的四个字母是ENST,T-Transcript
- 有很多其他查询LncRNA的数据库,会要求输入Ensembl编号,如果没有特别说明,这个Ensembl编号指的是Gene编号,不是转录本编号
- RefSeq编号可以带我们进入NCBI数据库的对应界面
- 转录本的转录方向:”>”表示从左至右,”<”表示从右至左
- Flags项:转录本的证据等级,其中TSL指transcript support level,转录本支持证据等级,1是证据最强的,数字越大等级越低,越不可靠。
- 获取序列信息的方法
- 点击RefSeq,进入NCBI的对应页面获取信息
- Ensembl的序列呈现方法比较令人迷惑,下面的行是转录本的序列信息,上面行是某个位置的单核苷酸多态性信息

LncRNAdb
- 是经典数据库,但体量小,数据的更新也慢,不是很推荐
LNCipedia
- LncRNA专业性网站
- 简单search可以找到结果
- 网站直接把RNA序列信息列在了RNA sequence对话框内,直接复制黏贴信息就好
- 数据不一定更新及时,在遇到更新不够及时的时候,以Ensembl和NCBI的信息为准
Protein Coding Potential板块
- 网站给出了5种算法,分别给出了对LncRNA编码蛋白的能力

- 除了最下面的Bazzini法会关注较小的ORF外,其他算法主要关注大的ORF(300bp以上)
Locus Conservation板块
- 主要分析PICSAR所在的基因座的保守性,不是PICSAR的保守性
- 基因座的保守性:分析不同物种间,PICSAR基因所在的位置、及其周边的编码和非编码基因所在的位置,以及基因间的相互关系等
- 举例来说,如果人的PICSAR基因上游有一个编码基因A,在小鼠的PICSAR基因的上游也同样有这个编码基因A的同源基因的话,那就说明人类的基因座和小鼠的有比较高的保守性,反之较低,当然真实的算法不会如此简单
- 只有人的基因座和小鼠的基因座在60%以上,或者人的基因座和斑马鱼的基因座在25%以上,才会被认为是具有保守型的
- 通过计算核苷酸的吉布斯自由能,给出一个二级结构的模型
- RNAfold Image后的download按钮提供了对应模型的下载
Targeting miRNAs板块
Noncode
- 有自己的命名系统,对于转录本而言,以”NON”开头,意为NONCODE ID,后为”HSA”-homo sapiens,T-transript或G-gene
- CNCI score:conding non-coding index,用以表征序列的编码/非编码特征,对于PICSAR而言,CNCI是负数,表明PICSAR不能编码蛋白,是非编码RNA
- PICSAR的数据以fasta格式展示在Sequence板块,可以直接拷贝使用,这一点和LNCipedia相似,也非常的方便
Expression Profile板块
- 展示了不同组织和肿瘤细胞内表达水平的高低,相比于NCBI数据库Gene部份Expression内容不同的是,在Noncode中不仅有组织,而且有肿瘤细胞内的PICSAR水平表达高低,而且即便都是组织内表达水平的高低
- 非常特殊地,Noncode提供了PICSAR在肿瘤细胞外泌体中的表达数据,
Structure Visualization板块
- 提供了LncRNA分子的二级结构模型,并提供下载
- Noncode提供的二级结构模型和LNCipedia提供的存在着较大的差异,这些基于生物信息学的结构模型仅供参考
Data Sources板块