- 如果说功能基因裂变出来的DNA、RNA和蛋白是老三样,那么miRNA、LncRNA和CircRNA就是三个新分子天王
- 一个阶段过去了就没法逆转,如果你上来就做蛋白或者lncRNA,错过了简单好用的miRNA,中途想换回来恐怕很难再续上缘分,总会有各种情非得已的限制
- miRNA是对新手最友好的分子类型
- 从miRNA入手做基础科研,SCI 低分灌水很容易,想发到五分也不是特别难
- 等文章在手要申报基金课题的时候, miRNA跟其他的分子类型交互作用又很普遍,从miRNA到LncRNA,再联系到CircRNA, 或联系到转录因子、信号通路都比较方便,甚至还可以联系到细胞间交互通信,像外泌体这样的热点方向
- miRNA研究的其他优势
- miRNA是非编码RNA,没有蛋白,所以不管是做表达差异还是验证基因过表达还是沉默的效率,都只需要qPCR验证,不需要买抗体做Western,简化了一半工作量。
- miRNA是短片段,直接合成就行,转染效率还 高,不需要用病毒载体,在细胞水平实现“一正一反”的操作,流程上超简单
- 表型做完了探索分子机制,miRNA 有一套固定的机制模式,miRNA 一般作用于靶基因的3’-UTR,引起下游靶基因表达沉默。miRNA 结合靶基因的验证只有一个经典实验——荧光素酶报告基因实验Luciferase Assay,这个实验应该算是机制研究里比较容易做的。
- 已知miRNA预测靶基因呢?有现成的数据库,只需要在几个数据库中输入 miRNA名称,获得的靶基因预测结果取交集,Luciferase Assay验证成功其中一个靶基因,就大功告成了
miRNA简介
- 长度整齐划一,都是19-25nt的单链RNA片段,在物种之间保守性比较好,做人的细胞和老鼠的动物实验可以用同一个序列,还可以通过研究一个miRNA在模式生物中的功能来反推在人类中的功能
miRNA的命名
- 查询miRNA的权威数据库是miRBase,注意查基因序列去NCBI
- 跟基因命名俗名混乱的情况比,miRNA命名规范得多,都是用数字命名的
- 除了最早期发现的一批有lin-4、let-7这样的俗名,miRNA的名字一般都是miR-XXX,XXX为数字序号。
- 按照发现的顺序用数字编码,数字大的就是发现比较晚的,数字大的miRNA相对来说研究可能更少一点
- 现代的miRNA命名,起头先用物种名称,如人的hsa,是Homo sapiens的H和sa组合起来缩写,hsa代表人,小鼠是Mmu,大鼠是Rno,物种后面加一个横杠接miRNA简写成miR/mir,再加个横杠接序号数字
- 如果遇到新发现的miRNA跟已有名称的高度同源的情况,序列只差 1-2 个碱基,且区分开来没法体现这种序列和功能上的相似性,那就在第一个发现的miRNA后加上小写的a/b/c来区分
- 如果一条miRNA可以来源于不同的DNA编码区域,也就是在基因组有平行的多个拷贝,那么还要在a/b/c后面加个横杠再以数字1/2/3来表示
- 最后一条规则:科学家们发现miRNA前体是个茎环结构,加工过程会从3’-或5’端-茎环臂产生最终成熟的miRNA,但是一般只有其中一条是表达量高的。以前把表达量低的加个星号(Shift+8),后来发现这样不太准确,也有会以”-s”和”-as”来命名,最新的命名规则改用了来源于5’-端的标上5p,3’-端标3p。这样就形成了物种-miR-数字序号+字母-5p/3p的名字
miRNA的产生流程
- miRNA是基因编码转录出来的
- 最初转录出来的miRNA有几百,甚至几千个碱基长, 称为初级转录产物(primary miRNA,pri-miRNA)
- pri-miRNA经过Drosha的二次剪切,产生约70-90nt的miRNA前体(miRNA precursor,pre-miRNA),这一步发生在细胞核内
- miRNA前体转运到胞浆再被Dicer酶切,产生miRNA成熟体。这类似于shRNA,shRNA加工成siRNA和miRNA前体加工为成熟体用的是同一套细胞内部机制
miRNA的作用机制
- 成熟的miRNA 分子要发挥功能,它可以跟一个或多个 mRNA 分子不完全匹配的互补结合,一旦结合上就可以下调基因的表达。
- miRNA主要作用位点在 靶基因的3’-UTR,依赖于RISC,即RNA induced silencing complex沉默复合体发挥作用,这一点也跟siRNA一样
- 在一些文章里也有报道miRNA作用于5’-UTR和mRNA编码区的, 但是结合3’-UTR是主流
miRNA研究套路
- 基本同功能基因
- 检测基础表达水平
- 制备分子操作工具
- 细胞功能表型实验
- 动物水平表型验证
- Rescue实验
挑选适合的目标mRNA分子
- 筛和猜的方法基本同功能基因
- “以通量换概率”的策略
- 在五步法里,完成前面三步,就已经得到了细胞水平的表型结果,能不能发展成一篇article这个时候已经知道了
- 这个验证过程还可以适当减配,完成工作量的简并和效率优化,比如过表达加沉默一正一反的双向研究,在找候选分子的时候,只要先做一个方向就行了。在疾病中高表达的分子做沉默验证,低表达的分子做过表达,以抑制或者缓解致病的表型作为目标
- 又或者,猜分子验证的时候,细胞株也只需要先做一株,表达差异也可以只在这一株细胞上做,只要新的分子代入到表型里没有人报道过, 就算表型很老套,那也是一篇新Paper的idea,后面再按照规范化的套路补全整套数据就好。
执行套路
- 一旦有表型的miRNA分子确定,文章已经看到曙光了,就可以开始执行套路了
执行套路第一步——分析miRNA的表达差异情况
- 包括细胞和组织水平的检测。相比于蛋白要做的免疫组化、免疫荧光,miRNA只需要做 Real-time PCR来验证就行
- 要注意的是,miRNA的qPCR用到的试剂盒跟检测编码基因 mRNA 的不太一样,抽提 miRNA 的方法和检测 miRNA 的引物都有区别,知道做miRNA时,要买针对miRNA的检测试剂盒就可以了
执行套路第二步——制备 miRNA过表达或者抑制的实验工具
- 这一步基本等同于做RNA干扰时候合成siRNA片段
- miRNA成熟体可以找公司进行化学合成,订购完一两周到货,费用不贵
- 一个使用术语上的差异
- 过表达的基因一般称over-expression,如果文章在实验分组里出现一个基因名称或者缩写OE的组, 就是在过表达基因,miRNA过表达的专用名词时mimics(模拟物)
- 同样地,做基因沉默时编码基因的分组标注一般是si-XXX,或者用载体的sh-XXX,看到si或者sh,你就知道作者在做loss of function,而miRNA的沉默叫inhibitor(抑制物),同样是术语上的差别
- miRNA很小,转染操作较方便
- 用质粒或者病毒做稳定转导的时候,跟做shRNA是非常相似的,也是表达一个茎环结构的发卡状 RNA
- 一般做miRNA表达载体会用前体pre-miRNA的结构,胞内经过加工成为成熟的miRNA,做inhibitor的载体就在这个茎环里放上 miRNA的反义链,整个茎环结构都是通用的,仅仅是核心序列变化而已
- 还嫌麻烦,就用合成的成熟体miRNA做瞬时转染,也能把细胞表型做 完还嫌麻烦,就用合成的成熟体 miRNA做瞬时转染,也能把细胞表型做完
- 跟功能基因一样,制备完操作工具也需要检测下、过表达或者沉默效率,也是用到之前做表达差异时候的那一套,用定量PCR来检测,这一步也不需要Western
执行套路第三步——表型验证
- 和功能套路的内容,把biomarker往里套就好了
- 细胞表型套路一样,动物表型也没什么差异
额外的内容——找miRNA的靶基因
- 疾、型、 模、法、标加上变量分子,就像写作文一样描述的是时间、地点、人物、事件,WHO、WHERE、WHEN、WHAT,是一个场景画面。
- 随着故事再进一步,一定会问WHY或者是HOW的问题,解释一个分子介导某种表型背后的原因就是分子机制Mechanism
- 变量分子和通路组合在一起,通路就是解释分子发挥功能的 Mechanism;药物和分子组合在一起,分子就是解释药物为什么有效的 Mechanism;药物也可以跟通路串联在一起,用通路变化来解释药物起效的Mechanism
- 用来当做机制的分子或者是通路,一般是已知跟这个表型有关联的, 前面研究人员已经明确的老东西,作为机制去套的时候,我们会自动屏蔽那些解释不清楚的,把一靠上就海阔天空,自圆其说的那种机制挖出来,课题就可以完满收工了
机制研究的两个层次
间接作用机制
- 可以理解为知其然,但不知其所依然
- 主变量通过影响下游另外一个因变量,发挥功能,但是不知道这两个变量之间具体是怎么调节的
直接作用机制
- 可以理解为知其然,而且志气所依然
- 不仅知道有调控关系,而且知道了直接作用的靶点和方式是什么
- 在这种机制里,miRNA靶向作用于下游的一个编码基因,是最简单的一种机制模型
- miRNA为主变量的研究项目,只要有分子机制,一般都是做靶基因,这是一种直接作用机制
- miRNA间接调节一个通路,或者明星分子的文章并不多见,因为做靶基因较简单,没必要再舍近求远,找通路间接作用机制 的路径并不比直接找靶基因省力多少,但是文章的学术价值却更差。
Rescue实验:见下一讲
miRNA预测靶基因算法
- 比较简单,成功率相对高
- 核酸与核酸结合主要还是基于碱基互补配对的原则,miRNA和靶基因是不完全互补配对的结合,但有一段Seed region,也就是种子区,一般是互补的;根据这种结合的特点,再算一算双链结合的二级结构、自由能、稳定性等等, 就可以推测基因组当中与之匹配的序列,默认是找基因的3’-UTR区域
- 查miRNA的序列和注释用miRBase数据库,在预测miRNA靶基因方面最权威的数据库是Targetscan
- 一个miRNA有多个靶基因,同一个基因可以受到多个miRNA的调节。两者之间是网状的关系,原理简单、形式多样,但一篇文章只要抓住一对 分子就好,一个miRNA和一个靶基因就是一篇文章
- 因为miRNA预测的算法比较宽松,候选基因经常会特别多,甚至几千个,这时候可以多个数据库一起做预测然后取交集,缩小候选分子范围,这种策略文章里很常见也很有效,最后只需要验证成功一个就行了
- 有了预测的靶基因之后,就应该通过 miRNA 和 mRNA 的表达负相关去找进一步的证据。
- 靶基因的表达数据,可以找文献资料,也可以查数据库, 当然最好还是基于自己实验验证。
- 实验验证是不是潜在靶基因,只需要在细胞株中过表达miRNA,然后qPCR和WB检测一下,选出miRNA过表达后,表达下调的预测靶点。
- 找到这种有显著负调节关系的预测靶基因后再加一个Luciferase assay,就可以证明直接调控作用了
补充介绍:荧光素酶报告实验
- 荧光素酶报告基因实验是机制研究中的一个非常经典的实验,五分以上的文章就经常看到了,有两种主要的用途:用在miRNA靶基因验证和用在研究转录因子对启动子的调控活性
- 用在miRNA和转录因子研究里的两套载体是不同的, 研究miRNA时,是将需要鉴定的 miRNA靶基因的3’-UTR 插入荧光素酶基因的3’-端, 转到细胞再过表达miRNA,如果miRNA对靶基因的3’-UTR是有结合和抑制翻译作用的, 荧光素酶表达量会减少,对底物荧光的值就会降低,这样就能获得证据证明miRNA与靶基因3’-UTR是有结合的。
- 在研究转录因子的时候,插入的序列位于荧光素酶报告基因编码序列的5’-端,插入的是启动子序列,一个在头一个在尾
补充介绍:miRNA作用机制
- 阻遏机制:一般认为miRNA与mRNA的3’-UTR结合后会阻碍翻译过程,但不影响mRNA的稳定性
- 降解机制:miRNA还可以降解靶基因mRNA。当miRNA与mRNA完全互补或者近乎完全互补的时候,是可以引导降解mRNA的, 是一种类似于 siRNA的机制,降解机制在动物中是比阻遏更加普遍的存在
- 阻遏翻译和引导mRNA降解是两种机制,不是因果关系,不是先阻遏再降解,两者是相互独立的,要么阻遏,要么降解
- 引申思考:“蛋白表达降低是miRNA起效的金标准“
- miRNA过表达,其靶基因mRNA可能表达降低,也可能变化不显著,但在蛋白水平,都应该表现为明显的降低,无论是哪种机制,蛋白表达降低都是金标准