- 讲解分子变量代入模法标科研恒量的规范化设计套路
- 科研套路领悟的三个阶段
- 看山不是山:读一篇文章连真相都掌握不到,云里雾里
- 看山是山:读几十篇文章达到,每个数据的用意,作者在讲什么故事,产生自己的体会,在这个阶段通过类比发现文章的数据编排上存在相似点,感觉到套路的存在
- 看山不过是山:文章呈现在面前能辨别出哪些是文章的规定动作,哪些是作者的自由发挥,文章数据背后的逻辑线条能被全面洞悉
- 看水不只是水:读一篇文章不仅能够推演出普遍适用的规律,而且能在读的过程中进行总结和升华,读一篇的收获不只一篇文章
功能基因研究的经典模式
- 本质上是在研究蛋白,只有在研究机制的时候才会涉及到DNA与RNA
研究蛋白介导表型的经典研究思路
- 科研套路是研究者们约定俗成的通用体系,因为大家都这么干,逐渐就成了标准
表达差异分析
- 是套路开始的地方,如果一个蛋白在细胞中有一定的功能,那么合理推测它在细胞中也有相应的表达量,没有表达就没办法执行功能
- 在疾病中有表达的改变,才说明这个分子在疾病的发生发展中有意义
- 分子为变量的研究中,第一个Figure往往是检测目标分子的表达水平,具体来说可以是把病理组织和对照组进行比较,搞清楚疾病过程中在组织中的表达是否明显改变,也可以检测细胞模型/动物模型特定组织中的表达变化
- 如果想简化第一步的工作,人的标本和动物模型的实验内容可以先不做,但细胞模型上是不可或缺的;在蛋白功能的研究里,基础表达数据相当于犯罪嫌疑人在场或否的证明,是非常重要的证据
做表达差异时用qPCR和WB
- 收集完细胞或者组织样品后,抽提其中的RNA进行逆转录,然后进行qPCR;收集其中的蛋白,用特异性抗体去检测,这样就能读出编码基因的mRNA和蛋白的表达量,这俩一般是一样的,可以相互佐证,出现不一样考虑特殊的调控机制,在文章后面作出解释
- qPCR的数据一般是用相对表达量呈现,就是用其中一组的数据作为对照,表达量设为1,其他组和它相比的比值用柱形图进行分析
- western可以用灰度扫描的图像处理软件来进行相对定量,有些文章周围还有柱形图用来表示灰度,其存在意义就在于此;western不是定量分析,灰度是半定量统计结果,原则上有图就行,不一定非要统计
- 在组织的检测表达上,新鲜组织和细胞是一样的,也是qPCR和western,还可以用石蜡包埋做免疫组化分析,免疫组化还可以获得蛋白的定位分析;免疫组化那么多图,放几张典型的上去就好了;少数情况下还可以选择免疫荧光,也可以看到细胞定位的情况,图片很炫酷,文章要求高的时候可以考虑,想要偷懒就不必了,因为实验更复杂,但是数据说明的效果其实差不多
- 检测细胞表达还有一个目的,选择gain-of-function和loss-of-function的实验在哪个细胞上做,常规的思路是低表达的细胞系做过表达,高表达的细胞系做沉默;条件不满足的情况下,一株细胞同时过表达和沉默也是有的,反正只要是过表达了获得表型,沉默了失去表型,就算是一正一反的证据都有了
- 单株细胞同时过表达和干扰的方法并不是最理想的,从道理上讲,如果一个细胞的某个基因表达量已经很高了,再过表达会不会有溢出效应,也许因为溢出了就没有表达了;反过来也是一样,一个基因的表达量已经很低了,我们还去沉默它,失去的表型是特异性作用的结果吗?这类问题经常容易被文章审稿人提出
- 替代单株细胞的研究方法不够理想,可以用rescue法替代掉
基因操作工具
- 查基因的mRNA序列,用于qPCR引物设计,过表达基因设计质粒和干扰RNA(siRNA),这种可以达成工厂化标准流程操作的分子生物学技术本身也比较适合进行外包,但是即使这些东西都是找公司定的,我们也要知道怎么查基因和蛋白的序列
- NCBI有很多子数据库,查基因序列的可以用Gene,Nucleotide和Protein,前两个使用的非常频繁,我们从Gene数据库中检索到一个基因,可以从Gene的页面链接到相关的mRNA信息(Nucleotide里)
- 识别基因不能单靠基因名称,因为一个基因有很多名称,主要靠基因ID,这是专有的识别标志
- 对于一个基因有多个名称的时候,检索文章要每个别名都搜一下
- 一个基因有多个名称的时候,在搜索文章的时候,可能一个关键词出来的搜索结果并不完全对应
- 基因的物种性:不同物种的基因序列大概率不一样,所以如果弄错了就做不出来了,物种是中括号里面的拉丁文,比如人是Homo sapiens,小鼠Mus musculus,大鼠Rattus norvegicus
- 仅仅做表达差异也是能发SCI的,这是有大量组织样本,并且配套详细临床资料的同学们可以尝试的套路,简单来说就是把表达差异和疾病的其他病理特征结合起来做统计分析,样本量不能太小,80-100例起步,临床资料也要提前收集,系统评估高表达/低表达是不是和某些临床特征有相关性,在肿瘤研究中比较常见
- 具体的数据格式:“三表一图”
选择基因转导工具的具体策略
- 常用的病毒载体:腺病毒adenovirus,慢病毒lentivirus,腺相关病毒adeno-associated virus,简称AAV
- 基因转导的具体选择要根据实验来斟酌,最可靠的是看细胞比较喜欢哪种病毒来进入,“按照口味来伺候”
腺病毒
- 腺病毒主要用来做基因过表达,做RNA干扰的时候免疫原性比较强,不怎么推荐
慢病毒
- 慢病毒尤其适合做RNA干扰实验,当然也可以用来进行CRISPR实验,对于表达短的插入片段,慢病毒表现相当不错
- 慢病毒可以说是没有生育能力的HIV-1病毒,很安全;慢病毒的本质是逆转录病毒,可以通过逆转录酶把序列整合到宿主细胞的基因组里,然后进行表达
- 慢病毒的优点是理论上因为基因整合到了基因组,所以可以长期稳定表达目标基因,当然这一点非常理论化,实际上长期培养会遇到表达基因丢失或者沉默效力减弱的情况(被重组或细胞代偿)
- 为了获得长期实验的材料,我们还是建议筛选稳转株,也就是分选感染成功的单克隆细胞再扩增或者用抗性基因进行压力筛选。在培养基中加了抗生素之后,只有整合了抗性基因的细胞才能存活下来,这样可以维持比较长期的性状稳定, 携带抗性基因也就意味着实现了目标分子转导的操作。
- 慢病毒也不全是优点,它的致命缺点是表达大片段的时候,包装效率会大幅降低,而且不同的基因包装效率也有不同,有时候基因不大但出毒效率也低。所以做过表达用慢病毒有一些限制,它基本算是一个标准的沉默载体。
腺相关病毒AAV
- 过表达用的很多,也可以用来干扰,效率都不错
- AAV有不同血清型可以选择,不同的血清型对不同细胞的感染效率是不一样的,有一些特异性的作用
- 总体来说应用场景还是比较丰富的
补充:shRNA和siRNA的关系
- shRNA-short hairpin RNA; siRNA-small interfering RNA
- 总结:这俩是同一个东西,一个是化妆前(shRNA),一个是化妆后(siRNA)
- 之所以质粒和病毒上会用到shRNA的结构,是因为shRNA相比于siRNA更加稳定,发夹结构是相对于RNA的稳定结构,形成双链有助于维持RNA在细胞内的稳定
细胞表型验证
效率验证
- 把质粒或病毒导入细胞内,抽提细胞的mRNA或蛋白,检测目标蛋白的表达情况
- 实验里面还要设计一个阴性对照,在过表达中,阴性对照是空载体;RNAi里是一段打乱了的无效序列,对任何序列都没有干扰调控作用的那种
- 在常规文章套路里,Fig1是组织和细胞表达的数据,Fig2就要开始做细胞水平的功能研究了,但是Fig2a应该先提供过表达或者沉默有效的数据,这是gain-of-function或loss-of-function之前的研究体系确认,有了这个数据工具才制备成功
剩下的内容
- Fig2剩下的小图,应该是一系列的、细胞水平的essays,用来检测表型功能的实验,每种固定的疾病+表型参数组合下,有固定的模、法、标套路,详见二十四型
- 一般来说,为了保证验证的严谨性,我们应当采用不同实验原理的实验反复验证同一个表型,这样细胞水平的结果Figure会很丰富,同一个实验用不同的细胞做;同一个细胞做不同的实验,这都是结果,都需要展示
动物表型验证
- Fig2是in vitro,相对应的Fig3就该出现in vivo 的内容了,也就是体内动物实验
- 有一些文章里,同一个表型的细胞和动物结果会用一张图来展示,这是因为杂志社可能对图片的总数有所限制,压缩篇幅,也可能是因为作者本身就喜欢这么搞
- 我们看文章要有自己的框架,在看文章的时候把文章的数据填进自己的框架内,而不是反过来被每篇文章的作者带往不同的框架,即“五马分尸”
- 表型的体内+体外实验,也就是细胞+动物,是普遍的论证规律,在功能基因研究的套路里分别是第三步和第四步
Rescue验证/回复实验
- 要形成逻辑严密的论证所必要的
- 在同一个条件下先正向再反向或反过来,观察表型的得而复失或反过来
- rescue可以很好地排除一个事情背后的假阳性本质,建立可靠的因果逻辑
rescue实验的常见套路
- 把基因用siRNA沉默掉
- 把稳定沉默目标基因的细胞分为两组,一组空载体对照,另外一组转录过表达载体,观察表型的变化
- 只有当过表达载体的表现为原来沉默失去的表型回复回来的情况下,才能证明表型是依赖分子存在而存在的,两者具有因果效应
- rescue的两次操作效应相反,观察到表型也在这两者之间波动,那么就毫无疑问地可以排除其他因素的干扰了
以虫子与庄稼来论证科研基因的五步法
表达有差异:
- 找两块土地,一块收成好,一块收成差
- 分别检测两块地上的虫子数量,证明收成好的那块总是与虫子数量低相关,相对的,收成差的那块地总是与虫子数量高相关
制备变量的操作工具
证明虫子有损害庄稼的表型
- 选两块质量差不多的地,一块放养好的虫子,另外一块放杀虫剂,观察庄稼的收成
体外做外做体内
- 围个大棚,排除外界的干扰,把前面做过的实验再做一遍
回复实验
总结
表达差异
正反回复
细胞动物