banner

三十六策 Lesson 27 半壁江山

  • Home
  • 解螺旋·三十六策
Scroll down
TIP

这些是本篇文章的标签,来发现更多感兴趣的内容吧
科研
解螺旋
三十六策

  • 经过三十六策前两节课的学习,我们已经整理了细胞交互的逻辑框架,并且熟悉了用在这个套路中共通的,以及独有的分子类型,细胞交互有它自己的论证格式,毕竟是涉及到了两种细胞以及胞外胞内的信号传递。从今天开始的三节课,我们要展开学习细胞交互的具体论证套路。
  • 这节课会给大家介绍细胞交互课题框架中最简约的一种文章思路。我们来回忆一下,上一节课中我们讨论了讲了参与细胞交互的变量角色,除了我们在Lesson 4提出,并且在Lesson 9Lesson 11Lesson 12进一步讨论的那些分子类型,有编码基因的产物蛋白、miRNA、lncRNA、circRNA,它们都存在circulating循环的形式,还有专门用来循环的特殊分子类型,也就是cfDNA、cfRNA。循环分子从细胞里分泌出来,或者细胞裂解了释放出来。“裸体”在循环系统游泳是一种情况,但为了安全起见,它们可能更倾向于外面包裹一层囊泡结构,“穿上衣服:更容易在循环系统中保持稳定。囊泡有微泡、外泌体、凋亡小体三种主要形式,我们需要聚焦的就是当前最流行的外泌体。
  • 外泌体里面会有蛋白、RNA,还有脂质和一些代谢小分子,其中执行调控性功能的RNA是目前最受欢迎的研究对象。miRNA+外泌体的组合已经在基础科研中进化得比较成熟,现在最新的变化就是把非编码RNA的复杂度再增加,尝试lncRNA和circRNA加上外泌体的细胞间交互对象研究,这在套路格式上达到了现阶段的创新顶峰。
  • 有一点需要注意,外泌体是双层磷脂膜的结构,跟细胞膜一样,它的膜上也有跨膜蛋白,这些蛋白可以作为信号分子,与受体细胞膜上的受体蛋白产生结合,这也是直接作用机制。蛋白+蛋白的直接机制嵌套到细胞交互的研究模型中, 一样有显著的故事性提升,是高分文章的基础架构。

复习:分子机制的“半套”思路

  • 在研究间接机制的时候,我们通常会检测通路中的明星分子表达变化,很多时候分子有磷酸化的状态,会去检测总蛋白以及磷酸化蛋白表达的变化,以它们的比值来提示通路活化或者抑制情况。
  • 这个时候主变量是上游发挥调控功能的分子,下游是通路的明星分子,它们之间一定有能介导磷酸化生物学过程的变量,不然怎么会有蛋白磷酸化水平的改变呢?这个推论是自然而然的,有果必有因。在很多文章里,我们会发现作者并没有详细讨论这个问题,具体是哪个激酶调节的上游驱动因素就这么一言不发给忽略掉了,只检测磷酸化状态的变化,不找磷酸化的上游效应分子,把特异性的激酶变化检测一下,把磷酸化变化从哪里来的问题说清楚。为什么会这样?其实很好理解, 我们吃饭的时候会纠结这米到底是谁种的吗?更大的可能是停留在“反正肯定有人种就是了”就满足了。作为机制找到的这些明星分子已经是不知道多少个环节之后的下游了,既然不是主变量发生磷酸化,那即使找到了激酶还是间接机制,知其然不知其所以然,低分的文章没有必要执着于跟主变量关系相对远的机制细节。
  • 当主变量存在某种修饰的时候,是不是也有这样的论证省略呢?有,而且普遍存在,比如DNA甲基化,我们在解释主变量发生表达变化原因的时候,有一种策略是做启动子区CpG岛甲基化检测,通过启动子位点的甲基化状态的改变,来解释基因为什么被“封印了”或者“解封印了”。这时候是不是必须去找上游介导甲基化或者去甲基化途径的催化酶?我们在 Lesson 17提到过,可以检测,也可以不检测,如果检测的话,故事就更圆满,不检测的话,就是知其然不知其所以然,跟间接机制的层次差不多。同样,组蛋白甲基化,也可以检测一下位点,就草草结束。文章讨论的时候有机制,可以推测组蛋白甲基化水平变化是一种上游驱动因素,但是再说细一点,就不知道从哪里开始了。
  • 由此延伸出去,RNA修饰、以及蛋白的各种五花八门的修饰形式也会这样,都有这种直接机制做一半的策略,也就是只讨论分子变量状态的变化, 回避上游谁调控的问题。可以说在涉及分子修饰的研究中,做半套是常见的减配手段。有个道理大家要明白,其实不是做分子+通路组合的人不知道分子+分子故事的可读性更高, 也不是做间接机制的人不知道直接机制能文章发得更好,有可能原因仅仅在于他们评估了自己,觉得难做不了,或者想偷懒所以选择Eas 模式。文章影响因子有高有低,大家量力而行也无可厚非。分子修饰的半套机制也算是从全套简化而成的一种策略,在逻辑的本质上,跟直接机制太难,做间接有相似性。

细胞交互的“半套”思路

  • 这一节课的题目是半壁江山,如果把江山比做细胞交互的逻辑,那我们今天会cover这些内容某种意义上的一半,也就是细胞交互的“半套”思路。
  • 我们之所以会专门挑选出一节课,来专门介绍细胞交互的半套简配,是因为前面说到的几种省略手段相对简单,用不着单独一策来讲,而从逻辑复杂度最高的细胞交互层次中省略下来的半套细胞交互,依然保留了研究直接分子交互的可能性,依然具备到达10分甚至更高文章水平的潜在能力, 可谓是瘦死的骆驼比马大。
  • 从最高级套路上省略下来的半套策略依然是华丽的,值得作为一个独立的典型套路来讨论,我们今天就来详细解构一下细胞交互的半壁江山。
  • 所谓细胞交互的半套机制,就是从哪里来和到哪里去的问题只研究一半,要么研究一种供体细胞的病理过程,说明这种病理过程中会释放某个循环分子,这个分子可以作为疾病的Biomarker,或者先提出发现了一个分子伴随疾病的发生有特异性表达增高的现象(一般是研究增高,致病因素),先说明这个分子可以作为 Biomarker,然后研究某一种受体细胞接受了这个信号分子之后发生与疾病相关的表型过程。
  • 它们有一个共同的套路源头,都是先建立循环分子与疾病临床特征之间的相关性,问题从临床而来,然后开始细胞动物、分子机制的研究。这就特别适合有丰富临床样本的医生们来搞研究,尤其是循环分子,还只需要体液样本,不涉及组织,大大拓展了能开展的科室范畴,在医学研究中可谓万金油一样的存在,这种以循环Biomarker为切入点,在某一种供体细胞或者受体细胞里面,做一套分子机制的文章策略,大家应该纳入自己的知识体系范畴,在科研起步阶段,可谓一件发文利器。

半套细胞交互的操作步骤

  • 我们应该先明确,细胞交互的课题中,主角依然是变量,只是从常规分子类型拓展到了循环分子类型。

第一步:以疾病Biomarker为研究对象的课题套路

  • 一个循环分子,作为Biomarker被提出来,应该需要一系列数据的支撑,这套数据需要符合具有临床意义的原则,要么是用在疾病诊断上,要么是用在预后评估上,要么是用来判断某些治疗方法的疗效。
  • 我们前面有讲过临床相关性研究的三表一图经典数据套路,这个数据套餐格式大家必须掌握:三表是基线资料表、单因素分析表、多因素分析表,再加上预后生存曲线图。比较多因素对生存的影响可以用COX回归模型,用列线图作为一种数据表现形式。循环分子检测完表达值之后,一样可以用这套数据格式来分析与疾病临床特征的相关性。
  • 除此之外,涉及到诊断的意义,还要再引入一个数据图——ROC曲线图。ROC曲线英文是receiver operating characteristic curve,翻译过来是受试者工作特征曲线,一般都是叫ROC曲线。
  • 关于ROC曲线,大家只需要记住2个特征:
    • 第一,ROC曲线是用来评估一种检测方法与另一种金标准的检测方法之间敏感性和特异性的差别,也就是可以用来表征一种新的诊断方法与传统的策略相比诊断效能如何
    • 第二,ROC曲线可以用来设置诊断的cut-off值,也就是检测值多高算高表达、多低算低之间的阈值,这是以ROC曲线的曲线下面积AUC (area under the ROC curve)推导出来的。
    • AUC的值不会低于0.5,因为就算靠掷硬币来诊断患者,结果完全随机,AUC也有0.5;AUC也不可能是1,灵敏度100%,假阳性率0%,任何诊断方法都不可能完全不误诊和漏诊。
    • 一般来说,AUC在0.50.7时可以认为诊断效能偏低,发文章有问题,AUC在0.70.9比较常见,有一定的诊断应用潜力,AUC>0.9就是一种诊断准确性非常高的方法了。
  • ROC曲线有一个奇怪的地方,它的纵坐标是敏感度,横坐标是 (1-特异度),为什么不直接以特异度来做横坐标呢?这需要稍微了解一下ROC曲线来源的背景。
    • ROC曲线最初是为军事用途服务的,在第二次世界大战的时候由工程师发明,用于评价雷达兵的工作效能。雷达兵就是ROC曲线里面的R,reciever,信号的接收者,ta的任务就是天天盯着雷达显示器,观察屏幕上是否出现代表敌机的光点。
    • 当显示屏上出现光点有两种可能性,一种是雷达确实探测到了敌机,另一种是有飞鸟或其他非军事的目标从雷达探测区域经过。如果确实是敌机,雷达兵也发出警报,那就是“真阳性”;如果雷达兵没发出警报,那就是“漏报”;也有可能是假的目标雷达兵却把它当作敌机,这是“误报”;如果正确地把假目标识别为噪音,那是“真阴性”。
    • 真阳性是敏感性,真阴性就是特异性。ROC曲线最初就是用来描述雷达兵工作业绩一种图形工具,后来才引入医学诊断研究中,在雷达兵的业绩评价上,领导们关心的是真阳性率和假阳性率,也就是报警报之后到底敌机是真的还是假的,假阳性率就是(1-真阴性率)。所以才会有今天大家常见的ROC曲线坐标系,横坐标是(1-特异度)。
  • 在以循环分子为主变量的半壁江山套路中,从主变量的表达差异和临床意义入手,与我们前面讲的单变量研究思路是一致的,但在数据表现的层次上可以展现的维度更多。
    • 循环分子天然就是有诊断潜力的分子类型,所以涉及这一类主变量,在临床相关性的研究中ROC曲线是一个特征性数据,表达有差异不代表就一定有诊断价值,因为组织标本不是想取就能取到,循环分子之所以可以独立成为一个套路,正是因为它临床转化的意义非常显著:液态活检、分子诊断都是闪亮的概念,加上一些统计方法后,除了单指标也可以做多指标的联合,数据就更丰富了。
    • 这样一套数据本身不做细胞动物、表型验证和机制就可以发SCI,并不是新套路,组织标本的表达检测、临床相关性统计分析,本来就是可以发SCI的,还可以结合样本数据库,用别人发布的检测数据进行外部的双重验证。
  • 小结一下,半套细胞交互的套路步骤的第一步,是针对主变量的循环分子,无论是“裸体的”还是“坐车的”,检测它的表达做一套相关性统计分析,这种策略还有一个比较容易理解的名称,以疾病Biomarker为研究对象的课题套路,我们蘑菇老师就制作了一门Biomarker的套路课, 专门讲解这种常见套路的操作细节,大家可以去学一下,掌握了筛+猜分子的经验和心得后,往里套变量就是源源不断的文章。
  • 细胞交互课题的变量从何而来,依然是筛猜,没有第三条路径。数据可以是自己收集样本进行筛选,也可以找别人的高通量数据进行二次挖掘,如果目标不是发顶尖文章,那么你能想到的问题,大概率别人都筛过。咱们目标是发篇IF=3的SCI,就不用老想着套路要多么华丽,分子要多么创新,机制要多么深入了。在文章IF=3-5的档次,二元间接机制,分子+通路,把细胞、动物和组织标本来源的数据都做到,就完全能胜任了,连半套细胞交互的策略都有点杀鸡用牛刀的感觉。

第二步:确定交互的细胞与交互形式

  • 交互的细胞一共就2种,要么回答主变量从哪里来,做供体细胞分泌主变量的机制;要么回答主变量有什么生物学效应,做受体细胞接受主变量调控的具体机制。

交互的细胞怎么选

  • 一般来说,机制的解释是先下后上的,下游优先级更高,但这里需要注意,是做上还是做下,要依据分子的功能特性而定。
  • 我们故事的开头,是先把主变量的临床意义解释清楚,一个有诊断价值的Biomarker需要一定是一个效应分子吗?回答是否定的,它可以是一个生物学效应的伴随产物,甚至是一个“废物”。比如一个药物进入人体能代谢出一种小分子,这种分子能指示药物吸收的情况,但是它不是药效分子,也自然没有下游效应的故事。另一个例子是新生儿唐筛,它检测的cfDNA有生物学效应吗?也许有,但不重要,我们关心的就只是它作为Biomarker的意义。
  • 从逻辑上来看,关注下游效应的受体细胞途径的情况,适用于主变量是信号分子,它的作用是在细胞间传递信号;而主变量没有特定的信号传递功能情况下,解答上游如何释放环节的问题就成了优先考虑的研究角度。 这是做半套机制到底是上还是下的选择规律。总结来说,能下还是要下,不能下那就溯源,具体来说下和上是由分子的特性决定的,信号分子可上可下,做半套就做下;非信号分子,下游问题展不开,那半套就只能做上游。
  • 在基础研究的范畴里,大部分故事的主变量是有信号传导功能的,但是循环分子里也有ctDNA这种伴随细胞裂解而产生的,比较特殊的分子类型,我们就需要注意半套策略的倾向问题。当前有些代谢组学的研究,筛选体液中的特征性小分子,这些小分子作为Biomarker一套临床相关性数据做完,往下游找效应不太容易自圆其说,因为可能就是代谢的终产物, 那就重点放在谁分泌了它们,把亲缘关系找到也行,这是半套做法中的逻辑走向。

发生交互的具体形式是什么

  • 分子是供体细胞主动分泌的, 还是细胞破碎的时候带出来的?受体细胞是膜上接受信号,还是把信号分子吞进去,再发生分子间的交互作用的?宏观上基本就这么几种交互形式,不复杂,但是涉及具体细节,还是要结合文献来探索机制。
  • 有一点大家明确,我们不需要去发现一种新的分子释放或者接收的机制,这种机制只需要照搬前人工作就行了,什么样的分子类型会涉及什么释放和吸收机制,都有文献的模板可以参考。比如分泌蛋白有信号肽,外泌体是由胞内的多泡小体与细胞膜融合后释放的,中间有关键蛋白的调控过程,这都有文献报道。阻断了这些关键蛋白,就可以验证外泌体携带的分子是不是某种细胞释放,反过来受体细胞接受信号也大致相同,有固定模式可循。
  • 细胞间交互模式是来源于常识,很大程度是由你主变量的分子类型来决定的。

第三步:验证主变量与表型的关系

  • 对于上游来说,是验证表型出现与主变量释放的关联,而对于下游来说,是验证主变量被受体细胞接收,与表型获得Gain of function之间的关联。这里应该关注模型中的一个操作细节,Gain of function一般是在细胞里做过表达,在细胞交互的课题设计里,还有把循环分子直接加到细胞培养上清的做法,也就是直接加到培养基里,因为受体细胞成功接收信号是发挥相应生物学作用的前提, 我们不能用人为转导分子的操作来替代细胞接收信号的过程,所以这一组把主变量加到细胞培养上清中的策略是细胞交互研究中多出来的,动物实验也需要增加相应的分组。
  • 严谨起见,在受体细胞直接过表达主变量的表型实验还是需要做,这还是属于double check, 双重验证,增加分子与表型之间关系的说服力。上游的供体细胞思路一样吗?本质上是大同小异,差异之处是在于表型与分子的因果关系颠倒了,上游变成表型出现,与分子在培养上清中表达变化的关系,是用建立模型的手段去诱导细胞,然后检测培养上清中释放的主变量变化。如果把问题考虑的再深入一点,同样也可以在供体细胞过表达主变量,看主变量表达的增加,与释放增加有没有关系。

第四步:机制

  • 半壁江山策略第四步,终于到了机制环节。最难的部分我反而要松一口气,因为机制的套路之前的课程全部都讲过。
  • 细胞交互是在细胞外的时候有诸多的差别,一旦分子到了细胞里, 那就跟单细胞模型研究一样的了。细胞交互的半套,只做供体细胞或者受体细胞里的机制, 所以搞个二元关系就差不多了,在单个细胞内上下游都有的完美三元结构在这里不存在。
  • 二元关系,有间接和直接之分,那水平又天差地别了。间接作用,来一个通路,检测明星分子,最多Rescue一下搞定;直接机制的内容可以参考之前的课程,以分子类型来归类分子交互模式。验证了直接结合,还要验证结合位置,那是一套工作量不小,实验难度也比较大的细活。有同学要说了,我做半套,主要目的还是为了发篇性价比较高的文章,特别难的机制我也做不了,循环分子检测还能做,发个三五分我已经很满足了,那你就尝试把通路间接机制做完,以Rescue验证作为收尾,应该就差不多了。
  • 直接机制是基础科研细节难度的顶峰,宏观的逻辑顶峰是多元变量组合,嵌套在二元细胞模型里,细节和宏观组合起来都是顶配,确实不是容易习得的高深武功。
  • 不要怪我越讲越深,说好了是半套,四步走下来也并不轻松。一方面基础科研确实是深不可测;另一方面,我要为优秀的学员们准备足够的营养。

总结

  • 我们今天探讨了细胞交互类型课题的半套做法,半套是一种减配,但即使是从最复杂套路减下来的一半模型,依然有一个完整的细胞研究对象,要么是供体细胞,要么是受体细胞,所以单变量研究的表达差异、正反回复、细胞动物,多元变量的主次、上下、间接、直接这些规范动作还可以完整得表现出来,从数据内容的丰富程度而言,构成一个值得单独作为一策来拆解的套路是没有问题的。
  • 有前面的知识基础,单变量的五步法,多元论证调控关系和Rescue验证就不展开说了,还是按照之前教的来沿用。
  • 这节课我们主要总结了 4 个步骤的半套细胞交互研究方法:
    • 第一步,检测主变量分子表达,做一套临床相关性的统计分析,先把临床意义明确,这一步单独拆出来就是Biomarker的研究套路,也可以独立发SCI
    • 第二步,确定交互的细胞与交互形式。交互的细胞因为是半套机制所以只有一个,而交互的形式根据分子类型来假设,有基本的思路范围,可以从文献里找。
    • 有了细胞模型大概的信号传导假设,就要进行第三步,细胞表型验证,无论如何主变量与表型的关系还是一篇文章的重中之重,虽然仅仅提出 Biomarker 的临床意义也可以发文章,但基础的文章重点还是在表型和机制上。
    • 说到机制,表型做完接下来就是无边无际的机制的海洋,在之前的课程中我们已经讲了很多,不仅要考虑主变量是什么类型的分子,还要考虑交互的因变量分子是什么类型的,不同类型的分子交互有不同的研究方法。高端的科研设计是把直接机制放到细胞交互的半套做法中,这样也可以冲击高分文章。玩好直接机制起点就是IF=5左右,再加上前面那一堆临床诊断价值的吹捧, 液态活检的想象空间,文章的含金量哪怕是半套,也不会逊色于不涉及细胞交互模式的单细胞研究课题。
Other Articles
Article table of contents TOP
  1. 1. 复习:分子机制的“半套”思路
  2. 2. 细胞交互的“半套”思路
  3. 3. 半套细胞交互的操作步骤
    1. 3.1. 第一步:以疾病Biomarker为研究对象的课题套路
    2. 3.2. 第二步:确定交互的细胞与交互形式
      1. 3.2.1. 交互的细胞怎么选
      2. 3.2.2. 发生交互的具体形式是什么
    3. 3.3. 第三步:验证主变量与表型的关系
    4. 3.4. 第四步:机制
  4. 4. 总结
Find Something Special?