科研中的还原论/模块化思维
关于基因的“人生三问”
- 基因是谁——基因注释
- 基因从哪里来——通路分析,研究基因的上游有哪一些分子
- 基因到哪里去——通路分析,研究基因的下游有哪一些效应分子
为什么要做基因富集分析
- 基因富集分析是分析基因功能的一种方法,主要包括GO分析,即Gene Ontology基因本体论分析和Pathway 分析,即信号通路分析。
- GO分析包括三个部分,分别为MF(Molecular Function分子功能分析)、BP(Biological Process生物过程分析)和CC(Cellular Components细胞组成分析)。
- Pathway分析主要由KEGG、 QIAGEN和Reactome等通路数据库组成
通路数据库KEGG
KEGG数据库简介
得KEGG者可得基因通路分析,KEGG在通路富集分析江湖中处于老大的地位
- KEGG的全称为Kyoto Encyclopedia of Genes and Genomes,也就是京都基因与基因组百科全书,这是一个综合性的网站,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立,是最为知名和通用的通路数据库。
- 通路图可直接用于SCI文章。
- KEGG 数据库组成包括系统信息、基因组信息、化学信息和健康信息四大部分,进一步再分为18个子数据库。最核心的为信号通路检索KEGG PATHWAY数据库,但是本节课用到的主要是KEGG GENES这个数据库。
- KEGG版本知识库和网站功能不定期更新, 参考文献为PMID:30321428。
- 总结:KEGG是从分子水平信息,特别是基因组测序和其他高通量实验技术产生的大规模分子数据集,了解细胞、生物体和生态系统等生物系统的高级功能和实用性的综合性数据库。信息检索是它的一般功能,信号通路检索和KEGG Mapper才是它的核心功能,本节课的单基因分析只需要用到核心功能的信号通路检索。