① 如何看go数据库中查出来的pathway,是否与肿瘤相关
我对这个也不算非常了解,简单说下我的经验,仅供参考。
首先其实有很多pathway都与肿瘤相关,一般来说与肿瘤发生相关的pathway包括细胞信号转导(akt,notch,MAPK等)、细胞损伤修复(ATM,NHEJ等)、细胞周期调控(Cdk)、基因表达调控(如 p53)以及细胞迁移等,而且它们之间一般都有交叉。虽然大多数pathway都或多或少参与肿瘤发生,但是直接相关的一般是我提到的这些,主要作用于cancer的发生,成熟以及迁移。
其次,通过你这个图上列出来的这个肿瘤基因有可能参与的过程,我觉得有可能参与肿瘤发生的包括:regulation of cell morphogenesis(因为肿瘤细胞形成中细胞形态会发生变化);regulation of gene expression(比如p53就会抑制与cancer发生相关基因的表达,但这个功能实在太宽泛了,可以说所有细胞活动都和基因表达相关,请问你这个基因是transcript factor吗?如果是的话这就很可能是它直接参与cancer development的原因);positive regulation of peptidase activity (和前面那点一样,这种广谱性影响蛋白质变化的过程可以参与任何方面);response to corticosteroid (有可能通过response to一些皮质类激素调节cell signal);positive regulation of macromolecule biosynthetic process(调节大分子生物合成也可能影响蛋白质表达);anatomical structure formation involved in morphogenesis (同在morphogenesis的解释)。
最后说明一点,仅仅通过这种方法其实并不会很大的缩小范围,但是如果结合你的目的蛋白的功能研究(如果之前有相关文献报道或者你已知目的蛋白具有酶活性)或定位分析,就可以大大缩小范围了。
希望能对你有所帮助,如果有进一步问题,我们可以继续讨论。
② 什么是GO富集分析,常说的GO功能分析、功能分析、Pathway分析是什么意思
Gene Ontology可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分。蛋白质或者基因可以通过ID对应或者序列注释的方法找到与之对应的GO号,而GO号可对于到Term,即功能类别或者细胞定位。
功能富集分析: 功能富集需要有一个参考数据集,通过该项分析可以找出在统计上显着富集的GO Term。该功能或者定位有可能与研究的目前有关。
GO功能分类是在某一功能层次上统计蛋白或者基因的数目或组成,往往是在GO的第二层次。此外也有研究都挑选一些Term,而后统计直接对应到该Term的基因或蛋白数。结果一般以柱状图或者饼图表示。
1.GO分析
根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超几何分布关系,GO 分析会对每个有差异基因存在的GO 返回一个p-value,小的p 值表示差异基因在该GO 中出现了富集。
GO 分析对实验结果有提示的作用,通过差异基因的GO 分析,可以找到富集差异基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。
2.Pathway分析
根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异基因在该pathway 中出现了富集。
Pathway 分析对实验结果有提示的作用,通过差异基因的Pathway 分析,可以找到富集差异基因的Pathway 条目,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。与GO 分析不同,pathway 分析的结果更显得间接,这是因为,pathway 是蛋白质之间的相互作用,pathway 的变化可以由参与这条pathway 途径的蛋白的表达量或者蛋白的活性改变而引起。而通过芯片结果得到的是编码这些蛋白质的mRNA 表达量的变化。从mRNA 到蛋白表达还要经过microRNA 调控,翻译调控,翻译后修饰(如糖基化,磷酸化),蛋白运输等一系列的调控过程,mRNA 表达量和蛋白表达量之间往往不具有线性关系,因此mRNA 的改变不一定意味着蛋白表达量的改变。同时也应注意到,在某些pathway 中,如EGF/EGFR 通路,细胞可以在维持蛋白量不变的情况下,通过蛋白磷酸化程度的改变(调节蛋白的活性)来调节这条通路。所以芯片数据pathway 分析的结果需要有后期蛋白质功能实验的支持,如Western blot/ELISA,IHC(免疫组化),over expression(过表达),RNAi(RNA 干扰),knockout(基因敲除),trans gene(转基因)等。
3.基因网络分析
目的:根据文献,数据库和已知的pathway 寻找基因编码的蛋白之间的相互关系(不超过1000 个基因)。