基于TGF-β通路相关基因构建胃癌的风险评分预测模型以及临床相关分析

目的:根据国际癌症研究机构(IARC)最新统计报道,胃癌仍是世界五大癌症之一,对人类的健康构成了极大的威胁。目前有关于转化生长因子β(TGF-β)通路的机制研究中,大量的研究结果表明TGF-β通路在多种恶性肿瘤中起着关键作用。但是,关于TGF-β通路在胃癌中的预后和肿瘤微环境特征方面的潜在作用仍需进一步研究。因此我们利用肿瘤基因组图谱公共数据库(TCGA)中胃癌患者基因数据,构建一个基于转化生长因子β通路相关基因的胃癌风险评分预测模型,并以此模型对胃癌的肿瘤微环境进行相关分析。方法:首先,从肿瘤基因组图谱公共数据库(TCGA)中下载胃癌及癌旁正常组织的基因表达数据以及临床数据,同时从多个数据库中和相关文献中总结了目前已被研究发现的TGF-β通路相关基因。利用R语言软件进行对癌组织和癌旁正常组织之间的差异表达基因(DEGs)的筛选提取,然后将DEGs与TGF-β通路相关基因合并,获取差异表达的TGF-β通路相关基因,随后利用基因表达谱数据动态分析(Gene Expression Profiling Interactive Analysis,GEPIA)在线平台分析差异表达的TGF-β通路相关基因与GC预后的相关性。再采用单因素和多因数COX回归分析筛选所得到的与预后显著相关基因,基于所获得预后显著相关基因进行风险评分预测模型的构建,随后通过所构建模型计算风险系数,并将中位数作为截点值,将胃癌样本分为低危险和高危险两组,然后通过进行Kaplan-Meier(K-M)生存分析,比较高低风险组的整体生存率(overall survival,OS)。再通过卡方检验验证预后指数与临床预后的相关性,单因素COX回归分析和多因素COX回归分析相关临床指标,进行验证该风险评分预测模型对胃癌患者是否可作为独立预后因素,评估风险评分预测模型有效性。然后,我们基于此模型所区分出的高低风险组,分析高低风险组之间差异表达基因在肿瘤微环境的作用以及功能富集的结果,进行ESTIMATE评分、免疫细胞浸润等相关功能分析。结果:1.通过TCGA数据库下载GC基因表达数据,经过筛选获得46个差异表达的TGF-β通路相关基因,通过GEPIA在线分析平台验证发现,共有17个基因与GC患者的预后相关,通过单因素、多因素COX分析,发现17个基因中只有COL1A2、GDF7、INHBB、SERPINE1显著相关(p<0.05)。2.基于COL1A2、GDF7、INHBB、SERPINE1建立了风险评分预测模型,预后指数(PI)公式为:预后指数(PI,Prognosis index)=(0.415×COL1A2的表达量)+(0cancer cell biology.432×GDF7的表达量)+(0.422×INHBB的表达量)+(0.628×SERPINE1的表达量)。计算出预后指数PI中位值后,共有159名患者纳入高危险组,158名患者纳入低风险组。K-M分析结果表明,高危组患者的预后较差。卡方检验结果表明,预后指数PI与GC患者生存状态、T分期有统计学差异(p<0.05),单因素COX回归分析显示:年龄,临床分期,预后指数、T分期、N分期、M分期均与OS相关。多因素COX回归结果显示:年龄、预后指数、M分期均是GC患者预后的独立影响因素。3.通过对高低风险组的差异表达基因进行免疫细胞浸润分析,结果表明高风险组患者的树突状细胞、巨噬细胞、嗜中性粒细胞细胞浸润程度比较低风险组更高。进行ESTIMselleck激酶抑制剂ATE评分分析,结果示高风险组的基质细胞浸润丰度明显高于低风险组。4.通过检索文献及胃癌治疗相关指南,筛选胃癌治S63845使用方法疗常见的化疗药物,进行化疗药物敏感性分析,结果示低风险组比高风险组药物敏感性更高。结论:我们通过公共数据库TCGA中胃癌基因表达数据构建了一个基于COL1A2、GDF7、INHBB、SERPINE1这四个TGF-β通路相关基因风险评分预测模型,该模型可作为评价GC患者预后的独立影响因素。此外,还进行了免疫细胞浸润分析。发现高风险组比低风险组基质细胞浸润丰度更高。以及化疗药物敏感性分析,低风险组比高风险组对于化疗药物敏感性更高,为以后胃癌患者制订个体化方案、针对性治疗提供了一定的方向。