可左右滑动选省市

一种基于基因表达信息预测早期肺腺癌进展的方法及装置-9479威尼斯

更新时间:2024-08-01
一种基于基因表达信息预测早期肺腺癌进展的方法及装置 专利申请类型:发明专利;
源自:上海高价值专利检索信息库;

专利名称:一种基于基因表达信息预测早期肺腺癌进展的方法及装置

专利类型:发明专利

专利申请号:cn202210391575.5

专利申请(专利权)人:复旦大学附属肿瘤医院
权利人地址:上海市徐汇区东安路270号2号楼1203室

专利发明(设计)人:赵悦,高健,李媛,曹志伟,陈海泉

专利摘要:本发明公开了一种基于基因表达信息预测早期肺腺癌进展的方法及装置,其中,方法包括步骤:使用统计学方法筛选出肿瘤相关基因和免疫相关基因,基于此两组基因的表达量计算了肿瘤生长指数和免疫功能指数,最后将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。本发明方法可以预测肺腺癌患者的肿瘤‑免疫系统平衡状态,并据此评估肿瘤的进展水平。

主权利要求:
1.一种基于基因表达信息预测早期肺腺癌进展的方法,其特征在于,包括步骤:根据肿瘤病理学特征,将获取的肺部组织依次划分成正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌四类,对四类组织分别进行全转录组测序,生成测序文库;
将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组、原位腺癌与微浸润性腺癌对照组,以及微浸润性腺癌与浸润性腺癌对照组组成;
对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因;
在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因,根据所述肿瘤相关基因计算肿瘤生长指数;
在所述差异表达基因中筛选出在正常组织与原位腺癌对照组和微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因,根据所述免疫相关基因计算免疫功能指数;
将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。
2.根据权利要求1所述基于基因表达信息预测早期肺腺癌进展的方法,其特征在于,对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因的步骤包括:对测序文库中的每一个基因在所述三个对照组的每个对照组进行方差分析,将p<
0.0001和组间|log2‑表达倍数|大于等于2的基因作为差异表达基因。
3.根据权利要求1所述基于基因表达信息预测早期肺癌进展的方法,其特征在于,在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因包括bcl2l15、comp、cst1、fam83a、slc44a5、pglyrp4、clpsl2、arsh、cdh17、col10a1、spp1、mmp3、ddx4、fgf11、casr。
4.根据权利要求3所述基于基因表达信息预测早期肺癌进展的方法,其特征在于,根据所述肿瘤相关基因计算肿瘤生长指数的步骤包括:将肿瘤相关基因的表达量进行log2对数转换,然后对于每个样本,将肿瘤生长指数计算为肿瘤相关基因表达量的log2对数转换的平均值,所述肿瘤生长指数的计算公式为:其中,tpm为肿瘤相关基因的表达量,n为肿瘤相关基因的
数量。
5.根据权利要求1所述基于基因表达信息预测早期肺癌进展的方法,其特征在于,在所述差异表达基因中筛选出在正常组织与原位腺癌对照组、微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因包括itln2、marco、c8b、masp1、cd36、tal1、ppbp、cdh5、msr1、tbx21、c6、mcam、gzmh、czmb、cxcl12、lilrb2、cxcr1、cxcr2、lamp3、il1rl1。
6.根据权利要求5所述基于基因表达信息预测早期肺癌进展的方法,其特征在于,根据所述免疫相关基因计算免疫功能指数的步骤包括:将免疫相关基因的表达量进行log2对数转换,然后对于每个样本,将免疫功能指数计算为免疫相关基因表达量的log2对数转换的平均值,所述免疫功能指数的计算公式为:其中,tpm为免疫相关基因的表达量,n为免疫相关基因的数
量。
7.一种基于基因表达信息预测早期肺癌进展的装置,其特征在于,包括:
测序模块,用于根据肿瘤病理学特征,将获取的肺部组织依次划分成正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌四类,对四类组织分别进行全转录组测序,生成测序文库;
分组模块,用于将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组、原位腺癌与微浸润性腺癌对照组,以及微浸润性腺癌与浸润性腺癌对照组组成;
差异表达基因确定模块,用于对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因;
肿瘤生长指数计算模块,用于在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因,根据所述肿瘤相关基因计算肿瘤生长指数;
免疫功能指数计算模块,用于在所述差异表达基因中筛选出在正常组织与原位腺癌对照组和微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因,根据所述免疫相关基因计算免疫功能指数;
肿瘤进展指数计算模块,用于将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。
8.根据权利要求7所述基于表达信息预测早期肺癌进展的装置,其特征在于,所述肿瘤生长指数计算模块包括:肿瘤相关基因筛选单元,用于在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因包括bcl2l15、comp、cst1、fam83a、slc44a5、pglyrp4、clpsl2、arsh、cdh17、col10a1、spp1、mmp3、ddx4、fgf11、casr;
肿瘤生长指数计算单元,用于将肿瘤相关基因的表达量进行log2对数转换,然后对于每个样本,将肿瘤生长指数计算为肿瘤相关基因表达量的log2对数转换的平均值,所述肿瘤生长指数的计算公式为: 其中,tpm为肿瘤相关基因的表达量,n为肿瘤相关基因的数量。
9.根据权利要求7所述基于表达信息预测早期肺癌进展的装置,其特征在于,所述免疫功能指数计算模块包括:免疫相关基因筛选单元,用于在所述差异表达基因中筛选出在正常组织与原位腺癌对照组、微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因包括itln2、marco、c8b、masp1、cd36、tal1、ppbp、cdh5、msr1、tbx21、c6、mcam、gzmh、czmb、cxcl12、lilrb2、cxcr1、cxcr2、lamp3、il1rl1;
免疫功能指数计算单元,用于将免疫相关基因的表达量进行log2对数转换,然后对于每个样本,将免疫功能指数计算为免疫相关基因表达量的log2对数转换的平均值,所述免疫功能指数的计算公式为: 其中,tpm为免疫相关基因的表达量,n为免疫相关基因的数量。 说明书 : 一种基于基因表达信息预测早期肺腺癌进展的方法及装置技术领域[0001] 本发明涉及生物信息学技术领域,尤其涉及一种基于基因表达信息预测早期肺腺癌进展的方法及装置。背景技术[0002] 在肺癌的所有病理学亚型中,肺腺癌(lungadenocarcinoma,luad)是最常见的病理学亚型。而若能在肺腺癌的癌前病变‑原位腺癌(adenocarcinomainsitu,ais)和微浸润性腺癌(minimallyinvasiveadenocarcinoma,mia)阶段予以手术切除,则患者的术后五年生存率可达到或接近100%。一旦进展到浸润性腺癌,患者的预后会有明显的下降,因此,有必要研究肺腺癌的演变过程,以发现新的靶点和开发新的治疗方法。尽管已经对ais、mia和luad患者的基因组和免疫分析进行了研究,但缺乏针对推动肺腺癌演变的关键分子事件的系统研究。[0003] 由于肺腺癌的浸润前肿瘤样本数有限,目前国际上对肺腺癌的癌前病变的基因组学研究甚少,目前尚无技术可以预测早期肺腺癌的进展过程。[0004] 因此,现有技术还有待于改进和发展。发明内容[0005] 鉴于上述现有技术的不足,本发明的目的在于提供一种基于基因表达信息预测早期肺腺癌进展的方法及装置,旨在解决现有技术缺少可以准确预测早期肺腺癌进展过程的方法和装置的问题。[0006] 本发明的技术方案如下:[0007] 一种基于基因表达信息预测早期肺腺癌进展的方法,其中,包括步骤:[0008] 根据肿瘤病理学特征,将获取的肺部组织依次划分成正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌四类,对四类组织分别进行全转录组测序,生成测序文库;[0009] 将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组、原位腺癌与微浸润性腺癌对照组,以及微浸润性腺癌与浸润性腺癌对照组组成;[0010] 对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因;[0011] 在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因,根据所述肿瘤相关基因计算肿瘤生长指数;[0012] 在所述差异表达基因中筛选出在正常组织与原位腺癌对照组和微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因,根据所述免疫相关基因计算免疫功能指数;[0013] 将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。[0014] 所述基于基因表达信息预测早期肺腺癌进展的方法,其中,对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因的步骤包括:[0015] 对测序文库中的每一个基因在所述三个对照组的每个对照组进行方差分析,将p<0.0001和组间|log2‑表达倍数|大于等于2的基因作为差异表达基因。[0016] 所述基于基因表达信息预测早期肺癌进展的方法,其中,在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因包括bcl2l15、comp、cst1、fam83a、slc44a5、pglyrp4、clpsl2、arsh、cdh17、col10a1、spp1、mmp3、ddx4、fgf11、casr。[0017] 所述基于基因表达信息预测早期肺癌进展的方法,其中,根据所述肿瘤相关基因计算肿瘤生长指数的步骤包括:[0018] 将肿瘤相关基因的表达量进行log2对数转换,然后对于每个样本,将肿瘤生长指数计算为肿瘤相关基因表达量的log2对数转换的平均值,所述肿瘤生长指数的计算公式为: 其中,tpm为肿瘤相关基因的表达量,n为肿瘤相关基因的数量。[0019] 所述基于基因表达信息预测早期肺癌进展的方法,其中,在所述差异表达基因中筛选出在正常组织与原位腺癌对照组、微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因包括itln2、marco、c8b、masp1、cd36、tal1、ppbp、cdh5、msr1、tbx21、c6、mcam、gzmh、czmb、cxcl12、lilrb2、cxcr1、cxcr2、lamp3、il1rl1。[0020] 所述基于基因表达信息预测早期肺癌进展的方法,其中,根据所述免疫相关基因计算免疫功能指数的步骤包括:[0021] 将免疫相关基因的表达量进行log2对数转换,然后对于每个样本,将免疫功能指数计算为免疫相关基因表达量的log2对数转换的平均值,所述免疫功能指数的计算公式为: 其中,tpm为免疫相关基因的表达量,n为免疫相关基因的数量。[0022] 一种基于基因表达信息预测早期肺癌进展的装置,其中,包括:[0023] 测序模块,用于根据肿瘤病理学特征,将获取的肺部组织依次划分成正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌四类,对四类组织分别进行全转录组测序,生成测序文库;[0024] 分组模块,用于将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组、原位腺癌与微浸润性腺癌对照组,以及微浸润性腺癌与浸润性腺癌对照组组成;[0025] 差异表达基因确定模块,用于对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因;[0026] 肿瘤生长指数计算模块,用于在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因,根据所述肿瘤相关基因计算肿瘤生长指数;[0027] 免疫功能指数计算模块,用于在所述差异表达基因中筛选出在正常组织与原位腺癌对照组和微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因,根据所述免疫相关基因计算免疫功能指数;[0028] 肿瘤进展指数计算模块,用于将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。[0029] 所述基于表达信息预测早期肺癌进展的装置,其中,所述肿瘤生长指数计算模块包括:[0030] 肿瘤相关基因筛选单元,用于在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因包括bcl2l15、comp、cst1、fam83a、slc44a5、pglyrp4、clpsl2、arsh、cdh17、col10a1、spp1、mmp3、ddx4、fgf11、casr;[0031] 肿瘤生长指数计算单元,用于将肿瘤相关基因的表达量进行log2对数转换,然后对于每个样本,将肿瘤生长指数计算为肿瘤相关基因表达量的log2对数转换的平均值,所述肿瘤生长指数的计算公式为: 其中,tpm为肿瘤相关基因的表达量,n为肿瘤相关基因的数量。[0032] 所述基于表达信息预测早期肺癌进展的装置,其中,所述免疫功能指数计算模块包括:[0033] 免疫相关基因筛选单元,用于在所述差异表达基因中筛选出在正常组织与原位腺癌对照组、微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因包括itln2、marco、c8b、masp1、cd36、tal1、ppbp、cdh5、msr1、tbx21、c6、mcam、gzmh、czmb、cxcl12、lilrb2、cxcr1、cxcr2、lamp3、il1rl1;[0034] 免疫功能指数计算单元,用于将免疫相关基因的表达量进行log2对数转换,然后对于每个样本,将免疫功能指数计算为免疫相关基因表达量的log2对数转换的平均值,所述免疫功能指数的计算公式为: 其中,tpm为免疫相关基因的表达量,n为免疫相关基因的数量。[0035] 有益效果:本发明根据对不同发展阶段的肺腺癌的全转录组测序数据的结果,筛选出能够预测从肺原位腺癌(adenocarcinomainsitu,ais)到微浸润性腺癌(minimallyinvasiveadenocarcinoma,mia)再到浸润性腺癌(invasiveadenocarcinoma,luad)的进化过程的关键基因,包括一组与肿瘤自身的生长潜力相关的肿瘤相关基因和一组与周围免疫系统的功能水平相关的免疫相关基因,以这些关键基因的标准化表达量进行建模,计算出对应的肿瘤生长指数和免疫功能指数,最后将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。本发明可反映不同发展阶段的肺腺癌的肿瘤‑免疫平衡状态,从而实现预测肺腺癌的进展与患者的预后。附图说明[0036] 图1为本发明一种基于基因表达信息预测早期肺腺癌进展的方法流程图。[0037] 图2为肺腺癌进展过程中2023个基因的12个表达模式。[0038] 图3为肿瘤进展指数在a)本申请数据集,b)外部验证集和c)tcga‑luad数据集中不同肺腺癌发展阶段的比较结果图。[0039] 图4为在本申请数据集和tcga‑luad数据集中,不同肿瘤进展指数的肺腺癌患者的预后生存比较结果图。具体实施方式[0040] 本发明提供一种基于基因表达信息预测早期肺腺癌进展的方法及装置,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。[0041] 请参阅图1,图1为本发明提供的一种基于基因表达信息预测早期肺腺癌进展的方法流程图,如图所示,其包括步骤:[0042] s10、根据肿瘤病理学特征,将获取的肺部组织依次划分成正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌四类,对四类组织分别进行全转录组测序,生成测序文库;[0043] s20、将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组、原位腺癌与微浸润性腺癌对照组,以及微浸润性腺癌与浸润性腺癌对照组组成;[0044] s30、对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因;[0045] s40、在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因,根据所述肿瘤相关基因计算肿瘤生长指数;[0046] s50、在所述差异表达基因中筛选出在正常组织与原位腺癌对照组和微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因,根据所述免疫相关基因计算免疫功能指数;[0047] s60、将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。[0048] 具体来讲,本发明通过分析对中国肺腺癌患者的大规模全转录组测序数据信息,探索了在肺腺癌从正常组织进展到癌前病变再进展到浸润性肺腺癌的全过程的基因表达水平的变化,使用统计学方法筛选出2组代表性基因,其中一组基因反映肿瘤内在生长潜能,另外一组基因反映免疫系统的功能状态,基于此两组基因的表达量设计了肿瘤进展指数,可以预测肺腺癌患者的肿瘤‑免疫系统平衡状态,并据此评估肿瘤的进展水平。该肿瘤进展指数预测的肿瘤‑免疫系统平衡状态可以被外部肺腺癌数据验证,本发明技术将为预测肺腺癌的进展提供理论依据与9479威尼斯的技术支持。[0049] 本发明设计的肿瘤进展指数可以预测肺腺癌患者的预后,该结果可被外部数据验证,为预测肺腺癌患者的预后提供了新的指标。[0050] 本发明通过全转录组测序筛选出了一组能够反映肿瘤内在生长潜能和免疫系统功能状态的基因组合,将来可以据此设计针对该2组基因的特异性检测方式,为检测试剂盒的研制提供了新的思路与方法。[0051] 下面通过具体实施例对本发明做进一步的解释说明:[0052] 首先,使用150例手术切除或活检抽取的新鲜肺部肿瘤组织和配对的癌旁正常组织,根据肿瘤的病理学特征分成4组:150例正常组织、16例原位腺癌(ais)、52例微浸润性腺癌(mia)和82例浸润性腺癌(luad),取样后使用machery‑nagel公司(德国)的rna抽提试剂盒进行样本总rna的抽提,去除核糖体rna、生成测序文库并在illuminahiseqxten平台上对文库进行配对末端测序,读长为150bp。[0053] 接着,将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组(正常组织vsais)、原位腺癌与微浸润性腺癌对照组(aisvsmia),以及微浸润性腺癌与浸润性腺癌对照组(miavsluad)组成;对测序文库中的每一个基因在所述三个对照组的每个对照组进行方差分析,将p<0.0001和组间|log2‑表达倍数|大于等于2的基因作为差异表达基因;之后选出在上述3次比较中的至少1次出现显著差异表达的基因进行下游分析,根据其在相邻两组样本中的表达上调或下调确定12种表达模式,如图2所示。根据表达谱鉴定出12种表达模式,进行通路分析以揭示每种模式的生物学功能。具体来讲,本实施例挑出来的有统计学差异的基因总共有2023个,根据其在相邻的两个肿瘤发展的阶段中的表达水平的变化确定了12个表达模式,比如表达模式1:第二组比第一组高,第三组比第二组高,第四组比第三组高,呈一个逐渐升高的态势;表达模式2:第二组比第一组高,第三组跟第二组差异不显著,第四组比第三组高,以此类推。之后本实施例选取在上升趋势和下降趋势中有生物学意义的基因作为代表性基因,来确定我们最终的候选基因。图2就是展示了这12个表达模式,最左侧的线图代表相邻组间基因表达水平的变化趋势,然后图中的注释代表这些基因的主要生物学功能。[0054] 接下来,为了尽量减少低表达基因引入的可能混杂效应,本发明过滤掉所有样本中平均表达量(tpm)<1.0的基因,在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因包括bcl2l15、comp、cst1、fam83a、slc44a5、pglyrp4、clpsl2、arsh、cdh17、col10a1、spp1、mmp3、ddx4、fgf11、casr;将肿瘤相关基因的表达量进行log2对数转换,然后对于每个样本,将肿瘤生长指数计算为肿瘤相关基因表达量的log2对数转换的平均值,所述肿瘤生长指数的计算公式为: 其中,tpm为肿瘤相关基因的表达量,n为肿瘤相关基因的数量。[0055] 进一步地,在所述差异表达基因中筛选出在正常组织与原位腺癌对照组、微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因包括itln2、marco、c8b、masp1、cd36、tal1、ppbp、cdh5、msr1、tbx21、c6、mcam、gzmh、czmb、cxcl12、lilrb2、cxcr1、cxcr2、lamp3、il1rl1;将免疫相关基因的表达量进行log2对数转换,然后对于每个样本,将免疫功能指数计算为免疫相关基因表达量的log2对数转换的平均值,所述免疫功能指数的计算公式为: 其中,tpm为免疫相关基因的表达量,n为免疫相关基因的数量。[0056] 最后,本发明定义肿瘤生长指数和免疫功能指数的差值为肺腺癌的肿瘤进展指数,即肿瘤进展指数=肿瘤生长指数‑免疫功能指数。使用上述公式计算出的肿瘤进展指数随着肿瘤的进展而逐渐增加,如图3所示,故本发明认为,以此2组基因的表达量为基础,可以预测肺腺癌的进化与进展。在本发明中,负的肿瘤进展指数表明免疫系统有足够的能力抑制肿瘤的进展,而正的肿瘤进展指数表明免疫系统不能再抑制肿瘤细胞的生长,肿瘤‑免疫系统之间的平衡被打破。在我们的研究队列中,肿瘤进展指数在正常组织中为负,但在ais和以后的阶段中为正,表明免疫逃逸已经存在于肺腺癌的浸润前阶段ais中,并且随着疾病的进展变得更加严重,如图3中a所示。[0057] 为了验证本发明的肿瘤进展指数,我们在另一个数据集中观察到相同的增加趋势,该数据显示肿瘤进展指数从正常组织到非典型腺瘤性增生(aah)然后到luad显着增加,如图3中b所示。本发明进一步发现,在aah阶段,肿瘤进展指数呈阴性,此时肿瘤无法克服免疫系统进一步转移。尽管tcga‑luad数据集不包含肺腺癌的侵袭前阶段,但我们仍然计算了每个样本的肿瘤进展指数,并在正常样本和肿瘤样本之间进行了比较。在这一部分的比较中,我们观察到肿瘤样本的肿瘤进展指数显着高于正常样本,如图3中c所示。[0058] 本发明筛选了2组有代表性的基因用于计算肿瘤进展指数,其中,在上调的基因中,bcl2l15基因的表达产物参与调控细胞凋亡。comp基因的表达产物是一种非胶原性细胞外基质蛋白,有报道称其高表达会促进癌细胞的上皮间质转化,患者的预后较差。cst1基因的表达产物是血清胱抑素,其高表达与多种癌症的预后差相关。fam83a是一个可能的原癌基因,在表皮生长因子受体(egfr)通路中发挥作用,能够激活下游的ras/mapk和pi3k/akt/tor信号通路,促进细胞的生长。在下调的基因中,itln2基因的表达产物与机体对病原体的防御有关。marco是一种巨噬细胞表面的受体,在机体的固有免疫中发挥重要功能。c8b基因编码补体c8的beta链。masp1基因编码一种丝氨酸蛋白酶,作为补体激活的凝集素途径的一个组成部分在固有免疫和适应性免疫中均发挥作用。cd36基因编码血小板表面的一种主要糖蛋白,在血小板和其他多种细胞系中充当血小板反应蛋白的受体,在肿瘤免疫中发挥重要作用。tal1与造血系统恶性肿瘤的起源有关,有报道称其与前t细胞急性淋巴细胞白血病和儿童t细胞急性淋巴细胞白血病相关。ppbp基因编码一种血小板衍生的生长因子,属于cxc趋化因子家族,能够激活中性粒细胞。cdh5基因编码钙粘蛋白超家族的一种经典钙粘蛋白。[0059] 更进一步地,为了研究本发明设计的肿瘤进展指数是否对肺腺癌患者具有预后指导价值,我们对本申请数据集和tcga‑luad数据集进行了生存分析。分析结果显示,在本申请数据集中,肿瘤进展指数高的患者无复发生存期(recurrence‑freesurvival,rfs)和总生存期(overallsurvival,os)显著较差(如图4中a和b所示),而在tcga‑luad数据集中,肿瘤进展指数较高的患者os较差,但两组的无进展生存期(progressive‑freesurvival,pfs)相当(如图4中c和d所示)。[0060] 基于上述方法,本发明还提供了一种基于基因表达信息预测早期肺癌进展的装置,其包括:[0061] 测序模块,用于根据肿瘤病理学特征,将获取的肺部组织依次划分成正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌四类,对四类组织分别进行全转录组测序,生成测序文库;[0062] 分组模块,用于将所述正常组织、原位腺癌、微浸润性腺癌和浸润性腺癌的全转录组测序结果组成三个对照组,所述三个对照组由正常组织与原位腺癌对照组、原位腺癌与微浸润性腺癌对照组,以及微浸润性腺癌与浸润性腺癌对照组组成;[0063] 差异表达基因确定模块,用于对测序文库中的每一个基因在所述三个对照组之间分别进行方差分析,确定差异表达基因;[0064] 肿瘤生长指数计算模块,用于在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因,根据所述肿瘤相关基因计算肿瘤生长指数;[0065] 免疫功能指数计算模块,用于在所述差异表达基因中筛选出在正常组织与原位腺癌对照组和微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因,根据所述免疫相关基因计算免疫功能指数;[0066] 肿瘤进展指数计算模块,用于将肿瘤生长指数和免疫功能指数的差值作为肺腺癌的肿瘤进展指数用于预测早期肺腺癌进展。[0067] 本发明提供的装置通过设计并计算肿瘤进展指数来衡量肿瘤内在生长潜力和免疫微环境之间的不平衡程度,证明了肿瘤进展指数在肺腺癌的不同发展阶段有着显著的差别,可以预测肺腺癌患者的术后生存时间,并通过外部数据集验证。[0068] 在一些实施方式中,所述肿瘤生长指数计算模块包括:[0069] 肿瘤相关基因筛选单元,用于在所述差异表达基因中筛选出在三个对照组中表达量呈显著上升趋势的一组肿瘤相关基因包括bcl2l15、comp、cst1、fam83a、slc44a5、pglyrp4、clpsl2、arsh、cdh17、col10a1、spp1、mmp3、ddx4、fgf11、casr;[0070] 肿瘤生长指数计算单元,用于将肿瘤相关基因的表达量进行log2对数转换,然后对于每个样本,将肿瘤生长指数计算为肿瘤相关基因表达量的log2对数转换的平均值,所述肿瘤生长指数的计算公式为: 其中,tpm为肿瘤相关基因的表达量,n为肿瘤相关基因的数量。[0071] 在一些实施方式中,所述免疫功能指数计算模块包括:[0072] 免疫相关基因筛选单元,用于在所述差异表达基因中筛选出在正常组织与原位腺癌对照组、微浸润性腺癌与浸润性腺癌对照组中表达量呈显著下降趋势的一组免疫相关基因包括itln2、marco、c8b、masp1、cd36、tal1、ppbp、cdh5、msr1、tbx21、c6、mcam、gzmh、czmb、cxcl12、lilrb2、cxcr1、cxcr2、lamp3、il1rl1;[0073] 免疫功能指数计算单元,用于将免疫相关基因的表达量进行log2对数转换,然后对于每个样本,将免疫功能指数计算为免疫相关基因表达量的log2对数转换的平均值,所述免疫功能指数的计算公式为: 其中,tpm为免疫相关基因的表达量,n为免疫相关基因的数量。[0074] 综上所述,本发明的研究结果表明,肿瘤内在生长潜力的增加和对肿瘤的免疫反应受损共同推动了肺腺癌的进展,而本发明使用2组分别代表肿瘤内在生长潜能和免疫功能相关基因开发的肿瘤进展指数则衡量了肿瘤内在生长潜力和肿瘤免疫微环境之间的不平衡水平,对肺腺癌患者具有预后价值。[0075] 应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

专利地区:上海

专利申请日期:2022-04-14

专利公开日期:2024-07-09

专利公告号:cn114927231b


以上信息来自国家知识产权局,如信息有误请联系我方更正!
电话咨询
读内容
搜本页
回顶部
网站地图