You are on page 1of 59

臺北醫學大學醫學資訊研究所碩士班

碩士論文

Taipei Medical University

College of Medical Science and Technology

Master Program in Graduate Institute of Biomedical Informatics

Master Thesis

指導教授:張資昊(Tzu-Hao Chang)

利用細胞分解工具及免疫特徵進行非小細胞肺癌化療患者

預後預測模型建立及建立免疫圖

Prognostic analysis and establishment of immunogram for lung

adenocarcinoma receiving chemotherapy patient using cell

decomposition tools and immune signature

研究生:廖子齊(Tze-Chi Liao) 撰

中華民國 112 年 1 月

Jan, 2023
誌謝

感謝指導老師張資昊教授在這兩年期間的指導,在研究方面給

予我很多點子及建議,讓我從中學習到身為研究者要有的嚴謹及思

考邏輯,另外在我遇到困難時不斷拉著我回到軌道上,如今能順利

完成論文,真心感謝。另外感謝口試委員吳育瑋副教授及蘇家玉副

教授,在口試開始前就提前到場修改,給予許多論文修改的建議,

讓我的論文更完整。

再來感謝爸媽,謝謝爸爸在我申請上北醫時無條件資助我兩年

的學費,謝謝媽媽在就學期間的接送讓我能更專心在學習上,以及

感謝你們在我跌落人生谷底時的不責怪及陪伴,我終於完成碩士

了!我一定會再重新站起來,而且這次會站得更穩。

最後感謝佩君,在兩年碩士期間的陪伴及包容,沒有你在旁邊

我大概也放棄了,祝未來我們都能變得更好。

子齊 2023/1/16

i
目錄

誌謝 ............................................................................................................. i

目錄 ............................................................................................................ii

表目錄 ........................................................................................................ v

圖目錄 ....................................................................................................... vi

摘要 ..........................................................................................................vii

英文摘要 ................................................................................................ viii

第一章 緒論
1.1 研究背景 ........................................................................................ 1

1.2 研究動機與目的 ............................................................................ 3

第二章 文獻探討

2.1 非小細胞肺癌與細胞分解工具及分群結果 ............................... 4

2.2 癌症免疫圖譜 ............................................................................... 6

2.3 非小細胞肺癌亞型 ....................................................................... 8


第三章 研究方法

3.1 研究架構圖 ................................................................................... 9

3.2 資料來源

3.2.1 TCGA ................................................................................ 12

3.2.2 Single Cell Data & Cell type annotation ........................... 13

3.3 免疫特徵剖析模組

3.3.1 Bisque ................................................................................ 14

3.3.2 ssGSEA .............................................................................. 14

3.3.3 比例涉險模型 ................................................................... 18

3.4 病患免疫特徵分析 ..................................................................... 18

ii
3.5 預測模型建立 ............................................................................. 19

3.6 化療反應及疾病復發分析 ......................................................... 20

3.7 統計方法 ..................................................................................... 20

第四章 研究結果

4.1 LUAD 患者基本資料 ................................................................. 22

4.2 LUAD 患者細胞比例分析結果 ................................................. 23

4.3 LUAD 患者 ssGSEA 分析及建立免疫圖 ................................. 26


4.4 LUAD 患者 PPS 分群 ................................................................ 28

4.5 LUAD 化療患者免疫分群結果 ................................................. 29

4.6 LUAD 化療患者預後與化療反應之關聯性分析

4.6.1 預後關聯性分析 ............................................................... 33

4.6.2 化療反應關聯性分析 ....................................................... 34

4.7 LUAD 化療患者之分群預測模型 ............................................. 35

第五章 討論

5.1 細胞比例與預後之關聯性 ......................................................... 36

5.2 免疫特徵與預後之關聯性 ......................................................... 37

5.3 PPS 基因與預後之關聯性 ......................................................... 38

5.4 患者分群與化療反應之關聯性 ................................................. 38

5.5 化療患者之預測模型 ................................................................. 39

5.6 總結 ............................................................................................. 39

第六章 結論與建議

6.1 結論 ............................................................................................. 40

參考文獻 .................................................................................................. 41

附件 1 PPS 分佈及 23 個基因表達熱圖 ................................................ 45

iii
附件 2 PPS 分群之 PFI 存活分析 .......................................................... 46

附件 3 分群特徵統計摘要表 .................................................................. 46

iv
表目錄

表1 TCGA 資料摘要 ........................................................................... 12

表2 細胞類型分析結果 ....................................................................... 13

表3 免疫特徵之敘述 ........................................................................... 15

表4 LUAD 患者基本資料 ................................................................... 22

表5 LUAD 化療患者分群之預後關聯性分析 ................................... 33

表6 LUAD 化療患者分群之化療反應關聯性分析 ........................... 34

表7 各模型預測準確性之評估 ........................................................... 35

v
圖目錄

圖1 肺癌患者免疫圖譜 ......................................................................... 7

圖2 研究架構圖 ..................................................................................... 9

圖3 本研究彙整之新免疫圖 ............................................................... 17

圖4 LUAD 全部患者細胞比例 ........................................................... 24

圖5 LUAD 化療患者細胞比例 ........................................................... 25

圖6 LUAD 全部患者免疫圖 ............................................................... 26

圖7 LUAD 化療患者免疫圖 ............................................................... 27


圖8 比例涉險模型分析結果 ............................................................... 28

圖9 LUAD 化療患者分群之 PFI 存活分析 ....................................... 29

圖 10 LUAD 化療患者分群之免疫圖 ................................................. 30

圖 11 LUAD 化療患者分群顯著差異之特徵熱圖 ............................. 32

vi
摘要

背景:近年針對肺癌之藥物進步如免疫抑制劑,所帶來的益處往往

只在一小部分的患者中顯現,研究指出免疫微環境會影響化療反

應。相較於單一生物標記,結合多種免疫組織概況可獲得更好癌症

預測。方法:本研究搜集 TCGA 資料庫 LUAD 患者(n=513)基因表

達及臨床資料,以及 GEO 非小細胞肺癌患者(n=42)單細胞資料,透

過 Bisque 細胞分解工具拆解患者之細胞比例,並整合多篇文獻之免

疫特徵建立新免疫圖,運用 ssGSEA 免疫分數繪製免疫圖譜,另以


Lasso-Cox model 建立 PPS 23 個與 PFI 相關基因,彙整以上特徵進

行 K-means 分群,依照存活分為 C1 組及 C2 組,進行化療病患免疫

特徵分析及預測模型建立。結果:C1 組相較 C2 組具備顯著存活優

勢,且帶有之免疫細胞比例及免疫評分均優於 C2 組。結論:本研

究證實細胞比例的拆解、免疫特徵及 PPS 對於化療反應有關聯性。

關鍵字:肺腺癌、免疫圖譜、反卷積、TCGA

vii
Abstract

Background: In recent years, much progress have been made in lung

cancer drugs, such as immunosuppressants. But the benefits are only seen

in a subset of patients. Research indicates that tumor microenvironment

have an effect on chemotherapy response. Compared to a single

biomarker, multiple immune profiles lead to better cancer predictions.

Method: In this study, We collected gene expression and clinical data of

LUAD patients (n=513) from TCGA, and single cell data of NSCLC
patients(n=42) from GEO. The calculation of proportion of cell type was

conducted using Bisque. A new immunogram has been constructed by

integrating immune signatures from various researches. The immunogram

is constructed by using ssGSEA. In addition, 23 PFI-related gene were

established by the Lasso-Cox model. All the above features were then

integrated for K-means clustering. Tow groups C1 and C2 were divided


according to survival analysis. Chemo patient immune clustering analysis

and the construction of prognostic prediction model were conducted

based on the two groups. Result: Compared with the C2 group, the C1

group had a significant survival advantage, and the proportion of immune

cells and immune score were better than the C2 group. Conclusion: We

demonstrated that cell proportions, immune signatures, and PPS were

associated with chemotherapy response.

Keywords: Lung adenocarcinoma, Immunogram, deconvolution, TCGA

viii
第一章 緒論

1.1 研究背景

癌症為十大死因之首,致死人數又以肺癌為主,肺癌主要分為

非小細胞肺癌(Non-small-cell lung carcinoma, NSCLC)及小細胞肺癌

(Small-cell lung carcinoma),其中非小細胞肺癌屬於較常見肺癌,罹


患率超過 85%(Gridelli et al., 2015)。依據組織學又能分成肺腺癌

(Lung adenocarcinoma, LUAD)及肺鱗狀細胞癌(Lung squamous cell

carcinoma, LUSC)(Devarakonda et al., 2015; Oser et al., 2015)。研究指

出相較於 LUSC,LUAD 在 EGFR、ALK 及 ROS1 等基因中突變率

較高(Soda et al., 2007)。以及 LUSC 中 PIK3CA、AKT1 和 CDNK2A

突變率較高(Cancer Genome Atlas Research, 2012)。隨著次世代定序

問世,學者可以將癌症分為多個亞型( subtype ),這有助於臨床上治

療之決策。本研究根據 TCGA 資料庫 LUAD 基因表達量(Gene

expression profiling)進行分析。

近年關於肺癌之藥物治療進步,包括免疫療法、標靶藥物、化

學藥物等,特別是免疫檢查點抑制劑(Immune checkpoint inhibitors,

ICIs)在近十年已改變許多癌症的臨床治療策略,例如 PD-

1(Programmed death 1)、PD-L1(Programmed death 1 ligand 1)、T 淋巴

球抗原-4(cytotoxic T lymphocyte antigen 4, CTLA-4)及聯合免疫療法

(Mariniello et al., 2020)。其中 PD-1 及 PD-L1 已被核准作為肺癌第一

線或第二線用藥(Remon et al., 2017)。然而,免疫治療策略所帶來的

益處往往只在一小部分的患者中顯現,如肺癌患者之五年存活率僅

1
約 15%。原因可能為免疫抑制劑的反應與多種因素相關,例如腫瘤

突變負荷量(Tumor mutation burden, TMB)、微衛星不穩定性

(Microsatellite instability)及 PD-L1 表達差異(Havel et al., 2019)。或者

免疫療法的療效取決於癌症分期(Shroff et al., 2018)。但這些資訊不

足以區分患者是否該接受免疫療法或其他療法(Whiteside et al.,

2016)。因此需要建立有效和可靠的生物標記,精確的用藥以降低不

必要的藥物副作用。

由於腫瘤微環境的複雜性,需要生物標記的組合來預測個體患

者對治療的反應。「免疫圖」方法被提出可更全面的整合免疫相關

變量(Kobayashi et al., 2020)。此外,單細胞定序為近年火紅的新技

術,相較 Bulk RNA 可更細緻探討細胞的種類、組成數量,然而此

方法需要昂貴的實驗成本。目前已開發許多由傳統測序方法(bulk

RNA)數據推估免疫細胞比例工具,如 Bisque、CIBERSORT、

CIBERSORTx、MuSiC、TIMER、xCell、EPIC 及 MCP-counter 演算

法等(Jew et al., 2020; C. Li et al., 2022)。這些工具在實驗上相較單細

胞定序更方便、低成本。另外,有學者透過細胞類型的拆解,替肺

癌患者進行分群,他們假設可以根據腫瘤微環境的主要成分來區分

非小細胞肺癌的異質性。與此同時,現今已有許多公開資料可提供

研究者進行細胞類型分解,如美國癌症基因體圖譜計畫(TCGA)上有

bulk RNAseq 資料,另有 DISCO 提供單細胞 RNAseq 資料(M. Li et

al., 2022)。本研究將應用上述二種資料庫進行腫瘤細胞比例之估

計,結合免疫圖方法探討預後相關議題。

2
1.2 研究動機與目的

腫瘤發展是極為複雜的過程,攸關宿主免疫系統與癌細胞之間

的互動。過去研究指出免疫微環境會影響化療反應(Cerbelli et al.,

2020)。相較於單一生物標記,研究結合多種免疫組織概況(tissue

immune profile) 可獲得更好癌症預測。然而過去有關免疫圖研究僅

針對患者進行初步分類,尚未深入探討臨床用藥的關聯性及預測模

型的建立。

本研究目的為探討非小細胞肺癌患者之腫瘤細胞比例及免疫特

徵與化療反應之關聯性,並建立免疫圖及預測模型,最終提供給醫

師及臨床醫事人員,提升用藥的準確性及治療效果,同時也避免不

必要的藥物副作用,最終有助於延長宿主存活期,以達到精準醫療

(Precision Medicine)之概念。

3
第二章 文獻探討

本章節將以「非小細胞肺癌與細胞分解工具及分群結果」 、 「癌

症免疫圖譜」 與 「非小細胞肺癌亞型」等方面進行探討。

2.1 非小細胞肺癌與細胞分解工具及分群結果

2020 年 Brandon 等人提出一種細胞分解工具為 Bisque(Jew et al.,

2020)。其能透過傳統 RNA 測序數據(Bulk RNA)及單細胞測序數據

(single cell RNA-seq)作為參考,以反卷積方法(deconvolution)推估患

者細胞比例。此研究以皮下脂肪(subcutaneous adipose)及背外側前額

葉皮質層(Dorsolateral prefrontal cortex, DLPFC)為對象,與過去方法

比較其性能。結果顯示 Bisque 的方法性能優於 MuSiC、BSEQ-sc、

CIBERSORT、CIBERSORTx 等方法,且此作者更提出另一種方法

MarkerBased,僅需提供已知的標記基因(Marker gene)即可推估細胞

豐度(abundances)。

2015 年 Newman 等人提出細胞分解方法 CIBERSORT(Newman

et al., 2015)。透過 22 個 Leukocyte signature(LM22)作為參考推估患

者細胞比例,然而研究者提出 CIBERSORT 方法最大的限制是參考

譜的忠誠性(fidelity),儘管此方法顯示出低於其他方法如 RLR、

4
PERT、DSA、LLSR、QP、MMAD 之估計偏差,但他仍可能高估或

低估某些細胞類型比例(Newman et al., 2015)。

2022 年 Chang Li 等人透過 CIBERSORT 工具分解腫瘤浸潤免疫

細胞(Tumor-infiltrating immune cells, TIIC)(C. Li et al., 2022)。根據不

同 TIIC 比例將 3-4 期非小細胞肺癌患者分成三個分群。結果顯示第

二分群患者具有生存優勢,且對免疫治療有良好反應,並發現三個
關鍵分子 HSPA8、CREB1、RAP1A 可能作為第一分群的潛在標靶

點(C. Li et al., 2022)。然而研究針對 3-4 期患者進行分析,樣本數量

僅 195 人。

2021 年 Yang Zheng 等基於 LM22 免疫特徵,替 TCGA 非小細

胞肺癌患者資料進行非負矩陣分解(nonnegative matrix factorization,

NMF)以建構分群(Zheng et al., 2021)。結果確立了四個基於免疫的

NMF 分群,分群間的表觀遺傳分析顯示拷貝數變異(copy number

alterations, CNA)在確立免疫檢查點表達起到關鍵作用。

2020 年 Avila 等使用五個 scRNA-seq 資料集,模擬 bulk RNA 來

進行不同反卷積工具的推估(Avila Cobos et al., 2020)。結果顯示使用

scRNA-seq 作為反捲積參考的方法如 SCDC、DWLS、MuSiC、

Bisque 優於其他估計細胞比例之工具如 OLS、CIBERSORT、

NNLS。

5
總結上述研究可了解到為癌症分群的重要性,本研究嘗試替

TCGA 非小細胞肺癌患者表達數據進行免疫細胞估計,透過 scRNA-

seq 為參考的 Bisque 作為研究主要拆解工具,並根據不同估計值進

行分群。

2.2 癌症免疫圖譜

2016 年 Blank 等人提出癌症免疫圖的概念(Blank et al., 2016),將


單一病患中癌症與免疫系統之間的不同相互作用可視化,目的為幫

助生物標記研究並協助臨床用藥選擇,但此研究並未實際於臨床上

進行測試,因此本研究結合免疫圖及臨床用藥資料,剖析不同化療

患者之免疫圖差異。

2017 年 Karasaki 等人針對 20 名非小細胞肺癌患者進行全外顯子


及 RNA 定序,評估及標準化癌症免疫相關的基因表達,以建立能反

映癌症免疫週期的個人雷達圖(Karasaki et al., 2017)。此研究結果(圖

1)觀察到肺癌患者中三種不同免疫圖譜,分別為富含 T 細胞、中等

及缺乏 T 細胞。透過使用免疫圖譜作為生物標記,可了解癌症患者

腫瘤微環境的特異性概觀。然而研究指出仍有更多與 T 細胞相關的

因素可納入免疫圖軸向,因此本研究彙整免疫圖相關研究之軸向及

基因列表,創立新免疫圖。

6
圖 1 肺癌患者免疫圖譜

2020 年 Donghai 等人針對黑色素瘤進行免疫特徵的驗證(Xiong

et al., 2020)。結果顯示 ImmunCell.Sig 包含免疫細胞亞型的基因特

徵,以預測對免疫療法的反應。本研究將依照實驗中彙整之免疫特

徵作為免疫圖軸向。2013 年 Kosuke 提出 ESTIMATE 工具,使用基

因表達數據估計腫瘤中體細胞、免疫細胞的含量以及腫瘤的純度

(Yoshihara et al., 2013)。

7
2.3 非小細胞肺癌亞型

非小細胞肺癌主要可分為肺腺癌及肺鱗狀細胞癌,過去研究指

出 LUAD 及 LUSC 之間的遺傳及表觀遺傳學存在顯著差異,如果能

夠準確辨別亞型,將有助於於臨床治療。如 Ran Su 等人設計整合

mRNA 長鍊非編碼 RNA(long non-coding RNA, lncRNA)之分類模

型,提出 WGRFE 基因選擇演算法。研究使用 TCGA 資料庫肺癌數

據驗證提出的演算法,結果顯示此方法能以更少的基因特徵
(signature)替非小細胞肺癌進行分類,有趣的是,此研究首次發現

lncRNA 在分類模型中的潛在作用(Su et al., 2020)。

8
第三章 研究方法

3.1 研究架構圖

圖 2 研究架構圖

9
圖 2 為本研究架構圖。研究資料方面,使用 TCGA 資料庫

LUAD 之 RNA open data,經資料處理後分為 Raw read count 及

TPM(Transcripts Per Million),另於 GEO 搜集 42 位非小細胞肺癌患

者單細胞表達量資料進行細胞比例估計,單細胞資料先分別以

DISCO 套件 CELLiD 進行細胞類型註記(cell type annotation)。

在免疫特徵剖析模組中,分為三個流程:第一,結合 Raw read


count 及預處理之 Single Cell 資料導入 Bisque 工具,輸出為各細胞

類型比例(proportion);第二,搜集各文獻之免疫特徵(signature)進行

單樣本基因富集分析(single-sample Gene Set Enrichment Analysis, 以

下稱 ssGSEA),輸入資料類型為 TPM,輸出為各特徵之免疫評分;

第三,將原資料 58,387 個基因經 InnateDB 之 Immport 免疫基因資料

集(https://www.innatedb.com/index.jsp)比對,此資料庫提供 4,723 個

免疫基因,經篩選後得出 4,617 個基因,導入至比例涉險模型(Cox

Proportional Hazards model, 以下稱 CoxPH model)計算與存活相關之

基因,並根據 Chang Li(2022)等人作法得出 PPS(Poor Prognosis

Signature)值。

下一步,根據 17 種細胞比例、29 個 ssGSEA 評分及 23 個計算

PPS 之基因作為患者分群之特徵,方法使用 K-means 分成兩群患

者,並觀察兩群患者之 PFI 存活曲線、細胞比例、建立免疫圖及繪

製熱圖,其中根據 PFI 分成 Good prognosis group 和 Poor prognosis

group,以下稱為 C1 組及 C2 組。在分群後,分別解析 C1 組及 C2

組對於化療反應之比例及一年內復發之人數。

10
在預測模型建立中,以 69 個特徵經由 Mann-Whitney U-test 篩選

出 49 個在兩群顯著差異的特徵,再導入機器學習模型,研究使用的

模型為隨機森林(Random Forest, RF)、支持向量機(Support Vector

Machine, SVM)、極限梯度提升(eXtreme Gradient Boosting, XGBoost)

及自適應增強(Adaptive Boosting, AdaBoost)等分類器進行預測,預

測目標為先前分好之 C1 組與 C2 組。

11
3.2 資料來源

3.2.1 TCGA
美國癌症基因體圖譜計畫(The Cancer Genome Atlas, TCGA)是由

美國國家癌症研究所(National Cancer Institute, NCI) 及國家人類基因

組研究所(National Human Genome Research Institute, NHGRI) 於

2005 年發起的癌症基因組計劃。計畫內容為搜集癌症病患的臨床紀

錄,包括腫瘤組織及正常組織進行定序及生物資訊分析,並公開搜

集之定序資料與分析結果提供下載,以利於全球研究人員及學術單
位使用,最終目的為協助癌症的預防、治療及診斷。如表 1,本研

究蒐集 TCGA (https://www.cancer.gov/tcga)之 LUAD (n=513)基因表

達資料進行分析,並搜集病患之臨床及用藥資料進行後續分析,篩

選出 177 位化療患者。

表1 TCGA 資料摘要

資料類別 內容

mRNA mRNA 基因表現量,依需求分為 Raw reads count 及

TPM

Clinical 性別、年齡、治療方法、臨床分期、存活情形等
Drug 用藥紀錄,包含 Cisplatin、Gemcitabine 等

12
3.2.2 Single Cell Data & Cell type annotation

本研究依照細胞分解工具需求搜集單細胞表達數據,資料參考

Fengying Wu 等人研究中使用 42 位 NSCLC 患者之單細胞表達資料

(Wu et al., 2021)。由高通量基因表達數據庫(Gene Expression

Omnibus, GEO)下載 GSE148071 公開資料,並進行細胞類型註解

(cell type annotation)以進行後續研究分析。

本研究使用及 DISCO 網站提供

(https://www.immunesinglecell.org/cellpredictor)之 CELLiD(CELL type

iDentification)工具分別進行細胞類型註解,結果如下表 2,由

CELLiD 分析得出 17 種不同細胞類型。

表 2 細胞類型註解結果

分析方法 細胞類型

CELLiD Basal cell, cDC, differentiating cliated cell, endothelial

cell, epithelial cell, macrophage, mast cell, mesothelial

cell, monocyte, myofibroblast, plasma cell, proliferation


epithelial cell,

proliferation macrophage, secretory cell, smooth muscle

cell,
T cell, type 2 alveolar epithelial cell

13
3.3 免疫特徵剖析模組

3.3.1 Bisque

本研究利用 R 套件 BisqueRNA1.0.5 之 Reference-based 方法分析

非小細胞肺癌患者之細胞比例及根據細胞類型概況將患者分群,並

探討化療反應之關聯性。

(一) Reference-based decomposition

本研究蒐集 TCGA 之 LUAD 基因表達資料進行分析,以 42 位

肺癌患者單細胞表達數據做為參考,共 89,888 顆細胞,平均每位患

者 2,140 顆細胞,將單細胞數據以 DISCO 套件 CELLiD 解析細胞類

型,並整合 raw reads count 與單細胞資料至 BisqueRNA 工具進行分

析,以得知細胞類型比例。

3.3.2 ssGSEA

ssGSEA 是基因富集分析(Gene set enrichment analysis, GSEA)的

延伸用法,可以針對單一樣本及感興趣的基因集(gene set)計算單獨

的富集分數。本研究透過 ssGSEA 方法計算 Estimatesscore、

Immunescore、Stronmalscore、TumorPutiry、12chemokine、

IFNG.expanded、IFNG.Sig、CD8.Sig、Inflammatory.Sig、

EMG.Sig、IPRES.Sig、CRMA.Sig、IMPRES.Sig、Innate immunity、

Priming activation、IFNG response、Inhibitory cells_Tregs、Ingibitory

cells_MDSC、Recognition of tumor cells、Proliferation、Glycolysis、

14
T cell_Immune metagene、activated DC_LM22、Treg_Immune

metagene、MDSC_Immune metagene、Trafficking_infiltration、

Immune checkpoints、Other inhibitory molecules、CTL 等特徵免疫分

數,前四者均使用 R 套件 ESTIMATES 進行評分。以上特徵之敘述

如表 3。本研究分別搜集四篇免疫圖及免疫特徵相關文獻結合

ESTIMATES 工具整理出新免疫圖(Jiang et al., 2018; Karasaki et al.,

2017; Kobayashi et al., 2020; Xiong et al., 2020; Yoshihara et al.,


2013)。其各搜集之特徵位於免疫圖之軸向如圖 3。

表 3 免疫特徵之敘述

特徵 敘述

12chemokine 直腸癌 12 趨化因子 CCL2, CCL3, CCL4,

CCL5, CCL8, CCL18, CCL19, CCL21,

CXCL9, CXCL10, CXCL11, CXCL13。

IFNG.expanded 由 IFN 特徵基因擴展相關的免疫特徵,共

28 個基因。

IFNG.Sig IFNG、STAT1、IDO1、CXCL10、CXCL9
和 HLA-DRA 等 6 種基因的 γ 干擾素

(IFNγ) 反應生物標誌物。

CD8.Sig CD8A+CD8B+CD3D+CD3E+CD3G 的基因


表達。

Inflammatory.Sig 預測肺癌免疫檢查點阻斷反應的 27 個發

炎相關基因的基因表達特徵。

15
EMG.Sig 12 個上皮-間質轉化 (EMT) 相關基因的基

因表達特徵預測肺癌免疫檢查點阻斷反

應。

IPRES.Sig IPRES(先天性抗 PD-1 耐藥性)包括 16

個基因,涉及 cell adhesion、extracellular

matrix remodeling、血管生成、傷口癒合和

mesenchymal transition,預測黑色素瘤對抗

PD-1 抗體治療的反應。

CRMA.Sig 抗 CTLA4 抗性 MAGE 基因,包括

MAGEA2、MAGEA2B、MAGEA3、
MAGEA6 和 MAGEA12。

IMPRES.Sig Immuno-predictive score (IMPRES),基於

28 個免疫檢查點基因的黑色素瘤免疫檢查
點阻斷 (ICB) 反應預測因子。

Innate immunity NK 細胞活化。

Priming activation 樹突細胞活化。

IFNG response Hallmark interferon gamma response.

Inhibitory cells_Tregs T cells regulatory (Tregs).

Ingibitory
Angelova_MDSC.
cells_MDSC

Recognition of tumor Reactome class I MHC mediated antigen

cells progessing presentation. (MSigDB)

Proliferation Reactome DNA replication. (MSigDB)

Glycolysis Hallmark Glycolysis. (MSigDB)

16
T cell_Immune
T 細胞的豐度(enrichment)。
metagene

activated DC_LM22 aDC 細胞的豐度。

Treg_Immune
Neoantigen, CG antigen.
metagene

MDSC_Immune
Treg, MDSC 的豐度。
metagene

Trafficking_infiltration CXCL9, CCL5 等基因。

Immune checkpoints PD-1, PD-L1 等。

Other inhibitory
IDO1, ARG1 等。
molecules

CTL CD8A, CD8B, GZMA, GZMB, PRF1.

圖 3 本研究彙整之新免疫圖

17
3.3.3 比例涉險模型

本研究使用 R 套件 survival 進行 CoxPH model 建立, 將 Bulk

RNA 之基因與 InnateDB 免疫相關基因集進行對照篩選,篩選出之

基因經 CoxPH model 分析後過濾出顯著與 PFI 相關的基因,再用 R

套件 glment 之 Lasso 特徵選取方法篩選出代表基因,Lasso 之參數

alpha 設定為 1、nlambda 為 100。後續參考 Chang Li(2022)等人提出

之 PPS 計算,依照每個基因的係數乘上表現量加總為 PPS。

3.4 病患免疫特徵分析

本研究使用 R 套件 cluster 套件之 K-means 演算法,參數設定為

k=2,將患者分為兩群。使用存活分析進行後續研究,觀察疾病穩定

間期(Progression-free interval, PFI),追蹤患者 1,000 天之存活表現。

PFI 代表病患自上次治療後疾病復發的時間。本研究將依據存活分

析結果分為 C1 組及 C2 組。免疫圖方面,本研究使用 MacOS 內建

之 Numbers 繪製免疫圖,依照 ssGSEA 的免疫評分進行 Z-score 標準

化,並將分群之 Z-score 平均後,並參考 Yukari Kobayashi(2020)公

式免疫圖分數為 3+1.5 x Z。細胞比例方面,使用 Python 套件

plotly.express 繪製細胞比例盒鬚圖,並比較 C1 組及 C2 組之各細胞

比例分佈。特徵熱圖部分,針對顯著差異的特徵進行熱圖(heat map)

繪製,使用的工具為 Clustergrammer 網站提供之熱圖繪製

(https://maayanlab.cloud/clustergrammer/),輸入的資料格式為 txt 檔。

18
3.5 預測模型建立

本研究透過 Python 套件 sklearn 進行機器學習,使用的模型為

RF、SVM、XGBoost 及 AdaBoost 等分類器進行預測,RF 參數設定

為 n_estimator=100、criterion=gini,SVM 參數設定為 kernel=linear、

degree=3、gamma=scale,XGBoost 參數設定為 n_estimators=3,

AdaBoost 參數設定為 n_estimators=50。預測目標為患者之分群,分

為 C1 組及 C2 組。所有的模型皆使用交叉驗證 5-Fold Cross-

Validation,模型評估指標為準確率(Accuracy)、召回率(Recall)、精
確率(Precision)、F1 Score 及 ROC 曲線下面積(Area Under Curve,

AUC)。

19
3.6 化療反應及疾病復發分析

根據前述分群之 C1 組及 C2 組,進一步探討對於化療反應之比

例及一年內復發之人數,並以卡方檢定為統計考驗。

3.7 統計方法

依照前述進行患者分群後,所有特徵均進行統計檢定,本研究
使用 Mann-Whitney U-test 檢定,顯著水準為 p<.05。此外,在患者

分群之疾病復發與化療反應與否,本研究使用卡方檢定(Chi-

Squared),顯著水準為 p<.05。

20
第四章 研究結果

本研究於 TCGA 之 LUAD 進行分析,本章節將分成七個部分:

LUAD 患者基本資料、LUAD 患者細胞比例分析結果、LUAD 患者

ssGSEA 分析及建立免疫圖、LUAD 患者 PPS 分群、LUAD 化療患

者免疫分群結果、LUAD 化療患者預後與化療反應之關聯性分析、
LUAD 化療患者之分群預測模型,以下將根據各分析進行說明。

21
4.1 LUAD 患者基本資料

本研究搜集 TCGA LUAD 患者資料共 513 位(表 4),其中包

含 177 位使用化療患者。在全部患者中男性人數為 237 人女性 276

人,癌症分期為第一、二期(表稱 Early)人數為 395 人,第三、四

期(表稱 Late)人數為 115 人,平均年齡為 65.2 歲。在化療患者中

男性人數為 84 人女性 93 人,癌症分期為第一、二期人數為 106

人,第三、四期人數為 68 人,完整化療反應(表稱 CR, Complete


Response)人數為 93 人,疾病惡化(表稱 PD, Progressive Disease)

人數為 42 人。平均年齡為 63.3 歲。

表4 LUAD 患者基本資料

性別 分期 化療反應
類別 年齡
男 女 Early Late CR PD

全部
237 276 395 115 NA NA 65.2±10.3
n=513

化療
84 93 106 68 93 42 63.3±9.9
n=177

22
4.2 LUAD 患者細胞比例分析結果

本研究目的為探討細胞比例對化療反應之關聯性,在本節中將

觀察全部患者(n=513)及化療患者(n=177)細胞比例概況。全部患者如

圖 4,結果顯示平均比例最高的為 basal cell,平均比例最低的為

smooth muscle cell。化療患者如圖 5,結果顯示平均比例最高的為

basal cell,平均比例最低的為 smooth muscle cell。

23
圖4 LUAD 全部患者細胞比例

24
圖5 LUAD 化療患者細胞比例

25
4.3 LUAD 患者 ssGSEA 分析及建立免疫圖

在本節中將呈現全部患者(n=513)及化療患者(n=177)免疫特徵評

分。如圖 6,在全部患者免疫圖中 Glycolysis 分數為最高 3.760,而

CRMA.Sig 分數為最低 2.611。如圖 7,在化療患者免疫圖中

Glycolysis 分數為最高 3.763,而 Immune.checkpoings 分數為最低

2.596。

圖6 LUAD 全部患者免疫圖

26
圖7 LUAD 化療患者免疫圖

27
4.4 LUAD 患者 PPS 分群

本研究使用 CoxPH model 建立 PPS 分數, 如圖 8,經

InnateDB 篩選出 4,617 之基因,經 CoxPH model 分析後過濾出 737

個顯著與 PFI 相關的基因,最終 Lasso 特徵選取方法篩選出 23 個代

表基因。後續 PPS 計算,如附件 1、2,本研究根據 23 個基因算出

之 PPS 分數由分數低排到分數高並取平均值作為切點分成兩群患

者,結果兩群在 PFI 有顯著差異,證實研究所篩選出 23 個基因與

PFI 有關聯性。

圖 8 比例涉險模型分析結果

28
4.5 LUAD 化療患者免疫分群結果

研究整合了細胞比例、免疫分數及 PPS 基因共 69 個特徵進行患

者分群,進一步篩選至 177 位化療患者並觀察 PFI,結果顯示兩分

群 PFI 有顯著差異,且分群一(n=102)相較分群二(n=75)具備存活優

勢(圖 9),後續本研究將分群一(cluster=1)稱為 C1 組 Good

prognosis group,分群二(cluster=2)稱為 C2 組 Poor prognosis group。

圖9 LUAD 化療患者分群之 PFI 存活分析

根據分群的結果繪製免疫圖,如圖 10,結果顯示在大部分的免

疫軸向均有顯著差異,其中 CRMA.Sig、Proliferation 為 C2 組顯著

高於 C1 組,僅 Inhibitory.cell.Tregs、Ingibitory.cells.MDSC、

Recognition.of.tumor.cells、Glycolysis 四個特徵在兩分群無顯著差

異,而其餘特徵 C1 組均顯著高於 C2 組。

29
圖 10 LUAD 化療患者分群之免疫圖

30
根據分群的結果進一步觀察兩群之細胞比例分佈情形,如圖

11,結果顯示 Macrophage、Mast cell、Mesothelial cell、

Myofibroblast、Plasma cell、Proliferation macrophage、T cell 為 C1

組顯著高於 C2 組,另 Proliferation Epithelial cell、Secretory cell 為

C2 組顯著高於 C1 組,其餘細胞則無顯著差異。

圖 11 LUAD 化療患者分群之細胞比例

31
根據 69 個特徵進行分群後,經過 Mann-Whitney U-test 有 49 個

特徵有顯著差異,如附件 1 顯示統計摘要。本研究根據顯著差異的

特徵進一步進行熱圖繪製。如圖 12,結果顯示在細胞比例方面有 9

個特徵有顯著差異(綠色),ssGSEA 免疫評分有 25 個特徵有顯著

差異(橘色),PPS 基因有 15 個特徵有顯著差異(灰色)。

圖 12 LUAD 化療患者分群顯著差異之特徵熱圖

32
4.6 LUAD 化療患者預後與化療反應之關聯性分析

4.6.1 預後關聯性分析

根據分群結果,本研究進一步進行分群之卡方檢定。如表 5,結

果顯示 C1 組及 C2 組在疾病一年內復發與否存在顯著差異,且 C1
組在一年內復發的比例小於 C2 組。

表5 LUAD 化療患者分群之預後關聯性分析

PFI<365 PFI>=365

C1 組
21 (20.5%) 81 (79.4%)
n=102

C2 組
27 (36.0%) 48 (64.0%)
n=75

P=.0350*

33
4.6.2 化療反應關聯性分析

根據分群結果,本研究進一步進行分群之卡方檢定。如表 6,結

果顯示 C1 組及 C2 組在化療反應上存在顯著差異,且 C1 組在 CR

的比例高於 C2 組,而 PD 則為 C2 組比例高於 C1 組。

表6 LUAD 化療患者分群之化療反應關聯性分析

CR PD

C1 組
59 (75.6%) 19 (24.3%)
n=78

C2 組
34 (59.6%) 23 (40.3%)
n=57

P=.0474*

34
4.7 LUAD 化療患者分群預測模型

本研究將使用分群顯著差異之 49 個特徵進行預測模型建立,預

測目標為 C1 組及 C2 組。結果顯示在 Accuracy 方面,SVM 為最佳

0.955 而 XGBoost 為最低 0.904;Recall 方面,SVM 為最佳 1.000 而

RF 為最低 0.931;Precision 方面,SVM 為最佳 0.934 而 XGBoost 為

最低 0.898;F1 score 方面,SVM 為最佳 0.964 而 XGBoost 為最低;

AUC 方面,SVM 為最佳 0.996 而 RF 及 XGBoost 為最低 0.977。各


評估指標之表現如表 7。

表 7 各模型預測準確性之評估

RF SVM XGBoost AdaBoost

Accuracy .910 .955 .904 .921

Recall .931 1.000 .940 .951

Precision .919 .934 .898 .920


F1 score .919 .964 .918 .933

AUC .977 .996 .977 .989

35
第五章 討論

本研究整合細胞比例、免疫評分及 PPS 基因進行一系列分析,

目的為探討非小細胞肺癌患者之腫瘤比例及免疫特徵與化療反應之

關聯性,最終提供給醫師及臨床人員,並提升用藥的準確性及治療

效果。以此,本研究將根據研究結果進行分點討論。

5.1 細胞比例與預後之關聯性

本研究進一步根據細胞比例及免疫特徵進行分群,並篩選出化

療患者進行細胞比例之分析,在免疫細胞 Macrophage 及 T cell 為

C1 組高於 C2 組,同時在免疫圖(圖 10)上 C1 組之

T.cell.Immune.metagene 評分顯著高於 C2 組,研究也指出 T cell 的

高比例對於肺腺癌的預後是有明顯幫助(Guo et al., 2018)。此外

Macrophage 在腫瘤生長及轉移過程中作為重要角色,研究指出 M1

macrophage 的高浸潤(infiltration)對於改善非小細胞肺癌患者的總體

存活有關(Jackute et al., 2018)。

本研究使用的細胞拆解工具為 Bisque,本研究也嘗試使用其他

scRNA-seq 為參考之反卷積工具如 MuSiC,初步結果顯示對於患者

的分群能力相似,如 plasma cell 在兩工具間的估計比例相關性高達

98%,故本研究以 Bisque 做為代表工具。

36
5.2 免疫特徵與預後之關聯性

本研究根據細胞比例及免疫特徵進行分群,並篩選化療患者進

行免疫圖繪製,結果在絕大部分的免疫特徵都為 C1 組較高分,此

結果符合預期,腫瘤微環境中 CD8 T cell 的存在對於改善 LUAD 患

者的預後相關(Zhang et al., 2022)。另外 Myeloid-derived suppressor

cells(MDSC)在免疫抑制腫瘤微環境中扮演關鍵角色之一,有研究也

證實對於非小細胞肺癌之疾病轉換及預後發揮作用(Zahran et al.,
2021)。根據前述免疫圖(圖 10)的建立及存活分析(圖 9),可看

出預後及免疫圖趨勢存在著關聯性。此外過去研究提出熱腫瘤(hot

tumor)與冷腫瘤(cold tumor)之概念,免疫療法(ICIs)的出現雖大幅提

高臨床治療腫瘤之療效,但 ICIs 對於缺乏 T 細胞的冷腫瘤卻無效

(Liu & Sun, 2021)。研究發現 LUAD 患者在經過放射及化療後,腫

瘤微環境產生變化,檢測到 PD-L1 由陰轉陽性,即冷腫瘤轉變熱腫


瘤(Miao et al., 2021)。在本研究中化療患者之免疫圖結果也吻合,在

圖免疫圖上佔據較大的面積 C1 組,其具備熱腫瘤的特徵同時也與

良好預後有關聯性,本研究更近一步發現也跟化療反應有關聯性。

37
5.3 PPS 基因與預後之關聯性

經由 CoxPH model 挑選出與 PFI 相關的基因,並依照模型的係

數計算出的 PPS 分數加總排列後分群,結果發現分數低的患者在

PFI 有非常顯著的存活優勢,進一步觀察熱圖(圖 12)可看出如

HLA.DRB1、NELL2、IGLV8.61、C1QTNF7、TNFSF13、CAT、

AZGP1 等基因在 C1 組具高表達,而在 C2 組具備低表達,這可能

顯示這些基因表達時對患者存活帶來正面的效益。反之,如 CPS1
基因在 C2 組高表達,同時 C1 組低表達,這可能顯示這些基因表達

時對患者存活帶來負面效益。過去研究在 LUAD 患者 Epithelial

cancer cell 中發現 HLA-DR 表達與 T cell 數量呈現正相關(Senosain et

al., 2021)。此外研究顯示 TNFSF13 是 NSCLC 的預後因子,其可能

為治療新靶點(Qian et al., 2014)。

5.4 患者分群與化療反應之關聯性

前述不論是細胞比例、免疫特徵及 PPS 基因均為分群使用之特

徵,接下來本研究將關聯至患者治療反應與否。結果符合預期,C1

組之化療完整反應比例確實高於 C2 組,而疾病惡化的比例則反

之,這顯示本研究所彙整的特徵除了可分出存活差異也可為患者的

化療反應做區分。

38
5.5 化療患者之預測模型

在預測模型建立中,本研究將顯著差異的特徵導入分類器進行

訓練,並預測 C1 組及 C2 組。結果不論是準確率、敏感度及 AUC

均為 SVM 最佳,此結果與 Chang Li(2022)的最佳為 Adaboost 不

同,然而本研究 SVM 準確率 95.5%與其 Adaboost 準確率 96.1%相

近,其餘模型之準確率也均超過 85.0%同本研究,可顯示此方法預

測分好的預後優劣組可有不錯的預測能力。

5.6 總結

Chang Li(2022)研究使用 CIBERSORT 細胞比例結果替 3-4 期非

小細胞肺癌患者進行分群,結果發現不同分群之總體存活率有顯著

差異,證實病患免疫狀況對於末期患者存活有關聯性,建立之分群

預測模型也達到 96.1%之準確率。然而,我們的研究不僅發現免疫

狀況對化療患者之預後有關,更進一步發現對疾病復發與化療反應

也有關聯性,同時我們的預測模型也達到 95.5%之準確率。

39
第六章 結論與建議

6.1 結論

由於腫瘤環境的複雜性,本研究利用 Bisque 細胞分解工具搭配

Single cell 作為參考推估 LUAD 患者細胞比例,同時進行 ssGSEA


及建立免疫圖來整合免疫相關變量,後續透過 CoxPH model 找出與

PFI 顯著相關的基因表現。根據研究結果,本研究證實細胞比例的

拆解、免疫特徵及 PPS 對於化療反應有關聯性。

研究使用 Bisque 作為拆解工具,以及搭配 DISCO 之 CELLiD 做

細胞註解,共註解出 17 種細胞類型,但是否這 17 種細胞完全涵蓋

腫瘤之原貌,我們仍要抱持懷疑的態度。本研究建議未來實驗可多

方嘗試不同細胞註解工具,此外一些工具如 Bisque 在 Bulk 同時具

有 Single cell data 的時會提升拆解的能力,故臨床實驗上如能搜集

到一些單細胞資料將有助於研究結果的精確度。

40
參考文獻
1. Avila Cobos, F., Alquicira-Hernandez, J., Powell, J. E., Mestdagh, P., & De
Preter, K. (2020). Benchmarking of cell type deconvolution pipelines for
transcriptomics data. Nature Communications, 11(1), 5650.
https://doi.org/10.1038/s41467-020-19015-1
2. Blank, C. U., Haanen, J. B., Ribas, A., & Schumacher, T. N. (2016). CANCER
IMMUNOLOGY. The "cancer immunogram". Science, 352(6286), 658-660.
https://doi.org/10.1126/science.aaf2834
3. Cancer Genome Atlas Research, N. (2012). Comprehensive genomic
characterization of squamous cell lung cancers. Nature, 489(7417), 519-525.
https://doi.org/10.1038/nature11404
4. Cerbelli, B., Scagnoli, S., Mezi, S., De Luca, A., Pisegna, S., Amabile, M. I.,
Roberto, M., Fortunato, L., Costarelli, L., Pernazza, A., Strigari, L., Della Rocca,
C., Marchetti, P., d'Amati, G., & Botticelli, A. (2020). Tissue Immune Profile: A
Tool to Predict Response to Neoadjuvant Therapy in Triple Negative Breast
Cancer. Cancers (Basel), 12(9). https://doi.org/10.3390/cancers12092648
5. Devarakonda, S., Morgensztern, D., & Govindan, R. (2015). Genomic alterations
in lung adenocarcinoma. Lancet Oncol, 16(7), e342-351.
https://doi.org/10.1016/S1470-2045(15)00077-7
6. Gridelli, C., Rossi, A., Carbone, D. P., Guarize, J., Karachaliou, N., Mok, T.,
Petrella, F., Spaggiari, L., & Rosell, R. (2015). Non-small-cell lung cancer. Nat
Rev Dis Primers, 1, 15009. https://doi.org/10.1038/nrdp.2015.9
7. Guo, X., Zhang, Y., Zheng, L., Zheng, C., Song, J., Zhang, Q., Kang, B., Liu, Z.,
Jin, L., Xing, R., Gao, R., Zhang, L., Dong, M., Hu, X., Ren, X., Kirchhoff, D.,
Roider, H. G., Yan, T., & Zhang, Z. (2018). Global characterization of T cells in
non-small-cell lung cancer by single-cell sequencing. Nat Med, 24(7), 978-985.
https://doi.org/10.1038/s41591-018-0045-3
8. Havel, J. J., Chowell, D., & Chan, T. A. (2019). The evolving landscape of
biomarkers for checkpoint inhibitor immunotherapy. Nat Rev Cancer, 19(3),
133-150. https://doi.org/10.1038/s41568-019-0116-x
9. Jackute, J., Zemaitis, M., Pranys, D., Sitkauskiene, B., Miliauskas, S., Vaitkiene,
S., & Sakalauskas, R. (2018). Distribution of M1 and M2 macrophages in tumor
islets and stroma in relation to prognosis of non-small cell lung cancer. BMC
Immunol, 19(1), 3. https://doi.org/10.1186/s12865-018-0241-4
10. Jew, B., Alvarez, M., Rahmani, E., Miao, Z., Ko, A., Garske, K. M., Sul, J. H.,
Pietilainen, K. H., Pajukanta, P., & Halperin, E. (2020). Accurate estimation of

41
cell composition in bulk expression through robust integration of single-cell
information. Nature Communications, 11(1). https://doi.org/ARTN 1971
10.1038/s41467-020-15816-6
11. Jiang, P., Gu, S., Pan, D., Fu, J., Sahu, A., Hu, X., Li, Z., Traugh, N., Bu, X., Li,
B., Liu, J., Freeman, G. J., Brown, M. A., Wucherpfennig, K. W., & Liu, X. S.
(2018). Signatures of T cell dysfunction and exclusion predict cancer
immunotherapy response. Nat Med, 24(10), 1550-1558.
https://doi.org/10.1038/s41591-018-0136-1
12. Karasaki, T., Nagayama, K., Kuwano, H., Nitadori, J. I., Sato, M., Anraku, M.,
Hosoi, A., Matsushita, H., Morishita, Y., Kashiwabara, K., Takazawa, M.,
Ohara, O., Kakimi, K., & Nakajima, J. (2017). An Immunogram for the Cancer-
Immunity Cycle: Towards Personalized Immunotherapy of Lung Cancer. J
Thorac Oncol, 12(5), 791-803. https://doi.org/10.1016/j.jtho.2017.01.005
13. Kobayashi, Y., Kushihara, Y., Saito, N., Yamaguchi, S., & Kakimi, K. (2020). A
novel scoring method based on RNA-Seq immunograms describing individual
cancer-immunity interactions. Cancer Sci, 111(11), 4031-4040.
https://doi.org/10.1111/cas.14621
14. Li, C., Tian, C., Zeng, Y., Liang, J., Yang, Q., Gu, F., Hu, Y., & Liu, L. (2022).
Machine learning and bioinformatics analysis revealed classification and
potential treatment strategy in stage 3-4 NSCLC patients. BMC Med Genomics,
15(1), 33. https://doi.org/10.1186/s12920-022-01184-1
15. Li, M., Zhang, X., Ang, K. S., Ling, J., Sethi, R., Lee, N. Y. S., Ginhoux, F., &
Chen, J. (2022). DISCO: a database of Deeply Integrated human Single-Cell
Omics data. Nucleic Acids Res, 50(D1), D596-D602.
https://doi.org/10.1093/nar/gkab1020
16. Liu, Y. T., & Sun, Z. J. (2021). Turning cold tumors into hot tumors by
improving T-cell infiltration. Theranostics, 11(11), 5365-5386.
https://doi.org/10.7150/thno.58390
17. Mariniello, A., Novello, S., Scagliotti, G. V., & Ramalingam, S. S. (2020).
Double immune checkpoint blockade in advanced NSCLC. Crit Rev Oncol
Hematol, 152, 102980. https://doi.org/10.1016/j.critrevonc.2020.102980
18. Miao, Q., Zhang, L., Zheng, X., Jiang, K., Wu, B., & Lin, G. (2021).
Transformation of a cold to hot tumor and a durable response to immunotherapy
in a patient with non-small cell lung cancer after chemoradiotherapy: a case
report. Annals of Palliative Medicine, 10(4), 4982-4986.
https://apm.amegroups.com/article/view/68231
19. Newman, A. M., Liu, C. L., Green, M. R., Gentles, A. J., Feng, W., Xu, Y.,
Hoang, C. D., Diehn, M., & Alizadeh, A. A. (2015). Robust enumeration of cell

42
subsets from tissue expression profiles. Nat Methods, 12(5), 453-457.
https://doi.org/10.1038/nmeth.3337
20. Oser, M. G., Niederst, M. J., Sequist, L. V., & Engelman, J. A. (2015).
Transformation from non-small-cell lung cancer to small-cell lung cancer:
molecular drivers and cells of origin. Lancet Oncol, 16(4), e165-172.
https://doi.org/10.1016/S1470-2045(14)71180-5
21. Qian, Z., Qingshan, C., Chun, J., Huijun, Z., Feng, L., Qiang, W., Qiang, X., &
Min, Z. (2014). High Expression of TNFSF13 in Tumor Cells and Fibroblasts Is
Associated With Poor Prognosis in Non–Small Cell Lung Cancer. American
Journal of Clinical Pathology, 141(2), 226-233.
https://doi.org/10.1309/ajcp4jp8bzomheaw
22. Remon, J., Besse, B., & Soria, J. C. (2017). Successes and failures: what did we
learn from recent first-line treatment immunotherapy trials in non-small cell lung
cancer? Bmc Medicine, 15. https://doi.org/ARTN 55
10.1186/s12916-017-0819-3
23. Senosain, M. F., Zou, Y., Novitskaya, T., Vasiukov, G., Balar, A. B., Rowe, D.
J., Doxie, D. B., Lehman, J. M., Eisenberg, R., Maldonado, F., Zijlstra, A.,
Novitskiy, S. V., Irish, J. M., & Massion, P. P. (2021). HLA-DR cancer cells
expression correlates with T cell infiltration and is enriched in lung
adenocarcinoma with indolent behavior. Sci Rep, 11(1), 14424.
https://doi.org/10.1038/s41598-021-93807-3
24. Shroff, G. S., de Groot, P. M., Papadimitrakopoulou, V. A., Truong, M. T., &
Carter, B. W. (2018). Targeted Therapy and Immunotherapy in the Treatment of
Non-Small Cell Lung Cancer. Radiol Clin North Am, 56(3), 485-495.
https://doi.org/10.1016/j.rcl.2018.01.012
25. Soda, M., Choi, Y. L., Enomoto, M., Takada, S., Yamashita, Y., Ishikawa, S.,
Fujiwara, S., Watanabe, H., Kurashina, K., Hatanaka, H., Bando, M., Ohno, S.,
Ishikawa, Y., Aburatani, H., Niki, T., Sohara, Y., Sugiyama, Y., & Mano, H.
(2007). Identification of the transforming EML4-ALK fusion gene in non-small-
cell lung cancer. Nature, 448(7153), 561-566.
https://doi.org/10.1038/nature05945
26. Su, R., Zhang, J., Liu, X., & Wei, L. (2020). Identification of expression
signatures for non-small-cell lung carcinoma subtype classification.
Bioinformatics, 36(2), 339-346. https://doi.org/10.1093/bioinformatics/btz557
27. Whiteside, T. L., Demaria, S., Rodriguez-Ruiz, M. E., Zarour, H. M., & Melero,
I. (2016). Emerging Opportunities and Challenges in Cancer Immunotherapy.
Clin Cancer Res, 22(8), 1845-1855. https://doi.org/10.1158/1078-0432.CCR-16-
0049

43
28. Wu, F., Fan, J., He, Y., Xiong, A., Yu, J., Li, Y., Zhang, Y., Zhao, W., Zhou, F.,
Li, W., Zhang, J., Zhang, X., Qiao, M., Gao, G., Chen, S., Chen, X., Li, X., Hou,
L., Wu, C., . . . Zhou, C. (2021). Single-cell profiling of tumor heterogeneity and
the microenvironment in advanced non-small cell lung cancer. Nature
Communications, 12(1), 2540. https://doi.org/10.1038/s41467-021-22801-0
29. Xiong, D., Wang, Y., & You, M. (2020). A gene expression signature of
TREM2(hi) macrophages and gammadelta T cells predicts immunotherapy
response. Nature Communications, 11(1), 5084. https://doi.org/10.1038/s41467-
020-18546-x
30. Yoshihara, K., Shahmoradgoli, M., Martinez, E., Vegesna, R., Kim, H., Torres-
Garcia, W., Trevino, V., Shen, H., Laird, P. W., Levine, D. A., Carter, S. L.,
Getz, G., Stemke-Hale, K., Mills, G. B., & Verhaak, R. G. (2013). Inferring
tumour purity and stromal and immune cell admixture from expression data.
Nature Communications, 4, 2612. https://doi.org/10.1038/ncomms3612
31. Zahran, A. M., Hetta, H. F., Zahran, Z. A. M., Rashad, A., Rayan, A., Mohamed,
D. O., Elhameed, Z. A. A., Khallaf, S. M., Batiha, G. E., Waheed, Y.,
Muhammad, K., & Nafady-Hego, H. (2021). Prognostic Role of Monocytic
Myeloid-Derived Suppressor Cells in Advanced Non-Small-Cell Lung Cancer:
Relation to Different Hematologic Indices. J Immunol Res, 2021, 3241150.
https://doi.org/10.1155/2021/3241150
32. Zhang, M., Ma, J., Guo, Q., Ding, S., Wang, Y., & Pu, H. (2022). CD8(+) T
Cell-Associated Gene Signature Correlates With Prognosis Risk and
Immunotherapy Response in Patients With Lung Adenocarcinoma. Front
Immunol, 13, 806877. https://doi.org/10.3389/fimmu.2022.806877
33. Zheng, Y., Tang, L., & Liu, Z. (2021). Multi-omics analysis of an immune-based
prognostic predictor in non-small cell lung cancer. BMC Cancer, 21(1), 1322.
https://doi.org/10.1186/s12885-021-09044-4

44
附件 1 PPS 分佈及 23 個基因表達熱圖

45
附件 2 PPS 分群之 PFI 存活分析

46
附件 3 分群特徵統計摘要表

特徵類別 特徵類別 U-value Z-score p-value

Proportion basal.cell 3467 -1.06 .289

cDC 3493 0.98 .327

differentiating.ciliated.cell 3221 -1.79 .073

endothelial.cell 3476 1.03 .303

epithelial.cell 3389 1.29 .197

macrophage 2827 2.96 .003*

mast.cell 2800 2.74 .006*

mesothelial.cell 2953 2.59 .010*

monocyte 3177 1.92 .055

myofibroblast 2272 4.61 .000*

plasma.cell 2608 3.61 .000*

proliferation.epithelial.cell 2525 -3.86 .000*

proliferation.macrophage 2647 3.50 .000*

secretory.cell 1776 -6.08 .000*

smooth.muscle.cell 3439 1.14 .254

T.cell 2850 2.89 .004*

type.2.alveolar.epithelial.cell 3600 -0.67 .503

ESTIMATE StromalScore 1297 7.50 .000*

ImmuneScore 425 10.09 .000*

ESTIMATEScore 572 9.66 .000*

TumorPurity 572 -9.66 .000*

ssGSEA 12chemokine 817 8.93 .000*

IFNG.expanded 905 8.67 .000*

47
特徵類別 特徵類別 U-value Z-score p-value

IFNG.Sig 1030 8.30 .000*

CD8.Sig 1043 8.26 .000*

Inflammatory.Sig 913 8.64 .000*

EMG.Sig 1539 6.78 .000*

IPRES.Sig 2065 5.22 .000*

CRMA.Sig 2850 -2.89 .004*

IMPRES.Sig 725 9.20 .000*

Innate immunity 976 8.46 .000*

Priming activation 377 10.23 .000*

IFNG response 1332 7.40 .000*

Inhibitory cells_Tregs 3310 -1.53 .126

Ingibitory cells_MDSC 3385 -1.30 .194

Recognition of tumor cells 3326 -1.48 .139

Proliferation 2845 -2.91 .004*

Glycolysis 3549 0.82 .412

T cell_Immune metagene 634 9.47 .000*

activated DC_LM22 409 10.14 .000*

Treg_Immune metagene 899 8.68 .000*

MDSC_Immune metagene 599 9.58 .000*

Trafficking_infiltration 599 9.58 .000*

Immune checkpoints 2909 2.72 .007*

Other inhibitory molecules 1082 8.14 .000*

CTL 1568 6.70 .000*

48
特徵類別 特徵類別 U-value Z-score p-value

PPS ANGPTL4 3031 -2.36 .018*

AZGP1 2376 4.30 .000*

B3GNT5 3801 -0.07 .944

C1QTNF7 2171 4.91 .000*

C8B 2558 0.79 .430

CAT 3078 2.22 .026*

CCL17 1538 6.79 .000*

CIDEA 3277 -1.63 .103

CPS1 2453 -4.07 .000*

CPXM2 2479 3.99 .000*

HLA.DRB1 931 8.59 .000*

HOXA13 3460 1.08 .280

HRH1 2625 3.56 .000*

IGLV8.61 2123 5.05 .000*

KIAA1549L 3097 2.16 .031*

NELL2 1799 6.01 .000*

NT5E 2322 4.46 .000*

OPA1 3616 -0.06 .535

PMS2 3356 -1.39 .165

PXDN 3113 2.11 .035*

SYTL1 3554 0.80 .424

TCTA 3406 1.24 .215

TNFSF13 2865 2.85 .004*

*=p<.05

49

You might also like