三陰性乳腺癌(TNBC)的特征是缺乏孕酮受體 、雌激素受體和人表皮生長因子受體2(HER2),與其他乳腺癌類型相比,TNBC表現(xiàn)出更多的血管生成和上皮-間充質(zhì)轉(zhuǎn)換(EMT),且具有廣泛的腫瘤間和腫瘤內(nèi)異質(zhì)性,在單細(xì)胞水平上鑒定TNBC細(xì)胞的異質(zhì)性和高轉(zhuǎn)移性腫瘤亞群將有助于TNBC的精確治療。
作者整合了兩個單細(xì)胞轉(zhuǎn)錄組(GSE118389和GSE75688),用Seurat包基于regularized negative binomial regression的方法處理批次效應(yīng)以及進(jìn)行單細(xì)胞RNA-seq分析,采用UMAP方法進(jìn)行非線性降維(圖1.B),顯示出每個患者的腫瘤細(xì)胞高度聚集。而免疫細(xì)胞則根據(jù)其細(xì)胞類型而不是來源表現(xiàn)出較高的聚類(圖2.A)。
TNBC的腫瘤復(fù)發(fā)與幾個侵襲性癌癥特征密切相關(guān),如細(xì)胞干性、血管生成和EMT,因此作者在單細(xì)胞水平上分析了這三個特征。在TNBC細(xì)胞中,細(xì)胞干性、血管生成和EMT互相呈正相關(guān)(圖1.C-E),這三個特征的相關(guān)性表面TNBC的轉(zhuǎn)移性更強(qiáng),復(fù)發(fā)率更高。作者還鑒定出三者分?jǐn)?shù)都很高的細(xì)胞(散點(diǎn)圖中以紅點(diǎn)標(biāo)出),提示它們在腫瘤進(jìn)展、轉(zhuǎn)移和復(fù)發(fā)中可能具有重要作用。
免疫細(xì)胞經(jīng)UMAP降維被分為三類:T細(xì)胞、B 細(xì)胞和巨噬細(xì)胞(圖.2A),熱圖(圖.2B)顯示了三個子類的代表基因。接著作者分別對三類免疫細(xì)胞進(jìn)行分析。
對于T細(xì)胞,作者根據(jù)細(xì)胞在每個樣本中的GSVA富集分?jǐn)?shù)進(jìn)行聚類分析,將其與T細(xì)胞功能狀態(tài)如調(diào)節(jié)性、共刺激性、初始性、細(xì)胞毒性和耗竭性等聯(lián)系起來,分別表現(xiàn)出初始T,共刺激T,調(diào)節(jié)T和耗竭性T細(xì)胞的基因表達(dá)特征。與其他患者相比,BC09患者具有更多的細(xì)胞毒性T細(xì)胞。相反,PT058和 PT084患者的細(xì)胞毒性T細(xì)胞活性水平較低。高細(xì)胞毒活性的T細(xì)胞表達(dá)高水平的CST7、GZMA、GZMB、IFNG、NKG7、PRF1 和TNFSF10。另外,作者發(fā)現(xiàn)TNBC組織中的T細(xì)胞即使在同一患者中也表現(xiàn)出混合的初始T細(xì)胞狀態(tài),提示初始T細(xì)胞狀態(tài)可能與TNBC中T細(xì)胞細(xì)胞毒性活性的效率有關(guān)。(圖.3)
對于腫瘤浸潤的B細(xì)胞,作者分析了B細(xì)胞的功能狀態(tài), 如抗凋亡、初始記憶、細(xì)胞因子、促凋亡、增殖、生發(fā)中心和相關(guān)基因表達(dá)特征。在TNBC患者之間和同一TNBC患者中,B免疫細(xì)胞及相關(guān)基因表達(dá)均表現(xiàn)出異質(zhì)性分布。(圖.4)
對于腫瘤浸潤的巨噬細(xì)胞,作者在巨噬細(xì)胞中發(fā)現(xiàn)了較高的M2活性。在許多癌癥類型中,M2樣TAMS通過誘導(dǎo)血管生成、EMT和細(xì)胞干性以及抑制免疫監(jiān)測來促進(jìn)腫瘤的發(fā)生。在TNBC的大多數(shù)巨噬細(xì)胞中,M2型基因如TGFBI、MS4A6A和CD163被上調(diào)。此外,已知促進(jìn)血管生成、EMT和腫瘤進(jìn)展的基因,如IL8和PLAUR,在TNBC的巨噬細(xì)胞中過表達(dá)??偟膩碚f,M2樣TAMs是TNBC巨噬細(xì)胞的主要類型。
作者用CIBERSORT計算了TCGA-TNBC患者bulk RNA-seq轉(zhuǎn)錄組圖譜中M2樣TAMS的豐度。表2總結(jié)了TCGA-TNBC患者信息。生存分析表明,高豐度的TAMs與 TNBC患者較差的無復(fù)發(fā)生存(RFS)有關(guān)(圖.6.A)。為了進(jìn)一步了解TAMs在TNBC中的潛在作用,作者進(jìn)行了WGCNA分析,以軟閾值=5,擬合指數(shù)R2=0.95構(gòu)建無標(biāo)度的共表達(dá)網(wǎng)絡(luò)來識別與TAM相關(guān)的基因特征。一共生成7個模塊,其中藍(lán)色模塊與與M2樣TAM得分相關(guān)性最高(r=?0.48,P=1e?6,圖.6.B)。圖.6.C中的每一個點(diǎn)代表一個基因,橫坐標(biāo)Module Membership表示基因與模塊(module eigengene)的相關(guān)性,縱坐標(biāo)基因顯著性表示基因與TAM的相關(guān)性,這里可以看出與TAM高度顯著相關(guān)的基因往往是與TAM顯著相關(guān)的模塊中的重要元素。接著,作者提取了藍(lán)色模塊的hub genes并進(jìn)行單因素COX回歸分析,以p=0.01為閾值,火山圖顯示篩選得到146個基因(圖.6.D),并使用TAM相關(guān)基因計算預(yù)后風(fēng)險評分。
作者基于PCA以146個基因的第一主成分計算了保護(hù)得分Anti-TAMPCA(圖.6.E) ,具體計算過程見下圖,其中Eij表示腫瘤樣本j中第i個hub gene的 log2(RSEM + 1) 表達(dá)量,Ci表示表示TAM細(xì)胞相關(guān)基因?qū)?yīng)的coefficient。在TCGA-TNBC隊列中,高保護(hù)得分的患者比低保護(hù)得分的患者有更好的預(yù)后 (HR=0.11,P<0.001,圖.6.F)。作者還在GEO整合數(shù)據(jù)集(GSE19615, GSE21653, GSE31519)中進(jìn)一步驗(yàn)證了TAM相關(guān)基因預(yù)測TNBC患者RFS的能力(HR=0.56,P=0.033,圖.6.G)。接著,作者使用ssGSEA鑒定了TAM相關(guān)基因特征的潛在機(jī)制,圖.6.H顯示膽汁酸代謝、雌激素反應(yīng)和P53通路與TAM相關(guān)的保護(hù)評分呈較高的負(fù)相關(guān)。
根據(jù)TAM相關(guān)基因的表達(dá),使用ConsensusClusterPlus包基于K均值的Consensus Clustering(一致性聚類)將TNBC分為不同的亞組。一致性聚類通過基于重采樣的方法來驗(yàn)證聚類合理性(即找到一個適合的K值)。常見標(biāo)準(zhǔn)是選擇CDF(Cumulative distribution function)(圖7.A)下降坡度小的K值,作者在這里選擇了K=2作為最優(yōu)參數(shù),將訓(xùn)練隊列劃分為不同的亞組。然后圖7.B建立一致性矩陣(consensus matrix),一致性矩陣的數(shù)值在[0,1],等于1代表多次聚類兩個數(shù)據(jù)點(diǎn)全部在同一個類里面,等于0代表多次聚類全部不在同一個類里,圖中顯示出K=2時聚類效果較好。圖7.C熱圖顯示了作者使用limma包篩選得到的兩個cluster之間的差異表達(dá)基因。圖7.D顯示cluster 1患者的預(yù)后優(yōu)于cluster 2患者,圖7.E的小提琴圖顯示了與cluster 1相比,cluster 2的TAM評分顯著升高(P<0.005),總的來說,低TAM評分的cluster 1患者預(yù)后優(yōu)于高TAM評分cluster 2患者。
作者還進(jìn)一步進(jìn)行了GSEA分析,與cluster 2相比,cluster 1上調(diào)的通路包括與雌激素早期反應(yīng)相關(guān)的通路、與雌激素晚期反應(yīng)相關(guān)的通路、M2巨噬細(xì)胞的上調(diào)以及p53通路;cluster 1下調(diào)的通路包括E2F靶點(diǎn)、G2M檢查點(diǎn)和MYC靶點(diǎn)相關(guān)通路。(圖7.F-G)
首先,作者通過ranger包找到回歸過程中的最佳超參數(shù)(這里的超參數(shù)即為機(jī)器學(xué)習(xí)算法中的調(diào)優(yōu)參數(shù),如正則化系數(shù)λ等)。然后,使用randomforest包構(gòu)建隨機(jī)森林回歸模型,使用e1071包構(gòu)建SVM模型并進(jìn)行特征排序,提取了前50個基因,隨機(jī)森林算法和SVM算法有19個基因重疊,作者發(fā)現(xiàn)其中的VIPR1、ABCD4、SLC40A1和SCNN1A是不良的預(yù)后因素,這四個基因在之前的研究中顯示與代謝變化有關(guān),這提示了TAM與TNBC代謝變化之間的潛在聯(lián)系。而其他15個基因與較好的RFS有關(guān)。
作者接著在Python中采用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò),通過TAM相關(guān)基因來預(yù)測免疫治療的反應(yīng)。神經(jīng)網(wǎng)絡(luò)的構(gòu)造過程如圖8.A所示。神經(jīng)網(wǎng)絡(luò)由輸入值x,權(quán)重w,偏置b,激活函數(shù)構(gòu)成。作者使用了隨機(jī)梯度下降法求得最合適的權(quán)重,使得預(yù)測值與真實(shí)值之間的誤差最小,梯度下降的learning rate或步長設(shè)置為0.001。將TCGA-TNBC隊列作為訓(xùn)練集,將整合的GEO隊列作為測試集來評估準(zhǔn)確性。在訓(xùn)練過程中,dropout rate設(shè)置為0.2,dropout是指構(gòu)造神經(jīng)網(wǎng)絡(luò)前向傳播的時候,讓某個神經(jīng)元節(jié)點(diǎn)以一定的概率p隱藏,這樣可以使模型泛化性更強(qiáng),不會過于依賴某些局部特征,減少過擬合。激活函數(shù)為ReLU。訓(xùn)練集的損失值隨迭代次數(shù)Epoch的增加而減小,表明訓(xùn)練過程的效率很高(圖8.B)。當(dāng)對訓(xùn)練集迭代次數(shù)達(dá)到1000時,值得注意的是,使用混淆矩陣在測試集中正確地識別了所有樣本(圖8.D)。在ROC圖中,曲線下面積(AUC)達(dá)到100%(圖8.C)。
小結(jié)
本篇文章中使用公共數(shù)據(jù)庫的scRNA-seq和bulk RNA-sec數(shù)據(jù),分別分析了三陰乳腺癌腫瘤細(xì)胞和腫瘤免疫浸潤細(xì)胞的腫瘤間和腫瘤內(nèi)異質(zhì)性。在腫瘤細(xì)胞中,在單細(xì)胞水平上發(fā)現(xiàn)了血管生成、stemness和EMT之前的高度相關(guān)性,并發(fā)現(xiàn)了三者同時高表達(dá)的細(xì)胞子集。在腫瘤免疫浸潤細(xì)胞中,比較了T細(xì)胞、B細(xì)胞、巨噬細(xì)胞在單細(xì)胞水平上的腫瘤異質(zhì)性,還發(fā)現(xiàn)了巨噬細(xì)胞中M2樣TAMs與預(yù)后不良有關(guān),并基于已識別的M2樣TAMs相關(guān)特征建立神經(jīng)網(wǎng)絡(luò),以預(yù)測TNBC對免疫治療的反應(yīng)。
值得注意的是,神經(jīng)網(wǎng)絡(luò)在測試集中達(dá)到了100%的準(zhǔn)確率,這一結(jié)果強(qiáng)調(diào)了M2樣TAMs在TNBC治療中對預(yù)測免疫治療的重要性,并提示M2樣TAMs的消融可能對治療腫瘤有效。然而,巨噬細(xì)胞靶向方法具有全身性毒性,因?yàn)榘畜w作用于所有類型的巨噬細(xì)胞,因此還需要大量的臨床研究與實(shí)驗(yàn)。
聯(lián)系客服