Single-cell RNA-seq enables comprehensive tumour and immune cell profiling in primary breast cancer
利用scRNA-seq揭示原發(fā)乳腺癌中腫瘤細胞和腫瘤浸潤免疫細胞單細胞水平的基因表達譜
一.研究背景
自從內(nèi)分泌療法應(yīng)用于ER陽性的乳腺癌(Breast cance,BC)患者以來,研究者已經(jīng)評估了很多針對BC的分子靶向療法。然而BC基因組和基因表達譜的分析都是通過對腫瘤組織整體的研究得來的,因腫瘤自身的異質(zhì)性,分子靶向治療的效果大大折扣。其中BC的遺傳異質(zhì)性(拷貝數(shù)變異,單核苷酸突變等)以及癌細胞基因表達水平的異質(zhì)性對療效有很大影響。此外,因為腫瘤微環(huán)境中各種細胞的存在,從癌組織整體得到的基因表達譜中也反映了非腫瘤細胞的特征,也對癌癥的分子靶向治療造成了干擾。而且這些腫瘤微環(huán)境中的細胞自身的基因表達特征也存在獨立的預(yù)后價值,值得去探究。
以上這些觀點體現(xiàn)了根據(jù)癌組織基因表達譜進行分子靶向療法的缺點和局限。而作者希望通過對不同分子類型的乳腺癌的單細胞水平上的研究,去揭示不同BC亞型中癌細胞和腫瘤微環(huán)境中非癌細胞的基因表達特征,從而為不同亞型BC的分子靶向治療提供理論依據(jù)。同時作者希望通過對腫瘤微環(huán)境中免疫細胞的研究,從免疫細胞轉(zhuǎn)錄組水平揭示癌癥免疫逃逸的機制。
二.論證邏輯
三. 結(jié)果解析
1. 得到11個樣本的外顯子數(shù)據(jù)
11個乳腺癌病人的基本信息如下表,獲取全部病人的腫瘤組織以及BC03,07的轉(zhuǎn)移淋巴結(jié)組織進行WES(全外顯子測序,數(shù)據(jù)在SRP067248),bulk RNA-seq(即對樣本組織整體進行RNA-seq)以及scRNA-seq(數(shù)據(jù)在GSE75688)
乳腺癌的分子亞型分子標志樣本備注
Luminal AER+/PR+,HER2-BC01-02-
Luminal BER+/PR+,HER2+BC03經(jīng)過赫賽汀治療
HER2過表達型ER-,PR-,HER2+BC04-05-06-
basal-like型/三陰性ER-,PR-,HER2-BC07-08-09-10-11-
?向左拖拽可滑動
表1. 樣本信息
分析WES數(shù)據(jù)得到的11個BC患者發(fā)生顯著突變的基因的的CNV(拷貝數(shù)變異)和SNV(單核苷酸突變)信息。BC特征基因的突變也被發(fā)現(xiàn),包括PIK3CA,TP53,ERBB2等基因。在TNBC患者中發(fā)現(xiàn)CNV有明顯改變
圖. 1 樣本W(wǎng)ES得到乳腺癌相關(guān)基因的CNV和SNV信息
2. 得到11個樣本的scRNA-seq數(shù)據(jù)
作者用的是microfluidic chips捕獲單細胞,用SMARTer Ultra Low RNA Kit建庫,Hiseq-2500測序。STAR用于把reads與標準序列對照,基因reads歸一化為TPM(使用RSEM),RNA-SeQC對RNA-seq數(shù)據(jù)進行質(zhì)量控制,過濾標準如下:
細胞基因
1. number of total reads1. 樣本中TPM<1的基因直接用0替代
2. mapping rate2. 轉(zhuǎn)換為log2(TPM+1)
3. number of detected genes3. 在<10%的腫瘤組織細胞中表達的基因被除去
4. portion of intergenic region-
?向左拖拽可滑動
表2. scRNA-seq質(zhì)量控制步驟
經(jīng)過濾后留下了包含515個細胞和17779個基因的scRNAs-seq數(shù)據(jù)用于后續(xù)分析,在這之前先檢驗數(shù)據(jù)的可靠性。每個scRNA-seq數(shù)據(jù)中兩個RNA-spike in的表達比率恒定(A),與特定基因的qRT-PCR結(jié)果相關(guān)性高(B);將每個樣本的scRNA-seq數(shù)據(jù)合并后與其bulk RNA-seq數(shù)據(jù)間相關(guān)性高(C-D);對每個樣本隨機抽取一定細胞進行多元回歸分析,隨著細胞數(shù)增多,對bulk RNA-seq解釋的方差也增高(E)。這些都說明作者得到的scRNA-seq數(shù)據(jù)是可靠的,可以很好的代表腫瘤群體
圖. 2 檢測scRNA-seq數(shù)據(jù)是否真實可靠
3.分離單細胞群中的腫瘤細胞和非腫瘤細胞
首先是確認BC中廣泛的異質(zhì)性
A:通過PCA法對數(shù)據(jù)降維,發(fā)現(xiàn)不同樣本的細胞和屬于同一樣本的細胞混合在一起,說明BC異質(zhì)性同時存在于腫瘤間和腫瘤內(nèi)
B:三個治療靶點基因ER,PR,HER2在不同分子亞型BC樣本中以及同一分子亞型BC樣本的細胞中的表達也存在異質(zhì)性。比如在TNBC樣本的細胞中也存在高表達HER2的細胞
C-D:通過每個樣品的病理切片檢查發(fā)現(xiàn)腫瘤組織中存在不同程度的免疫細胞浸潤以及其他類型細胞
圖4. BC間存在廣泛的異質(zhì)性
因為在進行scRNA-seq前細胞并未篩選,所以作者認為腫瘤組織中的非腫瘤細胞可能造成了BC的異質(zhì)性,下一步是要對其進行分離,再分別分析
A:先通過細胞CNV信息分離開腫瘤細胞和非腫瘤細胞,再根據(jù)免疫評分區(qū)分免疫細胞和基質(zhì)細胞
B:作者打算根據(jù)單細胞基因組的染色體表達模式即CNV模式,從已知的乳腺癌的基因組CNV去推斷細胞是否為癌細胞。作者用GTEx數(shù)據(jù)庫中正常乳腺組織的基因表達譜做為對照,根據(jù)基因的所在的染色體以及起始位置進行排序,以150個基因步長移動計算每個細胞的CNV模式并歸一化。之后通過對515個細胞的無監(jiān)督聚類得到11種類別,可以看到靠上的細胞群都屬于某種BC亞型且都有獨特的CNV模式;而最下方的一類細胞群并不屬于某種BC亞型且沒有明顯的CNV模式
圖5. 細胞的CNV模式
為了驗證從scRNA-seq得來的細胞基因組CNV信息的可靠性,需要和WES得到的CNV信息進行比對,從而驗證根據(jù)細胞CNV模式進行分類的可靠性
A:以樣本BC01的scRNA-seq數(shù)據(jù)得到的CNV信息為例,可以看到它和WES得到的CNV信息有很高的一致性
B:對各個樣品中由scRNA-seq數(shù)據(jù)得來的有CNV的基因表達量取平均值與各樣本W(wǎng)ES得來的相應(yīng)基因表達量進行相關(guān)性分析,在大多數(shù)樣本中呈現(xiàn)高度正相關(guān)
圖6. 從scRNA-seq和WES數(shù)據(jù)中推斷的CNVs的相關(guān)性
C:根據(jù)圖6. B中的聚類結(jié)果,給每個細胞加上癌細胞或非癌細胞標簽,此時PCA圖中兩大類細胞是明顯分開了的,說明分類較成功,結(jié)果可信
D:用ESTIMATE包對兩類細胞進行分析,綠色數(shù)據(jù)為GTEx數(shù)據(jù)庫中183個正常乳房組織的分析結(jié)果。由上文得到的腫瘤細胞的腫瘤得分很高而免疫和基質(zhì)得分與非癌細胞相比顯著降低。有趣的是,在非腫瘤細胞中有一些細胞的免疫得分很低,被認為是纖維母細胞等基質(zhì)細胞
E:作者觀察了兩類細胞分別在3個免疫相關(guān)基因,3個機制相關(guān)基因和3個腫瘤相關(guān)基因的表達情況(順序從下到上)。腫瘤細胞高表達腫瘤相關(guān)基因;非腫瘤細胞高表達免疫相關(guān)基因;非腫瘤細胞中也存在高表達基質(zhì)相關(guān)基因的細胞
通過以上方法,作者從515個細胞中分離出了317個腫瘤細胞,175個腫瘤相關(guān)免疫細胞以及23個基質(zhì)細胞用于后續(xù)下游分析
圖7. 成功分離了癌細胞與非癌細胞
4. 乳腺癌細胞內(nèi)在的異質(zhì)性
在成功區(qū)分兩類細胞后,就能分別展開研究
A:在去除非癌細胞后,樣本單個腫瘤細胞間的相關(guān)性顯著增加,說明腫瘤內(nèi)在的異質(zhì)性可以從單細胞水平去解釋。也可以看到TNBC樣本細胞間的相關(guān)性并沒有明顯提高,說明其腫瘤細胞間也存在較大差異
B:用箱線圖的形式展示去除非癌細胞之前(白框)和之后(條紋框)的腫瘤內(nèi)細胞的相關(guān)系數(shù)。從最右側(cè)的條形圖可以看出在TNBC(粉色)內(nèi)無論是否去除非腫瘤細胞,其樣本內(nèi)細胞間相關(guān)性始終不高,說明腫瘤細胞和微環(huán)境中的非腫瘤細胞都對TNBC的異質(zhì)性有影響
C:分別對腫瘤細胞(左)和非腫瘤細胞(右)進行PCA分析。屬于不同BC樣本的腫瘤細胞會聚成自己獨立的類(左側(cè)),也有些樣本的腫瘤細胞混合在一起,說明了不同類型BC間和同一類型BC內(nèi)腫瘤細胞間的異質(zhì)性;而對于非腫瘤細胞而言(右側(cè)),不同樣本的細胞混合在一起,說明樣本BC類型對細胞聚類的影響很小,而非腫瘤細胞的類型對聚類的影響更大
圖8. 去除非癌細胞后揭示了BC細胞內(nèi)在的異質(zhì)性
接下來對分離出的腫瘤細胞進行BC分子亞型的分類,由于樣本BC05接受過化療,所以并不將其包含在內(nèi)
A:將腫瘤細胞根據(jù)HER2 module score和ER module score(利用genefu包)分成ER+/HER2-,HER2+和ER-/HER2-三類,右側(cè)熱圖展示每個樣本中腫瘤細胞的得分情況,與樣本所屬的BC分子亞型基本一致,但一些樣本混合了其它亞型的細胞。下方餅圖展示了每個樣本中各種類型細胞所占的比例,像BC04-06的細胞顯示出混合的亞型,尤其是BC06中大多數(shù)腫瘤細胞屬于TNBC型;而屬于Luminal B型(ER/HER2雙陽)的BC03中的腫瘤細胞卻被歸為HER2陰性的細胞。這說明不同分子分型BC的腫瘤細胞內(nèi)在的異質(zhì)性
B:GSVA包( Gene Set Variation Analysis,通過評估基因集在樣本轉(zhuǎn)錄組中表現(xiàn)看某一通路是否激活)分析了EMT,干性,血管新生,增殖和復(fù)發(fā)(從genefu包中得到基因集)通路在每個細胞中的富集程度??梢钥吹紼MT基因集在TNBC樣本中富集程度更高;HER2型和TNBC型樣本中干性和復(fù)發(fā)相關(guān)基因集富集程度更高(下方箱線圖)。EMT,干性和血管新生的富集分數(shù)在腫瘤細胞中呈現(xiàn)顯著正相關(guān)(上方散點圖),并以5%為閾值鑒定出三者分數(shù)都很高的稀有細胞(散點圖右上角標出),它們可能在BC的發(fā)生發(fā)展中起重要作用
圖9. BC細胞內(nèi)在的異質(zhì)性
5. BC分子亞型間的異質(zhì)性成分
A:利用Seurat包中的LRT檢驗法獲得了4種BC分子亞型樣本的單細胞水平的差異表達基因(左側(cè)),右側(cè)是bulk RNA-seq中樣本間的差異表達基因,下方是不同樣本單細胞水平GSVA分析的結(jié)果
B:分析BC03-04-06三個樣本(HER2+)腫瘤細胞中HER2/HER3及其下游信號通路激活情況
C:針對TNBC樣本的分析(BC07-BC11),在A中可以看出樣本細胞差異表達基因在basal通路富集。然而根據(jù)之前研究報道,還可以將TNBC樣本腫瘤細胞分為6種不同類型(右側(cè)圖例)。分類后發(fā)現(xiàn)每個TNBC樣本的腫瘤細胞中存在多種類型細胞,這也解釋了TNBC廣泛的異質(zhì)性
圖10. 不同BC亞型的單細胞水平基因表達譜
6. 腫瘤浸潤免疫細胞的異質(zhì)性
結(jié)果4.5是對BC樣本中腫瘤細胞的分析,接下來作者分析了腫瘤微環(huán)境中的免疫細胞
A:作者先用NMF法將175個免疫細胞根據(jù)免疫基因集聚成了三類,注釋為B細胞,T細胞和巨噬細胞。同樣用LRT法找出三個類中的差異表達基因(左上)。右側(cè)是三個類別細胞中差異基因的GO分析結(jié)果。作者同樣對所有免疫細胞做了GSVA分析(右下),可以看到第一類(B細胞)中的細胞大部分來自BC轉(zhuǎn)移淋巴結(jié)組織;其他兩類大部分來自原位BC組織
B:針對第一類B細胞,作者對它們根據(jù)在各個基因集中的GSVA的富集分數(shù)進行層次聚類畫熱圖,這些B細胞又被分為兩類。其中一種有初始B細胞的特征,多來自TNBC樣本;另一種具有中心細胞或中心母細胞的特征,大多來自BC03的轉(zhuǎn)移淋巴結(jié)組織
圖11. 對腫瘤微環(huán)境中免疫細胞的分析
B-C:利用免疫熒光技術(shù)檢測樣本BC組織中的免疫細胞,CD3是T細胞的標志分子,CD20是B細胞的標志分子。C中點代表樣本,顏色越深表示捕獲到的單細胞中的相應(yīng)免疫細胞數(shù)越多,橫坐標是相應(yīng)標志分子在bulk RNA-seq中的表達量,縱坐標是免疫螢光標記的細胞數(shù)??梢钥吹矫庖邿晒獾慕Y(jié)果和bulk RNA-seq的結(jié)果呈顯著的正相關(guān)(p<0.05),而且scRNA-seq確實可以得到T,B淋巴細胞的基因表達譜(灰/黑色點),但并不是所有樣本的scRNA-seq都可以(白點)
圖12. 免疫熒光技術(shù)驗證淋巴細胞的存在
7. 對腫瘤浸潤的T細胞和巨噬細胞進行分析
將免疫細胞中的T細胞提取出,根據(jù)細胞的在每個基因集中的GSVA富集分數(shù)進行聚類分析,它們又被聚成4種類型T細胞,分別表現(xiàn)出初始T,共刺激T,調(diào)節(jié)T和耗竭性T細胞的基因表達特征。之后分別對各樣本BC組織中免疫細胞的組成進行分析。并得出BC樣本中免疫細胞具有表達免疫抑制基因的特征的結(jié)論
圖13. 腫瘤微環(huán)境中T細胞的特征
好啦,讓我們總結(jié)一下本文。作者收集了4種分子亞型的BC樣本組織,主要是通過scRNA-seq數(shù)據(jù)研究乳腺癌的異質(zhì)性。在對RNA-seq數(shù)據(jù)質(zhì)量檢驗后根據(jù)細胞的CNV表達模式將細胞分為腫瘤細胞和非腫瘤細胞(多為免疫細胞)后分開研究乳腺癌的異質(zhì)性。本文主要利用genefu包對腫瘤細胞進行分子分型,以及GSVA包開展功能分析。讓我們期待下一次的文獻解讀,大家不見不散!