胃癌单细胞数据集GSE163558复现(三):细胞分群稳当

图片

序言

Hello小伙伴们行家好,我是生信时代树的小学徒”我才不吃蛋黄“。今天是胃癌单细胞数据集GSE163558复现系列第三期。第二期咱们走了Seurat V5法度历程,期骗harmony整合去批次后,按法度历程进行了降维聚类分群。本期,咱们将在第二期基础上选拔稳健的分辨率,对细胞亚群进行稳当。

1布景先容

Bulk转录组的降生,使咱们无意快速的得到组织和细胞多半的RNA-seq数据。相较于传统的RNA检测方法(pcr),这种高通量测序时代更高效,数据维度更高,数据量更大。然而,组织中包含有各式不同类型的细胞,如肿瘤组织中除了肿瘤细胞,还有平素上皮细胞、免疫细胞、成纤维细胞等等。Bulk转录组(组织)的最大劣势在于咱们得到到的RNA-seq数据反馈的是不同类型细胞平均的RNA水平,因此覆盖了部分细胞抒发特征。单细胞转录组测序(scRNA-seq)则很好的弥补了这一劣势,它在单个细胞水平上构建每个细胞的基因抒发谱。

在第二期,咱们最终得到到了45548个细胞的RNA-seq数据。咱们需要弄了了这45548个细胞分别是哪种类型,挨个细胞鉴别赫然不太现实。咱们对细胞进行了降维聚类分群,每一群的细胞具有相同的特征,不错约略的将其归类为团结类细胞(细致的话需要再次降维聚类分群后分亚群,后续有推文会有利先容,敬请温情)。每一群细胞王人有特征的抒发基因,咱们不错凭据这些特征基因将这群细胞归类为某一类型,这一过程被称为“细胞类型稳当”。

频频咱们第一档次降维聚类分群,会将细胞辩认为三大类,分别是

immune (CD45+,PTPRC)epithelial/cancer (EpCAM+,EPCAM)stromal (CD10+,MME,fibro or CD31+,PECAM1,endo)

常见的细胞群的maker基因分别是:上皮细胞(EPCAM、KRT19、CLDN4)、基质(PECAM1、CLO1A2、VWF)、增殖性(MKI67、STMN1、PCNA)、T(CD3D、CD3E、CD2)、B(CD79A,IGHG1,MS4A1),NK(KLRD1、GNLY、KLRF1)和髓系(CSF1R、CSF3R、CD68)细胞。

原文中也有提供分群maker:

图片

2细胞类型稳当

选拔分辨率

在第二期中细胞分群时咱们不错看到,分辨率建立越高,分群数目越多。

Tree_diff_resolution

图片

在这里,咱们选拔0.5分辨率。
rm(list=ls())sce.all.int = readRDS('2-harmony/sce.all_int.rds') sel.clust = "RNA_snn_res.0.5"sce.all.int <- SetIdent(sce.all.int, value = sel.clust)table(sce.all.int@active.ident) colnames(sce.all.int@meta.data) 

图片

此时,细胞分为了14群。

接着,咱们在此责任目次下创建了新的文献夹”3-Celltype“。

dir.create("./3-Celltype")setwd("./3-Celltype")scRNA=sce.all.int

绘画气泡图展示maker基因在各分群的抒发:

genes_to_check = c('EPCAM','KRT19','CLDN4',  #上皮                   'PECAM1' , 'CLO1A2', 'VWF',  #基质                   'CD3D', 'CD3E', 'CD8A', 'CD4','CD2', #T                   'CDH5', 'PECAM1', 'VWF',  #内皮                   'LUM' , 'FGF7', 'MME',  #成纤维                   'AIF1', 'C1QC','C1QB','LYZ',  #巨噬                   'MKI67', 'STMN1', 'PCNA',  #增殖                   'CPA3' ,'CST3', 'KIT', 'TPSAB1','TPSB2',#魁梧                   'GOS2', 'S100A9','S100A8','CXCL8', #中性粒细胞                   'KLRD1', 'GNLY', 'KLRF1','AREG', 'XCL2','HSPA6', #NK                   'MS4A1','CD19', 'CD79A','IGHG1','MZB1', 'SDC1',  #B                   'CSF1R', 'CSF3R', 'CD68') #髓系p = DotPlot(scRNA, features = unique(genes_to_check),                assay='RNA'  )  + coord_flip()p

DotPlot

图片

再次检验分群TSNE图:

mycolors <-c('#E64A35','#4DBBD4' ,'#01A187'  ,'#6BD66B','#3C5588'  ,'#F29F80'  ,             '#8491B6','#91D0C1','#7F5F48','#AF9E85','#4F4FFF','#CE3D33',             '#739B57','#EFE685','#446983','#BB6239','#5DB1DC','#7F2268','#800202','#D8D8CD')tsne =DimPlot(scRNA, reduction = "tsne",cols = mycolors,pt.size = 0.8,                  group.by = "RNA_snn_res.0.5",label = T,label.box = T)tsne

TSNE

图片

辘集DotPlot和TSNE图给各细胞群定名:

图片

####细胞生物学定名celltype=data.frame(ClusterID=0:13,                    celltype= 0:13) 

这里热烈依赖于生物学布景,看dotplot的基因抒发量情况来东谈主工审查单细胞亚群名字。

celltype[celltype$ClusterID %in% c( 4,6,13),2]='Myeloid'celltype[celltype$ClusterID %in% c( 5,11,12 ),2]='Epithelial'celltype[celltype$ClusterID %in% c(0,1),2]='T'celltype[celltype$ClusterID %in% c( 8 ),2]='Fibro'celltype[celltype$ClusterID %in% c( 9 ),2]='Proliferative'celltype[celltype$ClusterID %in% c(3,7 ),2]='B'celltype[celltype$ClusterID %in% c( 2 ),2]='NK'celltype[celltype$ClusterID %in% c( 10 ),2]='endothelial'

然后将细胞类型信息添加到meta.data:

scRNA@meta.data$celltype = "NA"for(i in 1:nrow(celltype)){  scRNA@meta.data[which(scRNA@meta.data$RNA_snn_res.0.5 == celltype$ClusterID[i]),'celltype'] <- celltype$celltype[i]}table(scRNA@meta.data$celltype)

检验不同类型细胞的数目:

图片

可视化细胞类型:

th=theme(axis.text.x = element_text(angle = 45,                                     vjust = 0.5, hjust=0.5)) library(patchwork)celltype_tsne =DimPlot(scRNA, reduction = "tsne",cols = mycolors,pt.size = 1,                    group.by = "celltype",label = T)celltype_tsne

celltype_tsne

图片

抽象看样本类型、患者、细胞类型TSNE图:

sample_tsne =DimPlot(scRNA, reduction = "tsne",cols = mycolors,pt.size = 0.2,                         group.by = "sample") patient_tsne =DimPlot(scRNA, reduction = "tsne",cols = mycolors,pt.size = 0.2,                     group.by = "patient") sample_tsne + patient_tsne+celltype_tsne 

sample_tsne + patient_tsne+celltype_tsne

图片

保存rds对象:

saveRDS(scRNA, "sce_celltype.rds")
3结语

本期,咱们选拔resolution=0.5对细胞进行了手工分群稳当。细胞稳当的口头有许多,笃定请参照单细胞寰球前期推文:单细胞测序最佳的教程(六):细胞类型稳当。在本系列后续推文“细胞亚群细分”中,咱们还将使用singleR自动稳当,并与手工稳当对比,干货满满,敬请期待。下一期,咱们将在本期基础上对细胞类型及基因进行可视化,使用DimPlot,FeaturePlot,ggplot,DoHeatmap等绘画多类型图,使你的Figure更细致,接待行家抓续追更,谢谢!

图片

本站仅提供存储管事,扫数执行均由用户发布,如发现存害或侵权执行,请点击举报。

http://zsbdhb.com/shouye/8474.html

QQ咨询

QQ: