生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

0

听众

11

主题
发表于 2022-7-28 17:48:24 | 查看: 683| 回复: 0
一、绘制每个群标记基因
       利用 FindMarkers 命令,可以找到各个细胞类型中与其他类别的差异表达基因,作为该细胞类型的生物学标记基因。其中 ident.1 参数设置待分析的细胞类别,min.pct 表示该基因表达数目占该类细胞总数的比例
  1. #寻找每群标记基因
  2. # find all markers of cluster 2
  3. cluster2.markers <- FindMarkers(pbmc, ident.1 = 2, min.pct = 0.25)
  4. head(cluster2.markers, n = 5)

  5. #一次寻找每个群标记基因
  6. # find markers for every cluster compared to all remaining cells, report only the positive
  7. # ones
  8. pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25)
  9. #通过test.use更换不同检测方法
  10. cluster0.markers <- FindMarkers(pbmc, ident.1 = 0, logfc.threshold = 0.25, test.use = "roc", only.pos = TRUE)

  11. #输出每个cluster中前三个基因
  12. top3 <- pbmc.markers %>%  group_by(cluster) %>% slice_max(n = 3, order_by = avg_log2FC)

  13. #方法二
  14. top3 <- pbmc.markers %>% group_by(cluster) %>% top_n(n=3,wt=avg_log2FC)
  15. top3
复制代码
      对每群标记基因进行绘图,features 指定基因。

二、小提琴图
       小提琴图可以反映亚群中各个细胞的标记基因表达量分布,常用于细胞类型的验证;但是对于低表达比例的标记基因不敏感,
  1. #1 小提琴图
  2. VlnPlot(pbmc, features = top3$gene[1:3])
  3. #使用原始count数
  4. VlnPlot(pbmc,features = c("NKG7","PF4"),slot = "counts",log = TRUE)
复制代码
      
       markgene 在不同 cluster 中分布

三、FeaturePlot
       选择每群代表基因绘图,这种展示方法把基因表达量映射到 UMAP 结果中,同样可以直观的看到基因表达的特异性。
       基因映射图可以直观的表达标记基因在不同细胞中的分布情况,但是一张图里只能展示一个基因,检测多个基因时比较复杂,缺乏呈现对因素结果的能力,该图更适合用于展示基因的分布而非亚群细胞鉴定。

  1. #2 FeaturePlot,选择每群代表基因
  2. FeaturePlot(pbmc, features = c("MS4A1", "GNLY", "CD3E", "CD14", "FCER1A", "FCGR3A", "LYZ", "PPBP","CD8A"))
复制代码
      
       markgene 映射在 umap 图中


四、热图
       热图综合反映基因表达水平,通过明暗变化展示标记基因在不同细胞亚群中的分布及细胞亚群中表达标记基因的细胞数量,但是绘制热图之前对数据进行了均一化处理,是敏感变化不明显。这样对于低表达的基因缺乏辨识度。

      
       markgene 分布热图
  1. #4 其他绘图函数
  2. top1 <- c("MS4A1", "GNLY", "CD3E", "CD14", "FCER1A", "FCGR3A", "LYZ", "PPBP","CD8A")
  3. RidgePlot(pbmc,features = top1)
  4. colnames(pbmc)[c(1,2)]
  5. RidgePlot(pbmc,features = top1[3]) #山峦图

  6. CellScatter(pbmc,cell1 = "AAACATACAACCAC-1",cell2="AAACATTGAGCTAC-1",features = top3$gene)
  7. DotPlot(pbmc,features = top3$gene)+ NoLegend()
复制代码


五、定义细胞类型
       前面绘图中每个 cluster 只展示出数字 ,通过对比我们鉴定的 marker gene 与已发表的细胞类型特意的基因表 marker,可以定义我们划分出来的细胞类群。最后,将定义好的细胞类群加上名称。

       每个 cluster 标记基因与细胞类型
Cluster ID Markers Cell Type
0 IL7R, CCR7 Naive CD4+ T
1 CD14, LYZ CD14+ Mono
2 IL7R, S100A4 Memory CD4+
3 MS4A1 B
4 CD8A CD8+ T
5 FCGR3A, MS4A7 FCGR3A+ Mono
6 GNLY, NKG7 NK
7 FCER1A, CST3 DC
8 PPBP Platelet

       该案例中根据每个 cluster 中 markgene,可以很容易鉴定出细胞类型,如果是其他数据,则需要通过额外方式,进行细胞类型鉴定。

  1. #下面这个案例只适用于pbmc3k,其余两个案例需要去鉴定细胞类型
  2. new.cluster.ids <- c("Naive CD4 T", "CD14+ Mono", "Memory CD4 T", "B", "CD8 T", "FCGR3A+ Mono","NK", "DC")
  3. # "Platelet")
  4. names(new.cluster.ids)
  5. names(new.cluster.ids) <- levels(pbmc)
  6. pbmc <- RenameIdents(pbmc,new.cluster.ids)
  7. levels(pbmc)
  8. #重新绘图
  9. DimPlot(pbmc, reduction = "umap", label = TRUE, pt.size = 0.5) + NoLegend()
复制代码
      
       将细胞类型标记图中


六、软件版本信息
  1. #显示软件版本
  2. sessionInfo()
复制代码


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人

GMT+8, 2024-5-4 23:36 , Processed in 0.045213 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表