生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

318

主题
发表于 2022-11-26 23:50:54 | 查看: 15920| 回复: 3
本帖最后由 生信喵 于 2022-11-27 11:59 编辑

一、利用 STAMP 分组检验
       如果一次测序多个样品,需要进行分组比较,可以选择 stamp 软件。STAMP 是一款用于分析微生物分类和功能谱的软件,不仅可以做统计,更能绘制多种图形,可直接放到文章中发表使用。stamp 完全图形化操作模式,支持两两分组,多样品分组比较。将很多复杂的组间统计检验模块化,只需点点鼠标即可完成,非常的方便。并且可以实时生成可视化的结果,包括条形图,箱线图,热图,PCA,散点图,带误差条的条形图等。
      
       stamp 部分可视化结果展示

二、软件安装
       软件支持 Windows、mac,Linux 等多个系统平台,选择自己的系统平台进行下载安装。
下载地址:
  1. https://beikolab.cs.dal.ca/software/STAMP
复制代码
github 主页:
  1. https://github.com/dparks1134/STAMP
复制代码
使用说明下载:
  1. https://beikolab.cs.dal.ca/software/images/c/cd/STAMP_Users_Guide.zip
复制代码
图形案例:
  1. https://beikolab.cs.dal.ca/software/STAMP_image_gallery
复制代码

三、输入文件
       stamp 不仅可以做物种组成差异的比较,还可以做功能差异的比较。stamp 默认支持一种列表格式结果,扩展名为 spf。同时也支持 biom 格式,MGRAST、IMG/M、CoMet、RITA 等软件的结果转换为 spf 格式。如果是使用 metaphlan,可以将 metaplan 的结果转换为 stamp支持的格式。如果是使用 kraken2,可以先生成 metaphlan 结果,再进行转换。利用metaphlan_to_stamp.pl 工具可以直接将 metaphlan 格式结果转换为 spf。也可以在 megan软件中输出 spf 格式结果。
  1. #软件下载:https://github.com/LangilleLab/microbiome_helper
  2. metaphlan_to_stamp.pl metaphlan2.tsv> metaphlan2.spf
复制代码

3.1 spf 文件
       spf 是一种表格数据,如下图所示,其中前面几列是物种分类的层级,可以有多列,这里是两列 phyla(门)和 genera(属)。接下来每一列对应样品中相对丰度。软件提供了一个checkHierarchy.py 脚本来检查文件格式。
      
       spf 格式文件

3.2 metadata 分组信息
       由于是要进行分组比较,因此需要一个分组信息列表,这个需要人为填写。分组信息至少需要两列,第一列样品名,第二列分组信息。分组有多个维度,例如采样点,国籍,临床症状,性别等等。多个分组方便后续进行多个维度的数据探索。关于分组信息如何填写,可以参考qiime 软件官网给出的建议:
  1. http://qiime.org/documentation/file_formats.html
复制代码
      填写时注意一定要对应,有些情况下由于空白的关系,是列名没有正确对应,导致错误,最好在 excel 中验证一下。
      
       metadata 分组文件

3.3 导入数据
       如果是 spf 文件和 metadata,直接导入即可。如果是 biom,MG-RAST 等结果,需要先导入 STAMP 中进行转换,保存为 spf,再次导入。然后依次导入 spf 和 metadata。
      
       从其他软件结果导入 stamp

四、使用案例
4.1 多组比较——肠型
       安装好软件,Load data 打开 example 中的 EnterotypesArumugam 目录中的肠型数据(spf是数据矩阵,tsv 是实验设计),打开默认显示 PCA 结果如下:
      
       展示 PC1-3 之间组合的散点图
       图片大小、关闭其它轴、图例位置等可以下方 Configure plot 中设置,图例在右侧,每组不同颜色,可在 Group field 中选择实验设计中不同的分组,分组可通过勾选进行取消或选择,并实时显示分析结果。(大数据时,请点击右下角实时计算,减少等待时间)

重现肠型分类
       选择右上角 Group field 为 Enterotype,去除后三个非主要分组,只保留三种肠型;同时左侧的数据属性中,Profile level 选择 Genera,现在我们可以看到三种肠型的不同形状在图中分开比较明显。
      
       PCA 图
              属性面板功能简介
       Parent level:标准化的总体范围
       Profile level: 分析的具体级别,如科、属、种或 OTU
       Unclassified: 末分类数据处理方法,分别为 Retain 保留、Remove 移除和仅用于计算比例。不同处理方法,结果会很大差异。
       Statistical properties:统计属性,主要包括统计检验方法,事后检验方法和置信区间,效应大小,多重检验校正方法等的选择;
       Filtering: 过滤阈值,主要是设置 P 值和效应大小。修改后,下方同步有符合条件的结果数量。方便在查看图表结果时只关注符合条件的 features。


4.2 图表类型介绍
       比较常用的是两组比较,本软件对多组比较支持也非常好,很容易进一步探索数据。

       柱状图:显示每个样品中 feature 的相对比例,并添加组均值,方便查看单个 Feature 的数据分布,如下图显示三种肠型中拟杆菌属的相对丰度。

      
       柱状图
       注:Feature 列表下方,可勾远 Show active 来只显示符合条件的结果。上图可以看出选了国家按p值排序点击第一个菌种,美国和意大利区别最大。

       热图:显示每个 Features 在样品中丰度的比例,优热在于不仅显示所有样本的丰度值,更可以对行 Features 和列样品进行聚类显示之间的关系;

       箱线图:简单快速显示组内数据分布。

      
       箱线图展示三种肠型中拟杆菌的相对丰度分布和整体统计 P 值
       主成分分析 PCA:散点图在低维空间显示高维数据间主要差异;
       Post-hoc 图:多组统计检验的无效假设(如 ANOVA 或 Kruskal-Wallis)是所有组相等。提供每对组间测量的 P-value 和效应大小。

      
       扩展柱状图/事后图显示组间两两比较柱状图,及置信区间分布和 P 值。
       图片的具体参数见 Configure plot 页面,可在 File 菜单中 Save plot 保存图片,有 PNG 位图,和 PDF, PS, EPS, SVG 共 4 种矢量图可选,推荐 PDF 格式方便查看和修改。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-11-23 21:43 , Processed in 0.082152 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表