|
发表于 2022-11-11 08:42:00
|
查看: 14729 |
回复: 0
一、megan 简介
megan,Metagenome Analyzer Microbiome analysis using a single application。是一款综合性的微生物物种分类工具,将多款物种分类的工具集合到一个软件中。mega 不仅可以完成物种分类,同时还包括非常强大的可视化功能,可以用户物种分类结果的可视化,只需点点鼠标即可完成其他软件复杂的图。我们几乎可以将任何软件物种分类的功能表输入到megan 中进行数据可视化。
megan 除了支持物种分类工作,还支持功能分析,包括 InterPro2GO, SEED, eggNOG or KEGG数据库的结果。不过由于 KEGG 版权的限制,社区版本的 megan 分析 KEGG 分析结果是使用 2011 年之前的数据库,使用付费版本的 megan 可以做最新版的 KEGG 数据库分析。
megan:
- https://software-ab.informatik.uni-tuebingen.de/download/megan6/welcome.html
复制代码 diamond:
- https://github.com/bbuchfink/diamond
复制代码
二、megan 数据可视化
megen 提供了非常强大的数据可视化功能。使用起来非常简单,它支持多种格式作为输入文件,例如 diamond 比对的 daa 格式,blast 比对结果,sam 格式结果,last 比对,RDP,MG-RAST,Silva 等在线网站生成的结果。同时 megan 也支持通用的 biom 格式,不过当前biom 2.0 采用 HDF5 的格式封装,Java 不是原生支持,因此 megan 不支持,需要将 biom 2.0进行转换才能导入 megan 中。好在 megan 支持最简单的 csv 格式或者 tsv 列表格式,几乎所有软件生成的结果都可以转换为这种格式,直接就可以导入 megan 中。我们几乎可以将所有物种分类软件的结果生成这种格式。只需两列,第一列物种分类名称,第二列 reads 数目或者丰度信息。csv 可以用逗号分隔,如果是使用制表符分隔则为 tsv 格式。如果不熟悉Linux 命令,可以使用 Excel 进行处理。
输入文件格式:
megan 输入文件 csv 格式
megan 物种分类:
megan 系统发育树
结果可视化:
megan 可视化展示
三、分组比较
添加分组信息 metadata,首行必须为关键字“#SampleID”,然后是分组信息,可以有多个维度分组内容。
metadata 信息,之前我们有写过。
四、热图
利用 hclust2 可以绘制热图,输入合并之后的物种组成丰度表即可。
- #提取种丰度信息
- grep -E "s__|clade" merged_abundance_table.txt | sed 's/^.*s__//g'| cut -f1,3-8 | sed -e 's/clade_name/body_site/g' > merged_abundance_table_species.txt
- hclust2.py -i merged_abundance_table_species.txt -o abundance_heatmap_species.png --f_dist_f braycurtis \
- --s_dist_f braycurtis --cell_aspect_ratio 0.5 -l --flabel_size 10 --slabel_size 10 --max_flabel_len 100 \
- --max_slabel_len 100 --minv 0.1 --dpi 300 --ftop 25
复制代码
hclust 结果热图展示
还可以将生成的矩阵,导入R中绘制热图
- <div>x <- read.table("merged_abundance_table_species.txt",sep = "\t",header = T,row.names = 1)</div><div>head(x)</div><div>library(pheatmap)</div><div>y <- x[order(rowSums(x),decreasing = TRUE),]</div><div>pheatmap(y[1:10])</div>
复制代码
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
|