生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

318

主题
发表于 2022-11-2 15:32:45 | 查看: 15226| 回复: 1
本帖最后由 生信喵 于 2022-11-7 10:28 编辑

一、下载案例数据
       网址:
  1. https://github.com/biobakery/biobakery
复制代码
      案例文章:
  1. https://www.nature.com/articles/nature11234
复制代码
      该案例来自 HMP 计划,选取 10 个口腔黏膜(buccal mucosa)样品和 10 个舌头背面( tongue dorsum)样品进行比较分析。
  1. #/share/home/xiehs/17.meta/data/hmp

  2. buccal_mucosa_samples="SRS013506 SRS015374 SRS015646 SRS017687 SRS019221 SRS019329 SRS020336 SRS022145 SRS022532 SRS045049"
  3. for s in ${buccal_mucosa_samples}
  4. do
  5.     wget http://downloads.hmpdacc.org/data/Illumina/buccal_mucosa/${s}.tar.bz2 -O input/${s}.tar.bz2
  6. done
  7. tongue_dorsum_samples="SRS011243 SRS013234 SRS014888 SRS015941 SRS016086 SRS016342 SRS017713 SRS019219 SRS019327 SRS043663"
  8. for s in ${tongue_dorsum_samples}
  9. do
  10.     wget http://downloads.hmpdacc.org/data/Illumina/tongue_dorsum/${s}.tar.bz2 -O input/${s}.tar.bz2
  11. done
  12. #解压
  13. cd input
  14. id="SRS013506 SRS015374 SRS015646 SRS017687 SRS019221 SRS019329 SRS020336 SRS022145 SRS022532 SRS045049 SRS011243 SRS013234 SRS014888 SRS015941 SRS016086 SRS016342 SRS017713 SRS019219 SRS019327 SRS043663"
  15. for s in ${id}
  16. do
  17.     tar -jxvf ${s}.tar.bz2
  18. done
复制代码
  1. vi matadata.txt
  2. #写进如下内容
  3. ID  type
  4. SRS013506   BM
  5. SRS015374   BM
  6. SRS015646   BM
  7. SRS017687   BM
  8. SRS019221   BM
  9. SRS019329   BM
  10. SRS020336   BM
  11. SRS022145   BM
  12. SRS022532   BM
  13. SRS045049   BM
  14. SRS011243   TD
  15. SRS013234   TD
  16. SRS014888   TD
  17. SRS015941   TD
  18. SRS016086   TD
  19. SRS016342   TD
  20. SRS017713   TD
  21. SRS019219   TD
  22. SRS019327   TD
  23. SRS043663   TD
复制代码


二、KneadData 数据质控        kneaddata 是一个数据质控过滤流程,软件整合了 fastqc 质控,trimmomatic 数据过滤,bowtie2 比对数据库过滤宿主等功能。输入原始数据,即可得到处理好的 cleandata,直接用于后面的分析。默认集成人,小鼠,rRNA 等数据库。如果是其他宿主,可以自行建库。
文档:
  1. https://github.com/biobakery/kneaddata
复制代码
  1. conda activate biobakery
  2. vi kneadata.sh #编辑如下内容进脚本
  3. kneaddata  -i1 /share/home/xiehs/17.meta/data/hmp/input/SRS011243/SRS011243.denovo_duplicates_marked.trimmed.1.fastq \
  4.     -i2 /share/home/xiehs/17.meta/data/hmp/input/SRS011243/SRS011243.denovo_duplicates_marked.trimmed.2.fastq \
  5.     -db /share/home/xiehs/17.meta/database/kneadData_databases/human_genome_bowtie2/Homo_sapiens \
  6.     -o kneaddata_output --remove-intermediate-output -v -t 12 \
  7.     --trimmomatic /share/home/xiehs/Software/miniconda3/envs/biobakery/share/trimmomatic/ --trimmomatic-options \
  8.     'ILLUMINACLIP:/share/home/xiehs/Software/miniconda3/envs/biobakery/share/trimmomatic/adapters/TruSeq3-PE.fa:2:40:15 SLIDINGWINDOW:4:20 MINLEN:50' \
  9.     --reorder --bowtie2-options '--very-sensitive --dovetail' --run-fastqc-start --run-fastqc-end
  10. #集群命令
  11. #bsub -q fat -n 12 -o %J.log -e %J.err sh kneadata.sh
  12. #没有的话就nohup sh执行到后台
  13. nohup sh kneadata.sh &
复制代码
您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-11-23 21:22 , Processed in 0.106720 second(s), 29 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表