生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

318

主题
发表于 2022-7-5 15:02:07 | 查看: 1703| 回复: 0
一、软件介绍
        bioawk 是 bwa,samtools 等软件作者李恒写的另一个工具,在 awk 的基础上增加一些专门处理生物文件的使用功能。可以处理 fasta/q,bam,gff,vcf 等格式文件。
  1. #安装
  2. mamba install -y bioawk
  3. #显示文件格式
  4. bioawk -c help
复制代码
       软件地址:https://github.com/lh3/bioawk

二、使用案例
  1. #输出fasta/q名字部分
  2. bioawk -c fastx ' { print $name } ' demo.fastq.gz
  3. #计算gc含量
  4. bioawk -c fastx ' { print $name, gc($seq) } ' demo.fastq.gz
  5. bioawk -c fastx ' { print $name, gc($seq) } ' demo.fasta

  6. #输出CIGAR为deletions的列
  7. samtools view -f 2 demo.bam | awk '$6 ~ /D/ { print $6 }' | head
  8. samtools view -f 2 demo.bam | bioawk -c sam '$cigar ~ /D/ { print $cigar }' | head

  9. #打印vcf文件中的CHROM与POS列
  10. grep -v "^##" demo.vcf | bioawk -tc hdr '{print $_CHROM,$POS}'

  11. #输出比对上的行
  12. samtools view demo.bam | bioawk -Hc sam '!and($flag,4)' | le

  13. #反向互补fasta
  14. bioawk -c fastx '{print ">"$name;print revcomp($seq)}' demo.fasta

  15. #输出vcf中特定genotypes类型
  16. grep -v "^##" in.vcf | bioawk -tc hdr '{print $foo,$bar}'
复制代码


您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-11-23 21:17 , Processed in 0.090158 second(s), 29 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表