生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

278

主题
发表于 2022-7-5 15:24:42 | 查看: 699| 回复: 0
一、软件介绍
       csvtk是 seqkit 与 taxonkit 作者开发的另外一款工具,专门用来处理表格数据,虽然名字称为 csvkit,但也可以处理 tsv 格式。可以对表格文件进行多种处理,包括统计,转换,集合,编辑,排序,绘图等操作。相比于 R 与 python 这些功能强大的软件,csvtk 是一个多功能的工具箱,是表格处理的“瑞士军刀”,特别适合处理一些简单的操作。与 csvtk 类似还有一个csvkit。
       官网: http://bioinf.shenwei.me/csvtk/
       手册: http://bioinf.shenwei.me/csvtk/usage/
       中文手册:https://bioinf.shenwei.me/csvtk/chinese/
       csvkit:https://csvkit.readthedocs.io/en/latest/

二、使用案例
  1. #安装软件
  2. mamba install -y csvtk
复制代码
  1. #下载案例文件
  2. git clone https://github.com/shenwei356/csvtk.git

  3. #1 显示csv文件
  4. cat names.csv | csvtk pretty

  5. #2 转为markdown
  6. cat names.csv  | csvtk csv2md

  7. #3 用列或列名来选择指定列,可改变列的顺序
  8. cat names.csv
  9. cat names.csv  | csvtk cut -f 3,1
  10. cat names.csv  | csvtk cut -f last_name,id

  11. #4 用通配符选择多列
  12. cat names.csv  | csvtk cut -F -f '*name,id' | csvtk pretty

  13. #5 按指定列搜索,默认精确匹配
  14. cat names.csv | csvtk grep -f id -p 1 | csvtk pretty

  15. #6 使用正则表达式匹配
  16. cat names.csv  | csvtk grep -f id -p 1 -r | csvtk pretty

  17. #7 分组计算
  18. cat digitals2.csv | csvtk summary -i -g f1,f2 -f f4:sum,f5:sum | csvtk pretty

  19. #8 合并文件
  20. cat names.csv
  21. cat phones.csv
  22. csvtk join -f 'username;username' --keep-unmatched names.csv phones.csv
  23. csvtk join -f 'username;username' --keep-unmatched names.csv phones.csv

  24. #9 绘制直方图
  25. csvtk -t plot hist grouped_data.tsv.gz -f 2 -o histogram.png

  26. #10 绘制箱线图
  27. csvtk -t plot box grouped_data.tsv.gz -g "Group" -f "GC Content" --width 3 -o boxplot.png
复制代码

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人

GMT+8, 2024-4-30 06:06 , Processed in 0.035456 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表