生信喵 发表于 2023-5-15 20:23:49

拼接与reads比对方法比较

一、拼接与序列比对检测方法比较
      变异检测有两种方案可以供选择,第一种是将测序数据与参考序列直接比对,也就是将 fastq文件与 fasta 文件进行比对,生成 bam 文件,在从 bam 文件中检测变异位点,得到 vcf 文件。
      第二种是将拼接好的基因组序列与参考序列进行比对,一般采用全局比对的方法。这两种方法都可以。但目前绝大部分的分析都采用第一种方法,主要有以下几点原因:
      1、拼接基因组并不容易,例如拼接人基因组需要测序至少 30X 数据,而进行变异检测只需要 10X 数据即可;
      2、拼接基因组需要消耗更多的计算资源和计算时间;
      3、拼接得到的基因组为单倍体,等位位点拼接结果中只给一个碱基,这样就丢失了杂合信息,而通过序列比对的方式,可以保留这部分信息;

      4、拼接结果中可能累积错误,这些错误信息有可能被当成变异位点;
      5、测序数据比对的方式可以通过深度信息对变异位点进行质控与校正。
      6、测序数据比对的方式更快,更省计算资源,可以更快的拿到结果。


二、其他物种变异检测?
      除了人基因组变异检测之外,其他物种基因组同样可以进行基因组变异检测,分析方法类似,都是通过将测序数据与参考序列比对,然后进行变异检测,但与人基因组又有几点显著的不同:
      1、没有捕获芯片,无法进行目标其余捕获,所以没有外显子和捕获芯片测序;一种通用的方法是进行酶切,称为简化基因组测序;
      2、没有先验数据库,例如 dbSNP,基因型与表型关系库,可以进行质控;
      3、没有人基因组要求严格,检测结果可以存在一定误差;

      4、其他物种没有高质量全基因组序列,且缺少基因注释信息,变异位点与性状之间的关系库;
      5、人基因组研究主要关注一些“不好的”性状,而动植物研究主要关注“优良”性状。

页: [1]
查看完整版本: 拼接与reads比对方法比较