生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

278

主题
发表于 2022-3-28 21:10:09 | 查看: 9482| 回复: 1
背景
      ARTIC Network(https://artic.network/),这个项目是由英国惠康基因会(Wellcome Trust)资助,旨在为病毒爆发开发方案,提供实时的流行病学信息。项目组开发了一组针对新型冠状病毒的实验室和生物信息学工作流程。这个工作流程最早适用于非洲埃博拉病毒的测序诊断工作。目前新冠疫情全球大流行,就顺势利用到了新冠病毒的测序研究中。目前这个团队一直都在努力优化这个工作流,包括前面我们介绍到的如何扩增病毒全基因组序列,也是来自这个团队的研究成果。必须感谢这个团队的努力工作,为这次疫情做出科学研究上的贡献。
使用 Artic Network 工作流程可以一步到位,输入数据,直接生成基因组序列。该流程支持illumina 测序,同时也支持纳米孔测序。另外,该流程中还为纳米孔测序提供了一个rampar 程序,可以充分利用纳米孔快速实时测序的特点,动态处理数据。
案例地址:https://github.com/CDCgov/SARS-C ... aster/protocols/BFXUT_ARTIC_Illumina
3.1 安装软件
  1. git clone https://github.com/artic-network/artic-ncov2019.git
  2. cd artic-ncov2019/
  3. conda env create -f environment.yml
  4. conda activate artic-ncov2019
复制代码
3.2 使用案例
1、创建工作目录
  1. # 创建工作目录
  2. mkdir artic;cd artic;
  3. #激活工作环境
  4. conda activate artic
复制代码
2、下载数据
  1. # 下载数据
  2. #下载nanopore测序数据
  3. wget https://storage.googleapis.com/nih-sequence-read-archive/run/SRR14800265/SRR14800265   -O SRR14800265.sra
  4. fasterq-dump SRR14800265.sra
复制代码
3、数据过滤
  1. artic guppyplex --min-length 400 --directory ../artic/ --prefix clean
复制代码
4、运行流程
      默认使用 nanopolish 的模式,nanopolish 需要原始 fast5 文件,如果是从网上下载的 fastq格式文件,可以添加参数--skip-nanopolish 跳过这步,或者选择 medaka 的模式。

  1. # 运行流程
  2. #medaka模式
  3. cp -r /share/home/xiehs/04.ncov/31.assembly/artic-ncov2019/primer_schemes/ ./
  4. artic minion --normalise 200 --threads 12 --scheme-directory primer_schemes/ --read-file clean_.fastq nCoV-2019/V3 out  --medaka --medaka-model r941_min_high_g351
复制代码

      学会了以上内容,我们就可以去NCBI找找纳米孔测序的数据练练手了。
      接下来我们针对埃博拉病毒跑一下前述流程。
1 下载数据
  1. mkdir ebov;cd ebov;
  2. wget http://artic.s3.climb.ac.uk/run-folders/EBOV_Amplicons_flongle.tar.gz
  3. tar -zxvf EBOV_Amplicons_flongle.tar.gz
复制代码
拷贝配置文件
  1. cp -r /share/home/xiehs/04.ncov/31.assembly/artic-ncov2019/primer_schemes/ ./
复制代码
2 basecalling以及demultiplex
  1. #激活环境
  2. conda activate artic
  3. #basecalling
  4. artic gather --min-length 400 --max-length 800 --prefix ebov-mayinga --directory ./20190830_1509_MN22126_AAQ411_9efc5448 --fast5-directory ./20190830_1509_MN22126_AAQ411_9efc5448/fast5_pass
  5. #拆分barcode
  6. artic demultiplex --threads 2 ebov-mayinga_fastq_pass.fastq
复制代码
3 获得基因组
  1. artic minion --normalise 200 --threads 12 --scheme-directory primer-schemes/ --read-file ebov-mayinga_fastq_pass-NB03.fastq --fast5-directory ./20190830_1509_MN22126_AAQ411_9efc5448/fast5_pass --sequencing-summary ./20190830_1509_MN22126_AAQ411_9efc5448/lab-on-an-ssd_20190830_160932_AAQ411_minion_sequencing_run_EBOV_Amplicons_flongle_sequencing_summary.txt IturiEBOV/V1 ebov
复制代码
     那么前面我们就介绍了新冠病毒基因组的拼接,无论是宏基因组测序,未知的,还是说拼接已知的都可以;illumina或者纳米孔都可以,如果现在给我们一个新冠病毒的测序数据,我们就可以快速的给出基因组序列,有了它我们就可以做其他各种分析了。

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人

GMT+8, 2024-4-25 19:53 , Processed in 0.043922 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表