生信喵 发表于 2022-3-28 21:10:09

ArticNetWork流程

背景
      ARTIC Network(https://artic.network/),这个项目是由英国惠康基因会(Wellcome Trust)资助,旨在为病毒爆发开发方案,提供实时的流行病学信息。项目组开发了一组针对新型冠状病毒的实验室和生物信息学工作流程。这个工作流程最早适用于非洲埃博拉病毒的测序诊断工作。目前新冠疫情全球大流行,就顺势利用到了新冠病毒的测序研究中。目前这个团队一直都在努力优化这个工作流,包括前面我们介绍到的如何扩增病毒全基因组序列,也是来自这个团队的研究成果。必须感谢这个团队的努力工作,为这次疫情做出科学研究上的贡献。
使用 Artic Network 工作流程可以一步到位,输入数据,直接生成基因组序列。该流程支持illumina 测序,同时也支持纳米孔测序。另外,该流程中还为纳米孔测序提供了一个rampar 程序,可以充分利用纳米孔快速实时测序的特点,动态处理数据。
案例地址:https://github.com/CDCgov/SARS-C ... aster/protocols/BFXUT_ARTIC_Illumina
3.1 安装软件
git clone https://github.com/artic-network/artic-ncov2019.git
cd artic-ncov2019/
conda env create -f environment.yml
conda activate artic-ncov2019
3.2 使用案例
1、创建工作目录
# 创建工作目录
mkdir artic;cd artic;
#激活工作环境
conda activate artic2、下载数据
# 下载数据
#下载nanopore测序数据
wget https://storage.googleapis.com/nih-sequence-read-archive/run/SRR14800265/SRR14800265   -O SRR14800265.sra
fasterq-dump SRR14800265.sra3、数据过滤
artic guppyplex --min-length 400 --directory ../artic/ --prefix clean4、运行流程
      默认使用 nanopolish 的模式,nanopolish 需要原始 fast5 文件,如果是从网上下载的 fastq格式文件,可以添加参数--skip-nanopolish 跳过这步,或者选择 medaka 的模式。

# 运行流程
#medaka模式
cp -r /share/home/xiehs/04.ncov/31.assembly/artic-ncov2019/primer_schemes/ ./
artic minion --normalise 200 --threads 12 --scheme-directory primer_schemes/ --read-file clean_.fastq nCoV-2019/V3 out--medaka --medaka-model r941_min_high_g351
      学会了以上内容,我们就可以去NCBI找找纳米孔测序的数据练练手了。
      接下来我们针对埃博拉病毒跑一下前述流程。
1 下载数据
mkdir ebov;cd ebov;
wget http://artic.s3.climb.ac.uk/run-folders/EBOV_Amplicons_flongle.tar.gz
tar -zxvf EBOV_Amplicons_flongle.tar.gz 拷贝配置文件
cp -r /share/home/xiehs/04.ncov/31.assembly/artic-ncov2019/primer_schemes/ ./2 basecalling以及demultiplex
#激活环境
conda activate artic
#basecalling
artic gather --min-length 400 --max-length 800 --prefix ebov-mayinga --directory ./20190830_1509_MN22126_AAQ411_9efc5448 --fast5-directory ./20190830_1509_MN22126_AAQ411_9efc5448/fast5_pass
#拆分barcode
artic demultiplex --threads 2 ebov-mayinga_fastq_pass.fastq3 获得基因组
artic minion --normalise 200 --threads 12 --scheme-directory primer-schemes/ --read-file ebov-mayinga_fastq_pass-NB03.fastq --fast5-directory ./20190830_1509_MN22126_AAQ411_9efc5448/fast5_pass --sequencing-summary ./20190830_1509_MN22126_AAQ411_9efc5448/lab-on-an-ssd_20190830_160932_AAQ411_minion_sequencing_run_EBOV_Amplicons_flongle_sequencing_summary.txt IturiEBOV/V1 ebov      那么前面我们就介绍了新冠病毒基因组的拼接,无论是宏基因组测序,未知的,还是说拼接已知的都可以;illumina或者纳米孔都可以,如果现在给我们一个新冠病毒的测序数据,我们就可以快速的给出基因组序列,有了它我们就可以做其他各种分析了。

页: [1]
查看完整版本: ArticNetWork流程