生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

319

主题
发表于 2022-3-31 21:51:01 | 查看: 1590| 回复: 0
背景
      随着病毒的不断传播,也是不断迭代的过程,在这个过程中会与环境不断的交互,就会产生很多的变种,在经过不停的演化选择过程,最后就会有很多被选择下来的变种,这些变种可能具有极强的感染性。在新冠疫情爆发之后,已经在英国,南非,印度,巴西等地不断发现新的变种。按照 WHO 最新命名规则,最早于 2020 年 9 月发现于英国的新冠变种病毒(编号 B.1.1.7)被命名为 Alpha;2020 年 5 月发现于南非的新冠变种病毒(编号B.1.351 )被命名为 Beta;2020 年 11 月和 4 月发现于巴西的新冠变种病毒(编号分别为P.1、P.2)分别被命名为 Gamma、Zeta;2020 年 10 月发现于印度的两种新冠变种病毒(编号 B.1.617.2、B.1.617.1)分别被命名为 Delta、Kappa。其中目前 Delta 病毒具有最强的感染性和致病性,并且能够突破疫苗的免疫屏障,有可能导致新一轮的全球疫情大流行,需要特别的关注。更多关于 WHO 关于新冠病毒变种株的命令点击下方链接地址。
https://www.who.int/en/activities/tracking-SARS-CoV-2-variants/
      那么如何鉴定一个新测序病毒株属于哪个变种?这个病不难,只需要两个步骤,首先获得新菌株的全基因组序列,然后将其与所有突变株进行比对,构建系统发育树,差别最小的即为该突变株。但多序列比较比较消耗资源。也可以采用 blast 比对的方法,快速计算相似性。这里我们采用 blast 比对的方法。也可以使用 blat 比对,输出 blast 格式结果,速度更快。

一、利用 Pangolin 进行变种病毒鉴定
      pangolin 用于对新冠病毒序列进行家系分析,目前已经将全球测序得到的新冠病毒序列进行了一套专门的家系分类术语,例如 B117,B1351,B.1.525 等,类似与血清型分型。通过家系分型,可以快速对新发序列进行定位,溯源等工作。目前国际上已经对新冠病毒突变株进行了系统分类命令。
1.1 pangolin 简介
      pangolin 是 PHYLOGENETIC ASSIGNMENT OF NAMED GLOBAL OUTBREAK LINEAGES 的简称,根据系统发育关系来对全球各突变株进行家系分配标记。这些单词刚好是 pangolin 穿山甲的英文名字,有传说穿山甲是新冠感染中间宿主,这个名字一语双关,但目前还没有明确的证据证明穿山甲是中间宿主,也可能最终冤枉了这个低调呆萌的小动物。
      
      pangolin 官方网站截图,提供命令行工具和在线分析工具
      如果只是分析少部分数据,安装软件比较麻烦,可以直接使用 pangolin 提供的在线工具,只需提交序列即可。不过提交序列即代表了数据的公开,如果对数据隐私有很大要求,请使用本地版本。
      使用 pangolin 系统,只需输入新冠病毒序列,即可快速得到突变类型信息。与我们上一节中介绍的新冠病毒变种识别的方法类似。不过 pangolin 提供了更加方便的流程,而且还有在线工具可供使用,更加方便。
      官方网址:https://cov-lineages.org/

1.2 软件安装
      本地使用 pangolin,可以直接安装 pangolin 软件,使用 conda 直接安装即可。
  1. git clone https://github.com/cov-lineages/pangolin.git
  2. cd pangolin
  3. conda env create -f environment.yml
  4. conda activate pangolin
  5. pip install ./
复制代码

1.3 运行软件
      软件运行非常简单,只需要输入序列即可,软件会使用 minimap2 软件与定制的数据库进行比对,由于数据库中已经屏蔽了保守区序列,可以提高比对效率。
  1. #运行软件
  2. conda activate pangolin
  3. pangolin ncov.fasta --alignment --outfile pangolin.csv
复制代码
     得到的csv文件可以搬去windows下excel打开
      

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-12-4 01:29 , Processed in 0.076982 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表