生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

318

主题
发表于 2023-4-16 18:18:41 | 查看: 2050| 回复: 0
一、扩增子简介
1.1 测序原理
       扩增子测序是宏基因组研究中的一种重要方法。扩增子顾名思义就是通过 PCR 扩增的方法获取研究序列。扩增子测序是一种高靶向性方法,用于分析特定基因组区域中的基因变异。
       扩增子测序主要包括 16S rDNA 测序、18S rDNA 测序、ITS 测序及目标区域扩增子测序等。由于 16S 测序较多,一般也直接成为 16S 测序。采用第二代高通量测序平台测定的 16S/18S /ITS 某个高变区域的序列,来反应环境样品在细菌、真菌、古菌分类方面物种之间的差异,对研究海洋、土壤、肠道粪便等环境中的微生物构成有重要的指导作用,同时也是系统发育和分类学研究中一种广泛使用的方法,特别是应用于不同的宏基因组学样本中。
       为什么可以选择扩增子作为宏基因组物种分类的研究对象。这是因为 16S,18S 和 ITS 区域有高度的保守性,且存在一定的高变区,在不同物种之间有明显的差异,可以作为物种分类的 Marker Gene。

1.2 扩增子分析内容
       扩增子分析结果包括三部分,1、物种分类结果;2、物种分类丰度信息;3、群落功能信息;
       其中物种分类和丰度是主要内容。能够对给定的一个微生物群进行定性和定量。扩增子的功能分析采用一种预测的方式。
       最后就是很多生态学统计内容和可视化,例如 alpha 多样性和 beta 多样性。所以,目前扩增子的分析内容还是非常多的。

二、宏基因组与 16S 比较
扩增子测序 宏基因组 宏转录组
研究对象 16S/18S/ITS 等扩增产物 全部 DNA 全部 mRNA
是否需要PCR扩增 需要 不需要 需要
资金成本 较低 较高 较高
获得结果 物种组成及多样性 物种组成,多样性以及基因功能 基因表达差异信息以及基因功能
物种组成信息 一次研究只包括细菌(16S)或真菌(18S 或 ITS),无法得到全部物种 可以得到细菌,真菌以及病毒信息 可以得到细菌,真菌以及病毒信息
分析难度 简单 较难 较难
优势 不用考虑宿主污染问题,价格便宜,适合大样本研究 无需扩增,包含全部DNA信息 可以得到基因表达差异信息
局限性 存在 PCR 偏好性 测序数据量大,价格高,无法得到基因表达信息 RNA 不稳定,建库难度较大,基因信息不完整

扩增子测序优势:
       1、价格便宜;
       2、通过扩增,不受宿主的影响;
       3、数据量小,容易分析;
       4、16S 数据库信息比宏基因组全,可以鉴定出更多的内容;
       5、数据量小,很容易达到饱和。
缺点:
       1、只能得到细菌或者真菌信息;
       2、扩增存在偏好性;
       3、非全长测序,存在误差;
       4、不能做功能分析。

三、扩增子分类
3.1 16S
       16S rDNA(16S ribosome RNA gene)是指编码核糖体上 16SrRNA 亚基的基因。在这里需要说明的一点是通常 rRNA 指的是 rDNA 的转录产物,它是构成核糖体的重要成分,核糖体由许多小的 rRNA 分子组装而成,16SrRNA 是其中一个组件。
       除了 16S,原核微生物的 rRNA 按沉降系数可以分为 5S、16S 和 23SrRNA,大小分别约为120bp、1540bp 和 2904bp(以 E.coli 为例),其中 5S rRNA 的基因序列较短,易于测定,但是由于其缺乏足够的遗传信息,不适用于系统分类研究。相反,23SrRNA 含有的核昔酸序列较长,分析较困难。       16SrRNA 占细菌总 RNA 量的 80%以上,基因序列长短适中,其结构中既有保守区域,又有变异区域,是较好的生物标志物。

      
       16S 结构示意图
       人们根据 16SrRNA 基因不同区域序列的可变性将其分为 9 个可变区和 10 个保守区(16S rDNA 扩增子测序(16S ribosome DNA ampliconsequencing),通常是选择某个或某几个变异区域,利用保守区设计通用引物进行 PCR 扩增,然后对高变区进行测序分析和菌种鉴定,从而实现环境样品中微生物组成结构和种群分布特征的探索与发掘。

      
       二级和三级立体结构
       16S rRNA 包括 10 个保守区域和 9 个高变区域,对高变区核酸序列进行 NGS 测序, 可区分属特性,用于细菌的分类鉴定和系统进化。16S 扩增子测序通常是选择某个或某几个变异区域,利用保守区设计通用引物进行文库扩增,然后对高变区进行测序分析和菌种鉴定,16S rDNA 扩增子测序技术已成为研究样品中微生物群落组成结构的重要手段。
       最早使用 16S 进行物种分类是 Carl Woese,通过 16S 发现了古细菌,提出了“三域”学说。

      
       三界生物的 16S rRNA 的比较

3.2 18S
       18S rDNA 为编码真核生物核糖体小亚基 rRNA 的 DNA 序列。对 18S rDNA 某个高变区进行测序,用于研究环境样本中真核微生物群落结构多样性。

      
       18S 结构示意图

       18S 比 ITS 更保守。真菌是一类特殊的真核生物,它们拥有很高的物种以及种内多样性,而又有较高的序列保守性。

      
       18S 扩增引物分布
       18S 可以构建远距离的系统发育关系,但是对于鉴定物种或区分种内株系比较困难;ITS 是间隔序列相当于内含子,进化速率更快一点,因此可用来鉴定特定的物种和株系,但是对于远距离的系统发育关系构建是很难支持的。现在比较普遍的做法是 18S 和 ITS 结合,能够比较好的分析进化又能获得高的物种分辨率。


3.3 ITS
       ITS(Internal Transcribed Spacer),内源转录间隔区,分为两个区域:ITS1 和 ITS2,ITS1 位于真核生物 rDNA 序列 18S 和 5.8S 之间,ITS2 位于真核生物 rDNA 序列 5.8S 和 28S 之间。ITS对区分所有真菌有 72%的成功率,因此 ITS 扩增是目前研究真菌的常用方法之一,用于研究环境微生物中真菌群落结构多样性。

      
        ITS 结构示意图

四、不同引物的选择
       由于 illumina 测序最长只能测序到 2*300bp,无法达到 16S 全长测序,因此只能测序 16S 的一部分区域。这就需要有所选择。目前 16S 有 9 个高变区,常用的扩增区域包括 V1-V2 区,V3-V4 区,V4-V5 区,V6-V8 区等。

      
       16S 高变区长度分布

       不同引物扩增产物不同,且针对不同物种有一定偏好性,选择不同的引物最终结果会有差别。有文章专门比较过不同扩增引物结果的差别。

       文章:PMID: 20880993
       从该文中结果中得出 V4 区域具有好的结果,一个可能的原因是 V4 区域较长。因此建议选择V3-V4,或者 V4-V5 区域。


五、不同测序平台 16S 测序比较
       由于测序技术的限制,目前的二代测序只能测序 16S 的部分区域,例如常用的 V3-V4 区域,且双末端具有一定的重叠区,可以进行连接。即使最长的 miseq 测序,2*300bp,拼接完也只有 500bp 左右,只有 16S 全长的 1/3。而使用 pacbio 和 nanopore 测序可以测序 16S 的全长,不过 pacbio 测序价格较高,nanopore测序错误较高,目前使用全长 16S 的并不多。不过随着技术的进步,已经有不少文章尝试使用三代全长 16S 进行分析。国内多家测序公司已经推出 nanopore 全长扩增子的测序产品。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

收藏回复 显示全部楼层 道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-11-23 21:04 , Processed in 0.085973 second(s), 30 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表