人基因组分析简介
一、比较基因组学在得到一个物种的基因组之后,首先可以进行结构基因组学的研究,然后进行功能基因组学。最后可以进行比较基因组的研究。
比较基因组学是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。
将测序数据与参考序列进行比较,找出二者基因组上的变异位点,然后对这些变异位点进行注释,进而推测出基因型与表型之间的关系。
在生物信息分析中,结构基因组学与功能基因组学称为基因组 Denovo 部分,也就是对一个物种的基因组进行从头测序。当基因组已经发表出来,则成为重测序(Re-sequencing)。重测序属于比较基因组学范畴,对物种进行测序,不需要拼接,而直接用测序的 reads 进行短序列比对分析。重测序本质就是找变异,变异检测在当前真核生物信息分析中也常常被称为重测序。
基因组学分类
二、人基因组变异检测简介
人基因组研究是当前基因组研究中最重要的组成部分,绝大部分的测序数据来自于人基因组。因为人基因组研究将广泛应用到临床医学研究中。当前绝大部分的测序数据来自于基因组测序。
对人基因组的研究最早开始于 1990 年的人类基因组计划,2003 年人类基因组计划初步完成,发布了人类基因组计划草图,之后有开启了 hapmap 计划,千人基因组计划等。
从 fastq 到 vcf
目前人基因组分析主要集中在变异检测部分,二代测序主要用来检测 SNP,pacbio 与纳米孔测序可以用来检测 SV。
三、人基因组研究应用
1、肿瘤基因检测;
2、无创产前诊断 NIPT;
3、胚胎植入前诊断 PGS;
4、液体活检;
5、肿瘤早筛;
6、罕见病检测;
7、消费级基因检测 DTC;
8、复杂疾病检测;
9、人类学研究。
四、基因组上的变异类型分类
单碱基突变 转换 颠换 插入 缺失 -
染色体变化 易位 倒位 插入 缺失 倍增
生物信息中的定义
SNP:(single nucletide polymorphsysm),即单核苷酸的多态性,是指等位基因发生了突变,致使不同等位型的出现。SNP 分为转换与颠换。
Indel:Insert+Deletion,小的插入缺失 1-50bp;
CNV:Copy Number Variation,拷贝数变化,倍增;
SV:Structure Variation,大的插入,缺失,易位,倒位;一般大于 50bp。
*SNV:单碱基突变,包括转换,颠换,插入,缺失。
页:
[1]