全基因组关联分析(genome-wide association study, GWAS),是由Risch和Merikangas在1996年首先提出,全基因组水平分析各位点与复杂性状遗传变异的关联强弱,它以连锁不平衡(linkage disequilibrium, LD)为基础,通过分析数百个或数千个个体的高密度分子标记的特征,一般是上万个甚至上百万个SNP标记,筛选出与复杂性状表现型变异相关联的分子标记,进而分析这些分子标记对表现型的遗传效应。
Hardy-Weinberg平衡定律与连锁不平衡之间的关系
Hardy-Weinberg 平衡定律保证的是一次随机交配单个座位上基因型频率与基因频率达到平衡,并不能保证两个座位上的基因型频率达到平衡状态。单个座位上的HW 平衡与两个座位的连锁平衡之间没有必然联系。
连锁不平衡的生物学意义以及GWAS在植物功能基因组学上的应用
在基因组的进化历程中,迁移、突变、选择、有限群体大小等因素都会引起等位基因频率的改变,从而引起LD的改变。位点间由连锁不平衡到连锁平衡的过程的快慢是通过LD衰减距离来衡量的。通过计算LD衰减可以判断GWAS所需的标记量。总的来说,在GWAS分析中,LD衰减速度越慢,形成的单体型(haplotype)区块越大,关联分析中需要的群体和标记数目越少,但定位就越不精准;相反地,LD衰减得越快,形成的单体型区块越小,关联分析中需要的群体和标记数目越大,定位越准确。一般来说,野生群体比驯化改良群体LD衰减快,异化授粉植物比自花授粉植物LD衰减快。
GWAS在拟南芥、水稻和玉米等模式植物中大量应用。Wang等(2016)提出了对水稻微核心种质材料进行低深度重测序,用于重要农艺性状的全基因组关联分析方法。通过相对可操作的小群体经关联分析直接鉴定到导致直链淀粉含量和粒长差异的突变位点,鉴定到控制种皮颜色的新主效数量性状位点(QTL)。