三叶木通微卫星序列分析及其在核心种质构建中的应用

人类社会的发展伴随着野生植物资源的开发和利用。我国生物多样性位居世界第二,约有33,000种高等植物,且多数是特有物种,具有广阔的应用前景。三叶木通(Akebia trifoliata(Thunb.)Koidz.)是木通科木通属多年生木质藤本植物,广泛分布于东亚地区,属于基部双子叶植物,在被子植点击此处物的遗传进化方面有着重要的理论研究价值。此外,三叶木通还是集药用、果用、油用和观赏为一体的经济型果树,商业开发价值高。然而,三叶木通的基础研究处于起步阶段,研究工具也较为匮乏、资源利用效率低。微卫星(Microsatellite),又称简单重复序列(Simple repeat sequence,SSR),作为真核生物基因组DNA的重要组成部分,在物种进化方面扮演者重要的角色。对微卫星的遗传学进行研究不仅可以揭示物种的演化进程、亲缘关系和分类地位,还能开发数量充足的分子标记,进而加快种质资源评价和新品种培育的进程。本研究先利用课题组前期测定的组学数据,探究三叶木通基因组中微卫星的组成、分布以及进化规律,并根据其序列特征,定向开发一批DNA分子标记;其次,采用新开发的分子标记对174份抽样群体进行遗传多样性分析;再次,根据抽样群体的遗传结构从3000多份资源群体中重新遴选了共306种质组成扩大抽样群体,并进行表型多样性分析和综合评价,筛选综合性状好的优良种质;最后,基于扩大化抽样群体的表型数据和基因型数据分别构建了核心种质与指纹图谱,并从核心种质中筛选出5份专用核心种质,取得的主要结果如下所示:(1)三叶木通基因组中SSR的遗传特征:在三叶木通基因组中共鉴定出434,293个SSR位点,相关性分析表明SSR位点数量与染色体长度呈极显著正相关(r=0.98,p<0.001),基因间区的SSR数量明显多于基因区。基序类型以短核苷酸(单核苷核(Single-nucleotide repeat,SNR)、二核苷酸(Di-nucleotide repeat,DNR)和三核苷酸(Tri-nucleotide repeat,TNR))为主,其比例高达98.67%,而长核苷酸类型(即由4-6个核苷酸单元组成)的占比很少,表明三叶木通SSR类型构成更偏向于草本植物。综合转录组数据分析发现不同类型的SSR其功能可能存在较大差异,其中DNR类型可能对功能基因的完整性和染色体结构的稳定性有重要作用;而TNR类型的表达模式与功能基因相似,通常呈现出组织和时间特异性。同时,进化研究发现三叶木通的微卫星主要通过DNA重组方式产生,在被子植物中有着广泛的转移性。(2)SSR标记的开发:通过软件预测发现,在组装的16条三叶木通染色体上共有36,160个高多态性潜力的微卫星序列,基于这些序列开发了相应的基因组SSR标记。同时,根据三叶木通不同组织转录组数据中注释的Unigenes开发了16,869个表达序列标签微卫星,其中TNR类型占9.83%。最后,利用PCR实验对随机选择的100对引物进行验证,结果表明这些引物的可靠性好、多态性高。(3)抽样群体的遗传多样性分析:以新开发的基因组SSR标记对174份材料组成的抽样群体进行遗传多样性分析,结果发现:83.33%的位点PIC值>0.5,位点整体多态信息含量丰富;抽样群体的期望杂合度、观测杂合度、遗传多样性指数分别是0.72、0.56和1.64,群体的遗传多样性较高且群体的连锁不平衡水平很低(1.17%);群体间遗传分化系数较大0.17,基因流为3.13,分子方差表明变异主要在群体内部(95%);亚群中,四川盆地群体的遗传多样性最高,秦岭淮河线以南的群体与四川盆地群体有着最高的遗传一致性。(4)扩大化抽样群体的表型多样性分析及综合评价:在保持群体结构的基础上,进一步扩大抽样数量,构成了306份扩大化的抽样群体。扩大化抽样群体的表型变异极为丰富,变异系数均值为40.03%,表型多样性指数均值为1.71;聚类分析划分的四个亚群中除了叶尖无显著性差异,其余性状之间差异性显著;相关性分析表明,不仅果实性状之间存在相关性,果实性状与叶片性状之间也有相关性;主成分分析表明,前8个主成分能够解释71.15%的变异,第一主成分是产量因子,第二主成分是观赏因子;综合评价中种质878M、710M和2009分别排名第一、五十六和最末,以逐步回归法筛选了单果重等12个综合评价指标,初筛了56份优良种质。(5)核心种质构建方法的筛选及代表性评价:对依据表型数据构建的21个候选核心种质进行代表性评价发现,采用“分组+总体取样规模20%+组内平方根比例取样法+欧式距离+离差平方和+逐步Crizotinib生产商聚类优先取样法”构建的候选核心种质(PQ2)代表性最好;采用分子标记对PQ2的规模进行压缩,并结合表型保留比列最大法对压缩后的PQ2进行优化构建最终核心种Biogeochemical cycle质。最终核心种质的样本保留率为17.32%,表型保留比例与原始种质一致,极差符合率、变异系数变化率、表型多样性指数、均值差异百分率、方差差异百分率分别为95.16%、121.20%、1.77、8.00%、8.00%,等位基因保留率为96.27%,有效基因数、期望杂合度和遗传多样性指数与原始种质t检验无显著差异。(6)交叉集合法筛选专用核心种质群体:以表型数据标准化后的等级梯度为标准如单果重≥8(232.75 g)、种子重≥8(10.18 g)、可食率≥8(27.00%)、抗病性≥5(高抗和免疫)等,对核心种质进行分类。通过表型交叉集合法筛选了5份专用核心种质和3份综合种质,其中鲜果专用核心种质为924,观赏专用核心种质为1265和113,油料专用核心种质为920和1301,综合核心种质为2140、710M和878M。(7)核心引物法构建指纹图谱:通过11个经过筛选的核心引物对306份种质进行基因分型,单对引物的分辨率范围为10.13%~25.82%,运用引物组合法构建指纹图谱,最少采用5个核心引物即可将306份种质完全分开;将分子身份证制作成条形码,并与种质资源的表型信息整合形成综合二维码,实现种质资源的数字化。以上结果为进一步研究三叶木通的起源、进化和迁移提供了理论依据;也为三叶木通种质资源的精准鉴定、系统评价和高效利用奠定了基础。