近日,华中农业大学作物遗传改良全国重点实验室和湖北洪山实验室玉米团队利用721份玉蜀黍属材料的基因组数据,构建了首个玉蜀黍属“超级泛基因组(super pan-genome)”图谱,解析了玉蜀黍属基因组特征并探究了其对玉米表型变异的贡献。该研究结果不仅有助于进一步理解玉米的驯化历史,也将促进玉米功能基因挖掘和遗传改良。相关成果以“A pan-Zea genome map for enhancing maize improvement”为题发表在Genome Biology杂志上。
泛基因组是一个物种中所有个体的基因组信息总和,能有效解决单一参考基因组带来的分析偏差,近年来越来越受到重视。“超级泛基因组”则代表一个属内所有物种的基因组信息,是对泛基因组的进一步扩展。
该研究利用玉米团队此前发表的和其它公开数据,共收集整合了721份玉蜀黍属材料的全基因组测序数据,包括507份现代玉米材料、31份玉米农家种材料以及183份玉米野生近缘种大刍草材料,覆盖了玉蜀黍属全部亚种,具有广泛的代表性。通过对每个材料进行de novo组装并比对到参考基因组,构建得到了总计6.71 Gb的玉蜀黍属泛基因组,是单个玉米基因组的3倍,其中有约37%序列是玉米基因组所没有的。结合参考基因组注释、群体水平转录组、同源蛋白等证据,在玉蜀黍属泛基因组中注释了58,944个基因,并对每个基因在群体水平的存在/缺失变异(PAV)进行了鉴定,发现其中约44%的基因是非必须基因(Dispensable gene, 沿用一般说法,并不表示这些基因没有功能)。该超级泛基因组囊括了目前最全面的玉蜀黍属基因组序列信息,极大地扩展了玉米遗传改良的基因池。
作物驯化过程中基因丢失等信息通常难以被准确鉴定。基于超级泛基因组,该研究鉴定了群体中每个植株中基因存在和缺失的信息,揭示了玉蜀黍属中“易丢失”基因的模式,并发现大刍草向玉米的驯化过程中可能同时发生了“老”基因的“主动”丢失和“新”基因获得,有助于进一步深入理解玉米的驯化过程,也为精准育种和从头驯化等提供新信息。
基于超级泛基因组,研究团队也对玉米群体中大量的结构变异(Structural Variation, SV)进行了鉴定,在玉米群体中共鉴定到274,649个结构变异,并结合团队此前发表的大量多组学数据分析发现,相比于常用的SNP和插入缺失(InDel)等遗传变异,结构变异能解释更多的表型变异,更有可能是功能变异位点,而且有37%的结构变异是不能被之前的高密度SNP或者InDel标记所代替的。
最后,研究团队探讨了泛基因组在基因发掘方面的应用。发现一个SV特有的QTL与响应干旱胁迫相关,进一步的分析表明,该SV是一个1,947bp的转座子插入,其插入位置刚好落在目标基因上游的脱落酸调控元件内,推测其可能通过破坏该基因上游转录因子的结合,从而抑制该基因在叶片中的表达,进而影响植株的干旱胁迫响应。结果表明合理利用该超级泛基因组可帮助基因定位和功能位点挖掘。
华中农业大学作物遗传改良全国重点实验室和洪山实验室严建兵教授为该论文通讯作者。我校博士后桂松涛为该论文第一作者。该工作得到了国家重点研发计划和国家自然科学基金项目的资助。
【英文摘要】
Background
Maize (Zea mays L.) is at the vanguard facing the upcoming breeding challenges. However, both a super pan-genome for the Zea genus and a comprehensive genetic variation map for maize breeding are still lacking.
Results
Here, we construct an approximately 6.71-Gb pan-Zea genome that contains around 4.57-Gb non-B73 reference sequences from fragmented de novo assemblies of 721 pan-Zea individuals. We annotate a total of 58,944 pan-Zea genes and find around 44.34% of them are dispensable in the pan-Zea population. Moreover, 255,821 common structural variations are identified and genotyped in a maize association mapping panel. Further analyses reveal gene presence/absence variants and their potential roles during domestication of maize. Combining genetic analyses with multi-omics data, we demonstrate how structural variants are associated with complex agronomic traits.
Conclusions
Our results highlight the underexplored role of the pan-Zea genome and structural variations to further understand domestication of maize and explore their potential utilization in crop improvement.
【论文链接】
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02742-7