近日,華中農(nóng)業(yè)大學(xué)作物遺傳改良全國重點(diǎn)實(shí)驗(yàn)室和湖北洪山實(shí)驗(yàn)室玉米團(tuán)隊利用721份玉蜀黍?qū)俨牧系?a href='http://www.zbchuanghe.com/tag_847.html' class='zdbq' title='基因相關(guān)食品資訊' target='_blank'>基因組數(shù)據(jù),構(gòu)建了首個玉蜀黍?qū)?ldquo;超級泛基因組(super pan-genome)”圖譜,解析了玉蜀黍?qū)倩蚪M特征并探究了其對玉米表型變異的貢獻(xiàn)。該研究結(jié)果不僅有助于進(jìn)一步理解玉米的馴化歷史,也將促進(jìn)玉米功能基因挖掘和遺傳改良。相關(guān)成果以“A pan-Zea genome map for enhancing maize improvement”為題發(fā)表在Genome Biology雜志上。
泛基因組是一個物種中所有個體的基因組信息總和,能有效解決單一參考基因組帶來的分析偏差,近年來越來越受到重視。“超級泛基因組”則代表一個屬內(nèi)所有物種的基因組信息,是對泛基因組的進(jìn)一步擴(kuò)展。
該研究利用玉米團(tuán)隊此前發(fā)表的和其它公開數(shù)據(jù),共收集整合了721份玉蜀黍?qū)俨牧系娜蚪M測序數(shù)據(jù),包括507份現(xiàn)代玉米材料、31份玉米農(nóng)家種材料以及183份玉米野生近緣種大芻草材料,覆蓋了玉蜀黍?qū)偃縼喎N,具有廣泛的代表性。通過對每個材料進(jìn)行de novo組裝并比對到參考基因組,構(gòu)建得到了總計6.71 Gb的玉蜀黍?qū)俜夯蚪M,是單個玉米基因組的3倍,其中有約37%序列是玉米基因組所沒有的。結(jié)合參考基因組注釋、群體水平轉(zhuǎn)錄組、同源蛋白等證據(jù),在玉蜀黍?qū)俜夯蚪M中注釋了58,944個基因,并對每個基因在群體水平的存在/缺失變異(PAV)進(jìn)行了鑒定,發(fā)現(xiàn)其中約44%的基因是非必須基因(Dispensable gene, 沿用一般說法,并不表示這些基因沒有功能)。該超級泛基因組囊括了目前最全面的玉蜀黍?qū)倩蚪M序列信息,極大地擴(kuò)展了玉米遺傳改良的基因池。
作物馴化過程中基因丟失等信息通常難以被準(zhǔn)確鑒定。基于超級泛基因組,該研究鑒定了群體中每個植株中基因存在和缺失的信息,揭示了玉蜀黍?qū)僦?ldquo;易丟失”基因的模式,并發(fā)現(xiàn)大芻草向玉米的馴化過程中可能同時發(fā)生了“老”基因的“主動”丟失和“新”基因獲得,有助于進(jìn)一步深入理解玉米的馴化過程,也為精準(zhǔn)育種和從頭馴化等提供新信息。
基于超級泛基因組,研究團(tuán)隊也對玉米群體中大量的結(jié)構(gòu)變異(Structural Variation, SV)進(jìn)行了鑒定,在玉米群體中共鑒定到274,649個結(jié)構(gòu)變異,并結(jié)合團(tuán)隊此前發(fā)表的大量多組學(xué)數(shù)據(jù)分析發(fā)現(xiàn),相比于常用的SNP和插入缺失(InDel)等遺傳變異,結(jié)構(gòu)變異能解釋更多的表型變異,更有可能是功能變異位點(diǎn),而且有37%的結(jié)構(gòu)變異是不能被之前的高密度SNP或者InDel標(biāo)記所代替的。
最后,研究團(tuán)隊探討了泛基因組在基因發(fā)掘方面的應(yīng)用。發(fā)現(xiàn)一個SV特有的QTL與響應(yīng)干旱脅迫相關(guān),進(jìn)一步的分析表明,該SV是一個1,947bp的轉(zhuǎn)座子插入,其插入位置剛好落在目標(biāo)基因上游的脫落酸調(diào)控元件內(nèi),推測其可能通過破壞該基因上游轉(zhuǎn)錄因子的結(jié)合,從而抑制該基因在葉片中的表達(dá),進(jìn)而影響植株的干旱脅迫響應(yīng)。結(jié)果表明合理利用該超級泛基因組可幫助基因定位和功能位點(diǎn)挖掘。
華中農(nóng)業(yè)大學(xué)作物遺傳改良全國重點(diǎn)實(shí)驗(yàn)室和洪山實(shí)驗(yàn)室嚴(yán)建兵教授為該論文通訊作者。我校博士后桂松濤為該論文第一作者。該工作得到了國家重點(diǎn)研發(fā)計劃和國家自然科學(xué)基金項(xiàng)目的資助。
【英文摘要】
Background
Maize (Zea mays L.) is at the vanguard facing the upcoming breeding challenges. However, both a super pan-genome for the Zea genus and a comprehensive genetic variation map for maize breeding are still lacking.
Results
Here, we construct an approximately 6.71-Gb pan-Zea genome that contains around 4.57-Gb non-B73 reference sequences from fragmented de novo assemblies of 721 pan-Zea individuals. We annotate a total of 58,944 pan-Zea genes and find around 44.34% of them are dispensable in the pan-Zea population. Moreover, 255,821 common structural variations are identified and genotyped in a maize association mapping panel. Further analyses reveal gene presence/absence variants and their potential roles during domestication of maize. Combining genetic analyses with multi-omics data, we demonstrate how structural variants are associated with complex agronomic traits.
Conclusions
Our results highlight the underexplored role of the pan-Zea genome and structural variations to further understand domestication of maize and explore their potential utilization in crop improvement.
【論文鏈接】
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02742-7
