小麥是重要的糧食作物之一。小麥基因組龐大、高度重復(fù)且為異源六倍體,使得小麥的完整組裝面臨挑戰(zhàn)。2018年,國際小麥基因組測序聯(lián)盟發(fā)布了中國春小麥參考基因組。但是,該基因組組裝存在大量未解析的重復(fù)區(qū)域和復(fù)雜序列結(jié)構(gòu),導(dǎo)致小麥基因組學(xué)研究難以全方位覆蓋整個基因組,阻礙了針對特定區(qū)域開展精細化研究,制約了小麥基因組學(xué)研究的發(fā)展和育種應(yīng)用。
近日,中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所傅向東研究組與魯非研究組,聯(lián)合中國農(nóng)業(yè)大學(xué)科研人員,綜合利用ONT超長讀長測序、PacBio HiFi高精度測序和Hi-C數(shù)據(jù),實現(xiàn)了中國春小麥基因組的近完整組裝(CS-CAU)。CS-CAU大小為14.46 Gb,堿基準確率大于99.9963%,僅剩290個組裝間隙。其中,1D、3D、4D、5D染色體首次實現(xiàn)無間隙組裝,1D和5D染色體達到端粒到端粒級別。
該研究解決了小麥基因組重復(fù)序列高、多倍體復(fù)雜的組裝難題,為解析其他復(fù)雜作物基因組提供了范本?;诮暾蚪M組裝,研究共注釋到151,405個高置信度基因,其中59,180個是新注釋基因,包括7,602個首次組裝出的基因。通過整合RNA-seq數(shù)據(jù)集和跨物種蛋白同源性證據(jù),研究解析了6類種子儲藏蛋白的基因組分布與表達特征。研究發(fā)現(xiàn),ω-醇溶蛋白表達完全由B亞基因組貢獻,而其他5類SSP表達則主要由D亞基因組貢獻,為剖析小麥面筋品質(zhì)的遺傳基礎(chǔ)和分子改良奠定了基礎(chǔ)。除chr1B的著絲粒存在與超長GAA重復(fù)序列相關(guān)的間隙外,其余20條染色體的著絲粒序列均全部組裝完成。對于著絲粒區(qū)序列組成進行分析發(fā)現(xiàn),著絲粒區(qū)域主要由逆轉(zhuǎn)座子構(gòu)成,其中A/B亞基因組著絲粒富含著絲粒相關(guān)反轉(zhuǎn)錄轉(zhuǎn)座子CRW和Quinta,而D亞基因組著絲粒中只有30%的序列為CRW和Quinta。相似的是,串聯(lián)重復(fù)序列在3個亞基因組間分布存在高度的不均勻性,其中71.89%的簡單串聯(lián)重復(fù)富集于B亞基因組,而接近一半的衛(wèi)星序列則集中于D亞基因組。同時,研究解析了著絲粒區(qū)CRW和Quinta逆轉(zhuǎn)座子的插入時間,明確了其在3個亞基因組間的主要擴張時期。
上述研究為小麥遺傳改良和基礎(chǔ)研究提供了關(guān)鍵資源。
相關(guān)研究成果以Near-complete assembly and comprehensive annotation of the wheat Chinese Spring genome為題,在線發(fā)表在《分子植物》(Molecular Plant)上。研究工作得到國家重點研發(fā)計劃和國家自然科學(xué)基金等的支持。
