近日,中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)基因組研究所農(nóng)業(yè)基因組學(xué)技術(shù)研發(fā)與應(yīng)用創(chuàng)新團(tuán)隊(duì)開發(fā)出了一種新算法——TRFill,解決了現(xiàn)有工具無(wú)法完全填補(bǔ)基因組間隙的難題,顯著提升了基因組質(zhì)量。相關(guān)研究成果發(fā)表在《基因組生物學(xué)(Genome Biology)》上。
動(dòng)植物基因組的許多區(qū)域存在大量高度重復(fù)的DNA片段(如人類著絲粒、番茄端粒附近區(qū)域),這些重復(fù)結(jié)構(gòu)會(huì)干擾基因組的準(zhǔn)確拼接,導(dǎo)致測(cè)序結(jié)果出現(xiàn)錯(cuò)誤或缺失。由于重復(fù)區(qū)域的復(fù)雜性,現(xiàn)有的組裝軟件難以完全填補(bǔ)基因組間隙。
為此,研究團(tuán)隊(duì)開發(fā)了一種名為TRFill的新算法,該算法能有效解決動(dòng)植物基因組測(cè)序中的重復(fù)序列難題。TRFill利用兩種高精度測(cè)序數(shù)據(jù)(PacBio HiFi長(zhǎng)讀序列和Hi-C染色體空間信息),成功填補(bǔ)了基因組組裝中的重復(fù)區(qū)域缺口。經(jīng)測(cè)試,在人類著絲粒和番茄端粒這些傳統(tǒng)測(cè)序難題區(qū)域,該算法能夠成功修復(fù)近三分之二的重復(fù)序列結(jié)構(gòu)。特別在番茄中,完善的端粒重復(fù)序列圖譜首次讓研究人員能夠從群體層面分析這些復(fù)雜結(jié)構(gòu)的變異規(guī)律。該技術(shù)為繪制更完整的基因組圖譜、研究重復(fù)序列功能提供了重要工具。
該研究得到國(guó)家自然科學(xué)基金、中國(guó)農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程等項(xiàng)目資助。
原文鏈接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03685-5
