
多物種遺傳變異數(shù)據(jù)庫
近日,華中農(nóng)業(yè)大學(xué)信息學(xué)院生物信息團(tuán)隊(duì)在Nucleic Acids Research中發(fā)表題為“Plant-ImputeDB: an integrated multiple plant reference panel database for genotype imputation”的研究論文。該研究通過收集包括水稻,玉米、小麥、油菜和棉花等12個(gè)重要農(nóng)作物的遺傳變異信息,構(gòu)建了植物中首個(gè)多物種的高質(zhì)量遺傳參考變異庫,為植物遺傳育種研究提供了寶貴資源。
基因型填充(Genotype imputation)是根據(jù)參考面板(reference panles,又譯參考集)中的單體型和基因型對(duì)目標(biāo)樣本中缺失基因型的估計(jì)填充過程?;蛐吞畛淇捎行г黾訂魏塑账岫鄳B(tài)性(SNPs)密度,因此被廣泛用于相對(duì)便宜和低密度的SNP芯片的填充以進(jìn)行大規(guī)模全基因組關(guān)聯(lián)研究(GWAS)。然而,大多數(shù)植物缺乏高質(zhì)量的參考面板,這極大限制了基因型填充在植物中的應(yīng)用。
為克服這一限制,研究團(tuán)隊(duì)開發(fā)了植物遺傳參考變異庫--Plant-ImputeDB,數(shù)據(jù)庫整合了包括水稻,玉米、小麥、油菜和棉花等12個(gè)重要農(nóng)作物的遺傳變異信息和全基因組重測(cè)序數(shù)據(jù)(包括34,244個(gè)樣本的約6,990萬個(gè)SNP的遺傳變異信息),構(gòu)建了植物中首個(gè)多物種參考面板的綜合數(shù)據(jù)庫。該數(shù)據(jù)庫提供在線的基因型填充,支持SNP和基因組block兩種方式搜索、瀏覽并提供相應(yīng)數(shù)據(jù)下載,同時(shí)接受不同類型的基因組變異數(shù)據(jù)的提交,提供對(duì)所有公開可用數(shù)據(jù)的免費(fèi)和開放訪問,以支持全球范圍相關(guān)研究。
信息學(xué)院碩士研究生高英杰、博士研究生楊植全、楊文倩為論文并列第一作者,牛曉輝副教授、楊慶勇副教授和龔靜教授為論文共同通訊作者,博士研究生楊彥波參與了研究工作,該研究成果得到中央高?;究蒲袠I(yè)務(wù)費(fèi)、國家重點(diǎn)研發(fā)計(jì)劃、華中農(nóng)大科技創(chuàng)新基金等項(xiàng)目資助。
數(shù)據(jù)庫鏈接:http://gong_lab.hzau.edu.cn/Plant_imputeDB/
原文鏈接:https://doi.org/10.1093/nar/gkaa953
