近日,華中農業(yè)大學豬基因組與育種團隊研究成果以“SIMER: an accurate and intelligent tool for simulating customizable population data across species in complex scenarios”為題在Journal of Big Data發(fā)表。研究開發(fā)出一款育種規(guī)劃與群體大數(shù)據(jù)模擬軟件“SIMER”,該軟件能夠根據(jù)數(shù)量遺傳學理論精確模擬不同復雜程度遺傳背景的多個世代基因型和具有豐富遺傳參數(shù)的多性狀表型大數(shù)據(jù),快速便捷地輔助育種者定制育種值評估模型和綜合選擇指數(shù)等育種規(guī)劃。
研究發(fā)現(xiàn),相比現(xiàn)有模擬軟件,SIMER具有以下三個獨有功能,一是目前唯一實現(xiàn)了多種繁殖方式的育種數(shù)據(jù)模擬工具,能夠模擬人類、動物、植物和微生物的基因型數(shù)據(jù);二是能夠基于混合線性模型框架,利用用戶指定的協(xié)變量、固定效應、隨機效應、遺傳力及遺傳相關等復雜目標參數(shù)來精準模擬表型數(shù)據(jù);三是具有育種規(guī)劃制訂和比較功能,能夠助力育種者優(yōu)化育種方案。
作為連接遺傳學理論與實際應用的橋梁,群體數(shù)據(jù)模擬是統(tǒng)計遺傳學研究領域中的重要環(huán)節(jié),尤其在統(tǒng)計模型的精準性及穩(wěn)定性測試方面發(fā)揮不可替代的作用。然而,精準的群體數(shù)據(jù)模擬存在繁殖方式不同的各物種基因型精準模擬、具有復雜遺傳相關的表型精準模擬和貼合生產實際的精準育種規(guī)劃制訂等三個挑戰(zhàn)。為應對上述挑戰(zhàn),SIMER實現(xiàn)了克隆、隨機交配、多元雜交等繁殖方式,創(chuàng)新了遺傳相關多性狀方差組分精準模擬算法,通過基因型模擬、表型模擬、群體模擬和育種規(guī)劃制訂四大功能模塊來滿足遺傳育種研究和產業(yè)需求。
與同類工具相比,SIMER的優(yōu)勢體現(xiàn)在四個“準確”。即在基因型模擬的“準確”上,SIMER內置了克隆、加倍單倍體繁殖、自交、隨機交配、排除自交的隨機交配和用戶指定系譜交配等單品種繁殖模式和二元雜交、三元雜交、四元雜交和回交等多品種繁殖模式用以精準復現(xiàn)具有物種特異性的基因型數(shù)據(jù);在表型模擬的“準確”上,SIMER能夠基于線性混合模型整合加性、顯性和上位等遺傳效應,以及協(xié)變量、固定效應、隨機效應和永久環(huán)境效應,同時創(chuàng)新了方差組分模擬算法,例如使用奇異值分解結合特征值分解的算法在消除原始遺傳效應間隨機相關的基礎上構建精確的多性狀遺傳相關;在群體模擬的“準確”上,SIMER可以靈活指定世代數(shù)、基因頻率分布等參數(shù)來精準模擬不同復雜程度遺傳背景的育種群體,用戶可基于豐富的群體參數(shù)來模擬具有詳細系譜信息的多世代群體;在育種規(guī)劃制訂的“準確”上,SIMER通過比較用戶制訂的多個育種規(guī)劃的遺傳進展來選擇最佳設計,規(guī)劃內容包括開展基因分型和表型測定的個體選擇,優(yōu)化育種值評估模型中協(xié)變量、固定效應和隨機效應,以及設計多個目標性狀的綜合選擇指數(shù)。
SIMER致力于服務生命科學研究和育種實踐。在生命科學研究領域,SIMER能夠提供包含基因型和表型的群體大數(shù)據(jù)用以測試統(tǒng)計模型的準確性、穩(wěn)定性及計算效率;在育種實踐領域,SIMER通過育種規(guī)劃制訂功能輔助育種者優(yōu)化育種值評估模型和綜合選擇指數(shù)用以增加目標性狀遺傳增益及經(jīng)濟收益,也能輔助育種者選擇合適的個體進行基因分型和表型測定,大幅減少育種成本。
華中農業(yè)大學動物科學技術學院、動物醫(yī)學院博士研究生殷東為論文第一作者,劉小磊教授為論文通訊作者,趙書紅教授、李新云教授、尹立林研究員參與并指導了該項工作。同時,武漢理工大學研究生張軒寧、張浩浩等參與了該研究。該研究工作受到國家自然科學基金、湖北省國際科技合作項目、國家生豬產業(yè)技術體系等項目的資助。
