近日,河南農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院康相濤院士團(tuán)隊(duì)劉小軍課題組在國(guó)際著名學(xué)術(shù)期刊《Computers and Electronics in Agriculture》上在線發(fā)表了題為“Advanced molecular system for accurate identification of chicken genetic resources”的研究論文。該研究成功開發(fā)了一種高效、準(zhǔn)確的雞種質(zhì)資源分子鑒定系統(tǒng),為雞遺傳資源的保護(hù)和利用提供了有力的技術(shù)支持。
雞作為全球最重要的家禽之一,具有豐富的遺傳多樣性。然而,傳統(tǒng)基于形態(tài)特征的鑒定方法存在諸多局限性,難以滿足現(xiàn)代家禽育種和保護(hù)的需求。隨著全球遺傳資源交流的日益頻繁,準(zhǔn)確鑒定雞遺傳資源對(duì)于保護(hù)地方品種、制定育種策略以及維持遺傳多樣性至關(guān)重要。
該研究整合了基因組單核苷酸多態(tài)性(SNP)變異信息和多種機(jī)器學(xué)習(xí)算法,對(duì)來自 132 個(gè)雞遺傳資源的 3,798 個(gè)個(gè)體的全基因組重測(cè)序數(shù)據(jù)和 600 K 芯片數(shù)據(jù)進(jìn)行了分析。通過構(gòu)建最大似然系統(tǒng)發(fā)育樹去除異常樣本,最終保留了 127個(gè)品種的數(shù)據(jù)。利用遺傳分化指數(shù)評(píng)估遺傳分化程度,并從每個(gè)遺傳資源中篩選出遺傳分化指數(shù)最高的100個(gè)SNP位點(diǎn),采用梯度提升樹模型評(píng)估這些位點(diǎn)的重要性。通過比較7種不同機(jī)器學(xué)習(xí)模型的性能,確定最有效的機(jī)器學(xué)習(xí)模型。
研究發(fā)現(xiàn),每個(gè)品種都具有近乎完全分化的位點(diǎn)。多分類邏輯回歸(MLR)模型被證明是雞種質(zhì)資源分子鑒別最有效的機(jī)器學(xué)習(xí)模型,使用 2000個(gè)SNPs時(shí),準(zhǔn)確率達(dá)到 99.45%。
此外,該系統(tǒng)提供了用戶友好的在線網(wǎng)站(http://www.chickenbreeds.cn),用戶可以通過上傳vcf或gvcf格式SNP變異文件進(jìn)行雞遺傳資源的鑒別。系統(tǒng)的通用性允許使用全基因組重測(cè)序和SNP芯片數(shù)據(jù),并且具備數(shù)據(jù)上傳功能有助于持續(xù)擴(kuò)展雞遺傳資源數(shù)據(jù)庫(kù),實(shí)現(xiàn)更廣泛的品種鑒別范圍。
該分子鑒別系統(tǒng)為雞遺傳資源的保護(hù)和利用提供了一種快速、準(zhǔn)確且低成本的方法。這不僅有助于保護(hù)地方品種的遺傳多樣性,還為制定創(chuàng)新的育種計(jì)劃提供了科學(xué)依據(jù),支持家禽行業(yè)的可持續(xù)發(fā)展。該系統(tǒng)有望在農(nóng)業(yè)科研和生產(chǎn)實(shí)踐中得到廣泛應(yīng)用,為全球雞遺傳資源的保護(hù)和利用做出重要貢獻(xiàn)。
動(dòng)物科技學(xué)院博士研究生職毅豪為論文第一作者,劉小軍教授、康相濤院士、李紅副教授、摩洛哥穆罕默德五世大學(xué)Badaoui Bouabid教授為論文共同通訊作者。該工作得到國(guó)家重點(diǎn)研發(fā)計(jì)劃課題(2022YFF1000202)項(xiàng)目資助。
論文鏈接:https://doi.org/10.1016/j.compag.2025.109989
