2022-12-28 15:20:57
近日,中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所、三亞南繁研究院大數(shù)據(jù)智能設(shè)計(jì)育種創(chuàng)新團(tuán)隊(duì)聯(lián)合多家單位提出利用植物海量多組學(xué)數(shù)據(jù)進(jìn)行全基因組預(yù)測(cè)的深度學(xué)習(xí)方法, 可以實(shí)現(xiàn)育種大數(shù)據(jù)的高效整合與利用,將助力深度學(xué)習(xí)在全基因組選擇中的應(yīng)用,為智能設(shè)計(jì)育種及平臺(tái)構(gòu)建提供有效工具。相關(guān)研究成果發(fā)表在《分子植物(Molecular Plant)》上。
全基因組選擇作為新一代育種技術(shù),通過(guò)構(gòu)建預(yù)測(cè)模型,根據(jù)基因組估計(jì)育種值進(jìn)行早期個(gè)體的預(yù)測(cè)和選擇,從而縮短育種世代間隔,加快育種進(jìn)程,節(jié)約成本,推動(dòng)現(xiàn)代育種向精準(zhǔn)化和高效化方向發(fā)展。統(tǒng)計(jì)模型作為全基因組選擇的核心,極大地影響了全基因組預(yù)測(cè)的準(zhǔn)確度和效率。傳統(tǒng)預(yù)測(cè)方法基于線性回歸模型,難以捕捉基因型和表型間的復(fù)雜關(guān)系。相較于傳統(tǒng)模型,非線性模型(如深度網(wǎng)絡(luò)神經(jīng))具備分析復(fù)雜非加性效應(yīng)的能力,人工智能和深度學(xué)習(xí)算法為解決大數(shù)據(jù)分析和高性能并行運(yùn)算等難題提供了新的契機(jī),深度學(xué)習(xí)算法的優(yōu)化將會(huì)提高全基因組選擇的預(yù)測(cè)能力。
全基因組選擇新方法與幾種傳統(tǒng)預(yù)測(cè)方法對(duì)比
該研究團(tuán)隊(duì)以玉米、小麥和番茄3種作物的4種不同維度的群體數(shù)據(jù)為測(cè)試材料,通過(guò)創(chuàng)新深度學(xué)習(xí)算法框架開(kāi)發(fā)了全基因組選擇新方法。與其他五種主流預(yù)測(cè)方法相比,該方法有以下優(yōu)點(diǎn):可以利用多組學(xué)數(shù)據(jù)開(kāi)展全基因組預(yù)測(cè);算法設(shè)計(jì)中包含批歸一化層、回調(diào)函數(shù)和校正線性激活函數(shù)等結(jié)構(gòu),可以有效降低模型錯(cuò)誤率,提高運(yùn)行速度;預(yù)測(cè)精度穩(wěn)健,在小型數(shù)據(jù)集上的表現(xiàn)與目前主流預(yù)測(cè)模型相當(dāng),在大規(guī)模數(shù)據(jù)集上預(yù)測(cè)優(yōu)勢(shì)更加明顯;計(jì)算時(shí)間與傳統(tǒng)方法相近,比已有深度學(xué)習(xí)方法提速近10倍;超參數(shù)調(diào)整對(duì)用戶更加友好。
該研究得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、海南崖州灣種子實(shí)驗(yàn)室和中國(guó)農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程等項(xiàng)目的支持。