2021-11-16 16:53:56
我國(guó)糧食總產(chǎn)量位居全球首位,玉米產(chǎn)量位居世界第二,但是育種技術(shù)體系的信息化與智能化程度與歐美發(fā)達(dá)國(guó)家相比,還有相當(dāng)大的差距。
科研人員意識(shí)到,我國(guó)急需建設(shè)為玉米種業(yè)服務(wù)的玉米智能設(shè)計(jì)育種技術(shù)體系,為我國(guó)玉米育種行業(yè)解決“卡脖子”問題。
近日,中國(guó)農(nóng)業(yè)大學(xué)農(nóng)學(xué)院、國(guó)家玉米改良中心教授王向峰與西北農(nóng)林科技大學(xué)生命科學(xué)學(xué)院、旱區(qū)作物逆境生物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室教授馬闖課題組在《生物信息學(xué)簡(jiǎn)報(bào)》上發(fā)表了一篇方法學(xué)研究論文,論文介紹了科研團(tuán)隊(duì)聯(lián)合開發(fā)的一款基因組優(yōu)化設(shè)計(jì)模型GOVS,可以加速玉米雜交育種,縮短育種周期,促進(jìn)玉米種業(yè)智能化、高質(zhì)量發(fā)展。
急需技術(shù)攻關(guān),解決關(guān)鍵問題
21世紀(jì)以來,隨著互聯(lián)網(wǎng)、人工智能、機(jī)器學(xué)習(xí)等現(xiàn)代信息技術(shù)的迅速發(fā)展,全球已邁入大數(shù)據(jù)時(shí)代。信息科學(xué)與生命科學(xué)的跨學(xué)科交叉融合為育種科技的跨越式發(fā)展提供了新的契機(jī)。
2018年美國(guó)康奈爾大學(xué)玉米遺傳育種學(xué)家、美國(guó)科學(xué)院院士Buckler教授提出“育種4.0”概念。中國(guó)科學(xué)院院士、我國(guó)水稻遺傳育種學(xué)家張啟發(fā)也提出作物育種已進(jìn)入5G育種時(shí)代。
“美國(guó)基本已經(jīng)進(jìn)入育種4.0時(shí)代,也就是智能育種時(shí)代,但我國(guó)還沒有實(shí)現(xiàn)這一步。”論文通訊作者王向峰在接受《中國(guó)科學(xué)報(bào)》采訪時(shí)表示,無(wú)論是“育種4.0”還是“5G育種”,其本質(zhì)都是育種行業(yè)的工程化、智能化升級(jí),即逐步形成“智能設(shè)計(jì)育種”技術(shù)體系。
在他看來,智能設(shè)計(jì)育種是在分子設(shè)計(jì)育種的基礎(chǔ)上融合生物信息學(xué)、群體遺傳學(xué)、大數(shù)據(jù)、人工智能等多個(gè)交叉學(xué)科的育種智能化解決方案,是全基因組選擇育種的升級(jí)和優(yōu)化,是我國(guó)“十四五”期間種業(yè)創(chuàng)新工程中重點(diǎn)攻關(guān)的技術(shù)領(lǐng)域。
玉米智能設(shè)計(jì)育種技術(shù)體系可以幫助解決三方面關(guān)鍵問題。王向峰指出,首先,可以解決玉米育種行業(yè)研發(fā)周期長(zhǎng)、效率低、成本高、決策難等問題;其次,助推現(xiàn)代種業(yè)與人工智能的融合發(fā)展,形成“智能+種業(yè)”的新經(jīng)濟(jì)產(chǎn)業(yè)體系;最后,打破育種技術(shù)壁壘,縮短與國(guó)際種業(yè)巨頭之間的技術(shù)差距,振興民族種業(yè)。
兩款工具相輔相成
為什么美國(guó)育種水平比我國(guó)高?“因?yàn)樗麄兺ㄟ^幾十年發(fā)展積累了大量育種數(shù)據(jù),在整個(gè)育種過程中,每一個(gè)步驟都是通過大數(shù)據(jù)驅(qū)動(dòng),已經(jīng)可以進(jìn)行作物表型的模擬,根據(jù)模型預(yù)測(cè)來輔助育種家篩選材料進(jìn)行雜交組配。”王向峰答道。
要想在種業(yè)科技創(chuàng)新上“彎道超車”,開發(fā)玉米智能設(shè)計(jì)育種技術(shù)體系成了當(dāng)務(wù)之急。
“不過,大數(shù)據(jù)的高效采集、深度分析和充分利用,十分困難。”論文共同通訊作者馬闖在接受《中國(guó)科學(xué)報(bào)》采訪時(shí)表示,相比歐美發(fā)達(dá)國(guó)家,我國(guó)的育種相關(guān)生物學(xué)大數(shù)據(jù)還比較缺乏。以基因組數(shù)據(jù)、表型數(shù)據(jù)為例,之前采集這些數(shù)據(jù)的成本較高,近年來隨著科技發(fā)展,相關(guān)成本有所下降,數(shù)據(jù)呈快速增長(zhǎng)趨勢(shì),數(shù)據(jù)的高效采集問題正在解決,深度分析和充分利用問題還需要高度關(guān)注。
玉米要做雜交種,實(shí)際是兩個(gè)純和自交系雜交以后形成。以前需要四五年才能生產(chǎn)出來一個(gè)純和自交系。“現(xiàn)在的利好是單倍體誘導(dǎo)育種技術(shù),基本上一年就可以生產(chǎn)出一個(gè)純和自交系。”王向峰表示,雙單倍體技術(shù)在玉米育種行業(yè)中的逐步成熟與普及,使得玉米純和自交系的生產(chǎn)周期大幅縮短、成本大幅降低、自交系數(shù)量大幅度增加。
我國(guó)一個(gè)中、大型種業(yè)公司每年可生產(chǎn)2萬(wàn)到5萬(wàn)份的玉米自交系。自交系量已經(jīng)達(dá)到如此規(guī)模,如果再將這些自交系與3到5個(gè)測(cè)驗(yàn)種進(jìn)行雜交,理論雜交組合的數(shù)量為幾十萬(wàn)。依賴于田間表型測(cè)試對(duì)數(shù)十萬(wàn)的組合進(jìn)行人工選擇的成本太高,是幾乎無(wú)法完成的任務(wù)。
因此,科研團(tuán)隊(duì)認(rèn)為,必須采用智能育種的方式,依據(jù)預(yù)測(cè)模型指導(dǎo)基于基因型的選系。
“假如有10萬(wàn)個(gè)自交系,再與一個(gè)測(cè)驗(yàn)種進(jìn)行雜交,就有10萬(wàn)個(gè)雜交種,把它們都種在田里根本不可能。而用模型先在計(jì)算機(jī)上模擬,篩選出產(chǎn)量最高、最優(yōu)的10%的雜交種,在田間就可以只種這10%的部分,相當(dāng)于種1萬(wàn)株,成本僅是原來的十分之一。”王向峰舉例。
鑒于此,科研團(tuán)隊(duì)開發(fā)了基因組優(yōu)化設(shè)計(jì)模型GOVS。傳統(tǒng)育種模擬軟件主要利用遺傳材料的系譜關(guān)系和表型數(shù)據(jù)模擬育種過程,同時(shí)指導(dǎo)未來育種流程中的選系和組配。“GOVS則采用了稱為‘基因組優(yōu)化設(shè)計(jì)’的策略,即通過算法模擬出一個(gè)理論上盡可能多地聚合了某個(gè)育種群體中目標(biāo)表型的優(yōu)勢(shì)基因組片段或有利等位基因的虛擬基因組。”論文第一作者、西北農(nóng)林科技大學(xué)博士生程前告訴《中國(guó)科學(xué)報(bào)》。他還是GOVS軟件的主要開發(fā)人之一。
程前表示,目前,這樣一個(gè)理想基因組在現(xiàn)實(shí)中還不太可能得到,但是可以作為評(píng)估層面或者育種路徑的一個(gè)指導(dǎo)。
在此之前,王向峰還與華中農(nóng)業(yè)大學(xué)教授嚴(yán)建兵課題組在《基因組生物學(xué)》上發(fā)表了一款基于機(jī)器學(xué)習(xí)建立的全基因組選擇模型——CropGBM工具箱,同時(shí)整合了多種常用遺傳分析工具,比如基因型與表型數(shù)據(jù)預(yù)處理、育種材料遺傳結(jié)構(gòu)解析、全基因組選擇模型、標(biāo)記篩選與模塊設(shè)計(jì)、數(shù)據(jù)可視化等功能模塊,為作物基因組設(shè)計(jì)育種提供一站式解決方案。
“智能指的就是機(jī)器學(xué)習(xí)里面建立的模型,這個(gè)模型相當(dāng)于人的大腦,是有驅(qū)動(dòng)力的。GOVS與CropGBM相輔相成,分別用于不同的育種環(huán)節(jié),實(shí)際上都是利用人工智能的策略加速育種。”王向峰說。
“強(qiáng)心劑”和“加速劑”
糧食安全事關(guān)國(guó)計(jì)民生與長(zhǎng)治久安,種業(yè)是現(xiàn)代農(nóng)業(yè)核心與命脈,科技創(chuàng)新是戰(zhàn)略支持。要想培育具有自主知識(shí)產(chǎn)權(quán)的新品種,需要育種家不懈的努力。
“不過,育種現(xiàn)狀卻不容樂觀。國(guó)內(nèi)育種家普遍年齡偏大,大多已過50歲,而且他們多是憑經(jīng)驗(yàn)、靠眼睛去決策選材料,每個(gè)人的經(jīng)驗(yàn)又有差異。加上在田間搞測(cè)試的年輕人很少,以后的育種越來越不能靠人去完成,只能通過計(jì)算機(jī)做育種。”王向峰表示。
而機(jī)器學(xué)習(xí)最大的兩個(gè)亮點(diǎn),一個(gè)是效率,一個(gè)是自動(dòng)化。用模型去代替育種家的經(jīng)驗(yàn),做更加標(biāo)準(zhǔn)化、規(guī)范化的決策,既減少育種家的工作量,又降低了許多成本。
“育種要‘藏糧于技’,我們這個(gè)成果是智能育種方法學(xué)和技術(shù)的大膽突破,也是給國(guó)內(nèi)做相關(guān)育種工作科研人員注入‘強(qiáng)心劑’。”馬闖說。
此外,他指出,相較于國(guó)外育種4.0理念,我國(guó)如何去追趕、超越,邁入“育種4.0”或是“5G育種”時(shí)代,需要更加先進(jìn)的技術(shù),從這個(gè)意義上說,這項(xiàng)成果也是“加速劑”。
“要明確的是,我們這套技術(shù)并不是基因組選擇的替代,我認(rèn)為基因組選擇在未來育種體系中仍是核心技術(shù),最大優(yōu)勢(shì)是可以大幅度減少田間工作量和成本,不可取代。而我們這套技術(shù)如果和基因組選擇、雙單倍體技術(shù)相結(jié)合,會(huì)達(dá)到更好的效果。”程前強(qiáng)調(diào)。
當(dāng)前,科研團(tuán)隊(duì)正圍繞玉米智能設(shè)計(jì)育種技術(shù)體系的建設(shè)開展多方面的工作,力爭(zhēng)打造大數(shù)據(jù)驅(qū)動(dòng)的玉米智能育種服務(wù)平臺(tái),為全國(guó)范圍內(nèi)的種業(yè)企業(yè)、育種團(tuán)隊(duì)提供智能決策服務(wù)。
有了這樣一個(gè)服務(wù)平臺(tái),未來育種流程中的組材、選系、組配、測(cè)試、推廣等諸多環(huán)節(jié)都將由一系列模型進(jìn)行育種決策,輔助甚至代替人工決策,最終實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)式的智能設(shè)計(jì)育種。