2024-05-14 10:28:16
科技日?qǐng)?bào)訊 (記者馬愛(ài)平)記者5月12日從中國(guó)農(nóng)業(yè)大學(xué)獲悉,該校生物學(xué)院王喜慶教授團(tuán)隊(duì)聯(lián)合上海人工智能實(shí)驗(yàn)室、崖州灣種子實(shí)驗(yàn)室日前發(fā)布了我國(guó)首個(gè)種業(yè)大語(yǔ)言模型“豐登”。
“‘豐登’集成了人工智能模型‘書(shū)生·浦語(yǔ)2.0’與大數(shù)據(jù)分析技術(shù)。通過(guò)深入學(xué)習(xí)我國(guó)迄今發(fā)布的科研文獻(xiàn)、科技書(shū)籍、種企報(bào)告和歷史推廣數(shù)據(jù),‘豐登’可準(zhǔn)確解答有關(guān)作物品種在選育推廣、農(nóng)藝性狀、栽培技術(shù)、推廣區(qū)域等方面的問(wèn)題。”王喜慶告訴記者。
相較于國(guó)內(nèi)外其他大語(yǔ)言模型,“豐登”重點(diǎn)關(guān)注生物育種領(lǐng)域。
據(jù)王喜慶介紹,該模型具有四大核心能力。首先,可系統(tǒng)深度挖掘并結(jié)構(gòu)化我國(guó)育種領(lǐng)域積累的學(xué)術(shù)文獻(xiàn)、書(shū)籍、田間日志等知識(shí)。其次,可利用多學(xué)科知識(shí)圖譜,整合生物學(xué)、遺傳學(xué)、氣象學(xué)、土壤學(xué)等相關(guān)領(lǐng)域知識(shí),并發(fā)掘這些領(lǐng)域知識(shí)之間的聯(lián)系。再次,能通過(guò)自然語(yǔ)言對(duì)話接口降低技術(shù)門(mén)檻,用戶可直接提出問(wèn)題并迅速獲得答案,確保信息的實(shí)時(shí)性和高效獲取,提高工作效率。最后,它不僅服務(wù)于育種專(zhuān)家和科研人員,也能為全國(guó)農(nóng)業(yè)工作者提供支持,加速育種知識(shí)的傳播和應(yīng)用。
經(jīng)評(píng)估測(cè)試,“豐登”在最佳答案?jìng)€(gè)數(shù)和綜合分?jǐn)?shù)上的表現(xiàn)均超出預(yù)期,在多個(gè)評(píng)估維度上超越了國(guó)際領(lǐng)先水平的大語(yǔ)言模型。
目前,“豐登”的首個(gè)重要版本——“豐登1.0”擁有超200億參數(shù),并已開(kāi)放針對(duì)水稻相關(guān)知識(shí)的測(cè)試接口申請(qǐng)。首批參與測(cè)試的單位包括中國(guó)科學(xué)院、中國(guó)農(nóng)業(yè)科學(xué)院、上海市農(nóng)業(yè)科學(xué)院、廣東省農(nóng)業(yè)科學(xué)院、華中農(nóng)業(yè)大學(xué)、華南農(nóng)業(yè)大學(xué)、復(fù)旦大學(xué)等。