“葡萄美酒夜光杯,欲飲琵琶馬上催。”這句古詩反映了人們自古以來對(duì)葡萄的喜愛。種下一粒葡萄種子,從種子萌發(fā)到結(jié)出果實(shí),需要3年,而想要培育出“令人滿意的”葡萄品種,需要的時(shí)間更久。能否找到一種既“快速”又“簡(jiǎn)便”的方法實(shí)現(xiàn)葡萄品種的“個(gè)性化”設(shè)計(jì)?
中國農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所(嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實(shí)驗(yàn)室深圳分中心)周永鋒團(tuán)隊(duì)提出利用人工智能進(jìn)行葡萄育種的新方法,該方法可大幅縮短育種周期,且預(yù)測(cè)準(zhǔn)確度高達(dá)85%,相比傳統(tǒng)方法,育種效率可提高400%。該研究有望實(shí)現(xiàn)葡萄的精準(zhǔn)設(shè)計(jì)育種,加速葡萄品種創(chuàng)新,并為其他多年生作物育種提供方法參考。相關(guān)研究成果于11月4日發(fā)表在《自然·遺傳學(xué)》(Nature Genetics)上。
有選擇性地通過特定手段對(duì)原有葡萄性狀進(jìn)行改良,這一過程被稱為育種。早期,人們發(fā)現(xiàn)野生葡萄后,會(huì)把品質(zhì)優(yōu)良的葡萄苗保存下來,通過一代又一代的繁育,只留下符合要求的后代,這種方法固然有用,但高度依賴自然種質(zhì)資源,可改良程度有限。
后來,人們發(fā)現(xiàn)如果既想要葡萄“產(chǎn)量高”,也想要“甜度高”,可以把“產(chǎn)量高”的葡萄品種和“甜度高”的葡萄品種進(jìn)行雜交,以培育出聚合了雙親優(yōu)良性狀的雜交后代。直到目前,葡萄育種的主要方法仍是雜交育種,這種方法滿足了有針對(duì)性選育葡萄品種的需求,但育種周期十分漫長(zhǎng),往往需要經(jīng)過數(shù)十年的篩選,工作量極大,且由于葡萄高度雜合,雜交后,后代會(huì)出現(xiàn)性狀分離,雜交效果并不理想。
進(jìn)入21世紀(jì)以來,育種家提出分子育種——通過分子標(biāo)記來“設(shè)計(jì)”性狀,并在此基礎(chǔ)上,提出了智能設(shè)計(jì)育種,即基于海量基因組的遺傳變異數(shù)據(jù)進(jìn)行分析預(yù)測(cè),以提高育種效率和精確度。其中,獲取全面、準(zhǔn)確的作物基因組數(shù)據(jù)是關(guān)鍵。
為此,周永鋒團(tuán)隊(duì)自2015年起開始聚焦葡萄設(shè)計(jì)育種,并于2023年發(fā)布了首個(gè)葡萄完整參考基因組圖譜。隨后,該團(tuán)隊(duì)又陸續(xù)對(duì)多個(gè)野生和栽培葡萄進(jìn)行測(cè)序、組裝,構(gòu)建了目前首個(gè)最全面、最準(zhǔn)確的葡萄泛基因組。
為了進(jìn)一步弄清楚葡萄基因與性狀之間的關(guān)聯(lián),周永鋒團(tuán)隊(duì)從近萬份葡萄品種中選取了400多份有代表性的葡萄品種,連續(xù)3年對(duì)包括果穗大小、果皮顏色等在內(nèi)的29個(gè)農(nóng)藝性狀進(jìn)行調(diào)查,構(gòu)建了葡萄基因型圖譜和性狀圖譜。在此基礎(chǔ)上,周永鋒團(tuán)隊(duì)利用數(shù)量遺傳學(xué)分析,鑒定到148個(gè)與農(nóng)藝性狀顯著相關(guān)的基因位點(diǎn),其中122個(gè)位點(diǎn)為首次發(fā)現(xiàn)。
全面、準(zhǔn)確的基因組數(shù)據(jù)是精準(zhǔn)“設(shè)計(jì)”育種的基礎(chǔ),而如何深入挖掘這些數(shù)據(jù)來優(yōu)化育種策略并指導(dǎo)育種?周永鋒團(tuán)隊(duì)決定引入機(jī)器學(xué)習(xí),通過構(gòu)建預(yù)測(cè)模型,根據(jù)評(píng)分進(jìn)行早期個(gè)體的預(yù)測(cè)和選擇,從而指導(dǎo)、優(yōu)化育種策略。
周永鋒團(tuán)隊(duì)引入人工智能中的機(jī)器學(xué)習(xí)技術(shù),解析基因型與性狀數(shù)據(jù)間的復(fù)雜網(wǎng)絡(luò)關(guān)系,構(gòu)建了首個(gè)葡萄全基因組選擇模型。與雜交育種需要根據(jù)葡萄成熟后的表型作出判斷相比,這種全基因組測(cè)序育種模式在葡萄幼苗時(shí)期,就可以通過計(jì)算機(jī)軟件預(yù)測(cè)其成熟后的性狀。結(jié)果表明,結(jié)合了結(jié)構(gòu)變異信息的多基因評(píng)分預(yù)測(cè)模型,其預(yù)測(cè)準(zhǔn)確率高達(dá)85%。
通過這一模型,可以快速準(zhǔn)確地評(píng)估大量育種材料的遺傳潛力,從而更好地選擇優(yōu)良品種。與雜交育種需要根據(jù)葡萄成熟后的表型作出判斷相比,全基因組選擇育種技術(shù)在葡萄幼苗時(shí)期就可以預(yù)測(cè)其成熟后的性狀,盡早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應(yīng)用中有很大的應(yīng)用潛力,提高葡萄育種效率,加速葡萄新種質(zhì)的創(chuàng)制,革新葡萄育種策略。