“葡萄美酒夜光杯,欲飲琵琶馬上催。”這句古詩反映了人們自古以來對葡萄的喜愛。種下一粒葡萄種子,從種子萌發(fā)到結出果實,需要3年,而想要培育出“令人滿意的”葡萄品種,需要的時間更久。能否找到一種既“快速”又“簡便”的方法實現(xiàn)葡萄品種的“個性化”設計?
中國農(nóng)業(yè)科學院深圳農(nóng)業(yè)基因組研究所(嶺南現(xiàn)代農(nóng)業(yè)科學與技術廣東省實驗室深圳分中心)周永鋒團隊提出利用人工智能進行葡萄育種的新方法,該方法可大幅縮短育種周期,且預測準確度高達85%,相比傳統(tǒng)方法,育種效率可提高400%。該研究有望實現(xiàn)葡萄的精準設計育種,加速葡萄品種創(chuàng)新,并為其他多年生作物育種提供方法參考。相關研究成果于11月4日發(fā)表在《自然·遺傳學》(Nature Genetics)上。
有選擇性地通過特定手段對原有葡萄性狀進行改良,這一過程被稱為育種。早期,人們發(fā)現(xiàn)野生葡萄后,會把品質優(yōu)良的葡萄苗保存下來,通過一代又一代的繁育,只留下符合要求的后代,這種方法固然有用,但高度依賴自然種質資源,可改良程度有限。
后來,人們發(fā)現(xiàn)如果既想要葡萄“產(chǎn)量高”,也想要“甜度高”,可以把“產(chǎn)量高”的葡萄品種和“甜度高”的葡萄品種進行雜交,以培育出聚合了雙親優(yōu)良性狀的雜交后代。直到目前,葡萄育種的主要方法仍是雜交育種,這種方法滿足了有針對性選育葡萄品種的需求,但育種周期十分漫長,往往需要經(jīng)過數(shù)十年的篩選,工作量極大,且由于葡萄高度雜合,雜交后,后代會出現(xiàn)性狀分離,雜交效果并不理想。
進入21世紀以來,育種家提出分子育種——通過分子標記來“設計”性狀,并在此基礎上,提出了智能設計育種,即基于海量基因組的遺傳變異數(shù)據(jù)進行分析預測,以提高育種效率和精確度。其中,獲取全面、準確的作物基因組數(shù)據(jù)是關鍵。
為此,周永鋒團隊自2015年起開始聚焦葡萄設計育種,并于2023年發(fā)布了首個葡萄完整參考基因組圖譜。隨后,該團隊又陸續(xù)對多個野生和栽培葡萄進行測序、組裝,構建了目前首個最全面、最準確的葡萄泛基因組。
為了進一步弄清楚葡萄基因與性狀之間的關聯(lián),周永鋒團隊從近萬份葡萄品種中選取了400多份有代表性的葡萄品種,連續(xù)3年對包括果穗大小、果皮顏色等在內(nèi)的29個農(nóng)藝性狀進行調(diào)查,構建了葡萄基因型圖譜和性狀圖譜。在此基礎上,周永鋒團隊利用數(shù)量遺傳學分析,鑒定到148個與農(nóng)藝性狀顯著相關的基因位點,其中122個位點為首次發(fā)現(xiàn)。
全面、準確的基因組數(shù)據(jù)是精準“設計”育種的基礎,而如何深入挖掘這些數(shù)據(jù)來優(yōu)化育種策略并指導育種?周永鋒團隊決定引入機器學習,通過構建預測模型,根據(jù)評分進行早期個體的預測和選擇,從而指導、優(yōu)化育種策略。
周永鋒團隊引入人工智能中的機器學習技術,解析基因型與性狀數(shù)據(jù)間的復雜網(wǎng)絡關系,構建了首個葡萄全基因組選擇模型。與雜交育種需要根據(jù)葡萄成熟后的表型作出判斷相比,這種全基因組測序育種模式在葡萄幼苗時期,就可以通過計算機軟件預測其成熟后的性狀。結果表明,結合了結構變異信息的多基因評分預測模型,其預測準確率高達85%。
通過這一模型,可以快速準確地評估大量育種材料的遺傳潛力,從而更好地選擇優(yōu)良品種。與雜交育種需要根據(jù)葡萄成熟后的表型作出判斷相比,全基因組選擇育種技術在葡萄幼苗時期就可以預測其成熟后的性狀,盡早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應用中有很大的應用潛力,提高葡萄育種效率,加速葡萄新種質的創(chuàng)制,革新葡萄育種策略。