由華大基因和生物醫(yī)學(xué)中心(Biomed Central)共同創(chuàng)辦的Giga Science是一個(gè)開放獲取且數(shù)據(jù)公開的大數(shù)據(jù)期刊。2014年5月28日,3000株水稻基因組測(cè)序文章在Giga Science正式發(fā)表,且整套水稻基因序列以可引用形式在該雜志的附屬開放獲取數(shù)據(jù)庫(kù)GigaDB中公開。該項(xiàng)目產(chǎn)生的數(shù)據(jù)是目前已公開水稻序列數(shù)據(jù)量的四倍。在"世界饑餓日"這天發(fā)布并公開這龐大的數(shù)據(jù)集,是為了體現(xiàn)該項(xiàng)目的最主要目標(biāo)之一,為改善全球尤其是最窮困地區(qū)的糧食安全提供資源。該成果標(biāo)志著3000株水稻基因組項(xiàng)目第一階段的完成,主要由中國(guó)農(nóng)業(yè)科學(xué)院(CAAS)、國(guó)際水稻研究所(IRRI)以及華大基因(BGI)合作開展,并獲得了比爾及梅琳達(dá)·蓋茨基金會(huì)和中國(guó)科技部的資金支持。
全球超過1/8的人口生活在極度饑餓和貧窮中,并且世界總?cè)丝谌栽谂c日俱增(預(yù)計(jì)2050年將突破96億),這迫切需要我們?nèi)?chuàng)造新資源來改善作物產(chǎn)量,減少農(nóng)業(yè)活動(dòng)對(duì)環(huán)境的影響,并且開發(fā)具備高產(chǎn)量、高營(yíng)養(yǎng)價(jià)值、能夠在干旱,病蟲害,疾病或貧瘠土壤條件下生長(zhǎng)的糧食作物。雖然2005年第一個(gè)高質(zhì)量水稻基因組序列圖譜的完成極大推動(dòng)了水稻研究,然而在培育改良具有更好適應(yīng)性的水稻品種等育種實(shí)踐方面卻成效甚微。
"3000株水稻基因組項(xiàng)目"所產(chǎn)出和公開的大量遺傳信息將最終被應(yīng)用到智能育種實(shí)踐中,為解決這些挑戰(zhàn)邁出了重要的一步。不同植株間存在自然變異,而了解這些不同性狀發(fā)生的遺傳機(jī)制,將有助于成功培育出可高度適應(yīng)不同環(huán)境的雜交品種。
中國(guó)農(nóng)業(yè)科學(xué)院項(xiàng)目負(fù)責(zé)人黎志康博士表示,3000株水稻基因組項(xiàng)目是目前正在為亞非地區(qū)貧困農(nóng)民提供資源所進(jìn)行努力的一部分,旨在造福生活在16個(gè)目標(biāo)國(guó)家(8個(gè)非洲國(guó)家和8個(gè)亞洲國(guó)家)的2000多萬水稻農(nóng)戶。"大部分亞洲人民以水稻為主食,并且非洲水稻消耗量逐年遞增。"黎博士指出,"無論是現(xiàn)在還是將來,隨著資源(水和土壤)銳減,糧食安全將是或已是這些國(guó)家所面臨的最大挑戰(zhàn)。作為水稻遺傳學(xué)、育種和基因組學(xué)領(lǐng)域的一名科學(xué)家,助力解決這項(xiàng)問題無疑是我們的夢(mèng)想。"
華大基因院長(zhǎng)王俊博士補(bǔ)充道:"人口激增和愈演愈烈的環(huán)境危機(jī)已經(jīng)讓全球糧食短缺和安全面臨巨大的挑戰(zhàn)。華大基因致力于通過基因組學(xué)技術(shù)實(shí)現(xiàn)快速、可控、高效的分子育種模式。這為農(nóng)業(yè)育種開辟了一條新道路。通過與中國(guó)農(nóng)業(yè)科學(xué)院(CAAS)、國(guó)際水稻研究所(IRRI)和蓋茨基金會(huì)的協(xié)作努力,我們已經(jīng)向以大數(shù)據(jù)為基礎(chǔ)的農(nóng)業(yè)研究和數(shù)字化育種邁出了重要一步。我們深信所作出的每一步努力都將使我們離造福人類這一終極目標(biāo)更近一步。"
國(guó)際水稻研究所總負(fù)責(zé)人Robert Zeigler博士表示:"3000株水稻基因組數(shù)據(jù)的公開將極大地增進(jìn)育種計(jì)劃的實(shí)力,以克服不久將來人類所面臨的關(guān)鍵性障礙。"對(duì)于這個(gè)項(xiàng)目,Robert Zeigler博士又補(bǔ)充道:"這將為水稻遺傳學(xué)補(bǔ)充大量的知識(shí),使全球研究團(tuán)體可以進(jìn)行更詳細(xì)的分析,從而最終使在最艱難的環(huán)境條件下種植水稻的窮苦農(nóng)民獲益。"
在Giga Science附帶的評(píng)論中,王俊博士、Robert Zeigler博士以及中國(guó)農(nóng)業(yè)科學(xué)院的李家洋博士提供了關(guān)于這個(gè)項(xiàng)目研究目標(biāo)的進(jìn)一步信息。
為了實(shí)現(xiàn)他們的目標(biāo),由三家研究所發(fā)起的合作不僅公開了13.4TB的數(shù)據(jù)資源,而且他們還收集了每株水稻的種子(存放于國(guó)際水稻研究所的水稻基因資源庫(kù)中)。儲(chǔ)存這些種子對(duì)充分利用這些遺傳信息已知的水稻品種來開發(fā)和驗(yàn)證最適合不同環(huán)境的雜交株是十分必要的。然而,實(shí)現(xiàn)這一目標(biāo)的另一條件是這一信息可以使研究人員和育種專家直接將遺傳信息(基因型)和不同植株的性狀特征(表型)聯(lián)系起來。這需要仔細(xì)評(píng)估和管理每株水稻的重要農(nóng)業(yè)性狀特征,之后再在可用的基因組序列中與其相應(yīng)的遺傳標(biāo)記相關(guān)聯(lián)。
自農(nóng)業(yè)發(fā)展以來,現(xiàn)代育種實(shí)踐延續(xù)至今,通常依據(jù)表觀性狀特征來指導(dǎo)候選植株雜交,并期望雜交后代能夠表現(xiàn)出結(jié)合和改良的預(yù)期性狀,如抗旱、抗病蟲、產(chǎn)量提高和營(yíng)養(yǎng)價(jià)值增加。然而,當(dāng)兩個(gè)植株進(jìn)行雜交后,對(duì)應(yīng)的遺傳組成常常使育種學(xué)家的期望落空,因?yàn)槲粗幕蛳嗷プ饔脮?huì)限制、修飾或改變所選擇的性狀特征的形成。因此,常常需要試驗(yàn)、發(fā)現(xiàn)錯(cuò)誤和多個(gè)連續(xù)的育種階段。
全面了解一個(gè)植物的遺傳組成可以使研究人員鑒定與特定性狀特征相關(guān)聯(lián)的遺傳標(biāo)記,并且可以更好地了解不同的基因相互作用是如何影響植物的表型的。這些信息使育種專家在植株選育上更加明智,從而實(shí)現(xiàn)更加準(zhǔn)確、快速的水稻品種培育,以適應(yīng)經(jīng)濟(jì)貧困和自然條件壓力下的不同農(nóng)業(yè)環(huán)境。
這個(gè)過程需要投入大量的精力與人力。因此,這些向全球植物育種學(xué)家和科學(xué)家免費(fèi)公開的數(shù)據(jù),將極大地推動(dòng)水稻的基因型/表型之間關(guān)聯(lián)的研究,同時(shí)對(duì)加深植物生物學(xué)的理解提供了豐富的資源。
發(fā)表在Giga Science雜志上的內(nèi)容還包括儲(chǔ)存于GigaDB數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)。GigaDB數(shù)據(jù)庫(kù)中的每個(gè)數(shù)據(jù)集都有一個(gè)數(shù)字對(duì)象標(biāo)識(shí)符(DOI),可用于引用,檢索和在標(biāo)準(zhǔn)的科學(xué)文獻(xiàn)中追蹤數(shù)據(jù),它為研究人員提供了一個(gè)強(qiáng)有力的動(dòng)機(jī)去更加快速地發(fā)布大量、密集型的數(shù)據(jù)集供科研團(tuán)體使用。除了將數(shù)據(jù)公開于GigaDB數(shù)據(jù)庫(kù)中之外,為了使科研人員最大程度的獲取這些數(shù)據(jù),3000株水稻基因組數(shù)據(jù)也同時(shí)提交到SRA數(shù)據(jù)庫(kù)(PRJEB6180)。(生物谷Bioon.com)