合作文章!開心果基因組,見刊Genome Biology!

2019年04月18日,Genome Biology在線發表了中國科學院昆明動物研究所與北京百邁客生物科技有限公司共同合作文章“Whole genomes and transcriptomes reveal adaptation and domestication of pistachio” 中國科學院昆明動物研究所研究員吳東東為本文通訊作者,中國科學院昆明動物研究所曾琳,北京百邁客公司大項目負責人韓鳳鳴,戴鶴為共同第一作者。本文繪制了開心果的基因組草圖,并對其進行了大規模的基因組重測序并進行了比較基因組分析,表明,開心果的應激適應可能與細胞色素P450和幾丁質酶基因家族的擴增有關。尤其重要的是,比較轉錄組學分析表明茉莉酸(JA)生物合成途徑在開心果耐鹽性中起著重要作用。此外,研究人員對93個栽培種和14個野生種(P. vera)基因組及35個親緣關系密切的野生黃連木屬基因組進行了重測序,以提供對種群結構、遺傳多樣性和馴化的見解與思路。

研究背景

隨著農業面積的減少和人口的增長,糧食?;晌桓鋈找嫜現氐奈侍?。沙漠約占地球陸地表面積的三分之一,是貧瘠的環境,幾乎沒有降水,通常有干燥和堿性土壤,因此對大多數植物和動物的生活條件都很不利。然而,一些沙漠地區仍可以種植一些作物。洞察這些物種的環境適應和經濟特征,有助于在不同的沙漠地區種植和繁殖這些作物,這可能有助于緩解世界糧食?;?。

開心果(p.vera,2n=30,圖1a)雙子葉植物綱、無患子目和漆樹科,是起源于中亞和中東的腰果家族成員。它是一種沙漠植物,對鹽漬土有很高的耐性??墓罱晌諼宕蠹峁魑?,除了具有經濟、營養和藥用價值外,對非生物脅迫也有很強的適應能力,被認為是一種能耐受干旱和鹽堿脅迫的物種,是干旱和鹽堿區重新造林的理想選擇。

盡管基因組測序的快速發展有助于發現許多作物馴化和改良的遺傳基礎,但關于開心果的研究卻很少。據估計,開心果的基因組大小約為600 MB,雜合率高。Moazzzam Jazi等人利用全基因組轉錄組,通過對照和鹽處理兩個開心果品種的比較,發現了耐鹽性相關的標記物和應激反應機制。

在本研究中,為了更好地了解開心果馴化的分子進化歷史,研究人員組裝了開心果的基因組草圖,并對107個全基因組進行了重測序,包括93個馴化和14個野生的開心果以及35個不同野生黃連木屬物種。整合基因組和轉錄組學分析顯示,擴張的基因家族(如細胞色素P450和幾丁質酶)和茉莉酸(JA)生物合成途徑可能參與應激適應。比較群體基因組分析顯示,開心果大約在8000年前被馴化,馴化的關鍵基因可能是那些涉及樹木和種子大小的基因,這些基因經歷了人工選擇。這些基因組序列應該有助于未來的研究,以了解沙漠作物的農業和環境相關特性的遺傳基礎。

材料方法

開心果(P.vera)二代測序denovo

測序材料:開心果栽培種“Batoury”;Illumina Hiseq 2500[包括兩種類型小片段文庫(270 bp和500 bp)]和六種類型 mate-pair文庫(3 kb、4 kb、8 kb、10 kb、15 kb和17 kb);PacBio sequel

重測序:107個開心果(93個馴化+14個野生)、35個不同野生黃連木屬物種;Illumina;

轉錄組:A:鹽處理:Ohadi(根:salt treatment 3 rep vs control 3 rep;葉:salt treatment 3 rep vs control 3 rep);B:野生型和馴化型:Ohadi和Sarakhs[根:Sarakhs (wild 3 rep) vs Ohadi (control 3 rep);葉:Sarakhs (wild 3 rep) vs Ohadi (control 3 rep)];

注:Ohadi與Sarakhs分別代表Pistacia vera的不同品系,Ohadi被認為是馴化型,Sarakhs是野生型)。

研究結果

1.?開心果的基因組進化

利用Illumina Hiseq 2500平臺組裝了569.12 Mb的開心果基因組草圖,Contig N50為20.69kb和Scaffold N50為768.39 Kb。為了提高連續性,進一步通過PacBio sequel系統組裝了671 MB的基因組草圖,ContigN50為75.7 Kb,Scaffold N50為949.2 Kb?;蜃櫓柿坑胂惹氨ǖ賴鬧參锘蜃橄嘁恢?,有助于一些令人信服的數據分析。裝配尺寸略大于估計的基因組尺寸,這可能是與開心果的高雜合度(1.72%)有關。轉座因子占開心果基因組的70.7%,其中46.75%為LTR(長末端重復轉座)。CEGMA分析表明,96.94%的核心蛋白編碼基因被恢復。BUSCO評估表明有94.51%完整的基因模型。

作者首先進行了比較基因組研究,以評估該物種的古歷史。利用9個植物基因組單拷貝家族基因的系統基因組分析表明,開心果在58百萬年前從柑橘中分離并在105百萬年前從毛果楊中分離出來。4DTV結果表明,開心果基因組在其與這些物種的分化之后沒有經歷譜系特異性的全基因組復制。文中還通過將開心果基因組與基礎被子植物無油樟基因組進行共線性分析,表明每個無油樟區域最多有三個開心果區域,而每個開心果區域最多有兩個毛果楊區域(圖1b)。共線性分析支持這樣一個結論:開心果中沒有發生譜系特異性基因組復制,但它們與真雙子葉植物中發生的γ復制相同,而毛果楊經歷了譜系特異性基因組復制事件。

圖1 開心果基因組進化
2.?開心果應激適應相關的擴張基因家族

為了揭示開心果表型(如耐鹽性)的遺傳基礎,利用OrthoMCL通過識別不同植物之間獨特和共同的基因家族來研究基因家族的進化??墓肽餑轄?、柑橘、雷蒙德氏棉、葡萄相比有9735個共有基因家族,而含有1381個基因的707個開心果有特基因家族。對這些基因進行GO與KEGG富集分析,并都發現了許多與“防御反應”有關的基因,其中包括許多包含NB-ARC domain和NBS-LRR domain的基因。這種基因以植物抗病性著稱,對開心果的防御反應具有相當重要的意義。

接下來,作者研究了開心果基因家族的擴張和收縮(圖1c)。由于很難從基因家族規模的收縮或與未在該參考基因組中成功組裝的基因有關,這里只分析了擴展的基因家族。對擴展基因家族的基因富集分析發現,它們在代謝類別中豐富,如萜類、黃酮類、倍半萜類和生物堿的生物合成?;蚣易宓睦┱狗⑸誄て誚?,并推動了黃連木屬和柑橘屬之間的進化差異,而不是開心果從野外馴化的非常短期的進化。因此,我們認為上述基因的擴展可能與野生黃連木中有機化合物的代謝有關。野生黃連木的植物化學篩選發現了許多植物化學物質,如生物堿、黃酮、香豆素、甾醇、單寧、萜類和倍半萜類。

此外,豐富的術語“氧化還原過程”包含許多細胞色素P450基因,這些基因編碼參與多種功能復雜代謝途徑的蛋白質,并在多個過程中發揮重要作用,特別是在應激反應中發揮作用。在187個細胞色素P450基因中,我們發現許多可能具有耐鹽功能。例如,透水性研究發現,CYP94家族基因表達水平的升高可減輕水稻的茉莉酸反應,增強水稻的耐鹽性。在開心果的這些擴張基因家族中,有14個CYP94基因。大豆中,CYP82A3參與茉莉酸和乙烯信號通路,增強對鹽堿和干旱的抗性,開心果擴張基因家族中有20個CYP82基因成員。毛果楊CYP714A3的異位表達增強了水稻的耐鹽性,開心果擴張基因家族中有10個CYP714A基因。因此,一些細胞色素P450基因可能與開心果的耐鹽性有關。

3.?RNA-seq揭示了開心果鹽適應的遺傳機制

進一步研究開心果的耐鹽性潛在遺傳機制,研究者進行了鹽度實驗??墓枘荊?em>P.vera?L.cv.Ohadi)的葉和根在正常條件和鹽度條件下進行RNA測序。使用Tophat-Cufflinks-Cuffdiff?pipeline,在鹽水條件下處理的植物與對照之間表現出差異表達,鑒定214和461蛋白質編碼基因分別在葉和根組織中(ncontrol = 3, nsalinity = 3, corrected P < 0.05,)?;蚋患治齜⑾中磯嗖鉅轂澩锘潁?1個基因)參與到“氧化還原進程”中(圖2a,b)。像比較基因組分析一樣,該類別中的15個基因是細胞色素P450基因,特別是CYP74A(即AOS),其編碼細胞色素P450 CYP74基因家族的一個成員,其起到丙二烯氧化物合酶(AOS)的作用。這種酶催化茉莉酸酯合成中的第一步[即茉莉酸(JA)]。AOS中每千堿基外顯子的表達片段(FPKM)值在葉片中從對照中的近0增加到鹽水條件下的2163.75,在根中從對照中的1.87增加到鹽水處理的87.74。研究者還發現了7個差異表達的基因(ChiC, TT4, ILL6, MYB108, MYB6, PRB1, and TIFY5A)被富集到“茉莉酸反應”中。以前的研究表明,干旱和高鹽度導致水稻葉片和根部JA含量增加。鹽度處理可以增加濕地物種鳶尾(Iris hexagona)中的內源JA水平。茉莉酸酯激活植物對生物脅迫(即病原體攻擊)和非生物脅迫(即鹽)的反應。在此,用鹽水處理增加了在葉和根中參與茉莉酸反應的這些基因的表達水平(圖2c)。這些基因的表達增加(例如,AOS作為酶催化茉莉酸酯合成中的第一步)應該增加茉莉酮酸酯的合成,因此,它們很可能被開心果用于應對鹽脅迫。

差異表達的基因富集到“幾丁質結合”,其中四種基因編碼幾丁質酶(CHIB, EP3, ChiC, AT2G43590)。植物幾丁質酶涉及多種生物系統。植物中的一些幾丁質酶是針對環境脅迫(如高鹽濃度,寒冷和干旱)而表達的,并且可以通過植物激素如乙烯,茉莉酸和水楊酸來上調。例如,基因ChiC編碼V類幾丁質酶,其表達可由茉莉酸和擬南芥鹽度引起的脅迫來誘導。研究者的轉錄組學分析表明,編碼幾丁質酶的基因和參與JA生物合成途徑的基因可能有助于開心果適應鹽水環境。

?圖2 鹽處理下開心果的轉錄組數據分析
4.?不同野生種間混和

為了研究開心果的種群歷史和適應性進化,研究者對107個開心果基因組進行重測序,包括93個品種和14個野生開心果,平均測序深度為6-8X。作者還重新測序了來自不同近緣種的35個基因組,包括P.mutica,P.khinjuk,P.integerrimaP. palaestina。用stringent GATK pipeline,發現14.77百萬個單基因變異位點,其中2.42百萬個在基因區。使用鄰近法和最大似然法的系統發育分析清楚地分離了5種不同的種群,即?P.vera, P.mutica, P. khinjuk, P. integerrima, and P. palaestina。通過TreeMix程序在一些物種之間檢測到漸滲的信號,這表明雜交可能在自然界中的不同近親之間發生,并且與植物中被發現的普遍雜交一致。然而,從其他開心果物種到馴化的開心果沒有檢測到漸滲,這種現象來源于野生的P. vera(圖3)。

?圖3 不同野生種間的基因漸滲
5.?開心果兩步馴化歷程

基于重測序數據,研究人員推測了這些物種的有效群體大小的變化,并發現在 Pleistocene期間發生了瓶頸事件,且在 ~200 kyr前,有效群體大小增加。系統發育樹顯示馴化和野生開心果之間的分離(圖4a)。利用δaδi推算野生和馴化開心果的分化時間在 ~8000年前,這與早在公元前6750年就表明開心果種子是一種常見的食物這一考古記錄相似。為了深入了解開心果種質之間的遺傳關系,研究人員進行了兩項經典分析:群體結構和主成分分析(圖4b,c)。這些分析清晰的顯示栽培種質分為兩個群。栽培種Group I的LD最高,栽培種Group II和野生開心果的LD衰減值相近。Group II包括 Qazvini,Italiaei和Badami

Zarand在內的5種類型的個體,且這些種質被記錄為古代具有種子的材料(圖4d)。與系統發育樹一致,這三個品種含有較高比例的野生血統(圖4e),這些結果支持了其兩步馴化的過程,初步馴化,然后通過作物育種進行改良。

圖4 野生和馴化開心果的系統發育關系分析
6.?開心果馴化的遺傳機制

群體核苷酸多態性θπ分析揭示了馴化型種質的核苷酸多態性低于野生型種質,通過分析發現,栽培種質中基因組上的一些區域的多態性降低,這些區域可能含有受到人工選擇的基因。此外,研究人員鑒定了栽培型和野生型樣品分化水平增加的區域。在馴化和野生的開心果之間,在基因組上約有9.2 Mb的區域被鑒定為具有高水平的群體分化。栽培種間遺傳多樣性降低,且超過95%的閾值。遺傳多樣性減少的區域和群體分化增強的區域在馴化或育種過程中經歷了選擇性清除。共計有665個基因定位在該區域。研究人員定位了受正向選擇的候選基因,其可能與馴化過程中重要的表型進化相關。在開心果馴化的過程中,其樹形大小經歷了人工選擇(圖5a)。研究人員發現了基因SAUR55(圖5b),編碼生長素應激蛋白,在植物的生長過程中發揮重要的作用,其在開心果的人工選擇下進化而來。除此之外,基于也和根的轉錄組數據分析結果顯示,馴化種與野生種相比,基因SAUR55表現出了顯著增加的表達水平(圖5c)。這些結果與在其它作物(如水稻和小麥)中生長素應激性基因的選擇性清除的研究結果一致,并揭示了在作物馴化期間類似特征性狀的人工選擇。果實重量是作物馴化和育種期間最重要的特征之一,包括開心果。在栽培種中,品種成分與果實重量呈正相關(圖4e)。這支持了一個結論,在開心果中,果實重量的人工選擇發生在馴化與人工選擇期間。研究人員指出,基因CYCD7-1在人工選擇的進化下,野生種和馴化的栽培種之間具有高度的群體分化特征。該基因編碼D型細胞周期蛋白,控制細胞分裂及種子發育過程中的生長率。CYCD7-1基因的過表達包括在胚胎和胚乳中的細胞增殖和細胞增大,其在擬南芥中導致種子過度生長?;?em>CYCD7-1在花粉和早期發育中顯示特殊表達,但在葉和根中沒有表達。因此,有希望在未來的實驗中比較野生型和馴化型開心果在花粉和早起發育時期CYCD7-1基因的表達,研究人員提出在CYCD7-1基因上進行的人工選擇可能會改變開心果的重量。

?圖5 開心果果樹大小的人工選擇

結論

本研究為開心果的局部適應和馴化提供了遺傳學基礎?;屏臼粑鎦只蜃樾蛄杏兄諼蠢吹難芯?,以了解沙漠作物農藝和環境相關性狀的遺傳基礎。

 

如果您的科研項目有問題,歡迎點擊下方按鈕咨詢我們,我們將免費為您設計文章方案。

推薦文章
快三手机计划软件下载 pk10怎样分析走势分析 香港90期买马最准免费资料 重庆时时彩稳赚技巧 重庆时彩两期稳赢计划软件下载 足球比分新浪 红马计划软件 pk10直播 ag平台作弊截图 二串一稳赚 北京pk赛车开结果结果 1136倍投方法 四川时时app下载手机版下载手机版 波克1000炮捕鱼破解版 河内五分彩稳赚技巧 时时彩宝典手机下载