:動植物基因組denovo二代測序

專業,準確,完整

產品介紹

timg-2

名人娱乐app下载 www.hfuqj.icu 基于二代測序技術手段,進行基因組組裝和基本分析,
獲得高質量基因組序列。為該物種的后基因組學研究奠定基礎。
簡單基因組:

contig N50≥200Kb

復雜基因組(小于2G):contig N50≥100Kb。
簡單基因組6個月,復雜基因組視根據具體情況而定。

分析內容

標準信息分析

  • 下機數據過濾;
  • 基因組組裝;
  • 全基因組精細注釋:編碼基因預測;重復序列注釋和轉座元件分類;Non-coding RNA注釋;假基因注釋;
  • 基因功能注釋:Nr庫注釋;KEGG代謝通路注釋;COG注釋(Gene Ontology);TrEMBL注釋;調控Motif預測;

640
2

高級信息分析

  • 基因家族聚類,特有、共有基因和基因家族統計;
  • 基因家族擴張收縮分析;
  • 系統發育樹的構建;
  • 物種分化時間推算(需要化石標定);
  • LTR形成時間估算;
  • 全基因組復制事件(一般為植物基因組的分析項);
  • 選擇壓力分析;

?NG芥菜基因組文章

2016年9月6日 ,Nature Genetics 在線發表由浙江大學種質創新和分子育種檢驗實驗室的張明方教授、楊景華老師與北京百邁客生物科技有限公司、中國農業部園藝植物生長發育與品質改良重點實驗室、浙江園藝植物綜合生物學省級實驗室、中國農業科學院蔬菜和花卉研究所、北京蔬菜研究中心、西澳大利亞大學等合作研究的異源四倍體芥菜基因組。

文章題目

The genome sequence of allopolyploid Brassica juncea and analysis of differential homoeolog gene expression influencing selection.

一、研究背景

異源四倍體芥菜(AABB)屬于十字花科蕓薹屬,是重要經濟作物,主要包括菜用和油用芥菜兩大類群,種植范圍較廣,經濟價值較大。菜用芥菜主要分布在中國等東亞國家和地區,油用芥菜主要分布在印度等南亞國家和地區。芥菜是“禹氏三角”中重要的一員,由白菜和黑芥雜交后加倍而來,至少發生了三次古多倍化事件,因此非常具有研究價值。但是由于其為異源多倍體,相關的全基因組測序工作一直很難開展。本研究團隊利用最新的測序技術(PacBio+BioNano),成功的組裝出高質量的芥菜基因組圖譜,為進一步改良芥菜的農藝性狀提供了基礎,為多倍體物種遺傳育種提供了新的方向。同時,也從多角度論證了芥菜A亞基因組起源問題,揭示了多倍體亞基因組間同源基因表達與選擇機制。

二、研究方法

1、組裝

研究中選取菜用芥菜的一個變種,使用二代測序和三代測序相結合的方法進行初步組裝,然后利用光學圖譜進行校正,得到了一版高質量的芥菜基因組,其中contig N50 由 28Kb 提升到61Kb ,scaffold N50 由710k 提升到1.5Mb.基因組完整性達到85%。另外還利用二代測序技術組裝了一版黑芥的基因組,基因組大小為591Mb,完整度為68%。

然后利用遺傳圖和光學圖譜對A、B亞基因組進行區分,整體掛載效果非常好,A為91.48%,B為72.32%。利用光學圖譜和遺傳圖譜對基因組進行區分,為其他多倍體物種基因組研究提供了參考。

2、基因組注釋情況

在高質量的基因組的情況下,采用從頭+同源+轉錄組結合的方法在芥菜基因組中獲得了80050個編碼蛋白的基因,其中有97.8%的基因可以注釋到Nr庫。另外黑芥基因組預測出來49826個編碼蛋白的基因,其中94.7%可以注釋到Nr。重復序列部分芥菜A基因組中重復序列比例為44.25%,B為52.37%。芥菜基因組特征情況見下圖:

三、研究結果

1、芥菜A亞基因組起源問題
芥菜的基因組是異源四倍體(AABB),在“禹氏三角”中由白菜(AA),黑芥(BB)雜交后加倍形成,在演化過程中變異類型非常豐富。問題是油用芥菜的AA和菜用芥菜的AA是來自同一個亞種,還是來自多個亞種呢,這個問題就是A亞基因組的起源問題。


如上圖,a中對芥菜A、白菜A、甘藍型油菜A進行共線性分析,可以發現其是高度共線的。

研究中對10個菜用的芥菜、7個油用的芥菜,5個甘藍型油菜基因組、27個白菜基因組(多亞種)進行了重測序分析,并繪制如上圖b中的進化樹。從b圖中可以看到芥菜全部聚在一起,沒有出現分散的情況,說明芥菜中A的基因組是來源于同一個亞種,屬于單系起源。

C圖中對同源物種和芥菜進行了進化樹構建,并計算了芥菜分化的具體時間為3-5萬年。

除了從群體的角度研究了芥菜亞基因組A起源問題,還從PCA聚類和Fixed SNP角度驗正了單系起源的結論。

2、基因表達的dominance現象
由于芥菜基因組是異源四倍體,也就是說基因組中存在兩套非常相似的亞基因組,那么在基因表達的過程中,位于兩套亞基因組上的等位基因的表達模式是怎么樣的呢,是一起表達,是相互抑制,還是一方占主導?


通過計算等位基因的表達量,發現在不同的時期,不同組織之間,發現存在dominance基因,存在dominance的基因經受的選擇壓力大于Neutral基因(不存在dominance現象,功能非常重要,純化作用較強,不輕易突變),但是小于Subordinate基因(作用不重要,純化作用較小,易丟失)。

3、油用芥菜和菜用芥菜的選擇與分化
通過菜用和油用芥菜群體進行選擇清除分析,發現dominance的基因被篩選出來的比例較高,同時結合轉錄組數據,這部分基因在油用和菜用兩個群體中差異表達。同時通過上面的分析發現與硫苷,脂類代謝顯著相關并且存在dominance的基因組,這些基因在油用菜用群體中有各自獨特基因分型。

四、文章亮點
1. 多倍體復雜基因組解決方案:二代+三代+光學,組裝出高質量復雜基因組;

2. 多個角度證據解決芥菜亞基因組A亞基因組單系起源/雜交起源爭論:Asubgenome phylogenetic tree,PCA, polymprphism and fixed SNP;

3. 通過構建群體模型及貝葉斯方法評估多倍體芥菜形成時間上下限,為新多倍體物種形成時間估算提供新方法;

4. 從不同發育時期,不同組織,不同處理條件,不同進化時期多個角度系統分析異源多倍體dominance 現象;

5. 通過油用菜用群體選擇角度識別vegetable- and oil- use B. juncea 分化選擇區域,發現與硫苷,脂類代謝顯著相關并且存在dominance的基因組,這些基因在油用菜用群體中有各自獨特基因分型;

6. 首次找到dominance gene 與潛在農藝性狀選擇相關性的證據,為多倍體物種遺傳育種提供了新的方向和基因候選材料。

五、摘要

The Brassica genus encompasses three diploid and three allopolyploid genomes, but a clear understanding of the evolution of agriculturally important traits via polyploidy is lacking. We assembled an allopolyploid Brassica juncea genome by shotgun and single-molecule reads integrated to genomic and genetic maps. We discovered that the A subgenomes of B. juncea and Brassica napus each had independent origins. Results suggested that A subgenomes of B. juncea were of monophyletic origin and evolved into vegetable-use and oil-use subvarieties. Homoeolog expression dominance occurs between subgenomes of allopolyploid B. juncea, in which differentially expressed genes display more selection potential than neutral genes. Homoeolog expression dominance in B. juncea has facilitated selection of glucosinolate and lipid metabolism genes in subvarieties used as vegetables and for oil production. These homoeolog expression dominance relationships among Brassicaceae genomes have contributed to selection response, predicting the directional effects of selection in a polyploid crop genome.

六、參考文獻

[1] The genome sequence of allopolyploid Brassica juncea and analysis of differential homoeolog gene expression influencing selection.

七、其他案例

【項目文章】百邁客助力苦蕎基因組在線發表

【項目文章】NG芥菜基因組文章解讀

【項目文章】百邁客NG文章搶先看

基因組de novo測序是什么?

基因組de novo測序也叫基因組從頭測序,主要針對未知物種的基因組序列以及需要更新的基因組,通過構建基因組DNA文庫,并進行測序。然后通過生物信息學的方法對測序所得到的數據進行拼接、組裝和注釋,從而獲得該物種完整的基因組序列圖譜。

三代基因組相比二代基因組的優勢有哪些?

三代測序具有長度長的特點,平均讀長在10-15Kb,而二代測序的讀長為PE125-250bp,所以二代測序在遇到重復序列,雜合難題時,就很無力。而三代測序能有效的解決這些問題。所以三代基因組具有超高的組裝指標,組裝錯誤率更低,組裝的完整性更好等優點。

三代的錯誤率高能否用于基因組組裝?

三代的錯誤率是隨機的堿基錯誤率,錯誤率達15%,但隨著自身覆蓋度的增加就可以進行糾錯,當覆蓋度在30X以上時,堿基準確度達99.99%以上。所以三代數據用于基因組組裝是完全沒有問題的。

基因組的樣品選擇?

基因組精細圖的樣品要盡量與調研圖樣品為同一個體,植物樣品最好選擇無污染的組培苗、嫩葉等,而動物樣品最好選擇全血或者內臟組織。

双色球预测大总汇 手机足球即时比分预测 重庆庆时时彩技巧 为什么黑客不去网赌 捕鱼游戏财神发发发技巧 七星彩近30期 球探体育比分在国外能用吗 快3和值技巧稳赚方法如下 龙虎和刷流水教程视频 广东11选5技巧稳赚公式 欢乐生肖投注 浙江11选5计划软件 欢乐生肖免费计划 福彩3d长期投注技巧 新时时彩开奖将结果 后一计划软件下载