|
關(guān)于目標區(qū)域測序 目標區(qū)域測序(Targeted Sequencing):是目標區(qū)域測序是指針對感興趣的目標區(qū)域富集后進行大規(guī)模測序。研究者可以針對自己感興趣的染色體區(qū)域或者大量的候選基因區(qū)域進行數(shù)百個甚至上千個樣品的序列測定。 目標區(qū)域測序優(yōu)勢 針對性強:比起全基因組水平的研究,目標區(qū)域測序更具有針對性,可以依賴大量的前期研究成果,獲得候選染色體區(qū)域或者基于生物通路的大量候選基因。 費用低:目標區(qū)域測序區(qū)域較小,可對數(shù)百個樣品進行快速測序,大大降低了研究成本。 信息量大:比起目標區(qū)域或者候選基因單倍型標簽SNP分型的研究策略,目標區(qū)域測序可以完整覆蓋整個基因區(qū)域,不僅可以獲得高頻SNP的分型數(shù)據(jù),而且還可以發(fā)現(xiàn)低頻的和個體特有的變異。 效率高:比起使用Sanger法的候選基因測序方法,基于二代測序技術(shù)的目標區(qū)域測序更加快速、高效! 高精度:目標區(qū)域的高測序深度保證了更準確的測序結(jié)果,例如目標區(qū)域測序的測序深度可以達到200×。 目標區(qū)域測序在動植物研究中的應用 1.有些物種是異源四倍體物種 ,對于這種異源四倍體物種其一個基因特定位點最多有四種不同的等位基因,因此要準確區(qū)別不同的等位基因和準確確定等位基因的拷貝數(shù)在測序時相對于二倍體就需要更高的測序深度,其測序深度至少要達到48×,此時目的目的區(qū)域測序就顯示出其無可比擬的優(yōu)勢。通過對這些異源多倍體物種的目標區(qū)域進行富集捕獲測序,數(shù)據(jù)可用于群體結(jié)構(gòu)以及GWAS-QTL分析。 相應研究案例: 對83株四倍體栽培土豆和1株參照二倍體土豆,平均分布在基因組上807個基因,共2.1M的區(qū)間進行富集,測序后獲得平均覆蓋深度為63×,共12.4G的高質(zhì)量數(shù)據(jù),發(fā)現(xiàn)129,156個可靠的序列變異(在外顯子1 SNP/24 bp ,在內(nèi)含子1 SNP/15 bp),這些變異含有大量罕見變異(61%的變異MAF小于 0.05),經(jīng)KASP技術(shù)驗證有99%的一致性。利用發(fā)現(xiàn)的變異對土豆植株成熟期和塊莖肉色相關(guān)的QTL進行GWAS分析,定位到了之前的已知QTL位點。主成分分析發(fā)現(xiàn)栽培土豆可以明顯聚類為五組。 ![]()
圖1. DNA序列變異與土豆的兩種性狀:(A)植株成熟期和(B)塊莖顏色相關(guān)性p值的Manhattan圖
參考文獻:A Next-Generation Sequencing Method for Genotyping-by-Sequencing of Highly Heterozygous Autotetraploid Potato. Jan G. A. M. L. Uitdewilligen et al. 2013, PloS ONE.2.針對某些物種間的保守區(qū)域進行目標區(qū)域測序,利用測序數(shù)據(jù)進行物種分類和系統(tǒng)進化分析,這種策略類似于利用16S rDNA/18S rDNA/ITS擴增子測序進行微生物群落多樣性分析或利用DNA條形碼技術(shù)進行品種資源鑒定和系統(tǒng)進化分析。 相應研究案例: 不同鳥類的演化仍然有爭議,利用雜交富集的定向測序技術(shù),對198種現(xiàn)存鳥類(代表所有鳥類譜系和兩個鱷魚外群)的394個有足夠變異度的保守位點進行目標區(qū)域測序(Agilent定制液相芯片富集),然后基于測序數(shù)據(jù)使用貝葉斯法和最大似然分析法建立所有鳥類譜系的系統(tǒng)進化樹。產(chǎn)生259個高質(zhì)量測序核位點(平均組裝長度為1523bp)共7.8 × 107 個堿基的數(shù)據(jù)量,基于這些數(shù)據(jù)使用貝葉斯法和最大似然分析法建立所有鳥類譜系的進化樹,5個主要分支形成新鳥綱的連續(xù)姐妹類群:(1)包括夜鷹,雨燕和蜂鳥;(2)包括杜鵑,大鴇,鴿子,蕉鵑和沙雞;(3) 鶴及其親屬;(4)水鳥類群,包括潛水類、涉水類、岸灘類;(5)麝雉類(圖1)。 ![]()
圖1. 鳥類的系統(tǒng)發(fā)育樹
參考文獻:A comprehensive phylogeny of birds (Aves) using targeted next-generation DNA sequencing. Richard O. Prum et al. 2015, Nature.3.為了保護種質(zhì)資源,開發(fā)可靠的并且高度可變的遺傳標記是必不可少的,對于一些基因組復雜但是遺傳標記比較缺少的物種,過去常使用細胞器基因組進行相關(guān)系統(tǒng)進化研究,但是這種方法具有效率低和單親遺傳等缺點,因此目前高通量測序非常適合這種非模式物種的遺傳標記開發(fā)研究,但是使用全基因組重測序?qū)@類基因組復雜物種進行群體進化研究實際上是代價高昂的,而目標區(qū)域測序這種只針對某些可靠位點進行深度測序的技術(shù)實際上更符合成本效益。 相應研究案例: 根據(jù)白皮松轉(zhuǎn)錄組序列設計捕獲探針,從而對48棵白皮松(每棵白皮松代表不同地理位置)上的7,849個不同基因進行目標區(qū)域捕獲測序,從這48棵白皮松樣本中共得到 390,910,265條 reads,所得到的數(shù)據(jù)提供了4452個基因的基因信息,共鑒定到12390個多態(tài)性位點(其中2163個變異位點的MAF > 0.1),然后通過這些位點揭示了雜合度和等位基因豐度的地理分布趨勢, PCA分析結(jié)果與這48棵白皮松的實際地理分布是一致的,并且指出南部樹木相對于其它區(qū)域的樹木顯示出最大的差異分化。 ![]()
圖1. 與雜合性,緯度和經(jīng)度相關(guān)的主成分(PC)。樣品的顏色按地理分布,(a)PC1與雜合度。(b)PC2與緯度。(C)PC3與緯度。(d)PC4與經(jīng)度
參考文獻:Targeted Capture Sequencing in Whitebark Pine Reveals Range-Wide Demographic and Adaptive Patterns Despite Challenges of a Large, Repetitive Genome.Syring JV et al. 2016,Front Plant Sci. 其它應用展望 4. 傳統(tǒng)方法QTL性狀粗定位鎖定大致區(qū)域后,如果區(qū)域內(nèi)沒有足夠多的分子標記或者沒有合適的分子標記,可使用目標區(qū)域測序來開發(fā)分子標記從而進行下一步的精細定位,如果精細定位鎖定區(qū)域大小在目標區(qū)域測序大小范圍內(nèi)可以使用目標區(qū)域測序直接鎖定QTL關(guān)聯(lián)位點或基因。 5. 混池分組分析法(BSA)已經(jīng)廣泛應用于動植物QTL定位的研究中,并且發(fā)現(xiàn)了QTL候選區(qū)域,因此后續(xù)可以對候選區(qū)間進行目標區(qū)域測序,獲得區(qū)域內(nèi)SNP/InDel的多態(tài)信息,聯(lián)合性狀進行關(guān)聯(lián)或者連鎖分析,從而鎖定QTL關(guān)聯(lián)位點/基因。 6. 全基因組關(guān)聯(lián)分析(GWAS)己經(jīng)廣泛地應用于QTL性狀的研究當中,并且定位出了大量顯著的SNP位點,然而這些標記位點大部分為常見變異位點,因此可以通過對 GWAS 鑒定的區(qū)域進行目標區(qū)域測序,從而找到與QTL性狀緊密相關(guān)的其它新的、稀有的和可能的功能變異。 目標區(qū)域測序在動植物研究中的應用總結(jié) ![]() 天昊生物目標區(qū)域測序整體解決方案 ![]() 天昊生物目標區(qū)域測序特色
天昊目標區(qū)域測序技術(shù)發(fā)表高分文章
FastTargetTM項目實例: 項目簡介:利用FastTargetTM富集技術(shù)對32個基因(約140K區(qū)域)350個樣本進行測序。 數(shù)據(jù)量統(tǒng)計:共測序得到37M的reads,有效34M的reads,富集效率92%,平均每個片段覆蓋173X。 ![]() 數(shù)據(jù)結(jié)果驗證:采用SNaPshot對目標區(qū)域內(nèi)12個高頻SNP位點對所有樣本進行了分析,觀察基因型的一致性,除了少部分樣本因為測序深度不夠,其它基本上達到了100%的一致性。 ![]() EasyTarget®項目實例 項目簡介:采用EasyTarget®富集方法對 9個基因(約37K區(qū)域)133個樣本進行測序。 數(shù)據(jù)量統(tǒng)計:總數(shù)據(jù)量為11M reads,有效reads為9.6M,富集效率87%,平均每個樣本72K reads,平均每個片段覆蓋486X,樣本測序深度分布如下。 ![]() 數(shù)據(jù)結(jié)果驗證:全部通過一代Sanger測序驗證,100%的準確性。 |
















