日漸成熟的高通量測序技術(shù)
測序在生命科學研究中一直發(fā)揮著重要作用。以Sanger法(雙脫氧核苷酸末端終止法)為代表的第一代測序技術(shù)幫助人們完成了從噬菌體基因組到人類基因組圖譜等大量測序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基因組時代最理想的測序方法。
進入21世紀后,以Roche 454、Illumina Solexa和ABI SOLiD為代表的第二代測序技術(shù)誕生了,并迅速掀起了你追我趕的技術(shù)比拼高潮。2010年,Illunima和ABI先后發(fā)布新款測序儀,改進了原有機型,測序通量不斷提升,測序成本不斷降低,現(xiàn)在已經(jīng)進入了數(shù)千美元測一個人全基因組的時代。
第二代測序技術(shù)進展
1. Roche 454測序技術(shù)
454公司可謂第二代測序技術(shù)的奠基者。2005年底,454公司推出了革命性的基于焦磷酸測序法的高通量基因組測序系統(tǒng)--Genome Sequencer 20 System。這一技術(shù)的建立開創(chuàng)了邊合成邊測序(sequencing by synthesis)的先河,被nature雜志以里程碑事件報道。之后,454公司被羅氏診斷公司以1.55億美元收購。一年后,他們又推出了性能更優(yōu)的第二代基因組測序系統(tǒng)--Genome Sequencer FLX System(GS FLX)。2008年10月,Roche 454在不改變機器的情況下,推出了全新的測序試劑--GS FLX Titanium,全面提升了測序的準確性、讀長和測序通量。
目前,Roche 454 GS FLX Titanium每次運行能產(chǎn)生100萬條序列,平均讀長能達到400nt,且第400個堿基的準確率能達到99%。一次運行所需時間為10小時,能獲得4-6億個堿基的序列信息。
2. Illumina Solexa測序技術(shù)
Illumina公司的第二代測序儀最早由Solexa公司研發(fā),利用其專利核心技術(shù)"DNA簇"和"可逆性末端終結(jié)(reversible terminator)",實現(xiàn)自動化樣本制備和大規(guī)模并行測序。Illumina公司于2007年初花費6億美金巨資收購了Solexa。2010年初,Illumina將其第二代測序儀Genome Analyzer IIx升級到HiSeq 2000。
HiSeq 2000含有兩張Flow cell,可同時運行或者只運行其中一張。讀長為100nt,同時支持Fragment、Pair-end和Mate-Paired文庫。每次運行最多可產(chǎn)生200 GB的數(shù)據(jù)量(讀長為2x100nt)。
3. ABI SOLiD測序技術(shù)
過去20年,美國應用生物系統(tǒng)公司(ABI)在一代測序方面一直占據(jù)著壟斷地位。第二代測序技術(shù)出現(xiàn)以來,ABI公司不甘落后,迅速趕上,于2007年底推出了SOLiD 第二代測序平臺。2010年末又發(fā)布了最新產(chǎn)品--SOLiD 5500xl測序平臺。從SOLiD到如今的SOLiD 5500xl,短短三年時間,連升五級,發(fā)展速度驚人。
SOLiD全稱為Supported Oligo Ligation Detetion,它的獨特之處在于它以四色熒光標記寡核苷酸的連續(xù)連接反應為基礎(chǔ),而沒有采用傳統(tǒng)的邊合成邊測序技術(shù)。連接反應沒有DNA聚合酶合成過程中常有的錯配問題,而SOLiD特有的"雙色球編碼技術(shù)"又提供了一個糾錯機制,這樣設(shè)計上的優(yōu)勢使得SOLiD在系統(tǒng)準確性上大大領(lǐng)先于其它平臺。
目前最新款SOLiD 5500xl含有兩張微流體芯片(microfluidic FlowChip),每張芯片含有6條相互獨立的運行通道(run lane)。每條lane都能運行相對獨立的測序反應,這樣的設(shè)計使得SOLiD 5500xl測序平臺極具靈活性。最大測序讀長為75nt,同樣支持Fragment、Pair-end和Mate-Paired文庫。單次運行能得到的最大數(shù)據(jù)量為300Gb(使用最新設(shè)計的nanobeads)。測序的系統(tǒng)準確性能達到99.99%。
第二代測序技術(shù)的應用
技術(shù)推進科學研究的發(fā)展。隨著第二代測序技術(shù)的迅猛發(fā)展,科學界也開始越來越多地應用第二代測序技術(shù)來解決生物學問題。比如在基因組水平上對還沒有參考序列的物種進行重頭測序(de novo sequencing),獲得該物種的參考序列,為后續(xù)研究和分子育種奠定基礎(chǔ);對有參考序列的物種,進行全基因組重測序(resequencing),在全基因組水平上掃描并檢測突變位點,發(fā)現(xiàn)個體差異的分子基礎(chǔ)。在轉(zhuǎn)錄組水平上進行全轉(zhuǎn)錄組測序(whole transcriptome resequencing),從而開展可變剪接、編碼序列單核苷酸多態(tài)性(cSNP)等研究;或者進行小分子RNA測序(small RNA sequencing),通過分離特定大小的RNA分子進行測序,從而發(fā)現(xiàn)新的microRNA分子。在轉(zhuǎn)錄組水平上,與染色質(zhì)免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術(shù)相結(jié)合,從而檢測出與特定轉(zhuǎn)錄因子結(jié)合的DNA區(qū)域和基因組上的甲基化位點。
這邊需要特別指出的是第二代測序結(jié)合微陣列技術(shù)而衍生出來的應用--目標序列捕獲測序技術(shù)(Targeted Resequencing)。這項技術(shù)首先利用微陣列技術(shù)合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區(qū)域互補結(jié)合,從而富集到特定區(qū)段,然后用第二代測序技術(shù)對這些區(qū)段進行測序。目前提供序列捕獲的廠家有Agilent和Nimblegen ,應用最多的是人全外顯子組捕獲測序??茖W家們目前認為外顯子組測序比全基因組重測序更有優(yōu)勢,不僅僅是費用較低,更是因為外顯子組測序的數(shù)據(jù)分析計算量較小,與生物學表型結(jié)合更為直接。
目前,外顯子組測序開始廣泛應用于尋找疾病的候選基因上。內(nèi)梅亨大學的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導致嚴重的智力缺陷、腫瘤高發(fā)以及多種先天性畸形的罕見病。他們使用Agilent SureSelect序列捕獲和SOLiD對四位患者的外顯子組進行測序,平均覆蓋度為43倍,讀長為50 nt,每個個體產(chǎn)生了2.7-3 GB可作圖的序列數(shù)據(jù)。他們聚焦于全部四位患者都攜帶變異體的12個基因,最終將候選基因縮小至1個。而貝勒醫(yī)學院基因組測序中心也計劃對15種以上疾病進行研究,包括腦癌、肝癌、胰腺癌、結(jié)腸癌、卵巢癌、膀胱癌、心臟病、糖尿病、自閉癥以及其他遺傳疾病,以更好地理解致病突變以及突變對疾病的影響。前不久剛剛結(jié)束的Science雜志年度十大科學突破評選中,外顯子組測序名列其中。
以上我們盤點了2010年第二代測序技術(shù)的最新進展和相關(guān)應用。但是除了第二代測序之外,還有另外一種以單分子實時測序和納米孔為標志的第三代測序技術(shù)也正在如火如荼的發(fā)展中,只是還沒有正式發(fā)布。所以目前科學界所說的高通量測序還指的是第二代測序。