背景與歷史人類基因組計劃(Human Genome Project):- 啟動時間:1990年,目標是繪制完整的人類基因組序列。
- 完成情況:2003年完成了85%的基因組序列,2022年完成了所有缺失片段的填補。
- 技術對比:最初使用的是Sanger測序技術,一次只能測序一條DNA鏈。而NGS技術可以同時測序數(shù)十億條DNA鏈,大大提高了速度。
- 通過NGS技術,測序一個人的全基因組只需一天,顯著縮短了測序時間。
- NGS技術依賴于人類基因組計劃創(chuàng)建的參考基因組。
NGS的原理與步驟樣品處理文庫構建- 這些適配子包含了測序儀器所需的序列信息,還包含樣品標識(Index),用于區(qū)分不同的樣本。
- 通過磁珠等方法去除未結合的適配子,保證文庫的質量。
- 根據(jù)具體應用,可能加入PCR擴增步驟來增加文庫的量。
- 一個成功的文庫需達到指定的片段長度和足夠的濃度,才能進入下一步測序。
測序準備與合成- 測序發(fā)生在玻璃表面的流動池(Flow Cell)中,流動池表面附有與文庫適配子序列匹配的寡核苷酸(Oligonucleotides)。
- 將文庫片段通過變性(Denaturation)處理,轉變?yōu)閱捂淒NA。
- 單鏈DNA與流動池表面的寡核苷酸結合,形成DNA鏈。
- 克隆擴增(Clonal Amplification):
- 使用PCR技術對文庫片段進行擴增,以便形成簇(Cluster),增加熒光信號的強度。
- 過程:DNA鏈通過橋式PCR擴增,形成多個拷貝(雙鏈DNA),然后將雙鏈分離,重復此過程形成大量局部簇。最終切割掉反向鏈,留下前向鏈用于測序。
測序過程- 測序合成(Sequencing by Synthesis, SBS):
- 原理:測序時通過DNA聚合酶將熒光標記的核苷酸(A、T、G、C)依次加入待測DNA鏈中,每次加入一個堿基,熒光信號被相機捕獲和記錄。
- 每種堿基(A、T、G、C)帶有不同顏色的熒光標簽和終止子,確保每個循環(huán)只能加入一個堿基。
- 去除終止子,繼續(xù)加入下一個核苷酸,重復此過程,直到完成預設的測序長度。
- 指數(shù)(Index)測序:通過標識序列區(qū)分不同的樣本。
- 多重樣本測序:利用獨特的雙重指數(shù)標簽,最高可同時在一個流動池中處理384個樣本。
- 雙端測序(Paired-End Sequencing):
- 雙端測序生成兩個來自同一片段的讀取(一個來自前向鏈,一個來自反向鏈),增加了測序的準確性,尤其是長片段分析。
- 過程:前向鏈測序完成后,創(chuàng)建橋接結構使反向鏈成為模板,接著對反向鏈進行測序。
數(shù)據(jù)處理- 在測序完成后,過濾掉質量較差的讀取,如重疊的簇、強度過低的簇,以及多重簇的情況。
- 利用樣本指數(shù)(Index)將不同樣本的讀取分離。
- 將過濾后的讀取比對到參考基因組上,重組DNA片段,并通過算法識別和定位這些片段。
- 讀數(shù)深度(Read Depth):指某個核苷酸被測序的次數(shù)。常規(guī)全基因組測序需要30倍的平均讀數(shù)深度,癌癥研究中檢測稀有突變時需要更高的讀數(shù)深度(如1500倍)。
- 覆蓋度(Coverage):目標是確保測序過程中目標區(qū)域沒有遺漏,覆蓋率越高,數(shù)據(jù)越完整。
參考文獻 Goodwin, S., McPherson, J.D., & McCombie, W.R. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics, 17(6), 333-351. [DOI: 10.1038/nrg.2016.49]van Dijk, E.L., Jaszczyszyn, Y., Naquin, D., & Thermes, C. (2018). The third revolution in sequencing technology. Trends in Genetics, 34(9), 666-681. [DOI: 10.1016/j.tig.2018.05.008]Mardis, E.R. (2017). DNA sequencing technologies: 2006–2016. Nature Protocols, 12(2), 213-218. [DOI: 10.1038/nprot.2016.182]Shendure, J., & Ji, H. (2008). Next-generation DNA sequencing. Nature Biotechnology, 26(10), 1135-1145. [DOI: 10.1038/nbt1486]Head, S.R., Komori, H.K., LaMere, S.A., Whisenant, T., Van Nieuwerburgh, F., Salomon, D.R., & Ordoukhanian, P. (2014). Library construction for next-generation sequencing: Overviews and challenges. BioTechniques, 56(2), 61-77. [DOI: 10.2144/000114133]Metzker, M.L. (2010). Sequencing technologies - the next generation. Nature Reviews Genetics, 11(1), 31-46. [DOI: 10.1038/nrg2626]Levy, S.E., & Myers, R.M. (2016). Advancements in next-generation sequencing. Annual Review of Genomics and Human Genetics, 17(1), 95-115. [DOI: 10.1146/annurev-genom-083115-022413]Reuter, J.A., Spacek, D.V., & Snyder, M.P. (2015). High-throughput sequencing technologies. Molecular Cell, 58(4), 586-597. [DOI: 10.1016/j.molcel.2015.05.004]Behjati, S., & Tarpey, P.S. (2013). What is next generation sequencing?. Archives of Disease in Childhood Education and Practice Edition, 98(6), 236-238. [DOI: 10.1136/archdischild-2013-304340]Goodwin, S., McPherson, J.D., & McCombie, W.R. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics, 17(6), 333-351. [DOI: 10.1038/nrg.2016.49]
|