三代測序的原理
一、測序原理先介紹 nanopore 測序中的幾位主角:
reader :在自然界中,有一種可以嵌入到細胞膜中作為離子或分子通道的跨膜蛋白,具有**的蛋白納米孔。經(jīng)過人為基因工程修飾后,得到的就是 nanopore 測序所需的 reader 蛋白。
membrane:reader 蛋白會被嵌入到高電阻率的 membrane (人工合成的多聚物膜),膜兩側(cè)是離子溶液,在兩側(cè)加不同的電位,離子就會在孔中流動,形成電流。
motor:在 nanopore 文庫構(gòu)建時,需要在接頭上連接一種動力蛋白,用于將dna或rna分子推入納米孔中。以dna解螺旋酶作為 motor(動力蛋白)為例,它可以除了可以解開雙螺旋,使之變?yōu)閱捂?,還可以提供推動力。
tether:該蛋白用于錨定dna或rna鏈,防止在溶液中飄動,并使其進入納米孔中。
這時,解開的其中一條鏈會穿過蛋白質(zhì)孔,它在通過蛋白孔時,會對膜兩邊離子的穩(wěn)定流動產(chǎn)生擾動。不同的堿基,對離子流的影響不同,也就會產(chǎn)生不同的電流大小,進而形成下面的電流信號圖。
利用這些電流信號,使用計算機軟件識別后,推斷出堿基類型,完成測序。
二、測序儀介紹雖然 nanopore 測序儀種類很多,但都是基于nanopore芯片來搭建的平臺,大到由多個芯片陣列組成的promehion,gridion系列測序儀,小到可以連接手機的type c,電腦usb的mnion系列便攜式測序儀。
這里邊,較*的就是mnion系列,2016年8月,美國宇航員凱特·魯賓斯在**空間站完成微重力條件的dna測序。
它在測序時,一般像下圖這樣連接就行,顯而易見的便攜性。比如,可以直接用它在深入疫區(qū)采集樣本后進行實時分析,為防疫工作爭取大量寶貴的時間和資源。
測序時,將制備好的文庫或樣本溶液,滴在芯片小孔中,開始測序。
一張芯片中有 2048 個 membrane wells,也就是芯片上的一個孔,每個孔包含一個nanopore reader。
每四個 wells 共享一個 amplifier(信號放大器),一張芯片中有 512 個信號放大器,也就是 512 組 wells。
在啟動測序儀后,機器自檢,會將每組 wells 中依據(jù)效率高低排序。測序開始,儀器先用每組 wells 中效率較高的 wells,運行 8 小時后,更換效率*二的,以此類推。
但是,在實際使用過程中,只有 1200 個 wells可以正常工作。
造成 wells 失效的原因:
wells 中沒有 reader 蛋白,或納米孔不通,這時無電信號
膜破損,這時有強電信號,不能正常測序
在單個 well 中有兩個及以上的 reader 蛋白,電信號互相干擾
三、建庫方法1、1d 文庫1d文庫是將dna雙鏈,解鏈為正義鏈與反義鏈,分別測序,大約有 85% 的堿基判讀準(zhǔn)確率。
目前1d文庫有兩種建庫方案:
標(biāo)準(zhǔn)建庫
將 dna 打斷
補齊dna末端,末端加 a 堿基
連接 adapter( 接頭序列),接頭上連有 motor 蛋白
接頭中有一段序列可以與 tether 蛋白結(jié)合,作用是為了將 dna 鏈吸附在膜上,將 dna 錨定,不易被溶液洗走
下圖是 tether 與接頭序列識別及錨定過程
轉(zhuǎn)座酶建庫
建庫時使用連有測序接頭的轉(zhuǎn)座酶,該酶可以將長鏈 dna 鏈切斷
由于該酶的特性,會在dna的斷點兩端加接頭序列
隨后在測序接頭加入 motor 蛋白
2、 文庫在 dna 兩側(cè)接 接頭,其他步驟和 1d 文庫類似。
這種文庫中的 接頭,可以讓*二鏈緊跟**鏈來一起測序。
由于可以測到兩條鏈,可以相互矯正,進而提高判讀準(zhǔn)確率,能達到 90%以上的堿基判讀準(zhǔn)確率。
但是,由于文庫質(zhì)量,蛋白活性等因素,導(dǎo)致并不是所有的**鏈后都會測到*二鏈。
四、堿基判讀在測序過程中,得到的信號并不是每次測得一個堿基信號。而是根據(jù) reader 蛋白孔的縱向長度,r9 大約為 5 個堿基長,也就是說,同時會測得 5 個堿基的電信號,這并不是一項簡單的判斷過程。
目前,nanopore 公司采用一種機器學(xué)習(xí)方法,遞歸神經(jīng)網(wǎng)絡(luò)(rnn),對堿基進行判讀。
該過程簡單來說,是將已知堿基序列的電信號波形圖做訓(xùn)練集和測試集,通過修正參數(shù),拿到模型。最后,將新測到的未知序列的波形圖與之比對,從而提高判讀準(zhǔn)確率。
但是,還是有誤讀情況:
由于空間結(jié)構(gòu)相似性,嘌呤間誤讀,嘧啶間誤讀較容易發(fā)生。
堿基復(fù)雜度低的序列(如,polya序列),較容易誤讀
五、測序影響因素電壓以r9芯片為例,測序過程,先用 180 mv 電壓,每 10 min,短時間翻轉(zhuǎn)電壓方向,作用是激活被堵住或卡住的 reader 蛋白孔。但是,這個過程也會使正常測序的 dan鏈倒吐回去。
隨著電極使用時間的增加,電極的電壓會發(fā)生漂移,因此每過兩小時,要增加 5mv 電壓抵消影響。
速度與產(chǎn)量r9 芯片,測序速度是 250 堿基/s,一張芯片可以得到約 5 ~ 10 g的堿基序列。
北京立博泰業(yè)科技有限公司專注于離心機,三代測序,純水儀,正倒置一體研究級顯微鏡等