首頁(yè) >快訊 >

突破瓶頸!NC:華大基因高通量高精度單細(xì)胞全長(zhǎng)isoform最新技術(shù)發(fā)表

長(zhǎng)讀長(zhǎng)單細(xì)胞RNA異構(gòu)體測(cè)序(scISO-Seq)可以揭示單個(gè)細(xì)胞中的轉(zhuǎn)錄本剪接等結(jié)構(gòu)變異研究,但仍存在測(cè)序通量低、研究成本高等瓶頸,且轉(zhuǎn)錄本測(cè)序深度覆蓋度低,分析結(jié)果相對(duì)不準(zhǔn)確。

5月6日,華大基因(300676)唐沖博士團(tuán)隊(duì)和中山大學(xué)眼科中心眼科國(guó)家重點(diǎn)實(shí)驗(yàn)室劉奕志院長(zhǎng)團(tuán)隊(duì)共同在Nature Communications(影響因子:17.694)發(fā)表名為“High-throughput and high-accuracy single-cell RNA isoform analysis using PacBio circular consensus sequencing”的文章(點(diǎn)擊文末“閱讀原文”查看文獻(xiàn))。

該研究突破關(guān)鍵技術(shù)瓶頸,開發(fā)了HIT-scISOseq技術(shù),將單細(xì)胞多個(gè)cDNA串聯(lián)建庫(kù),結(jié)合PacBio平臺(tái)(CCS)測(cè)序,以實(shí)現(xiàn)高通量和高精度的單細(xì)胞RNA亞型測(cè)序研究。


(資料圖片僅供參考)

HIT-scISOseq可以助力單個(gè)PacBio Sequel II SMRT Cell產(chǎn)出8M數(shù)據(jù)量,獲得大于1,000萬條的高精度全長(zhǎng)轉(zhuǎn)錄組有效reads,同時(shí)利用新開發(fā)scISA-Tools分析工具,將HIT-scISOseq多倍通量串聯(lián)測(cè)序片段用為單細(xì)胞cDNA分析,準(zhǔn)確度和特異性大于99.99%。

此項(xiàng)研究中應(yīng)用HIT-scISOseq技術(shù)解析表征3,375個(gè)角膜緣細(xì)胞的轉(zhuǎn)錄組,揭示其中的細(xì)胞類型特異性異構(gòu)體表達(dá)。

關(guān)鍵技術(shù)路線

采用高通量單細(xì)胞分選技術(shù),獲得單細(xì)胞全長(zhǎng)cDNA序列,利用生物素化的PCR引物對(duì)全長(zhǎng)cDNA進(jìn)行擴(kuò)增,然后使用鏈霉親和素珠捕獲擴(kuò)增的生物素化的cDNA(圖1),并使用USER酶在cDNA的兩個(gè)末端產(chǎn)生粘性末端,進(jìn)一步使用DNA連接酶連接多個(gè)cDNA構(gòu)建CCS文庫(kù)后進(jìn)行長(zhǎng)讀長(zhǎng)測(cè)序。

圖1 HIT-scISOseq單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)的技術(shù)流程

重要研究成果

●有效數(shù)據(jù)獲得率高

采用相同的樣本進(jìn)行不同技術(shù)測(cè)評(píng)顯示結(jié)果如下:

1. HIT-scISOseq cDNA特有捕獲技術(shù),可將無效TSO artifact reads從50%降低到8%(圖2b);

2. HIT-scISOseq有效比對(duì)reads數(shù)是常規(guī)單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組技術(shù)的平均8.3倍(圖2c);

3. HITscISOseq得到的單個(gè)細(xì)胞基因數(shù)(或單個(gè)細(xì)胞UMI數(shù))要明顯高于常規(guī)單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)(圖2g)。

圖2 HIT-scISOseq單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)性能概述

●細(xì)胞類群分析結(jié)果與短讀長(zhǎng)一致

1. 為了驗(yàn)證HIT-scISOseq區(qū)分不同細(xì)胞類型的能力,研究者比較了HIT-scISOseq和RNA短讀長(zhǎng)測(cè)序在相同的高通量單細(xì)胞平臺(tái)獲得的角膜緣上皮細(xì)胞cDNA樣本上,HIT-scISOseq和短讀長(zhǎng)測(cè)序平臺(tái)之間的cell標(biāo)簽的UMI計(jì)數(shù)(Pearson系數(shù)r=0.992)和基因的UMI計(jì)數(shù)(Pearson系數(shù)r=0.956)之間存在很強(qiáng)的相關(guān)性(圖3a,b);

2.生物學(xué)重復(fù)樣本間采用HIT-scISOseq技術(shù)獲得單細(xì)胞UMI計(jì)數(shù)也具有較高一致性(Pearson系數(shù)r=0.998)(圖3c);

3.相同樣本在不同測(cè)序長(zhǎng)度下,細(xì)胞聚類結(jié)果類型及邊界基本一致(圖3d,e);

4.細(xì)胞條形碼計(jì)數(shù)的高度一致性,表明HIT-scISOseq 可以可靠地分析高通量單細(xì)胞轉(zhuǎn)錄組(圖3f);

5.每個(gè)細(xì)胞類群前15個(gè)標(biāo)記基因的表達(dá)并在兩個(gè)平臺(tái)之間發(fā)現(xiàn)了相似的表達(dá)模式(圖3h,i)。

這些結(jié)果證實(shí),基于HIT-scISOseq的單細(xì)胞基因表達(dá)譜分析結(jié)果與基于短讀長(zhǎng)測(cè)序的方法的結(jié)果相當(dāng)。

圖3 HIT-scISOseq單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行單細(xì)胞基因表達(dá)分析

●單細(xì)胞轉(zhuǎn)錄本亞型豐度與已知成分高度一致

為了驗(yàn)證HIT-scISOseq可以準(zhǔn)確量化亞型表達(dá),首先使用SIRV來演示亞型檢測(cè)。

1. 使用HIT-scISOseq SIRV同種型數(shù)據(jù),顯示混淆率低至0.1066%(1-TPR,圖4b);

2. 通過將HITscISOseq獲得的觀察值與已知的ERCC異構(gòu)體豐度數(shù)據(jù)進(jìn)行比較來評(píng)估異構(gòu)體量化結(jié)果:HIT-scISOseq測(cè)得的豐度與已知成分高度一致,相關(guān)系數(shù)為0.97(圖4a)。

圖4 HIT-scISOseq單細(xì)胞全長(zhǎng)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行單細(xì)胞異構(gòu)體水平表達(dá)分析

●在識(shí)別和量化單細(xì)胞亞型方面的能力強(qiáng)

1. 研究者從樣本s1和s2中保留了單細(xì)胞水平29,392和31,793個(gè)異構(gòu)體亞型,其中FSM(完全剪接匹配:與參考注釋匹配的異構(gòu)體)是兩個(gè)樣本中最豐富的亞型,并且有相當(dāng)數(shù)量的NNC亞型(已有結(jié)果至少一個(gè)未注釋:包含至少一個(gè)未注釋的剪接位點(diǎn)的同種型),表明HIT-scISOseq可用于改進(jìn)參考單細(xì)胞轉(zhuǎn)錄本異構(gòu)體注釋(圖4c)?;趤喰退降谋磉_(dá),我們觀察到同一個(gè)細(xì)胞聚類模式如上述基因水平分析(圖4d);

2. 進(jìn)一步分析了每個(gè)細(xì)胞簇的前15個(gè)標(biāo)記亞型,發(fā)現(xiàn)其中一些亞型以前未被識(shí)別(圖4e)。在每種細(xì)胞類型中選擇了2個(gè)標(biāo)記亞型用于表達(dá)模式驗(yàn)證,并且結(jié)果顯示這些標(biāo)記亞型確實(shí)呈現(xiàn)細(xì)胞類型特異性表達(dá)(圖4f,g),證明HIT-scISOseq是能夠有效解析單細(xì)胞亞型表達(dá)。

總 結(jié)

HIT-scISOseq是一種高通量、高精度、技術(shù)上可行的方法,可以加速長(zhǎng)讀長(zhǎng)單細(xì)胞轉(zhuǎn)錄組學(xué)新興領(lǐng)域的發(fā)展,極大的推動(dòng)高通量單細(xì)胞長(zhǎng)讀長(zhǎng)測(cè)序成本的降低。

關(guān)鍵詞:

責(zé)任編輯:Rex_10

推薦閱讀