|
相信有些小伙伴已經(jīng)隱隱約約有聽說過UDI和UMI這兩個英文縮寫,但是一直沒搞清楚它們?nèi)巧叮克鼈兡芨缮叮?/span> |
|
|
|
|
|
在正文開始前,我們先來“揭秘”UDI和UMI的全稱: UDI的全稱為Unique Dual Index,譯為雙端不重復(fù)標(biāo)簽技術(shù)。 UMI的全稱為Unique Molecular Identifier,譯為分子條形碼或者分子標(biāo)簽技術(shù)。 別急,要弄清這兩個概念,還得從二代測序的那些事情說起: 我們都知道二代測序技術(shù)是近十年來曝光率非常高、非常受關(guān)注的基因組分析技術(shù)。以Illumina為代表的測序儀廠商不斷推出更新型號的測序儀,不斷刷新測序通量,但不變的仍是多樣本混合后測序的策略。 要實(shí)現(xiàn)對多個樣本同時(shí)測序,必須在各樣本PCR擴(kuò)增階段,往核酸片段上添加一段分子序列作為樣本標(biāo)簽,這種標(biāo)簽叫做index。 |
|
|
|
這樣,每個樣本就帶上屬于它的“專屬號碼牌”,在多樣本混合測序后,生信工程師能通過“翻牌”,確定這個“號碼”所代表的就是“尋尋覓覓”的那個“它”。 |
|
|
|
Index一般由8位堿基所組成,常有單端與雙端兩種添加模式,為了增加同時(shí)上樣的通量,大家一般在面臨大量樣本同時(shí)測序時(shí),會選擇雙端index↓ |
|
|
|
目前常用的雙端index策略是通過少數(shù)幾種index序列排列組合,去實(shí)現(xiàn)更多樣本的標(biāo)簽區(qū)分(如96種),但這種方式一直存在交叉污染的可能。 |
|
|
|
同時(shí),為了進(jìn)一步提升通量與擴(kuò)增效率,降低測序成本,Illumina為Novaseq等高通量型測序儀引入了圖案化流動槽(Patterned Flow Cell Technology,PFCT)和排他性擴(kuò)增(Exclusion Amplification,ExAmp)成簇技術(shù)。這兩個看似美好的技術(shù)卻無意間放大了一種叫做標(biāo)簽跳躍(index hopping)的樣本標(biāo)簽錯配的現(xiàn)象,導(dǎo)致科研人員無法正確拆析樣本與數(shù)據(jù)的關(guān)系,終可能與重大發(fā)現(xiàn)“失之交臂”。 |
為了降低標(biāo)簽跳躍,Illumina在可以使用UDI雙端特殊標(biāo)簽對樣本進(jìn)行標(biāo)記,混樣后進(jìn)行測序。 |
UDI的引入使得文庫兩端的index序列是不重復(fù),一對一組合的,不存在共用。換句話說,只有兩端帶有*正確index序列的reads才能進(jìn)入后續(xù)的樣本分析,從而可以剔除標(biāo)簽錯配的reads,有效避免樣本之間的數(shù)據(jù)串?dāng)_。 |
|
|
|
一句話總結(jié):采用UDI策略,能更正確拆解測序數(shù)據(jù)與樣本之間的一一對應(yīng)關(guān)系,減小樣本“戴錯號碼牌”的概率。 |
|
下面再來講講名為分子標(biāo)簽技術(shù)的UMI: |
UMI的原理就是給每一條原始核酸片段加上一段*的標(biāo)簽序列,經(jīng)PCR擴(kuò)增后一起進(jìn)行測序。這樣根據(jù)不同的標(biāo)簽序列,生信人員就能區(qū)分不同來源的DNA模板,分辨哪些是PCR擴(kuò)增及測序過程中的隨機(jī)錯誤造成的假陽性突變,哪些是患者真正攜帶的突變,從而提高檢測靈敏度和特異性。 |
|
|
|
|
|
一些需要較高正確度的應(yīng)用,如腫瘤稀有突變分析,常會對5%、甚至1%左右的稀有變異作檢測。這時(shí)一旦出現(xiàn)測序錯誤、或者PCR偏差,便會產(chǎn)生大量假陽性結(jié)果,因此需要添加UMI進(jìn)行校正。 |
|
一句話總結(jié):做稀有突變檢測、校正測序錯誤與PCR偏差,UMI“勞苦功高”。 |
|
看到這里,關(guān)于UDI和UMI的介紹已基本完成。 |
|
接下來我們來看一個實(shí)際案例應(yīng)用。 |
|
近我們收到一位寶粉的來信,咨詢我們Takara有沒有什么好的文庫構(gòu)建方案↓ |
|
我們了解到這位寶粉的團(tuán)隊(duì) ① 近正在研發(fā)腫瘤稀有突變分析的項(xiàng)目; ② 樣本類型主要是FFPE(石蠟包埋樣本)、cfDNA(游離DNA); ③ 起始量大概在幾十ng;④準(zhǔn)備自己建庫,然后送樣測序,平臺是Novaseq; ⑤ 由于是剛接觸建庫實(shí)驗(yàn),不希望操作太復(fù)雜。 我思考了大概1秒鐘,就從我們豐富的DNA-Seq文庫構(gòu)建產(chǎn)品線中找到了一款合適的產(chǎn)品↓ |
|
ThruPLEX Tag-Seq HV |
為什么說這款產(chǎn)品合適呢?我們來對標(biāo)這位寶粉的幾個需求。 |
|
需求1:希望操作簡便,不要太繁瑣 |
對標(biāo)1:ThruPLEX Tag-Seq HV這款試劑盒支持單管、三步操作,手動15 min,全程2 h,無需在建庫過程中轉(zhuǎn)管或純化。 |
|
|
|
我們比較了ThruPLEX HV和K、N兩家公司的試劑盒,只有ThruPLEX是單管操作、時(shí)間短、操作便捷的系統(tǒng)。 |
|
|
|
所以,無論新手還是老手,都能很快上手! |
|
需求2:樣本類型為FFPE DNA、cfDNA,起始量大概在幾十ng |
對標(biāo)2:ThruPLEX Tag-Seq HV支持5-200 ng FFPE DNA、cfDNA起始,input volume為30μl,無需樣品濃縮。 |
|
需求3:Novaseq測序分析稀有變異 |
對標(biāo)3:ThruPLEX Tag-Seq HV搭配UDI建庫,可以有效降低index hopping效應(yīng),是高通量型Illumina測序儀的“友好伙伴” |
|
ThruPLEX Tag-Seq HV莖環(huán)形接頭上還包含7位堿基的固定型UMI,雙端總共可有144種UMI連接到DNA分子兩端,以識別一致序列,減少擴(kuò)增或者測序錯誤帶來的假陽性突變。 |
|
|
|
再舉幾個例子 |
Takara科學(xué)家采用ThruPLEX Tag-Seq HV對10 ng起始的Quan-Plex Patient-Like ctDNA標(biāo)準(zhǔn)品(AccuRef)構(gòu)建文庫,腫瘤相關(guān)的基因采用IDT xGEN Pan Cancer Panel進(jìn)行捕獲富集,隨后用UMIs鑒定了ctDNA標(biāo)準(zhǔn)品中特定位點(diǎn)的實(shí)際突變頻率。結(jié)果顯示,檢測到的突變頻率分別與預(yù)期1%、5%的等位突變頻率接近,而陰性對照組沒有在位點(diǎn)處檢測到任何突變。 |
|
|
|
同時(shí),為了比較UMI與常規(guī)使用的坐標(biāo)法之間的效果差異,Takara科學(xué)家先使用未去重或者僅用坐標(biāo)法去重的文件分析,在預(yù)期的EGFR L858R突變附近觀察到大量的低頻及隨機(jī)等位基因頻率突變。而隨后用UMI校正、過濾數(shù)據(jù)后,清除了假陽性突變,得到了預(yù)期的突變分析結(jié)果! |
|
|
|
經(jīng)過幾場對標(biāo),我們明確了ThruPLEX Tag-Seq HV能滿足那位寶粉開發(fā)cfDNA/FFPE DNA稀有突變項(xiàng)目的需求。 |
當(dāng)然,若小伙伴們也有同等需求,ThruPLEX Tag-Seq HV定能不負(fù)所望。 |