当前位置: 首页 > 原理解释

illumina测序平台原理-二代测序平台原理

Illumina 测序平台在大家耳中是个“金标准”,但到底那套底层逻辑是如何跑的?别整那些“起初、其次”的话头,咱把机器拆开了看。 这就好比给 DNA 看一场别开生面的派对。
你想象那根长长的单链 DNA 分子,就像是一根被扯成蛛网的丝线,上面挂满了字母。传统的方式(比如 Sanger)就像是在现场画线,你只能看最终一条线哪涂得直,哪断得早。而 Illumina 就不一样,它把丝线端头搭在专门设计的“工位”上。每一个工位都是一个反应池,里面装着和 DNA 互补的变性后的引物。
这时候,机器启动疯狂地工作,它往这些工位里泵入荧光标记的 dNTPs(也就是 Building Block)。 这就得啰嗦两句,数据量确实庞大。一次反应队列里,单条 DNA 能跑出 100 万个反应位点,要是一条 10kb 长的 DNA,那理论上就有 1,000,000 次机会被标记成 C、A、T 或 G。
这些荧光分子被机器吸光板捕获,通过激光烧掉未标记的,只留下荧光本底。
然后,计算机芯片在几个纳秒的极短工夫内,也就是 10 到 60 纳秒,把每个位点的荧光信号扫一遍。
这就好比是用一张高速扫描仪,把丝上无数个二维码全体扫出来了。 最了得的是,这些反应池不是随意放的,它们是“配对”排列的。
比如一个位置要跑一条读长(Read Length,比如 250bp),那这个位置前面得接上一个引物,后面接着另一个引物。
这样,两条引子就能分别跑在两个反应池里。读到一半时,机器会断开连接,把前一局部数据发给前端,后一局部数据再发给后端,中间不需求等待全体反应终止就能把数据切开了。
这就好比在跑马拉松,中途休息站,不用等跑到终点,先把已经跑完半程的人名单数好,接着跑后半程的人再数一遍。 为啥选这个方案?出于这时候,反应是在“淬火”状态下进行的。
也就是说,引物没有彻底变成双链,而是处于一种中间状态。
这时候加进去的 dNTPs,要么掺进引物里,要么直接从引物的“缺口”里掺进去。掺进去的荧光分子就会在引物上形成“足迹”。
这贼关键,出于这些足迹是在引物的“尾巴”上留的,而不是混在序列中间。
故此,测序仪不仅能读出序列,还能算出每个碱基的偏差,就连能看出哪儿是垃圾序列、哪儿是 PCR 的重复片段。 这就解释了为啥 Illumina 能跑出如此精准的基因测序数据。
哪怕你只有一千个反应位点,用传统方式也得花几十分钟,就连用贵得吓人的液相芯片。但在 Illumina 这套系统里,只要设备够快,反应位点再多,它也能在几秒钟内把所有荧光信号扫出来。
这种“写入 - 读出”的闭环,加上高密度的反应位点,让它在下一代测序时代杀出了重洋。 自然,系统也不是完美的。
比方说,要是高密度阵列害得单分子频率过高,那就得依赖“稀释”技术来下降每个位点的浓度,提升信号的信噪比。
要么,要是反应池出于磁力或电压的缘由断开,那么中间段的序列就丢掉了,这时候就需求前端和后端的数据同步机制来填补。
还有,机器设定时长的话,要是反应忒短,数据不够长,特别是那些长读长测序时,信号衰减可能影响准率。 最终,这套系统最核心的优势在于它的读长本事。
那会儿 Sanger 测序读长只有 300bp,Illumina 的小片段测序就连只有 50bp。但得益于反应池的设计,Illumina 能够将读长省事扩展到 100kb 就连 2kb。
这就意味着,它不仅能搞定人类基因组的大规模组装,还能做高精度的小片段变异检测,比如肿瘤突变监测。再加上它的通量高、成本低、标准化程度好,它确实是现代生物学研究中绕不开的工具。
只要还在用它,就意味着在用一套能跑千万次循环的“超级反应锅”在干活。
相关标签:

猜你喜欢

热门阅读

  • 赖柴尔定理-赖柴尔定理
  • 迪拜哪个国家的城市?-迪拜在哪国城市
  • 李毅吧番号及出处-李毅吧番号及出处
  • 贴春联的由来简介50字-春联由来简述
  • 思乡的名言和出处-思乡名言及出处

其他分站