发布时间:2026-04-29 10: 19: 00
做Sanger数据时,很多人最头疼的不是装配跑不起来,而是峰图看着像能读,真到校对时又总觉得不踏实。前面一段峰形还算整齐,到了后面开始叠峰、虚峰、拖尾,或者某个位置明明像有变异,又拿不准到底是样本真的混了,还是读段质量已经掉下去了。DNASTAR的SeqMan Ultra本来就把这类工作放在装配后的分析阶段来做,官方资料也明确提到,它支持查看ABI色谱图、检查冲突、手动修剪末端,并对装配结果做碱基层级和contig层级的编辑。想把峰图校对顺,关键不是一上来就改碱基,而是先把峰图、质量、比对位置和杂峰类型分开判断。
一、DNASTAR测序峰图怎么校对
峰图校对这一步,最怕的是只盯颜色不看上下文。真正稳的做法,是先把色谱图调出来,再结合质量分数和比对位置去看,这样你改的是有依据的,不是凭感觉猜。DNASTAR官方说明里写得很清楚,在SeqMan Ultra的Alignment视图中,可以点序列名左边的加号来展开色谱图,且这项功能针对ABI序列提供。
1、先把对应序列的峰图展开
进入Alignment视图后,先点序列名称左侧的加号,把色谱图拉出来。只有把原始峰形摊开,后面你才能分清是单峰不稳,还是双峰并存,还是局部信号已经塌掉了。若只看装配后的碱基文本,很容易把低质量位点误当成真实突变。
2、打开质量分数一起看
官方说明提到,Quality scores可以直接显示在碱基旁边,而且这个分数是根据峰的形状和高度计算出来的,峰越高、越尖锐,分数通常越高;若主峰下面还压着明显的底峰,分数会被扣下去。也就是说,同样是看着像A,有的A是干净的主峰,有的A只是勉强胜出的一个峰,这两种情况在校对时不能混为一谈。
3、先校中间段再回头看两端
DNASTAR官方在Sanger装配流程里把手动修剪放在装配前后都能做的位置,还强调去novo装配对低质量末端和未修剪污染序列比较敏感。实际校对时,比较稳的顺序也是先看中间那段峰形饱满、质量相对稳定的区域,把主干结论立住,再回头处理两端不稳的位置。这样不容易一开始就被边缘噪声带偏。
4、冲突位点优先按变异排序去看
当序列多起来以后,逐条翻峰图会很慢。Alignment工具栏里有按变异排序的功能,能把含有variant base的读段先推到上面。这个功能本来就是为冲突检查准备的,特别适合拿来先锁定真正需要人工复核的位点,而不是把时间花在一大片没有争议的碱基上。
二、DNASTAR测序峰图杂峰怎么处理
杂峰处理最容易犯的错误,就是一看到双峰就立刻改成某一个字母。实际上,杂峰至少有几种完全不同的来源,处理办法也不一样。有的是低质量末端造成的假杂峰,有的是模板混样或杂合位点,有的是比对位置滑了,还有的是插入缺失后面的峰开始整体错位。DNASTAR给的工具并不是只让你“改字母”,而是让你先判断这类杂峰属于哪一种。
1、杂峰集中在首尾先修剪不要急着判突变
官方资料提到,SeqMan NGen和SeqMan Ultra支持基于质量和污染序列做自动修剪,末端修剪还会参考滑动窗口中模糊碱基的数量。若杂峰主要堆在5端或3端,尤其是靠近读段尾部越来越乱,这类情况通常先考虑修剪,而不是先当作变异。把低质量尾巴剪掉以后,再看主序列,判断会稳很多。
2、双峰稳定共存先保留模糊位点
SeqMan Ultra支持显示ambiguity codes,也支持用Show hide variant degeneracy临时强制显示单一碱基。这个设计本身就说明,软件默认承认有些位点不适合粗暴压成一个字母。若某个位点连续出现清晰的双峰,而且前后峰形还算稳定,更稳妥的做法通常是先保留模糊位点,再结合实验背景判断是杂合、混样,还是多模板共存,而不是为了让序列“好看”直接改成单一碱基。
3、局部从某一点开始整体变乱要怀疑对齐滑移
若不是单个点杂,而是从某个位置开始,后面一长段峰都像错位叠上去了,这种情况往往不是单纯的噪声,而更像插入缺失或局部比对锚点不对。DNASTAR在Alignment工具栏中提供了左右锚定编辑,也支持拖动Sanger读段左右滑动。遇到这类杂峰,先检查锚点和相对位置,通常比直接删碱基更有效。
4、杂峰很重时先看是不是样本本身就不干净
有些杂峰不是软件能“修”掉的,而是样本质量本来就不理想。DNASTAR官方对共识计算的说明里提到,Trace Evidence会直接参考峰的质量和形状,必要时会给出模糊编码;这说明如果底层峰形本身就不干净,软件也不会强行装成一条特别确定的序列。碰到这种情况,校对重点不该是死抠每个字母,而是回头检查PCR产物纯度、引物特异性和送样质量。
三、DNASTAR里哪些动作最容易把峰图越改越乱
峰图校对并不怕慢,怕的是改错方向。很多人不是不会用工具,而是顺序反了,结果本来只是一段低质量尾巴,最后被改成了一条全错的共识。DNASTAR提供了微编辑、手动修剪、滑动序列、强制显示非模糊碱基这些功能,但这些功能更适合建立在判断之后,而不是拿来盲改。
1、只看字母不看峰形
这是最常见的问题。软件给出的碱基文本只是结果,不是全部证据。尤其在争议位点,真正该看的仍然是峰高、峰宽、底峰和前后连续性。质量分数和原始色谱图本来就是给这一步准备的,不用它们,后面很容易改出“形式正确、证据不足”的序列。
2、为了消掉模糊码强行改单碱基
Show hide variant degeneracy可以让软件在模糊位点强制显示单一碱基,但这个功能更适合临时查看,不适合直接当作最终校对结果。若峰图证据本来就支持ambiguity,你硬把它压成一个碱基,后面做变异判读时反而更容易出错。
3、末端没修就开始全段微调
官方流程里把trimming放得很靠前,不是没有原因。因为低质量末端一旦没先处理,后面的错位、冲突和假双峰都会一起冒出来。先把该剪的剪掉,再做微编辑,通常比边修边拖更省事。
4、冲突位点没有集中复核
SeqMan Ultra本身支持按variant排序,也支持对装配结果做冲突检查和微编辑。若项目里读段不少,最怕东改一点、西改一点,没有一个固定的复核顺序。更稳的做法,是先把冲突位点集中找出来,再逐点核峰图,这样不会改漏,也不容易前后标准不一。
总结
DNASTAR测序峰图怎么校对,DNASTAR测序峰图杂峰怎么处理,关键不是先把每个杂点都改干净,而是先分清楚它到底属于低质量末端、真实模糊位点,还是局部比对错位。先在Alignment视图里展开峰图,再把质量分数、变异排序和修剪工具一起用起来,能修剪的先修剪,该保留模糊码的就先保留,怀疑滑移时再去调锚点和读段位置。顺着这条线处理,峰图会越来越清楚,最后留下来的杂峰,才更值得你认真判成真正的生物学信号。
展开阅读全文
︾