Sekvenační technologie Illumina na trhu stále dominuje. Poskytuje celou řadu výhod ve srovnání s ostatními technologiemi, zejména vysoký sekvenační výstup („hodně dat“) a přesné čtení („vysoká kvalita“), ale to bohužel neznamená, že je zcela bez nedostatků. Jednou z jejích hlavních nevýhod je především snížená efektivita sekvenování templátů nesoucích jednotný sekvenční motiv a následné riziko znehodnocení celého sekvenačního běhu nesprávným provedením sekvenace takovýchto templátů.
Problém se může vyskytnout například u následujících templátů a z nich vytvořených knihoven:
Dalším úskalím může být i nevhodný výběr kombinace indexů při návrhu multiplexu, jelikož index je čten de-facto jako samostatný read a co se týká sekvenční diverzity, platí pro něj stejná pravidla jako pro sekvenci insertu.
Pokud k této situaci dojde, co se vlastně stane a jaká se nabízejí řešení?
Při výskytu uniformního sekvenčního motivu nastane na čipu v sekvenátoru situace, kdy příliš velké množství klastrů vysílá obdobný signál. To zaprvé komplikuje definici klastrů (tzv. cluster calling) v začátku sekvenace, jak je znázorněno na obrázku (upraveno dle Krueger F et al., 2011):
Navíc dochází k tomu, že se detektor sekvenátoru „přehlcuje“ tímto uniformním signálem, což ukazuje následující obrázek (upraveno dle materiálů Illumina):
Situace se ještě více zhoršuje při sekvenaci druhého readu při párovém čtení, kdy se průměr klastrů zvětší a jejich hranice se tím k sobě více přiblíží.
Řešení samozřejmě existuje, ale je na úkor jedné z hlavních předností technologie – je nutné nemít tak vysoká očekávání co se týká množství dat, která chceme získat. V praxi totiž musíme snížit koncentraci knihovny nanášené na čip, aby hustota klastrů na čipu byla menší a klastry byly od sebe dostatečně vzdáleny. Dále je nutné tyto uniformní sekvence „naředit“ knihovnou fragmentů, které mají po celé své délce sekvenci maximálně rozmanitou (sekvence této knihovny se následně ze získaných dat zcela odstraní). Tyto dvě možnosti jsou univezálně platné.
Specifická možnost, jak této situaci vůbec předejít, se nabízí u amplikonů (s inline barkodem či specifickým přesahem), kde můžeme navrhnout primery obsahující tzv. „heterogeneity spacer“, viz obrázek - na 5' konce specifických primerů pro oblast V3-V4 genu 16S rRNA jsou přidány tyto spacery (upraveno dle Douglas et al. 2014):
Všechna tato opatření se používají v míře, která je závislá na uniformitě sekvenované knihovny. Jejich kombinace může v extrémním případě vést až k 50% snížení sekvenačního výstupu, avšak při jejich zanedbání hrozí znehodnocení celého sekvenačního běhu. Obzvláště důležité je to při párovém čtení, kdy se při sekvenaci druhého readu průměr klastrů zvětší a jejich hranice se tím k sobě více přiblíží. Kvalita prvního readu může být stále uspokojivá, ale kvalita druhého readu může být naopak velmi poznamenána, jak ukazuje obrázek níže.
V souhrnu lze říci, že jakkoliv templáty tohoto typu představují pro technologii Illumina výzvu, je to výzva řešitelná, a to (většinou) na úrovni sekvenační laboratoře. Zdůrazňujeme však, že v těchto situacích nemůžete očekávat, že budou splněny technické specifikace výrobce stran množství dat, která získáte, poněvadž ty jsou pochopitelně definovány na základě knihoven s vysokou sekvenční diverzitou.
Reference:
Douglas WF, Bing M, Gajer P, et al.; An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform; Microbiome 2014; 2:6
Krueger F, Andrews SR, Osborne CS; Large scale loss of data in low-diversity illumina sequencing libraries can be recovered by deferred cluster calling; PLoS One 2011; 6(1):e16607