Znie to určite divne, možno až smiešne, ale to je každodenná realita vedcov pracujúcich s metagenomickými sekvenciami. Metagenóm je vlastne zmes genómov mikróbov, ktoré žijú spolu v nejakom prostredí. Podľa sekvencií DNA vieme, že sme objavili “niečo” nové, ale nemôžeme to “niečo” ukázať pod mikroskopom – a zvolať: “Aha, pozrite sa sem, objavil som nového mikróba!” Sekvenovanie DNA z environmentálnych vzoriek totižto funguje tak, že vyextrahujeme DNA zo všetkých organizmov, ktoré sa vo vzorke nachádzajú, ale pritom by sme pod mikroskopom spoznali asi len polovicu z nich. Druhá polovica je takzvaná “microbial dark matter”, čo sú mikróby, o ktorých vieme, že existujú, lebo sa objavujú často v týchto metagenomických sekvenciách, ale v laboratóriu nevieme napodobniť ich životné podmienky, takže nikdy nezískame ich čistú kultúru a nebudeme vedieť skúmať ich schopnosti na kultivačných miskách. O ich schopnostiach a o ich funkcii v celom ekosystéme sa ale môžeme dozvedieť z ich DNA sekvencií.
Úplne neprebádaná je oblasť vírusov. Keď z environmentálnej vzorky získame DNA sekvencie, porovnávame ich s databázou bakteriálnych druhov, ktoré už boli predtým osekvenované, a tak vieme približne určiť, ktorému druhu asi tak patria. V prípade baktérii sa to ešte ako-tak dá, ale v prípade vírusov sa to dá iba veľmi ťažko. Databáza vírusov je plná vírusov chrípky, žltačky, HIV a podobne, ale vírusy, ktoré sa nachádzajú v environmentálnych vzorkách tam dosť chýbajú. Existuje veľa vírusov, ktoré napádajú také baktérie, ktoré vlastne ani nevieme kultivovať, takže už vonkoncom nevieme kultivovať ani tie vírusy. Ďalší problém je, že niekedy sa tieto vírusy nachádzajú začlenené do genómu baktérií, a tak z útržkov DNA, ktoré dostávame zo sekvenátora, ani nevieme určiť, či daný kúsok patril oddelenému samostatnému vírusu alebo už tvoril časť genómu baktérie, ktorú napadol. O tom som písala v minulom blogu.
V praxi to vyzerá tak, že vezmeme vzorku výkalu a rozpustíme ju vo fyziologickom roztoku. Najprv z výkalu centrifugáciou odstredíme baktérie, potom fekálnu suspenziu ešte pre istotu prefiltrujeme cez filter s mikroskopickými otvormi, cez ktoré neprejdú žiadne baktérie a ostane nám fyziologický roztok hnedej farby, v ktorom plávajú vírusy. Tie, samozrejme, ešte nevidíme, ale objavia sa, keď do roztoku pridáme nejakú chemickú látku, ktorá sa naviaže na tieto neviditeľné vírusy, ktoré by sa pri normálnej centrifugácii bez tejto látky nepodarilo zakoncentrovať. Tak sa nám na spodku centrifugačnej tuby ukáže maličká usadenina. A to sú vírusy. Na obrázku môžete vidieť, ako takéto vírusy vyzerajú.

Mnohí vedci sa snažia vyizolovať z environmentálnych vzoriek tieto vírusy a hneď ich všetky strčia do sekvenátora, ale problém je ten, že sekvenátor dokáže čítať DNA iba pokrájanú na kúsky a má obmedzenú kapacitu, takže prečíta iba niekoľko tisíc náhodne vybraných kúskov DNA, pričom vírusov tam môžu byť miliardy. Za úspech by bolo považované pospájať z týchto útržkov DNA celý genóm nejakého vírusu. Ale keďže je tých vírusov vo vzorke veľmi veľa a sú veľmi rôznorodé a z každého z nich máme iba jeden náhodný kúsok, museli by sme sekvenovať veľmi veľa. A to stojí veľa peňazí a analýza trvá veľmi dlho.
Okrem toho má takéto sekvenovanie ešte jeden veľký háčik, a to je kontaminácia. Aj keď vzorku prefiltrujeme, môže nám tam náhodou vpadnúť jedna baktéria, ktorá má vo svojej bunke aj 1000 x viac DNA než vírus, takže veľká časť sekvencii, ktoré získame, budú patriť tejto baktérii. Pri práci so vzorkami z ľudského tela sa tiež môže stať, že nám tam vpadne aj nejaká ľudská mitochondria, ktorá sa cez filter môže tiež ľahko dostať. A výsledok sekvenácie bude ľudská kontaminácia.
Ja som sa k problému postavila takto: načo dávať do sekvenátora toľko vírusov, keď ich potom ani nevieme poskladať? Lepšie by bolo dať do neho len toľko vírusov, koľko sa práve zmestí na jednu sekvenačnú doštičku.
Na počítanie baktérii som už bola expertka, prietokovým cytometrom sa to dá urobiť veľmi ľahko. Do vírusov som sa pustila až v roku 2014, v tej dobe bolo naozaj len pár ľudí na svete, ktorí vedeli analyzovať na cytometre vírusy. Problém je ten, že vírusy sú také malé, že cytometer si o nich myslí, že sú len taký elektrický šum, proste že sú chybou prístroja. Na to, aby sa dali vírusy na cytometri zobraziť, ich musíme nafarbiť fluorescenčným farbivom, ktoré sa naviaže na ich DNA. Potom už budú svietiť napríklad na zeleno, a to ich už cytometer dokáže zobraziť a aj vytriediť do osobitnej skúmavky.
Rozhodla som sa vytriediť len tie najmenšie vírusy, lebo aj keď by teoreticky prefiltrované vírusy nemali obsahovať žiadne baktérie, bála som sa, že by tam predsalen nejaké mohli byť a mohli by mi kontaminovať celú sekvenáciu. A keď už mám k dispozícii ten cytometer, tak prečo by som ho nevyužila na vytriedenie len tých najmenších… Tak sa aspoň uistím, že tam nebudú žiadne baktérie ani mitochondrie…
No a po ôsmych hodinách separovania zhruba 5 ml fekálneho filtrátu som získala len 314 vírusov. Strašne cenná vzorka. Vyextrahovala som DNA a dala ju do sekvenátora. Mala som len jeden pokus na sekvenovanie, lebo táto vzorka obsahovala presne minimálny počet molekúl, ktoré potrebuje sekvenátor na správne fungovanie. No a získala som asi 60,000 sekvencií. V tej dobe to bolo dosť (teraz sú už sekvenátory výkonnejšie). Jasala som, keď sa tieto útržkové sekvencie spojili jedným veľmi prísnym programom na spájanie sekvencií do dosť dlhých úsekov (volajú sa kontigy). To by sa so 60,000 sekvenciami pochádzajúcimi z originálneho fekálneho filtrátu nikdy nepodarilo, lebo by to bol mix kúskov DNA z príliš veľkého počtu druhov.
Špeciálna databáza, ktorá obsahuje sekvencie proteínov, určila, že sú to naozaj časti vírusov. Neboli tam žiadne mitochondrie ani baktérie. Pri tejto práci som našla jednu ďalšiu databázu vírusov, ktorú zhodou okolností vytvoril tím zo Slovenskej akadémie vied (L. Klucar, M. Stano a M. Hajduk). Publikovali to v Nucleid Acid Research (veľmi dobrý časopis). Tá ich databáza mi tiež pomohla potvrdiť, že tam mám nejaké vírusy. Ale nepodarilo sa mi presne taxonomicky určiť najpríbuznejší vírus. Takže záver je taký, že neviem, aké vírusy tam mám, ale nejaké tam sú.
Túto záhadu by som mohla rozlúštiť tak, že by som osekvenovala viac DNA z tejto vzorky a spojila tieto dlhé kontigy do jedného konečného genómu (alebo viacerých genómov). Alebo by som navrhla nejaké primery, aby sa dalo pomocou PCR dokončiť sekvenciu DNA genómu celého nového vírusu. Bohužiaľ som ale celú DNA spotrebovala na sekvenovanie, takže už žiadne pokusy robiť nemôžem a musím sa uspokojiť s týmto výsledkom.
Takže aj keď technika bola možno prevratná, výsledok skončil nakoniec iba vo Frontiers in Microbiology. Ja som rada, že som teraz na post-doku v Austrálii a že môžem fekálne vírusy skúmať podrobnejšie. A musím si pohnúť, lebo vírusy nenechávajú spať mnohých vedcov. Práve pred pár týždňami vyšiel v Nature článok, v ktorom vedci z objavili tisíce nových vírusov, a to len tak, že sa hrabali v sekvenciách, ktoré by predtým vyhodili do koša, lebo nemali žiadnu zhodu s doposiaľ známymi organizmami v databázach.