Szerző: Bojcsuk Dóra
Az enhanszerek a génektől távol elhelyezkedő DNS szakaszok, mely szakaszokon belül enhanszer elemek találhatóak. Az enhanszer elemeket kötő fehérjék transzkripciós faktorokként működnek, melyek kötődésük révén – nevükből adódóan is – a transzkripciós szabályozásban vesznek részt. Egy tipikus-enhanszer régióhoz képest a szuper-enhanszer első sorban abban különbözik, hogy egy viszonylag nagy DNS szakaszon belül sok, akár több tíz enhanszer elemét is magába foglalhatja és az egyedi, kifejezetten aktív enhanszer kötések közötti távolság nem haladja meg a 12.5 kb-nyi távolságot (1. ábra).
1. ábra. Az Oct4 és Sox2 fehérjék egy (tipikus-)enhanszer és egy szuper-enhanszer régiója genom böngészőben megjelenítve. Megjelenített adat: ChIP-seq. (Whyte et al. Cell, 2013)
Jellemző a szuper-enhanszerekre a Mediátor komplex egy kiemelt tagjának, a MED1 fehérjének a jelenléte, a nyitott kromatin régióra jellemző H3K27ac és DNáz I hiperszenzitivitás, továbbá az aktív, korábban aktív, vagy aktiválható régiót jelölő H3K4me1 markáns jelintenzitása is (2. ábra).
2. ábra. Az aktív kromatin- és enhanszer markerek (Med1, H3K27ac, H3K4me1 és DNaseI) kötéserősségben becsült különbsége a tipikus- és a szuper-enhanszereken. (Whyte et al. Cell, 2013)
Úgy tartják, hogy a szuper-enhanszerek a sejtek identitásáért felelős géneket szabályozzák, tehát egy tumoros sejtben többnyire onkogének közelében lelhetőek fel. Meg kell azért jegyeznem, bármilyen enhanszerről is beszélünk, csupán a pozíciójuk alapján nem tudhatjuk, pontosan mely gént vagy géneket szabályozzák, hiszen a genom térbeli szerkezete DNS-hurkok kialakulása révén lehetővé teszi két, vagy akár több távoli DNS szakasz térben egymás mellé kerülését (3. ábra). A fentebb említett Mediátor komplexnek is hasonló szerepe van: képes a promóter és az enhanszer régiók között távoli interakció révén kapcsolatot teremteni. De bármennyire is tűnik mindez bonyolultnak, az utóbbi években rengeteg, a kromatin interakció megismerésére alkalmas módszert dolgoztak ki (3C-seq, Hi-C, Capture-C, stb.). Egy tipikus-enhanszerhez képest a gének kifejeződésében sokkal markánsabb hatást képesek elérni (már csupán az additív hatásukat figyelembe véve is), tehát a szuper-enhanszerek feltérképezése és az általuk szabályozott gének azonosítása semmiképp sem hátrány (3. ábra).
3. ábra. Egy tipikus-és egy szuper-enhanszer hatása az általuk szabályozott gének kifejeződésének tekintetében. (Evan et al., Clin Cancer Res, 2017)
Hogyan azonosíthatóak a szuper-enhanszerek?
Az előző bejegyzésben már volt szó a ChIP-seq módszerről, amely egy viszonylag könnyen kivitelezhető, mára már jól optimalizált módja az enhanszer régiók genom-szintű feltérképezésének. Általánosan elfogadott, hogy H3K27ac jel alapján határozzák meg a vizsgált sejt szuper-enhanszereit, de akadnak tanulmányok, amelyekben egy, a sejt számára meghatározó szereppel bíró fehérje kötése révén definiálták őket. Utóbbi szerint jártunk el mi is, amikor kifejezetten az ösztrogén receptor alfa (ERα)-vezérelt szuper-enhanszerekre voltunk kíváncsiak. Ahhoz tehát, hogy szuper-enhanszereket tudjunk azonosítani, vagy H3K27ac, vagy egy fontos fehérje ChIP-seq adataira van szükségünk. Szóba jöhet még az ATAC-seq (Assay for Transposase Accessible Chromatin with high-throughput sequencing) módszer által nyert adat is, mely egy sejt összes nyitott kromatin régióját képes a behasító transzpozáz enzim segítségével feltérképezni. Ebben az esetben annyi hátrányunk lehet, hogy ha csupán az ATAC-seq adatok állnak rendelkezésünkre, nem tudjuk elkülöníteni egy nyitottnak vélt régióról, hogy aktivátor vagy represszor fehérje köti-e. Mindezt a bizonytalanságot egy hiszton ChIP-seq, vagy egy, az aktív enhanszerekre jellemző bármilyen fehérje (pl. p300) ChIP-seq adataival összevetve elsimíthatjuk.
Volt szó az előző bejegyzésben a HOMER programcsomag pipeline-ba integrált eszközeiről is. A szuper-enhanszerek predikcióját a pipeline bár nem tartalmazza, de egy egyszerű parancssorral elvégezhető és ehhez csupán egy jól megválasztott ChIP-seq adat HOMER tag directory-jára van szükségünk. A tag directory-k (tag könyvtárak) a BAM fájlhoz hasonlóan sort-olva, azaz genomi pozíció szerint rendezve, lefedettségértékeket tartalmaznak, melyeket kromoszómánként egy-egy *.tags.tsv fájl tárol az alapanalízis során. A szuper-enhanszer régiók meghatározásához a következő parancsot kell begépelnünk:
findPeaks <tag directory> -i <input tag directory> -style super -o auto
A findPeaks maga a parancs, a tag directory-t, pontosabban a *.tags.tsv fájlokat tartalmazó mappa nevét a teljes elérési úttal a vizsgálni kívánt mintára vonatkozóan kell megadni. A -i kapcsolót követően egy inputként szolgáló minta tag könyvtárára hivatkozhatunk, de ettől, ha ilyen nem áll rendelkezésünkre, eltekinthetünk. A -style super kapcsolóval jelezzük a findPeaks parancsnak, hogy szuper-enhanszer régiókat keressek, a -o kapcsolót követően pedig csupán egy kimeneti könyvtárat kell megadnunk.
Még több infó (angol nyelven) a szuper-enhanszerek HOMER programcsomag segítségével történő meghatározásáról itt.
Egyéb, sokak által használt, a szuper-enhanszerek prediktálására szintén alkalmas program még a ROSE (Rank Ordering of Super-Enhancers), illetve létezik egy dbSUPER nevű adatbázis is, ahol megtalálhatjuk számos primer sejt vagy sejtvonal szuper-enhanszer régióinak gyűjteményét és azok egyéb jellemzőit.
Az Emberi Erőforrások Minisztériuma ÚNKP-17-3-IV-DE-140 kódszámú Új Nemzeti Kiválóság Programjának támogatásával készült.