Labtutorials.org

Archive for the ‘DNA’ Category

Kompozit elemek

In DNA, molecular biology on August 31, 2021 at 8:00 am

Szerző: Dr. Nagy Gergely

Bevezetés

A transzkripciós faktorok (TF-ok) olyan fehérjék, amelyek képesek a DNS-hez szekvencia-specifikusan kötődni. Ez azt jelenti, hogy bizonyos oldalláncaik alkalmasak arra, hogy ideiglenesen nagyszámú másodlagos kémiai kötést alakítsanak ki bizonyos egymást követő bázispárokkal a DNS nagy és/vagy kis árkában, valamint a cukor-foszfát vázzal, döntően annak is a negatívan töltött foszfát részével. Az egymást követő bázispárok sorrendje (szekvenciája) így meghatározza, hogy melyek azok a DNS szakaszok, ahol egy TF több időt tölthet el (több, erősebb kölcsönhatást alakíthat ki), mint a genetikai anyag összességének (a genom) egyéb részein. A DNS ezen specifikus szakaszai (kötőhelyei) koevolúciót mutatnak a TF-ok DNS-kötő doménjeivel (DBD-ivel), és évmilliók alatt ez az együttműködés lett az alapja a gének bármilyen körülmények közötti megfelelő szabályozásának. A kötőhelyek egy része csoportokba rendeződik, így növelve nemcsak a DNS-fehérje, hanem a fehérje-fehérje kölcsönhatások számát is. Azonban nemcsak a TF-ok képesek a DNS felszínén együttműködni; kölcsönhatásaik és ebből fakadó szerkezetváltozásaik lehetővé teszik a további magi szabályozó fehérjékkel és egyéb, pl. RNS molekulákkal való együttműködést, amely végső soron képes hatékonyan (gyakran és eredményesen) elindítani a transzkripciós gépezetet. Ez leggyakrabban a promótereken történik meg, de vannak egyéb (az aktív promóterektől – csak lineárisan! – távoli) génszabályozó kötőhelyek is, amelyek nemcsak hozzájárulnak a génkifejeződés szabályozásához, de maguk is mutatnak transzkripciót, akár úgy is, ha csak egyetlen TF köti őket közvetlenül. Ezt a DNS háromdimenziós „gombolyag” természetével magyarázhatjuk, melyben a DNS-kötő és DNS-t nem kötő fehérjék csoportosulásai elősegítik bizonyos DNS hurkok stabilizálását, mely által a promóterek közel kerülhetnek a „távoli” szabályozó régiókhoz, ahol a transzkripciós gépezet ugyancsak mutathat aktivitást.

Kompozit elemek

A TF-ok többsége dimerként működik, tehát két TF komplexe foglal el egy dimer kötőhelyet. Ha két azonos TF alkot komplexet, homodimerről beszélhetünk, gyakoribb azonban, hogy két közel rokon TF alkot heterodimert, valamint előfordul az is, hogy egy heterodimer tagjai nem mutatnak semmilyen hasonlóságot. Az előbbi esetekben, ha azonos vagy közel rokon fehérjék alkotnak dimert, a dimer kötőhely is két hasonló – ritkábban azonos –, ún. félhelyből áll. A „félhely” kifejezés arra utal, hogy a monomer kötőhely önmagában nem feltétlenül működőképes, tehát mindkét félhely szükséges ahhoz, hogy a dimer hatékonyan kösse a DNS-t. Ha az asszociálódó TF-ok nincsenek rokonságban, tehát kötőhelyük eltérő, de együttműködésük konzervált, ún. összetett, másnéven kompozit elemeket is köthetnek. Ezek nem feltétlenül állnak kizárólag monomer kötőhelyekből, lehetnek egy dimer és egy monomer kötőhely vagy akár két dimer kötőhely összetételei is.

Az utóbbi években nagyszámú kompozit elemet fedeztek fel, bár ezek jelentősége és gyakorisága a genomban még kérdéses. Jolma és munkatársai sokezer „DBD pár” DNS-kötését vizsgálva többszáz lehetséges kompozit elemet találtak (Jolma et al. Nature. 2015). Egyik részletesebben vizsgált fehérjéjük a MEIS1 (myeloid ecotropic viral integration site 1) amellett, hogy homodimerként is képes volt közvetlenül DNS-t kötni, számos homeodomén fehérjével közösen is rendelkezett különböző kompozit elemekkel. Érdekes módon mind a DBD homodimer, mind pedig a vizsgált DBD heterodimer laza partnerséget mutatott, bár a teljes fehérjeszerkezetek ismeretének hiányában nem lehet megismerni a fehérjék viszonyát. Mindenesetre ez az adat azt sugallja, hogy a MEIS1 és lehetséges partnerei önállóan is képesek a DNS-kötésre, ehhez nincs feltétlenül szükség a dimer kialakulására. Más fehérjék esetében viszont feltételezhető a szorosabb kapcsolat a dimer tagjai között – elég, ha csak a leucin cipzár (bZIP, basic leucine zipper) szerkezetre és ennek viszonylag rövid célszekvenciáira gondolunk.

Jól ismert példa a kompozit elemekre az őssejtekre jellemző, ill. azokat meghatározó OCT4 (octamer-binding transcription factor 4; homeodomén) és SOX2 (sex determining region Y-box 2; high mobility group, HMG) fehérjék közös eleme, de a kis MAF-ok (musculoaponeurotic fibrosarcoma) CNC (Cap’n’collar) fehérjékkel alkotott heterodimereinek a kötőhelyeit is tekinthetjük kompozit elemeknek, mert félhelyeik eltérnek, még ha mindkét család a bZIP fehérjékhez tartozik is. Van a bZIP szupercsaládban egy másik példa is: a C/EBP (CCAAT/enhancer-binding protein) és ATF4 (activating transcription factor 4) fehérjék egy szokatlan elemet (CARE) kötnek, amelyben az ATF-ek jellemző félhelyétől eltérő (TGAC helyett TGAT) szekvencia található. Úgy tűnik, ez az eltérés jellemző a heterodimerre, de az ATF4 egyéb dimerei döntően az általános félhelyet kötik.

Az ETS szupercsalád és az immunsejtek kompozit elemei

Az ETS (erythroblast transformation-specific) szupercsalád legalább két tagjáról ismert, hogy heterodimert alkotnak más típusú TF-okkal. Az ELK1 (ETS-like 1) és GCM1 (glial cells missing transcription factor 1) fehérjék heterodimerei többféle kompozit elemet is képesek kötni, és érdekes módon mindegyik szuboptimálisnak tűnik a monomer kötőhelyek magját környező bázispárok tekintetében (Jolma et al. Nature. 2015). Ez azt jelenti, hogy ezek a kompozit elemek kisebb affinitással köthetőek a monomerek által, ill. elősegítik a specifikus heterodimerek általi DNS kötést.

A másik, régóta ismert heterodimert képző ETS fehérje a PU.1 (purine-rich nucleic acid binding protein 1), amely fehérvérsejtekben – pl. makrofágokban, dendritikus sejtekben és limfocitákban is – az IRF4-gyel vagy IRF8-cal (interferon regulatory factor 4/8) képez heterodimert. Ezek a dimerek több tízezer kötőhelyet foglalnak el a genomban, mely által kijelölik a sejtekre jellemző szabályozási keret jelentős részét, ezért mester TF-nak is nevezik őket. A korábbi eredmények alapján ez a két fehérje kétféle dimert is alkothat egymással, és ennek függvényében kétféle kompozit elemük létezik. Az ETS:IRF kompozit elemben (EICE) két bázispár választja el a monomer kötőhelyek magjait, míg az ún. ETS:IRF válaszadó elemben (EIRE) három – bár ez utóbbi egyáltalán nem szokott feldúsulást mutatni a motívumkeresések során, tehát nem lehet túl gyakori. Leírtak IRF:ETS kompozit szekvenciákat (IECS) is – ez a kötőhely tartozik a másik lehetséges konformációhoz, és szokott is feldúsulást mutatni –, de nehéz eldönteni, hogy az IRF valóban közvetlenül köti-e az adeninben gazdag régiót, vagy ez csak a PU.1 számára szükséges szekvenciakiterjesztés.

Az IRF4 és 8 nemcsak a PU.1-gyel, hanem AP-1 jellegű fehérjékkel is képes szorosan együttműködni immunsejtekben. Glasmacher és kollégái AP-1:IRF kompozit elemnek (AICE) nevezték el azokat a szekvenciákat, melyeket a JUNB/BATF (ju-nana [=17] b / basic leucine zipper ATF-like transcription factor) és IRF4 vagy 8 fehérjék együttesen elfoglalnak (Glasmacher et al. Science. 2012). Az interferon-béta promóter-közeli enhanszere pedig ennél még inkább összetett: összesen 8 fehérje – 2 bZIP, 4 IRF és 2 NFKB (nuclear factor kappa-light-chain-enhancer of activated B cells) – képes egyidejűleg kötni, mintegy gyöngysorként, amelyet enhanszeoszómának neveztek el (Panne et al. Cell. 2007). E komplex szerkezete (beleértve a DNS-t kötő TF-okon felüli egyéb szabályozó molekulákat is) egyedi, de minden bizonnyal nagyon sok hasonló komplex működik még sejtjeinkben, melyek felfedezése talán már nem várat sokat magára.

Fontosabb rövidítések: TF – transzkripciós faktor, DBD – DNS-kötő domén, bZIP – leucin cipzár (domén és szupercsalád)

Az Emberi Erőforrások Minisztériuma ÚNKP-20-5-DE-276 kódszámú
Új Nemzeti Kiválóság Programjának támogatásával készült.

A szekvencia motívumok szerepe a transzkripció szabályozásában

In bioinfo, bioinformatics, bioinformatika, DNA, molecular biology on June 8, 2019 at 8:18 pm

A magreceptorok motívumai

Szerző: Dr. Nagy Gergely

A magreceptorok csoportosítása

A magreceptorok beszédes névvel rendelkeznek, amely kifejezi, hogy tipikusan olyan fehérjékről van szó, amelyek jelmolekulákat ismernek fel és a sejtmagban fejtik ki hatásaikat. E fehérjék többsége sok más receptorhoz hasonlóan dimer formájában működik, viszont más receptorokkal ellentétben a magreceptorok nem membránkötöttek, hanem oldott formában a citoszólban, illetve a sejtmagban találhatóak. Ligandjaik a membránokon áthatolni képes lipid molekulák, beleértve a zsíroldékony hormonokat, vitamin-, szteroid- és zsírsavszármazékokat. A magreceptorok neve arra is utal, hogy nemcsak fehérje-fehérje kölcsönhatásokon keresztül képesek jelet továbbítani, hanem a sejtmagban, közvetlenül a DNS-hez kapcsolódva, mint transzkripciós faktorok szabályozzák a géneket. Azáltal, hogy ilyen rövid úton eljut a jel a célgénekhez, lényegesen lecsökken a sejtek adott körülményre adott válaszideje, nem úgy, mint a membránreceptoroktól induló, soklépéses jelátviteli útvonalak esetében.

A magreceptor szupercsalád emlősökben előforduló 19 családját 4 osztályba sorolják: a szteroid hormon receptorokra (I. osztály, 2 család), a retinoid X receptorral (RXR-rel) heterodimert alkotó ligandkötő receptorokra (II. osztály, 5 család), a dimerizáló árva receptorokra (III. osztály, 6 család) és a monomer árva receptorokra (IV. osztály, 6 család) (Mangelsdorf et al., Cell, 1995; Nuclear Receptor Nomenclature Committee, Cell, 1999; Evans and Mangeldorf, Cell, 2014). Az I. osztály tagjai homodimert alkotnak, és kizárólag szteroid hormonokat ismernek fel. A II. osztály tagjai a ligandok széles spektrumát képesek felismerni, mint például a tiroid hormont, az A- és D-vitamin, a zsírsavak, valamint a koleszterol származékait (Dawson and Xia, Biochim Biophys Acta., 2012). Az árva receptorok onnan kapták a nevüket, hogy eleinte nem sikerült a ligandjaikat azonosítani, később mégis kiderült, hogy a III. osztály fele képes valamilyen lipid természetű molekulát kötni. A valódi árva receptorok nem rendelkeznek működőképes ligandkötő doménnel, hanem mint más transzkripciós faktorok, fehérje-fehérje kölcsönhatások által vagy például foszforilációval szabályozódnak.

Magreceptor motívumok

A magreceptorok általában az AGGTCA motívumokat ismerik fel. Dimerek esetében ez a szekvencia kétszer szerepel egymás mellett, ezért magreceptor félhelynek is nevezik. Helytálló ez az elnevezés azért is, mert egy hatbázisos motívum, főleg, ha beleszámoljuk a lehetséges szekvencia variációkat, túl gyakran található meg a genomban (<46 vagy <45 = ~1000 bázisonként) és túl könnyen alakulhat ki véletlenszerű mutációk során ahhoz, hogy rendelkezzen a szükséges szelekciós erővel a génkifejeződés megfelelő szabályozásához. Hogy a magreceptor dimerek megtalálhassák az adott körülmények között szükséges szabályozó elemeiket, elsősorban a félhelyek egymáshoz viszonyított iránya és távolsága a felelős. Az I. osztály receptorai esetében például a félhellyel a tükörképe (például TGACCT) áll szemben, három bázissal elválasztva. Ezt a palindrom szekvenciát úgynevezett fordított ismétlődésnek vagy inverted repeat (IR)-nek nevezik, amit, mivel három, nagyjából véletlenszerű bázis van a közepén, IR3-ként emlegetnek. Ebben az osztályban az ösztrogén receptorok kivételesek az AGGTCA félhelyükkel, mivel az összes többi szteroid hormon receptor az AGAACA (illetve TGTTCT) szekvenciát preferálja.

A II-III. osztály dimerei ezzel szemben kivétel nélkül két, egymást azonos irányban követő magreceptor félhelyet, úgynevezett direct repeat (DR) elemet ismernek fel, ahol az elválasztó bázisok száma a leginkább meghatározó; és DR0-tól DR5-ig minden lehetőségre találunk specifikus dimereket (Umesono et al., Cell, 1991; Evans and Mangeldorf, Cell, 2014); de írtak már le működőképes DR8-at is. A DR0-t például GCNF homodimer, a DR1-et PPAR/RXR heterodimerek, valamint TR2/4 és HNF4 (homo)dimerek, a DR2-t RAR/RXR heterodimerek és REV-ERB (homo)dimerek, a DR3-at VDR/RXR heterodimerek, a DR4-et THR/RXR és LXR/RXR heterodimerek, a DR5-öt pedig RAR/RXR heterodimerek ismerik fel. Ezekben az osztályokban is vannak IR felismerő magreceptorok, illetve léteznek olyan dimerek is, amelyek, például a ligand minőségétől függően, különböző távolságra lévő félhelyeket kötnek. Az RAR/RXR heterodimerek az előbb említett DR5 és DR2 kötés mellett a DR1 elemeket is használhatják, a PXR/RXR heterodimerek esetében pedig leírták, hogy a pregnánszármazékok és másodlagos epesavak rugalmas kötése a konformációváltozás hatására különösen rugalmassá teszi a DR elemek felismerését is (Wu et al., Drug Discov Today, 2013; Frank et al., J Mol Biol., 2005).

Mivel a magreceptorok félhelye túlságosan gyakran fordul elő a genomban ahhoz, hogy specifikusan működhessen, a IV. osztály magreceptorai esetében a hat bázison felül általában további bázisok is hozzájárulnak az erős DNS-fehérje kölcsönhatáshoz. Ezek a bázisok minden érintett család esetén a félhelyek 5’ kiterjesztését jelentik. Az NR0B család kivételt képez ez alól, mert nem rendelkezik DNS-kötő doménnel (Ensembl). Az NR4A (NUR/NOR) fehérjék az AA-AGGTCA (Wilson, Milbrandt, Science, 1992), az NR3B (ESRR) és NR5A (SF-1, LRH1) családok tagjai a (T)CA-AGGTCA (Johnston, Mertz, Mol. Endocrinol., 1997; Lala, Parker, Mol. Endocrin., 1992; Laudet, Curr. Biol., 1995), az NR1F (ROR) fehérjék pedig az (A/T)AA(C/G)T-AGGTCA szekvenciákat ismerik fel (Giguere, Otulakowski, Genes Dev., 1994; IJpenberg, JBC, 1997). Ez utóbbi kiterjesztett félhely, az úgynevezett ROR válaszadó elem (RORE) azonban részét képezheti DR elemeknek is. Mind a PPAR/RXR, mind pedig a REV-ERB dimerek nagy affinitással kötik a kiterjesztett DR – DR1, illetve DR2 – elemeket, és ezeknek az elemeknek – a magreceptorok expressziós szintjének és az adott motívumokhoz való affinitásának függvényében – fontos szerepe van a sejtek napi ciklusának szabályozásában (Harding, Lazar, MCB, 1995; Duez, Stael, FEBS Letters, 2008; Zhang, Lazar, Science, 2015). Ez a kiterjesztés teheti specifikussá a DR1 elemek PPAR/RXR általi kötését a TR és HNF4 (homo)dimerekkel szemben, valamint a DR2 elemek REV-ERB általi kötését az RAR/RXR heterodimerekkel szemben.

Kiterjesztett magreceptor motívumok keresése

Az elmúlt három évtizedben lényegében négy olyan tényezőt azonosítottak, amely meghatározza a magreceptorok specifikus DNS kötését: a félhelyek szekvenciáját (AGGTCA vagy AGAACA), egymáshoz viszonyított irányát (IR vagy DR), egymástól való távolságát és 5’ kiterjesztését. Az alapszabályokkal ugyan tisztában vagyunk, de nem ismerjük minden magreceptor pontos szekvenciaigényeit. Ehhez az NGS módszerek, például a ChIP-seq vagy akár ATAC-seq és ezek elemző módszerei nagy segítséget nyújtanak (Heinz, Mol. Cell, 2010), mégsem mindig szembetűnő a különbség a különböző magreceptorok motívumai között. Egyszerre többféle DR vagy IR elem kiterjedt használata esetén, például az RXR cisztróm vizsgálatakor, megtörténhet a különböző motívumok teljes összekeveredése, összeolvadása („kiátlagolódása”), tehát akár egyetlen félhelyre redukálódása is (Dániel and Nagy, Genes. Dev, 2014). Mivel kisebb a kiterjesztett motívumok száma, mint azoké, amelyek nem rendelkeznek valamilyen 5’ kiterjesztéssel, a de novo motívumkeresések eredményeiben ezek általában nem hangsúlyosak vagy teljesen hiányoznak. Léteznek „trükkök” a motívumok szétválasztására a de novo motívumkeresés eszköztárában, ám ezek is szenvednek a módszernek attól az általános korlátjától, hogy csupán a bázisok gyakoriságát veszik figyelembe, ezekhez nem rendelik hozzá a fehérjekötés erősségét.

A de novo motívumokat kiegészítendő, kifejlesztettem egy motívum optimalizáló módszert, amely a motívumok bázisainak a fehérjekötéshez való hozzájárulását méri. Ennek segítségével lényegében egyetlen ChIP-seq minta alapján nagyon pontosan meghatározható volt a PPARg félhelyének a kiterjesztése. Ez a motívumkeresésen és -térképezésen alapuló módszer valójában bármely transzkripciós faktorra specifikus ChIP-seq adaton jól működhet, feltárva e fehérjéknek a gyakori motívumokon felüli szekvenciaigényeit. Bázisok kettőseit felhasználva több dimenzióban is tesztelhető a kettősök fehérjekötéshez való hozzájárulása, ezáltal akár különböző és átfedő motívumkiterjesztések, illetve távolabbi, úgynevezett szatellit elemek is azonosíthatóak. A PPARg mellett nagyszámú magreceptorra specifikus ChIP-seq adat érhető el nyilvánosan, például az NCBI SRA adatbázisában. Mivel elképzelhető, hogy a TR2/4 és HNF4 (homo)dimerek, valamint a THR/RXR és LXR/RXR heterodimerek DR1, illetve DR4 motívumaiban is található valamilyen eltérés, amely a specificitásukat adja, érdemes lehet e magreceptorok esetében is elvégezni a motívumok fehérjekötéssel kapcsolt optimalizálását; valamint feltételezhető, hogy az RAR, PNR és COUP-TF magreceptorok rugalmasabb DNS kötése mögött is van egy általános szabályszerűség. Kérdéses továbbá az is, hogy vajon minden, DNS-kötő doménnel rendelkező monomer árva receptor, beleértve az NR2E családot (TLX, PNR) is, vagy akár további dimerizáló receptorok is rendelkeznek-e kiterjesztett motívummal, illetve, hogy ezek a kiterjesztések mutatnak-e további specificitást.

Ha választ kapunk ezekre a kérdésekre, az közelebb visz a magreceptorok és motívumaik koevolúciós történéseinek a megismeréséhez is, amely egy sokkal teljesebb képet adhat a transzkripciós faktorok általi génszabályozásról és annak evolúciójáról.

Az Emberi Erőforrások Minisztériuma ÚNKP-18-4-DE-318 kódszámú
Új Nemzeti Kiválóság Programjának támogatásával készült.

DNS szekvencia motívumok azonosítása II.

In bioinfo, bioinformatics, bioinformatika, DNA, molecular biology on January 14, 2019 at 1:15 pm

Szerző: Bojcsuk Dóra

Ahogyan az előző bejegyzést is indítottam, a két leggyakrabban feltett kérdés, amikor motívumanalízisről beszélünk, a következő:

  1. Milyen szekvencia motívumok „dúsulnak fel” a transzkripciós faktor kötőhelyek egy előre definiált csoportjában?
  2. Jelen van-e egy adott transzkripciós faktor motívuma a transzkripciós faktor kötőhelyek egy előre definiált csoportjában?

Arról, hogy mik is azok a motívumok, mit jelent maga a motívumfeldúsulás és milyen program segítségével lehet ezeket a feldúsulásokat azonosítani, a DNS szekvencia motívumok azonosítása I. bejegyzésben olvashattok, a következő néhány bekezdésben pedig arról lesz szó, hogy egy vizsgálni kívánt motívumról hogyan tudjuk eldönteni, hogy jelen van-e az általunk vizsgált régiókon belül.

Feltételezzük, hogy van egy 2000 transzkripciós faktor kötőhely pozícióit tartalmazó fájlunk (bed/txt kiterjesztésű) és szeretnénk csak azokat a kötőhelyeket, illetve a kötőhelyeken belül is csak azt a néhány bázispárnyi régiót visszanyerni, ahol megtalálható például az AP-1 fehérje motívuma. Ez a következő parancs begépelésével lehetséges:

annotatePeaks.pl peaks.bed hg19 -mbed output.bed -m AP1.motif -noann -nogene

Mi mit jelöl?

Az annotatePeaks.pl maga a program, amely a HOMER egyik nagyon hasznos eszköze. A peaks.bed a vizsgálni kívánt genomi régiókat tartalmazó bed fájl. A hg19 fogja a genomot megadni – amit a HOMER automatikusan felismer –, de ez a paraméter lehet mm10 (vagy mm9) is, amennyiben nem humán, hanem egér mintákkal dolgozunk. Minden egyéb modell organizmus használatakor meg kell adni a teljes elérési utat a vizsgálni kívánt genom FASTA fájljához. Eddig szinte minden ugyanúgy történik, ahogy a de novo motívumfeldúsulások keresésénél. Az -mbed paraméter után nevesítenünk kell egy bed fájlt, amely tartalmazni fogja a motívumtalálatok pozícióit (a fenti példában ennek az output.bed felel meg), az -m kapcsoló után pedig meg kell, hogy adjuk annak a motívumnak a mátrixát, amelynek jelenlétét vizsgálni szeretnénk az általunk megadott genomi pozíciókban. Végezetül egy kicsit gyorsíthatunk a motívumok keresésén a -noann és -nogene paraméterek megadásával; ezek használatával a vizsgált genomi pozíciók génekhez, ill. azok TSS-eihez történő annotálását a parancs nem fogja elvégezni.

Ezen felül az annotatePeaks-nél is működik és hasznos lehet a -size paraméter, mellyel a vizsgálni kívánt genomi régiók középpontjához viszonyítva megadhatjuk, milyen széles régión történjen a motívumkeresés.

Honnan szedjünk *.motif fájlt és mit érdemes a mátrixban változtatni?

Az előző bejegyzésben bemutattam, hogyan néz ki egy motívum mátrix és hogyan kell a benne található információkat értelmezni. Ezeket a mátrixokat a HOMER könyvtárunk homerResults vagy knownResults mappáiban találhatjuk, de akár készíthetünk újat, vagy paraméterezhetünk egy már meglévő mátrixot mi magunk is. Ezen felül létezik a HOMER-nek egy több, mint 400 ismert motívumot tartalmazó adatbázisa, melyet ide kattintva érhettek el: HomerMotifDB. A mátrixban a motívum score az, amit módosítani érdemes, annak függvényében, hogy mennyire szeretnénk szigorítani vagy lazítani a keresésen – bővebben erről is az előző bejegyzésben olvashattok.

No, de hogyan értelmezzük az eredményt?

Az output.bed kimeneti fájlunk 6 oszlopot fog tartalmazni. Az 1-3. oszlopok már nem az eredeti genomi pozíciókat fogják megadni, hanem pontosan azt a néhány bp-nyi régiót, ahol a keresett motívum megtalálható volt. A 4. oszlop a használt mátrix azonosítóját tartalmazza, amely a további munkálatok során nem releváns, az 5. oszlopban található score viszont annál inkább. A legalacsonyabb score legalább akkora lesz, mint a visszatérképezett mátrixban szereplő score-nál; annak lazításával a találatok száma növelhető.

A 6. oszlopban „+” vagy „–” jelöli, hogy a DNS-en pozitív vagy negatív irányban sikerült a motívumot azonosítani. Olyan fehérjék esetében, mint az AP-1, amely a TGAnTCA szekvenciához képes kötni, vagy a magreceptor szupercsalád bizonyos tagjai (például az ösztrogén recepor dimerek), melyek az AGGTCAnnnTGACCT szekvenciát preferálják, ha a reverz komplementerét vesszük a konszenzus szekvenciáiknak, mind a pozitív (+), mind a negatív (–) szálon olvasva ugyanazt a bázissorrendet láthatjuk. Ennek eredményeként előfordulhat, hogy a kimeneti fájl a 6. oszlopban eltérő irányultságot mutatva, de lényegében kétszer is tartalmazza ugyanazt a motívumot. A duplikátumok kiküszöbölése érdekében a kimeneti fájlunkat érdemes parancssorban merge-elni:

cat output.bed | sortBed | mergebed > output_v2.bed

 

Motívum score minden vizsgálandó genomi régióra? Lehetséges!

Az annotatePeaks-nek van még egy nagyon hasznos paramétere, mégpedig az -mscore. Ennek használatával a HOMER megkeresi a megadott mátrix által definiált motívumhoz legjobban hasonító szekvenciát minden egyes régióban, és kalkulál rájuk egy-egy motívum score-t. Ez az információ további szűréseket követően nagyon hasznos lehet abban az esetben, ha azt szeretnénk megvizsgálni, hogy egy adott motívum „erőssége” eltér-e különböző genomi régiók csoportjai között. Példaként, az alábbi ábra a TEAD, TCF, SIX, ERE, Fox és AP2 fehérjék motívumainak erősségét demonstrálják a „piros”, „lila” és a „kék” csoportok kötőhelyei alatt (Bojcsuk et al. bioRxiv, 2018):

boxes

Mivel az „erősebb”, tökéletesebb, vagy mondhatni kanonikus motívumok fehérje iránti affinitása sokkal nagyobb, az eltérések egyúttal utalhatnak a fehérjék kötésének meglétére vagy hiányára is.

 

A következő parancsot szükséges begépelnünk, hogy megkapjuk a motívum score-okat minden egyes kötőhelyre:

annotatePeaks.pl input.bed hg19 -m AP1.motif -mscore -noann -nogene -size 100 > output.txt

A kimeneti fájlban a következő oszlopok fognak szerepelni: PeakID, Chr, Start, End, Strand, Peak Score, Focus Ratio/Region Size, CpG%, GC%, Best Motif log-odds Score, melyből az utolsó oszlop lesz a meghatározott motívum score érték. Fontos, hogy az -m kapcsoló után nem csupán egy, hanem számos motívum mátrixát feltüntethetjük; például: -m AP1.motif AP2.motif ERE.motif TEAD.motif; ebben az esetben a kimeneti fájl utolsó oszlopai a mátrixok megadásának sorrendjében fogják a score-okat tartalmazni.

Az utóbbi parancs esetében mondhatni minden régióra „ráerőszakolunk” egy score-t, ezért előfordul az is, hogy negatív előjelű score-ral tér vissza az eredmény – emiatt is szükséges a további szűrés. Ha érdekel, én milyen feltételek alapján szűrtem a fenti ábra elkészítéséhez, olvassátok el a kéziratot! 🙂

EEM (1)

Az Emberi Erőforrások Minisztériuma ÚNKP-18-3-III-DE-253 kódszámú Új Nemzeti Kiválóság Programjának támogatásával készült.

Transformation of competent cells

In DNA, GFP, molecular biology, plasmid, Resources, Restriction Enzyme, transformation on March 16, 2011 at 4:53 pm

Scientific Background

Transformation is the process of introducing foreign DNA (e.g plasmids, BAC) into a bacterium. Bacterial cells into which foreign DNA can be transformed are called competent. Some bacteria are naturally competent (e.g B. subtilis), whereas others such as E. coli are not naturally competent. Non-competent cells can be made competent and then transformed via one of two main approaches; chemical transformation and electroporation. It is important to note we have tested transformations of the distribution kit with this protocol. We have found that it is the best protocol. This protocol may be particularly useful if you are finding that your transformations are not working or yiedling few colonies.

In nature what happens is shown on the following two videos:

Overview

To see this in a nice lab demonstration tutorial about how transformation procedure is used, and why, watch this:

Materials

The demonstration of our iGEM protocol realized in summer 2009 is shown below:

Competent cells (we use DH5α)

DNA (this is a sample)

Ice

42°C water bath

37°C incubator

SOC (check for contamination!!)

Petri dishes with LB agar and appropriate antibiotic

Procedure

1. Start thawing the competent cells on crushed ice (we find this cells in the -70°C fridge)

2. Add 200μl competent cells and 2 or 5μl (50ng) DNA on ice

3. Incubate the cells for 30 minutes on ice

4. Heat shock at 42°C for 90 seconds water bath (not shaker)

5. Incubate for 5 minutes on ice

6. Add 200μl SOC broth (but sometimes not)

7. Shaker 2 hours at 37°C

8. (Sometimes centrifuge for 10 minutes at 10000 rpm and a few supernatant take int he dumb and suspendation the pellet)

9. Plate usually 60μl of the transformation or we make distribution 20μl and 200μl Petri dishes with agar and the appropriate antibiotic(s) with the part number, plasmid and antibiotic resistance

10. Incubate the plate at 37°C for 12-14 hours

Notes & troubleshooting

If you think another video demonstration would be needed, please go on to the next video:

More details about the procedure, with excellent links cand resource material can be found in the Molecular Biology Online Notebook.

References

1. Sambrook, J., E.F. Fritsch, and T. Maniatis. 1989. Molecular Cloning: A Laboratory Manual. 2nd ed.,1.25-1.28. Cold Spring Harbor Laboratory Press, Cold Spring harbor, NY, USA.

Sizes in Biology

In animation, cell, Cool stuff, DNA, molecular biology on June 30, 2010 at 6:09 pm

Dear colleagues,

An excellent tool is available to get a feeling about molecular sizes in Biology.

The tool is available here and was developped by “Learn Genetics” program from the University of Utah.

You can have a short movie on it below, but please check the original one from here!!!

Designing a gene or “Gene design”

In animation, DNA, Gene design, iGEM, Polymerase Chain Reaction, Resources, Restriction Enzyme on June 8, 2010 at 9:19 pm

On this tutorial you can see an easy way to design oligos for gene synthesis, or in other words Gene design.

The description is based on the Instructional Videos from the iGEM website!

Gene design in less than 10 minutes!

Good luck!!!

Some usefull tools:

1. Gene design web page
2. Tools at DNA20
3. Tools at DNA Works
4. A Revese-Complement Tool
5. Gene designer a comprehensive tool to artificial gene design from DNA20 described here.

QPCR oligo design

In DNA, PCR, Polymerase Chain Reaction on May 19, 2009 at 4:57 pm

Designing QPCR oligos might seem complicated but there are some rules and softwares that can make it easy. In our lab, majority of data points we generate are probably measured by QPCR, so I think  it is worth to review an algorithm for desiging QPCR assays.

So, today I will describe the way I design QPCR oligos. You can have a basic intro in PCR here.
More than a year ago I switched to the UPL system, the library of probes designed by Exiqon and now marketed by Roche. The concept is quite clear, the LNA modified oligonucleotides bind much stronger to the DNA template than the average oligonucleotides. By this we can decrease the lengths of them by keeping the Tm unchanged. The UPL library consists of 165 individual oligonucleotides that are in general nine basepair long and together cover the entire genome in respect of the coverage needed to design a QPCR oligo set for any gene. You can read more about the LNA nucleotides here and here. A good website where you can calculate the Tm of the LNA oligos here: http://lna-tm.com/. The UPL system is described here.

The system allows the design of an oligo set for any DNA sequence in the UPL Design Centre. You can access the Design Centre directly here.

UPL Assay Design Center

UPL Assay Design Center

Before we design an assay let us first look for the transcripts of a specific gene. It is very important to use annotated data, since in the annotated genomic data we have informations about possible SNP variations. This might be important, since the oligos and especially the probe should bind to an SNP free free region, because an SNP might disturb the binding of the probe to the template.

To make this data available we should use not the sequence but the transcript ID from the Ensembl.

Ensembl

Ensembl

At Ensembl select your species of interest, e.g. mouse and write the name of your gene of interest in the search box:

search box

If you write into the box a gene of interest (e.g. COUP-TF2) we will see the results as it is shown here:

couptf search

Here I have to click on the link of the gene and I will find the following screen: transcript infoThe most important info we are looking for is in the table on the top of the page:

transcripts

The two transcripts of the gene are:
ENSMUST00000089565
ENSMUST00000032768.

We will use these ID-s in the UPL Assay Design Centre. First select as organism the “Mouse”, and write into the box the two Ensembl transcript ID-s selected by commas. designIf you follow the steps the results will be like this:

resBelow this data you can see two links as it follows:common assaysTo design an assay that would measure all transcripts select: “common assays”.

The results will be given in a downloadable pdf report. Save this file and name is by the name of the gene you used as input.

The results in the pdf file look like this:

results

You can see that the amplicon is 95 bp long, there is no SNP in the binding regions of the primers and probes and the probe is closer to one of the primers. There is an SNP in the gene that was avoided by the program. You can have an SNP even in the amplicon, unless is not in the binding site of the primers or the probe.

Before I order the oligos, I usually test them with e-PCR on the UCSC Genome Browser.

UCSC Genome Browser

UCSC Genome Browser

Select the PCR view and paste the oligos into the given locations. Select the genome, the assembly and the target as “UCSC Genes”(If you used a genomic sequence for design use the target: “genome assembly”).

in silico PCRIf you have a hit, click on the link provided and the results will be represented in the genome as seen here:

browser results

The oligos are intron spanning and in the right location. Order the oligos in an HPLC pufied form in the lowest available scale for the first try. Be aware that according to the experience of several groups, and my own experience too,  only 2/3 of the UPL assays work without further optimization. This means, if you want to be sure from the first you better try two, three different assays for the same gene. The UPL Design Centre will generate several primer-probe sets and you can retrive these results too. Since the UPL library is given and one or two of the three ordered assays will work, it this worth trying three from the beginning!

In general the rules for a good QPCR assay:

1. The amplicon should be as short as possible (60-70 bp is ideal, but should be shorter than 100bp).

2. The Tm of the oligos should be around 60C, while the Tm of the probe 10C higher.

3. The distance between the the oligo and the probe should be as small as possible for a better exonuclease activity of the Taq polymerase.

4. The GC content of the two oligos should be as close as possible.

5. The number of GC bases in the last five nucleotides on the 3′ ends of the two primers should be identical (if possible).

6. Select for oligo sets with week internal bonds (less than four H bonds in the same conformation).

7. Avoid primer dimers that could produce artefacts due to the 3′ elongation of one of the primers.  The same for internal conformations.  Test it on the IDT webpage here. See below:conformations

8. Verify the oligos with e-PCR on the UCSC Genome Browser. The test should give one single hit!

9. If possible use annotated sequences to avoid the SNP effect.

10. If you are looking for genes (cDNA measurement) use exons that are common for all transcripts variants (or use the “batch assay-common assays” in the UPL Assay Design Centre)

Good luck!

PCR or the Polymerase Chain Reaction

In animation, DNA, molecular biology, PCR, plasmid, Polymerase, Polymerase Chain Reaction, Replication, Taq on April 12, 2009 at 6:25 pm

When I first heard about the Polymerase Chain Reaction my first association was with the atomic bomb chain reaction. You know probably from your studies: the labile Uranium if receives a neutron it transformed to a stable Uranium isotope while several new neutrons are released. If these newly release neutrons meet novel labile Uranium atoms the reaction is amplified, more and more neutrons will be released until the system if is lost from control explodes in the form of an atomic bomb. If the reaction is under control we can produce heat and through this electricity in an electric plant, if the critical mass of the labile isotope is ignited with a neutron beam, it will explode.

You can have two excellent representations of the chain reaction below:

The chain reaction

But this is a blog about techniques in the molecular biology lab, so we will not deal with the fission chain reaction but we will see how a similar type of amplified reaction is produced with the DNA by specific enzymes in a reaction tube. The enzymes that can do a chain reaction are the Polymerases.

What is the function of polymerases? We have them in each of our cells. They do the most basic reaction that keeps life going on from the start of the very first organism ever. They are duplicating in a semi-conservative way the DNA in order to allow the transmission of the genetic information during cell division.

You can have an animation about DNA replication below.

What is the Polymerase doing?

The two DNA strands are connected by hydrogen bonds and code for the same information by the A:T and C:G base pairing.  The two strands are anti-parallel if we look to the double strand from one direction one of the strands will be in 5′-3′ direction and the other vice-versa in 3′-5′ direction. As an important rule we have to know that in nature all polymerases are doing the DNA synthesis in the 5′-3′ direction. The strand that can be replicated according to this rule is the leading strand. The other one is called lagging strand. The problem is that both strands have to replicated in by the same protein complex! But how can one single Replication complex produce the leading strand and the lagging strand in the same time ? We arrived to the problem of the the Okazaki fragments.

In the animation below you can find a good representation about how a single Replication complex can do the synthesis of the two different strands.

In order to speak about PCR we have to go out to trip to check some Geysers.

So let us check first the big Steamboat Geyser.

Yellowstone Steamboat Geyser

If we go closer to one of the hot springs we might see that the water is “living”, there are some algae, micro-organisms in this water. Let’s have a look:

The Yellowstone Hot Springs

These micro-organisms are living in really hot water. But if they are living, they should replicate, and if they replicate, they should have DNA polymerases!

These micro-organisms were isolated and one of them, called Thermo aquaticus (sometimes named Thermophilus aquaticus) became really famous. It has a polymerase that is used in vast majority of the in vitro DNA replication processes and in PCR.

I am sure you all have an idea already about PCR. We put all reagents needed for a DNA replication in a tube and reproduce the normal DNA replication process. So what do we need? We need a DNA template an oligonucleotide as a primer, the building blocks of the DNA (dATP, dTTP, dCTP, dGTP or in general dNTP -deoxi nucleotide tri phosphate), Mg and the Polymerase. If possible from Thermo aquaticus, which is called Taq.

There is one trick! This one trick was invented by Kary Mullis and he received Noble Prize for this single idea. The trick is, that we will not reproduce completely the natural reaction. We do not want to bother with leading strand and lagging strand and with all kind of Okazaki fragments and helicases and ligases.

The idea of Kary Mllis was that if you separate the double strand and design two oligos that will bind the two different strands but will look towards each other, than the product will be doubled. If you separate the strands by heating the solution to 95C you can repeat the reaction, and now you will have 4 copies. In the next run 8 copies and so on in each reaction you will have 2 on the power of the “cycle number” copies in a chain reaction fashion!!!

Let us have a really simple and good introduction to the whole procedure in the next two animations:

Below you can find a more fancy animation of the same procedure:

For this idea Mullis got the Noble Prize. His work changed completely the history of molecular biology. Let us check an interview with him about how he discovered PCR:

What is the practical use of this whole method?

Amplifying DNA by PCR became one of the most widely used method in a molecular biology lab. You can use it for transferring DNA from one plasmid to a different one, to introduce mutations and even to measure the amount of a specific gene in a sample. By combining it with a Reverse Transcription reaction we can measure copy numbers of RNA molecules.

Below we can see an example of how it is used in criminal justice!

In the next video you can see the workflow of DNA sequencing with a New Generation sequencing machine. What is remarkable here is that the designers of the instrument are skipping the cloning of the DNA fragments into plasmids and amplification of the plasmids by bacteria. They use micro reactors in the form of an emulsion PCR. One oligo is on a bead and the DNA binds the oligo. Each bead is fused with a small droplet that contains all the other reagents for the PCR. By this trick you will have a clonal amplification of the DNA fragments. One bead will contain on  type of DNA and you skipped all bacterial work. The result is that you can sequence the whole human genome in a couple of weeks for less the 100k USD. Or you can sequence a bacteria in a day…

Emulsion PCR in the FLX sequencer workflow

At the end of this lesson, lets have some fun and see the celebration of the PCR!

Restriction Enzyme Resources

In DNA, plasmid, Resources, Restriction Enzyme, Uncategorized on April 6, 2009 at 8:46 pm

Dear Colleagues,

Sometimes it is good to have links that cover a topic. This is why I have collected here a bunch of links that might be useful for you in your work.

You can have a good description of the methods used in restriction enzyme analysis here: Methodbook.net

If you would like to use restriction enzymes for your work, you can find a list of links of the best known restriction enzyme providers below.

New England Biolabs

Promega

Roche Applied Science: Benchmate

Invitrogen

Fermentas

If you want to start your work with these enzymes, please consult the protocol provided with the enzyme or check it at the website of the manufacturer.

Be sure you know what an isoschizomer is, what star activity is, or how you can make double digestion (details here and here).

Hunting Viruses

In cell culture, DNA, molecular biology, RNA, virus on March 30, 2009 at 6:02 pm

If it comes to speak about the future possibilities of molecular biology, it is worth keeping an eye on the medical applications. And if you think about the most peculiar infection agents you should for sure think of viruses also. What is a virus? Of course we all know what a virus might cause to us, like a simple respiratory infection. These are usually caused by viral infections that later are super infected with bacteria. I had a professor who tried to explain us what a virus is. It skips almost any definitions. We can not be sure if we could consider a living thing at all!!! At the end he told us in a laconic way: a virus is a VIRUS! Nothing more.

If we try to find them it is good to know, that they were discovered through the observation that you can transfer an infection from one cell culture to the other even after filtrating the solution through a filter with 0.4 micrometer holes. That means that no bacteria can bypass this filter, but infections can be transferred with this solution. The firs experiments were done in order to monitor these infections, to see that after infection there was a “clean window period”, a period when the infections agent disappeared from the cell culture. After this window the virus reappeared and the supernatant solution had infections properties again.

Today we know plenty of details about viruses. There are basically two flavours of them DNA and RNA viruses. So that is an important point! because we have plenty of molecular biology tools that allow us to characterize nucleic acids. One of the most complex tool from this series is the DNA microarray. As one of my students pointed out last week, in the next video from TED, we can have a wonderful presentation about how these tools can be used in a fast and relatively easy way to get a deeper insight in the world of viruses. As a perspective the video shows us some excellent diagnostic applications that will be probably used to develop state of the art diagnostic tools in the next couple of years.

So, let us see how it works!

More info about the viruses and vaccination, here.

Restriction Enzymes

In DNA, molecular biology, plasmid, transfection, Water on March 15, 2009 at 9:22 pm

Restriction enzymes are used to cut plasmids. We have tackled the plasmids in the previous lecture. You can have a full description about the restriction enzymes here.

As a most basic introduction I would say that restriction enzymes are enzymes of the bacteria representing a kind of immune function of the bacteria. They are present in pairs in bacteria: a DNA methylase and a restriction enzyme. They both recognize the same sequence. The bacteria is methylating its own DNA in a sequence specific manner. By this its own DNA is protected against any foreign DNA. Since horizontal gene transfer is quite common in bacteria, the bacterial cell can protect its own genetic material with the help of the restriction enzymes. The foreign DNA entering into the cell will present a different DNA methylation pattern. The unmethylated recognition sites will be cut  by the restriction enzymes and by this destroyed.

Different bacterial species have different restriction enzymes with different recognition sites (certainly each has a DNA methyltransferase, too). The nomenclature of the restriction enzyme reflects their origin. In the most trivial case the name Eco RI enzyme is informing us that it has been isolated from Escherichia coli strain R and it has been the first to have been isolated from this strain.

In the molecular biology lab we use them to cut and manipulate plasmids. They are like scissors that can be directed to specific sites in the plasmid to cleave it. With an appropriate collection of site specific cutting enzymes we can step into the very exciting field of genetic engineering.

Let us have a look to some basic usage of restriction enzymes:

You can check a good introductory video here.

In any case when working with enzymes, please use latex gloves, and keep enzymes on ice!

The unit of a restriction enzyme “U” stands for the amount of enzyme needed to cut 1microgram of plasmid with a single cutting site, in one hour, in ideal environment.

The environment of the reaction is provided by buffers. The enzymes are usually provided in a concentration of 10U/ul (10 units per microliter). The enzymes are supplied in glicerol solution and always stored at -20 C. The buffer may as well come in a 10 fold concentrated solution (10X) and it should also be kept frozen.

A typical restriction enzyme reaction is set up in the following way:

1. Check the map of the plasmid for the distribution of the cutting sites.

2. Measure the concentration of the plasmid solution by spectrophotometer. Your plasmid concentration should be in the range of 1 microgram per microliter.

3. Calculate the volume of the plasmid needed to have the required amount of product at the end. The volume of the reaction should be kept as low as possible, and should not exceed 100 ul/ reaction tube. Use sterile, DNAse free microcentrifuge (so called) “Eppendorf” tubes.

4. Plan the reaction. You should have approx 1 to 10 U of enzyme per microgram of plasmid. In the final volume of the reaction the total volume of the enzyme should be less the 1/10, because higher glicerol concentration might alter the specificity of the reaction. The buffer will be 1/10 of the final volume. Keep the final volume low (less then 100 microliters). If needed, adjust the reaction volume to the planned final volume with nuclease free water. Check the optimal temperature for the reaction. It is usually 37C, but it might differ. Check for possible star activity of the enzyme in its data sheet.

Example:

Mix the following components (ul stands for microliter):

16ul Nuclease Free Water+

1ul Plasmid solution (concentration 1ug/ul)+

2ul 10X Buffer+

1ul Restriction Enzyme (10U/ul)

Total:     20ul

5. Once the reaction is planned, start to do it: bring ice, prepare tubes, melt the buffer in your hands.

6. Pipette the required volumes of water, plasmid and buffer into the tube.

7. Add the enzyme to the tube and mix gently. Do not vortex!

8. Put the reaction into the thermostat set to the required temperature.

9. Put the enzyme and the buffer back to -20C and clean up you bench!

10. After the allocated time has  passed, stop the reaction. We are usually keeping the reaction in the thermostat for 4 hours. You can stop the reaction in several ways: by adding EDTA; by heat inactivating the enzyme at 85C for 10 minutes, or simply by freezing the tube and keeping it frozen until you purify it.

You can have a look on the applications in the video below.

Good luck!

Green Fluorescent Protein or GFP

In animation, cell, DNA, GFP, molecular biology, plasmid, RNA, transfection on March 7, 2009 at 7:00 pm

Green lights in the dark

When someone first shows up in our lab, the prime goal I set up for him or her is to make “green cells” – I mean to introduce a Green Fluorescent Protein into a mammalian cell culture. In order to be able to perform this one has to know some basic molecular biology. One has to know what a cell is, what the difference is between a prokaryote and an eukaryote cell; what the central dogma is namelly that the information flows from DNA to RNA and from here to proteins is, or as it has been formulated originally and still correctly, the information flows from nucleic acids towards proteins (albeit I assume we will see exceptions for this rule, too). (You can reach a very good lecture on this topic here.)  One has to know what the difference between DNA and RNA is, in most basic approach the chemical difference is minuscule (there is a deoxyribose in the backbone of the DNA and a ribose in the RNA, there are other differences but this is the most prominent), while the results are spectacular. DNA is a quite stable molecule that can be degraded by DNAses. DNases require divalent metal ions for their activity ( usually Mg, but other divalent ions can be used too), and we can remove these ions from solutions with so called chelating agents. Most commonly we use EDTA for this task.

From practical point of view, one needs to have some backgrounds in order not to be lost in a molecular biology lab as it follows:

One has to be able to use pipettes (as seen in the previous posts), to make buffers, to know about pH, know what molarity is, and have a good basic background in maths (just enough to calculate the compositions of the buffers).

But you can perform the most basic experiment of DNA isolation even in the kitchen! At the end of this experiment you will be able to even SEE the DNA!

You can extract DNA from any cell, but the easiest way is to use some germs, like wheat or bean germs, soya germs and so on… In the following video you can see the procedure. If you do not have isopropyl alcohol (I don’t have at home for example) use regular ethanol or a strong spirit with at least 70% alcohol content!

Regarding RNA, the world of RNA is a transient world.  RNA is degraded by enzymes that can be found everywhere. RNAses can not be blocked by removing metal ions with EDTA. This makes the half life of RNA very short. Let us take the analology of the computer: DNA is like the information on the hard disk, one might have a software on the computer without using it- this is the information in the DNA. If one double clicks on its icon, the program starts, this corresponds to the transcription: information is transcribed from DNA to RNA, or the software is running, even if it is not yet in use, it is ready to get an input and process it into the output. The RNA is similarly translated by ribosome into proteins: these are the products that have been coded in the DNA. Or according to the computer analogy you create a document with the word processor software. The document is an entity by itself.  You can print it and have it. If you turn off your computer, the temporary files are destroyed, all unsaved files are deleted. So is with the RNA. RNA is carrying an information for a short period of time, it has a short half life, but can be regenerated from the DNA. These processes are explained in the following video:

Ok, so how do we make green cells? Green flourescent protein is encoded in the genome of the Jelly fish. The protein once identified can be introduced into other organisms if we isolate the DNA sequence that is encoding the GFP protein. So let’s have a look to these wonderful organisms!

Beautiful Jelly fish

The discovery of GFP protein and their mode of action changed plenty of studies in biology. The Nobel Prize for Chemistry in 2008 was given for the identification of the GFP protein and its way of action. You can see below two videos about the topic. A detailed, in depth one or below a short overview of the topic. You choose!

Giving green light to biology

Nobel Prize for GFP

After this overview I think it is time to have an experiment. We will see how you can introduce the GFP encoding DNA into a bacteria. For this we use so called plasmids as a vector. We call vector in biology a tool that is able to carry genetic information, like a plasmid, cosmid, or a virus. A plasmid is a small circular DNA that is able to self-replicate into a bacteria and to express a protein. They are responsible for lateral gene transfer in bacteria, e.g. transfering antibiotic resistance gene from one bacteria to a different one.

In the following experiment we will see the introduction of a GFP encoding DNA into a so called Agrobacterium, a bacteria that is infecting plants.

Introducing the GFP into a bacteria

Cool, isn’t it?

We can make even more complicated investigations with the help of the GFP. In the following animation it is shown the transfection process in a mammalian cell where the addressed question is if two proteins interact or not? For this they use the so called FRET or fluorescence resonance energy transfer. In order to see if the two proteins are close to each other or not, we have to use two GFP like tagged proteins with their excitation and emission wave lengths close to each other. See how it works:

Investigating protein-protein interactions with fluorescent proteins

GFP has several other applications, like tracing of migrating neurons, as seen in the following video:

Or full GFP organisms like in the following one:

If you would like to know even more about the GFP protein, please visit the best site in this topic I have ever seen, the page of Marc Zimmer, here.

I think we had even too much of GFP now, so in the next posts we will go back to plasmids…

See you!