Labtutorials.org

Archive for the ‘RNA’ Category

GRO-seq

In bioinfo, bioinformatics, bioinformatika, molecular biology, RNA on May 24, 2019 at 7:57 pm

Szerző: Dr. Nagy Gergely

A módszer, amely elől nem bújhat el egyetlen RNS molekula sem

A teljes genom szintű (Global) Run-On (GRO) szekvenálás a naszcens transzkriptóm meghatározására alkalmas újgeneráriós szekvenálási (NGS) módszer. A transzkriptóm általánosságban a sejtek teljes RNS állományát jelenti, a GRO-seq lényege azonban éppen az, hogy csak az egy adott pillanatban átíródó RNS molekulákat, sőt azoknak is csak az éppen átíródó részét, tehát gyakorlatilag az átírást végző RNS polimeráz komplexek helyét mutatja meg a genomban. Ez úgy érhető el, hogy egy szarkozil nevű detergenssel (tisztítószerrel) meggátolják, hogy szabad polimerázok csatlakozzanak a DNS-hez, ellenben a már elkötelezett komplexek tovább tudnak működni. A run-on gyakorlatilag a polimerázok korlátozott „újraindítását” jelenti izolált sejtmagokban, jelölt nukleotid-trifoszfát szubsztrátok felhasználásával. Néhány tíz nukleotid felépítése elegendő ahhoz, hogy az RNS molekulák darabolása után a jelölés segítségével kifogják az új szakaszokat, és meghatározzák a bázissorrendjüket.

A GRO-seq eljárás során arra is ügyelnek, hogy az RNS molekulák bázissorrendjének az iránya is megismerhető legyen. Ehhez előbb a molekulák 5’, majd 3’ végéhez kapcsolnak végspecifikus adaptort. Az RNS molekulák töredékeinek az 5’ végén azonban nincs feltétlenül szabad foszfát csoport. A későbbi lépésekhez az mRNS-ek 5’ „sapkáját” el kell távolítani (TAP), valamint end-repair-rel mind az 5’, mind pedig a 3’ vég javítható (például foszforilálható, illetve defoszforilálható; PNK). A különböző adaptorokkal közrefogott RNS molekulákból reverz transzkripcióval DNS-t hoznak létre, majd ezt sokszorozzák (PCR) a szekvenáláshoz.

A rövid szekvencia-leolvasások tehát megmutatják a polimerázok általi RNS szintézis helyét és irányát, amely kiválóan használható bizonyos nyomon követéses kísérletek esetében. Ha kíváncsiak vagyunk, milyen gének kapcsolnak be vagy ki egy stimulus hatására, érdemes néhány vagy néhány tíz perces felbontásban mintát venni. Ilyen módon láthatóvá válik, hogy a polimeráz percenként 2,5-3 kilobázis távolságot halad a szabályozott géneken. Azonban vannak olyan hosszú gének is, amelyek átírásához órák kellenek, és ez idő alatt az mRNS teljes érése és fehérjére „fordítása” sem történhet meg. A rövidebb gének viszont hamar nagy mennyiségű fehérjeterméket eredményezhetnek, és amennyiben ezek képesek a transzkripciót szabályozni, például mint transzkripciós faktorok, megfigyelhetjük az általuk be-, illetve kikapcsolt gének egy újabb hullámát, amely szó szerint a gének lefedettségén is látható. Ha egy hosszú gén előbb indukálódik, majd nem sokkal később gátlódik, egy „csúcs” jelenik meg rajta, amely idővel (későbbi időpontokban) a gén vége felé „vándorol”. Kellően nagyszámú időpont vagy jól időzített időpontok használatával teljes transzkripciós kaszkádok térképezhetőek fel a módszer segítségével.

A GRO-seq-kel nyert génexpressziós adatokat azonban más okokból kifolyólag sem könnyű értelmezni. Például sokszor nincs egyszerű összefüggés a különböző RNS molekulák szintézisének gyakorisága és az érett RNS szintje között. Az érés sem feltétlenül egyszerű folyamat, de összességében talán az érett RNS molekulák stabilitása (féléletideje) a leginkább meghatározó tényező a génexpressziót tekintve. Csupán GRO-seq adatokból tehát nem sokat tudhatunk meg a génexpressziós szintekről, annál többet a génexpresszió kezdeti szabályozásáról. A polimerázok ugyanis nemcsak a géneken találhatóak meg, hanem transzkripciót mutatnak minden aktív szabályozóhelyen is, még ha nem is következik utána lánchosszabbítás (elongáció).

Polimerázok mindenütt

Bőven a GRO-seq előtt ismert volt, hogy nagyszámú polimeráz gyülekezik a promótereken, de ezeknek tipikusan csak töredéke tudja megkezdeni a génen való továbbhaladást, a többi csak vesztegel (pausing). Ez a GRO-seq adatok alapján úgy néz ki, hogy a gén kezdeti szakaszán van egy csúcs – rövid, úgynevezett abortált átiratokból –, ami többnyire jelentősen magasabb, mint a gén további szakaszának a – transzkriptumok elongációjából fakadó – lefedettsége. Előfordul az is, hogy a promóter jelentős aktivitást mutat, a génen pedig alig vagy egyáltalán nem detektálható transzkripció, valószínűleg valamilyen további aktiváló jel hiánya miatt. Magasan kifejeződő gének esetében viszont nem feltétlenül látható pausing, mivel közel minden megkezdett RNS molekula meghosszabbításra kerül. Ebben az esetben időegység alatt tovább is jutnak a polimerázok, mert gyorsabban tudnak haladni a tartósabban szétválasztott DNS-en.

Az átíródó szabályozó régiók alatt nemcsak a promótereket értjük, hanem az aktív enhanszereket (silencer-eket) is, melyek átírását ugyanúgy érintik a pozitív/negatív stimulusok, mint a fehérjekódoló génekét. Ezt kihasználva a promóterektől akár többszáz kilobázis távolságra elhelyezkedő, az adott stimulus hatására azonos expressziós mintázatot mutató szabályozó régiókat is a génekhez rendelhetjük, amely segíthet azt is megmondani, mely transzkripciós faktorok vesznek részt a szabályozásban. A promóterektől távol eső szabályozó helyeken általában nagy a pausing mértéke – tehát az abortált transzkriptumok aránya –, de ezeken a helyeken is történhet elongáció, melynek hosszú nem-kódoló RNS-ek lesznek a termékei. Elongáció hiányában egyszerűen enhanszer transzkripcióról beszélünk, amely tipikusan mindkét irányban megtörténik (divergens) a szabályozó régióhoz képest – valószínűleg azért, mert itt nincsenek olyan, a polimeráz aktivitás irányát meghatározó szabályozó, úgynevezett válaszadó elemek, mint a promóterek klasszikus elemei, például a TATA-box. Jóllehet, a legtöbb promóteren is jellemző divergens transzkripció, akár elongáció mindkét irányba; sőt többezer olyan fehérjekódoló génpár létezik, amely látszólag egyetlen promóteren osztozik.

Nem-kódoló RNS-ek

Ellentétben a génekkel, a hosszú nem-kódoló RNS termékek hossza a GRO-seq adatok alapján vélhetően nem azonos – minél távolabb jut a polimeráz, annál valószínűbb, hogy nem folytatja tovább az átírást. De mindig vannak kivételek: bizonyos hosszú nem-kódoló RNS-ek egy bizonyos pontig azonos lefedettséget, sőt akár a génekhez hasonló intronkivágódást is mutatnak. Például a „csak” mikroRNS-t kódoló „gének” is így viselkednek. Az a bizonyos pont, ameddig a gének és gén jelleget mutató hosszú nem-kódoló transzkriptumok nagyjából azonos polimeráz sűrűséggel bírnak, a transzkripció terminációs helye. (Csak első ránézésre) érdekes módon a terminációs helyet követően felerősödik a polimerázok jelenléte, majd a hosszú nem-kódoló termékekhez hasonlóan egyre kevesebb tovább hosszabbított terméket látunk. Ez a jelenség valószínűleg az RNS polimerázok lelassulásának tudható be, nem újabb komplexek csatlakozásának. A terminációs helyet követően a polimerázok nem válnak le rögtön a DNS-ről, de a sebességük lecsökken, így gyakrabban lehet detektálni a termékeiket; ez magyarázhatja a – magas expresszió esetén akár többtíz kilobázisos – továbbírást.

A polimerázok lassulása és gyorsulása valamennyire a géneken is érvényesül, attól függően például, hogy milyen a G/C bázisok aránya, milyen a kromatin szerkezete, vagy például van-e aktív szabályozó hely a génen. Főleg a promóterek közelében, de valójában bármelyik intronban lehet enhanszer transzkripciót látni, de az intronokon belül akár más gének promóterei is lehetnek aktívak, és bármelyik irányban keletkezhet róluk, akár elongált RNS termék. Nem könnyítik meg a transzkriptumok azonosítását az alternatív promóterekkel rendelkező gének sem. Referencia annotáció nélkül – illetve hiányos referencia annotáció esetén –, csak a lefedettség adatok alapján, sokszor nem lehet megállapítani, hogy egy hosszabb, alacsonyabb expressziójú transzkriptum variánst látunk-e, vagy egy eddig ismeretlen gént, amely ugyanazon a szálon található, és az ismert gén promótere előtt végződik. Az is előfordulhat, hogy az ismert promótertől downstream helyezkedik el egy eddig ismeretlen, intronikusnak látszó alternatív promóter, amelyet, ha alacsony expressziót mutat, könnyen enhanszernek nézhetünk. Az alternatív terminációs helyek nem gyakoriak, de még nehezebb kezelni őket.

A GRO-seq adatokban nemcsak ismert gének ismeretlen variánsait és sohasem látott enhanszer transzkriptumokat, hanem eddig teljesen ismeretlen, gén jelleget mutató transzkripciós eseményeket is lehet találni. Ilyen esetben meg lehet próbálni a nyitott olvasási keretek és exon-intron határok keresését, ami akár új gének felfedezését is eredményezheti. Az eddig említett transzkriptumok mellett természetesen megfigyelhető a kis sejtmagi és „magvacskai”, valamint a transzfer és riboszómális RNS molekulák expressziója is, bár ezek általában nem mutatnak jelentős időbeli változásokat.


GRO-seq adatok elemzése

A korábban bemutatott ChIP-seq elemző pipeline alkalmas GRO-seq adatok alapelemzésére is, a további elemzésekhez viszont az adatok összetettsége miatt komoly fantáziára is szükség lehet. 🙂

Az Emberi Erőforrások Minisztériuma ÚNKP-18-4-DE-318 kódszámú
Új Nemzeti Kiválóság Programjának támogatásával készült.

Advertisements

Hunting Viruses

In cell culture, DNA, molecular biology, RNA, virus on March 30, 2009 at 6:02 pm

If it comes to speak about the future possibilities of molecular biology, it is worth keeping an eye on the medical applications. And if you think about the most peculiar infection agents you should for sure think of viruses also. What is a virus? Of course we all know what a virus might cause to us, like a simple respiratory infection. These are usually caused by viral infections that later are super infected with bacteria. I had a professor who tried to explain us what a virus is. It skips almost any definitions. We can not be sure if we could consider a living thing at all!!! At the end he told us in a laconic way: a virus is a VIRUS! Nothing more.

If we try to find them it is good to know, that they were discovered through the observation that you can transfer an infection from one cell culture to the other even after filtrating the solution through a filter with 0.4 micrometer holes. That means that no bacteria can bypass this filter, but infections can be transferred with this solution. The firs experiments were done in order to monitor these infections, to see that after infection there was a “clean window period”, a period when the infections agent disappeared from the cell culture. After this window the virus reappeared and the supernatant solution had infections properties again.

Today we know plenty of details about viruses. There are basically two flavours of them DNA and RNA viruses. So that is an important point! because we have plenty of molecular biology tools that allow us to characterize nucleic acids. One of the most complex tool from this series is the DNA microarray. As one of my students pointed out last week, in the next video from TED, we can have a wonderful presentation about how these tools can be used in a fast and relatively easy way to get a deeper insight in the world of viruses. As a perspective the video shows us some excellent diagnostic applications that will be probably used to develop state of the art diagnostic tools in the next couple of years.

So, let us see how it works!

More info about the viruses and vaccination, here.

Green Fluorescent Protein or GFP

In animation, cell, DNA, GFP, molecular biology, plasmid, RNA, transfection on March 7, 2009 at 7:00 pm

Green lights in the dark

When someone first shows up in our lab, the prime goal I set up for him or her is to make “green cells” – I mean to introduce a Green Fluorescent Protein into a mammalian cell culture. In order to be able to perform this one has to know some basic molecular biology. One has to know what a cell is, what the difference is between a prokaryote and an eukaryote cell; what the central dogma is namelly that the information flows from DNA to RNA and from here to proteins is, or as it has been formulated originally and still correctly, the information flows from nucleic acids towards proteins (albeit I assume we will see exceptions for this rule, too). (You can reach a very good lecture on this topic here.)  One has to know what the difference between DNA and RNA is, in most basic approach the chemical difference is minuscule (there is a deoxyribose in the backbone of the DNA and a ribose in the RNA, there are other differences but this is the most prominent), while the results are spectacular. DNA is a quite stable molecule that can be degraded by DNAses. DNases require divalent metal ions for their activity ( usually Mg, but other divalent ions can be used too), and we can remove these ions from solutions with so called chelating agents. Most commonly we use EDTA for this task.

From practical point of view, one needs to have some backgrounds in order not to be lost in a molecular biology lab as it follows:

One has to be able to use pipettes (as seen in the previous posts), to make buffers, to know about pH, know what molarity is, and have a good basic background in maths (just enough to calculate the compositions of the buffers).

But you can perform the most basic experiment of DNA isolation even in the kitchen! At the end of this experiment you will be able to even SEE the DNA!

You can extract DNA from any cell, but the easiest way is to use some germs, like wheat or bean germs, soya germs and so on… In the following video you can see the procedure. If you do not have isopropyl alcohol (I don’t have at home for example) use regular ethanol or a strong spirit with at least 70% alcohol content!

Regarding RNA, the world of RNA is a transient world.  RNA is degraded by enzymes that can be found everywhere. RNAses can not be blocked by removing metal ions with EDTA. This makes the half life of RNA very short. Let us take the analology of the computer: DNA is like the information on the hard disk, one might have a software on the computer without using it- this is the information in the DNA. If one double clicks on its icon, the program starts, this corresponds to the transcription: information is transcribed from DNA to RNA, or the software is running, even if it is not yet in use, it is ready to get an input and process it into the output. The RNA is similarly translated by ribosome into proteins: these are the products that have been coded in the DNA. Or according to the computer analogy you create a document with the word processor software. The document is an entity by itself.  You can print it and have it. If you turn off your computer, the temporary files are destroyed, all unsaved files are deleted. So is with the RNA. RNA is carrying an information for a short period of time, it has a short half life, but can be regenerated from the DNA. These processes are explained in the following video:

Ok, so how do we make green cells? Green flourescent protein is encoded in the genome of the Jelly fish. The protein once identified can be introduced into other organisms if we isolate the DNA sequence that is encoding the GFP protein. So let’s have a look to these wonderful organisms!

Beautiful Jelly fish

The discovery of GFP protein and their mode of action changed plenty of studies in biology. The Nobel Prize for Chemistry in 2008 was given for the identification of the GFP protein and its way of action. You can see below two videos about the topic. A detailed, in depth one or below a short overview of the topic. You choose!

Giving green light to biology

Nobel Prize for GFP

After this overview I think it is time to have an experiment. We will see how you can introduce the GFP encoding DNA into a bacteria. For this we use so called plasmids as a vector. We call vector in biology a tool that is able to carry genetic information, like a plasmid, cosmid, or a virus. A plasmid is a small circular DNA that is able to self-replicate into a bacteria and to express a protein. They are responsible for lateral gene transfer in bacteria, e.g. transfering antibiotic resistance gene from one bacteria to a different one.

In the following experiment we will see the introduction of a GFP encoding DNA into a so called Agrobacterium, a bacteria that is infecting plants.

Introducing the GFP into a bacteria

Cool, isn’t it?

We can make even more complicated investigations with the help of the GFP. In the following animation it is shown the transfection process in a mammalian cell where the addressed question is if two proteins interact or not? For this they use the so called FRET or fluorescence resonance energy transfer. In order to see if the two proteins are close to each other or not, we have to use two GFP like tagged proteins with their excitation and emission wave lengths close to each other. See how it works:

Investigating protein-protein interactions with fluorescent proteins

GFP has several other applications, like tracing of migrating neurons, as seen in the following video:

Or full GFP organisms like in the following one:

If you would like to know even more about the GFP protein, please visit the best site in this topic I have ever seen, the page of Marc Zimmer, here.

I think we had even too much of GFP now, so in the next posts we will go back to plasmids…

See you!