Labtutorials.org

Archive for November, 2014|Monthly archive page

Domén szerkezetek meghatározása a SMART adatbázis segítségével

In molecular biology on November 3, 2014 at 6:33 pm

Mi is az a SMART?

A SMART ( Simple Modular Architecture Research Tool) egy biológiai adatbázis, amit fehérje domének, fehérje szekvenciákon belüli azonosítására és szerkezeti analízisére használunk. Használatával több mint 500 domén család tagját azonosíthatjuk melyek a jelátviteli, az extracelluláris és a kromatin-asszociált fehérjék közé tartoznak. Ezek a domének széles körben annotáltak, a fejlődésitani szempontból, a funkcionális alosztály, a harmadlagos szerkezet és a működés szempontjából fontos oldalláncok tekintetében. Minden domén információja egy nem-redundáns fehérje adatbázisban található, továbbá egy kapcsolódó adatbázis rendszer tárolja a keresési paramétereket és a rendszertani információkat.

Jelen tutoriálban az aktuális (2014) működési módjáról adunk egy áttekintést ami előreláthatólag változni fog.

A SMART-ot két különböző módban használhatod: normál és genomikai módban.

A fő különbség közöttük az alárendelt protein adatbázis használatában van.

  • A normál SMART-ban, az adatbázis a Swiss-Prot, SP-TrEMBL és a stabil Ensembl proteomokat tartalmazza.
  • A genomikai SMART-ban, csak a teljesen szekvenált genomok proteomjai használhatóak, Ensembl a metazoákhoz és a Swiss-Prot a maradékhoz.

A protein adatbázis a normál SMART-ban jelentős redundanciával (létszámfölösleggel) rendelkezik, annak ellenére, hogy az azonos fehérjéket eltávolították. Ha arra használod a SMART-ot, hogy domén szerkezeteket deríts fel, vagy meg akarod találni a különböző genomokban a pontos domén számot, fontold meg, hogy Genom módba váltasz.

Az adatbázist az Európai Molekuláris Biológiai Laboratórium (EMBL) kezeli Heidelbergben. Az EMBL egy molekuláris biológiai kutatóintézet, amit 20 európai ország és Ausztrália, mint társult tagállam támogat. Az EMBL 1974-ben jött létre, mint egy kormányközi szervezet, amit a tagországok állami kutatási pénzből tartanak fent. A kutatást az EMBL-ben körülbelül 85 független csoport végzi, átfedve a molekuláris biológia spektrumát. A Laboratórium 5 helyen működik: a fő laboratórium Heidelbergben van, a távoli állomásai Hinxtonban (az Európai Bioinformatikai Intézet (EBI)), Grenoble-ban, Hamburgban, és a Róma közelében fekvő Monterotondoban van.

Magyarország 2014-ben csatlakozott az EMBL-hez!!!

Mindegyik helyszín specifikus kutatási területtel rendelkezik. Az EBI a bioinformatikai kutatások és szolgáltatások fejlesztésének és nagyszámú adatbázis fenntartásának a központja, amelyek díjmentesen hozzáférhetőek a tudományos közösség számára. Grenoble-ban és Hamburgban a kutatás a szerkezeti biológiára összpontosít. Az EMBL kiemelt Egér Biológiai Egysége Monterotondoban található. A székhelyen, Heidelbergben, Sejtbiológiai és Biofizikai, Fejlődésbiológiai, Genom Biológiai és Szerkezeti és Számítógépes Biológiai egységek vannak, valamint szolgáltatói csoportok egészítik ki az előbb említett kutatási területeket.

SMART használata

A következőekben végigmegyünk egy domén szerkezet meghatározásának folyamatán. Azonban azt itt meg kell említeni, hogy nem rögtön a SMART felületen kezdjük. Első lépésként az UniProt adatbázis segítségével kikeressük a megfelelő, meghatározni kívánt domén kódját. Az UniProt a következő linken érhető el: http://www.uniprot.org/. A linkre kattintva megjelenik a főoldal.

Az oldal a következőképpen néz ki:

1

A UniProt egy átfogó, magas színvonalú és szabadon hozzáférhető adatbázisa a fehérje szekvenciáknak és a funkcionális információknak, sok bejegyzés a genom szekvenálási projektekből származik. Nagy mennyiségű információt tartalmaz a szakirodalomból származó fehérjék biológiai funkcióiról.

A UniProt az Európai Bioinformatikai Intézet (European Bioinformatics Institute (EMBL-EBI)), a Svájci Bioinformatika Intézet (Swiss Institute of Bioinformatics (SIB)), és a Protein Információ Forrás (Protein Information Resource (PIR)) közötti együttműködésként jött létre. A három intézményen keresztül, több mint 100 ember vesz részt különböző feladatokban, mint az adatbázis kezelésben, szoftverfejlesztésben és támogatásban.

Az EMBL-EBI-t és a SIB-et a Swiss-Prot és TrEMBL készítéséhez használták, míg a PIR a Protein Szekvencia Adatbázist (PIR-PSD) hozta létre. A TrEMBL (Translated EMBL Nucleotide Sequence Data Library) eredetileg azért jött létre, mert a szekvencia adatok olyan ütemben generálódtak, hogy a Swiss-Prot nem tudott vele lépést tartani. Eközben a PIR fenntartotta a PIR-PSD-t és a kapcsolódó adatbázisokat, köztük az iProClass-t, ami egy fehérje szekvencia adatbázis. 2002-ben a három intézmény úgy döntött, hogy egyesíti erőforrásait és szakértelmét és megalakítja az UniProt konzorciumot, melynek élén Rolf Apweiler, Alex Bateman, Cathy Wu és Ioannis Xenarios állnak.

A UniProt adatbázisok: a UniProt Knowledgebase (UniProtKB→ protein tudásbázis) , a UniProt Reference Clusters (UniRef→ szekvencia csoportok), és a UniProt Archive (UniParc→szekvenciák archívuma). A UniProt Metagenomic and Environmental Sequences (UniMES) adatbázis egy gyűjtemény, mely kifejezetten a metagenomikai és környezeti adatok számára lett kifejlesztve.

Attól függően, hogy mit szeretnél keresni, kiválaszthatod a legmegfelelőbb adatbázist:

2

Ez esetben, példaként tehát, az 1-es típusú ösztrogén receptor (ESR1) doménszerkezetét nézzük meg.
A UniProtKB-t kiválasztva, a keresőbe beírtam, hogy ESR1 (ösztrogén receptor 1). Majd a keresés gombra kattintottam, és a következőt kaptam:

3

Ahogy a piros nyíl is mutatja, a Homo sapiens (Human) ESR1-re kattintottam, mivel ennek a szerkezetét szeretném meghatározni. Így a következő oldalra jutottam:

4

A feljövő ablakban, az ESR1 funkciójáról, lokalizációjáról, egyéb elnevezéséről, mutációiról, expressziójáról, interakcióiról, stb. kaphatunk információt. De ahhoz, hogy mi a SMART-ban a doménszerkezetét láthassuk, a neve mellett lévő, bekarikázott kódot át kell, hogy másoljuk annak keresőjébe. Az alábbi linken érhető el a SMART főoldala:
http://smart.embl-heidelberg.de/

5

A találatok az alábbiak voltak, de a pirossal bekarikázottat választottam:

6

Megkaptam a doménszerkezetet! 🙂

7

A kapott szerkezetet a Zoom in/out gombra kattintva nagyíthatjuk/kicsinyíthetjük. Továbbá beállítható az intronok pozícióinak feltüntetése.

Az egyes doménekre rákattintva, részletes információkat kaphatunk azokról. Így példánk esetében megtudtam, hogy az ESR1, két, alacsony komplexitású régióval, egy C4 cink-ujj doménnel (ZnF_C4), és egy, a hormon receptorokra jellemző ligand-kötő doménnel (HOLI) rendelkezik.

8

9

A doménekről általában

A protein domén az adott protein szekvenciának egy konzervált része és a szerkezete (tercier) képes függetlenül fejlődni, funkcionálni és létezni a fehérje lánc többi részétől. Mindegyik domén egy kompakt 3D-s szerkezetet alkot, és gyakran egymástól függetlenül lehetnek stabilak és hajtogatottak. Számos fehérje különböző szerkezetű doméneket tartalmaz. Egy adott domén különböző fehérjében is megjelenhet. A molekuláris evolúció a doméneket, mint építőelemeket használja, melyeket különböző elrendezésben rekombinál, hogy különböző funkciójú fehérjéket hozzon létre. A domének hossza változó, körülbelül 25 aminosav hosszúságtól, legfeljebb 500 aminosav hosszúságig terjedhetnek. A legrövidebb doméneket, mint a cink-ujj fehérjéket, fémionok vagy biszulfid hidak stabilizálják. A domének gyakran funkcionális egységet alkotnak, mint például a kalmodulin kalcium-kötő EF-hand doménje. Mivel egymástól függetlenül stabilak, géntechnológiával a domének kicserélhetőek az egyes proteinek között, kiméra fehérjéket eredményezve.

Például az ESR1 domén szerkezete:

10

Kék színnel a DNS kötő domén (azaz a C4 cink-ujj domén), míg zöld színnel a ligand kötő domén (HOLI) látható.

A cink-ujj fehérjék

A cink-ujj (Znf) domének viszonylag kis fehérje motívumok, melyek összetett ujj-szerű kiemelkedéseket tartalmaznak, amik tandem kapcsolatokat létesítenek a célmolekuláikkal. Néhány ilyen domén képes cinket kötni, de sokan közülük nem, azok helyette fémet (mint például vasat), vagy pedig nem-fémet kötnek. Például, néhány családtag só hidakat hoz létre, hogy stabilizálja az ujj-szerű redőket. Először, mint DNS-kötő motívumot azonosították őket a Xenopus laevis (Afrikai karmos béka) TFIIIA transzkripciós faktorában, azonban mára felismerték, hogy DNS-hez, RNS-hez, fehérjékhez és/vagy lipid szubsztrátokhoz is képesek kötődni. A Znf domének gyakran klaszterekben találhatóak, ahol az ujjak különböző kötési sajátságokkal rendelkeznek. Jelentős sokoldalúságot mutatnak a kötési módokban, akár az azonos osztályba tartozó tagok között (pl.: néhányan DNS-hez, mások fehérjékhez kötődnek), ami arra utal, hogy a Znf motívumok stabil scaffold-ok (állványok), amik kialakított specializált funkciókkal bírnak. Például, hogy néhányat említsek, a Znf-t tartalmazó fehérjék a gén transzkripcióban, a transzlációban, az RNS-forgalomban, a citoszkeleton-szerveződésben, az epitheliális fejlődésben, a sejt adhézióban, a fehérje összetekerésben, a kromatin átalakításban és a cink-érzékelésben vesznek részt. A cink-kötő motívumok stabil struktúrák, amik ritkán ugyan, de konformáció változáson eshetnek át a célmolekulához történő kötődést követően.

A cink-ujj fehérjékről szóló videót lásd az alábbi linken:
https://www.youtube.com/watch?v=WyU2v7HT6bw

HOLI (hormon receptorok ligand-kötő doménje)

A szteroid vagy nukleáris hormon receptorok transzkripciós szabályozók fontos szupercsaládját alkotják, amik igen sokféle élettani funkcióban vesznek részt, beleértve az embrionális fejlődés szabályozását, a sejt differenciálódást és a homeosztázist. A receptorok a sejtmagban dimer molekulákként funkcionálnak, hogy ligand érzékeny módon szabályozzák a célgének transzkripcióját.

A nukleáris hormon receptorok nagymértékben konzervált DNS-kötő domént tartalmaznak, ami felismeri a specifikus szekvenciákat, s a C-terminális ligand-kötő doménhez egy linker régión keresztül kapcsolódik. Továbbá, bizonyos nukleáris hormon receptorok N-terminális moduláló doménnel rendelkeznek.

A ligand-kötő domén ligand kötődésre válaszol, vagyis a receptor konformációs változását idézi elő, kialakítva ezzel a választ. Így molekuláris kapcsolóként hatva bekapcsolja a transzkripciós aktivitást. A ligand-kötő domén egy olyan rugalmas egység, ahol a ligand bekötődése stabilizálja annak konformációját, ami viszont kedvez a koaktovátor bekötődésnek, módosítva a receptor aktivitását. A koaktivátor a ligand-kötő domén C-terminális végégnek AF2 helyéhez kötődik be. Tehát a ligand bekötődése a ligand-kötő domén konformációját megváltoztatja, ami viszont kihat a DNS-kötő domén DNS-kötő specificitására.

A hormonhatás mechanizmusa:
https://www.youtube.com/watch?v=TgNwxF3aQpE

Az alábbi linkre kattintva többet tudhatsz meg az ESR1-ről, illetve az ESR2-ről, de ez utóbbit példánkban nem említettük:
http://en.wikipedia.org/wiki/Estrogen_receptor

Az ösztrogén hatásmechanizmusáról szóló videó az alábbi linket érhető el:
https://www.youtube.com/watch?v=JQcFk7J_Tf4

Visszatérve a példánkhoz…

A szerkezeti ábra alatt található részben összegzik a receptorról meglévő adatokat. Öt fülön belül keresgélhetünk tovább:

11

Például, megnézhetjük, hogy mikkel áll kapcsolatban az ESR1:

12

Az ismert és a feltételezett kölcsönhatások a STRING adatbázisból érhetőek el:
http://string-db.org/

Sikeres keresgetést!  🙂

Flóra