MCB: Hoofdstuk 11: genexpressie RNA polymerase gen controle 11.1 overzicht van eukaryote gencontrole en RNA polymerasen



Vergelijkbare documenten
1 (~20 minuten; 20 punten)

94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten

Nederlandse Samenvatting

Intermezzo, De expressie van een eiwit.

SAMENVATTING IN HET NEDERLANDS

Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.

Transcriptie en de Genetische code


ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT

HERKANSINGSTENTAMEN Moleculaire Biologie deel 2, 5 Jan 2007

Hetzelfde DNA in elke cel

Samenvatting en algemene discussie Het DNA, de drager van alle genetische informatie, wordt constant bedreigd door verschillende factoren.

DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life

Nederlandse samenvatting

Tentamen Genetica Studentnr:

Samenvatting. Samenvatting

Samenvatting. Samenvatting

DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma

Samenvatting bij het proefschrift: Jasmonzuur-responsieve transcriptionele regulatie in Catharanthus roseus

Samenvatting. Samenvatting

Humane levenscyclus 1

Nederlandse Samenvatting

Tentamen Celbiologie. DATUM TIJD 14 tot 17 uur ZAAL N109 Wentgebouw. Beantwoord elk onderdeel op een apart vel. Veel succes!

DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle holds various files of this Leiden University dissertation.

SAMENVATTING EN ALGEMENE DISCUSSIE

Nederlandse samenvatting

a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P)

biologie vwo 2017-I Gespierder door gendoping

Nederlandse samenvatting

Samenvatting. Samenvatting

Hoofdstuk 8 Samenvatting in het Nederlands

Samenvatting Biologie B2

Biotechnologie deel I

1. Injectie van cytochroom c in het cytosol van een cel

Docentenhandleiding. Afsluitende module. Op zoek naar een gen in een databank

We wensen je veel succes met studeren en het halen van jouw tentamens!

Door de voortdurende blootstelling aan verschillende vormen van stress, hebben planten

Juli blauw Biologie Vraag 1

Juli geel Biologie Vraag 1

Figuur 1. Representatie van de dubbele helix en de structuren van de verschillende basen.

Rondleiding door de cel

TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie)

1 (~20 minuten; 15 punten)

Computer Ondersteund Onderwijs (COO).

vwo eiwitsynthese 2010

Van mens tot Cel oefenvragen 1. De celdeling bestaat uit verschillende fasen. Hoe heten de G1, S en de G2 fase samen?

Nederlandse samenvatting

Samenvatting. Samenvatting

Molecular analysis and biological implications of STAT3 signal transduction Schuringa, Jan Jacob

Moleculaire mechanismen. De connectie tussen interacties van eiwitten en activiteiten van cellen

Toevoeging bij hoofdstuk 10 07/05/2012 A. Het maken van een genomische bank

Cover Page. The handle holds various files of this Leiden University dissertation.

University of Groningen. Quorum sensing in Streptomyces coelicolor Martin Sanchez, Lara

a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P) LLORETDEMAR (iedere fout -1P)

Archaebacteriën. Eubacteriën. Eukaryoot

Nederlandse samenvatting

BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6

Naam: Student nummer:

van de cel Bioinformatica het probleem Inleiding Medisch Technische Wetenschappen Bioinformatica Deel 1 Celbiologie Elementaire celbiologie


2. Erfelijkheid en de ziekte van Huntington

In search for biomarkers of aging: A proteomics approach Rinse Klooster

Nederlandse Samenvatting. Nederlandse Samenvatting

(~30 minuten; 20 punten)

Samenvatting. Figuur 1. Algemene structuur van een nucleotide (links) en de structuren van de verschillende basen (rechts).

Nederlandse samenvatting voor geïnteresseerden buiten het vakgebied

Dutch Summary. Nederlandse Samenvatting

Nederlandse Samenvatting 159

8,6. Samenvatting door Jasmijn 2032 woorden 9 januari keer beoordeeld. Biologie voor jou. Biologie samenvatting hoofdstuk 4 Genetica

Chapter 9. Samenvatting

Hoofdstukken 2 en 3 Hoofdstuk 2 Hoofdstuk 3

Nederlandse Samenvatting

Nederlandse samenvatting

Cover Page. The handle holds various files of this Leiden University dissertation.

- 1 - Microbiologie en Biochemie (MIB-10306) Biochemie deel Vrijdag 29 februari 2008, uur

Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.

Nederlandse samenvatting

Phospoinositides and Lipid Kinases in Oxidative Stress Signalling and Cancer W.J.H. Keune


Tentamen Biochemie,, onderdeel Abrahams, 2e jaar MST, Antwoorden

<A> Thymine is een pyrimidinebase en vormt 3 waterstofbruggen met adenine. <B> Adenine is een purinebase en vormt 2 waterstofbruggen met thymine.

<A> Adenine is een purinebase en vormt 2 waterstofbruggen met thymine. <B> Guanine is een pyrimidinebase en vormt 2 waterstofbruggen met cytosine.

6,4. Samenvatting door E woorden 6 december keer beoordeeld. Biologie voor jou

NEDERLANDSE SAMENVATTING

4,4. Praktische-opdracht door een scholier 2016 woorden 4 november keer beoordeeld

in de route kunnen activeren. Een groep van enzymen die ook deel uitmaken van deze cascade zijn de mitogen-activated protein kinases (MAP kinases).

Nederlandse samenvatting. Baarmoederhalskanker en het humaan papillomavirus

Nederlandse Samenvatting

Van mutatie naar ziekte

Naam: Studentnummer: Opleiding:..

1. Welk(e) van de volgende baseparen komt(en) van nature voor in een DNA dubbele helix. Omcirkel deze. C-G

Gentechnologie & moleculaire analysetechnieken Godelieve Gheysen eerste zit

Cover Page. The handle holds various files of this Leiden University dissertation

Moleculaire Diagnostiek binnen een routine Pathologie Laboratorium

NEDERLANDSE SAMENVATTING

biologie pilot vwo 2015-I

Transcriptie:

MCB: Hoofdstuk 11: In vorige chapters hebben we gezien dat de acties en eigenschappen van elk celtype bepaald wordt door de proteïnen die het bevat. In deze en de volgende chapter beschouwen we hoe de soorten en hoeveelheden van de verschillende proteïnen geproduceerd door een bepaald celtype in een meercellig organisme gereguleerd wordt. De basisstappen in genexpressie, het gehele proces waarbij de informatie gecodeerd in een bepaald gen gedecodeerd wordt in een bepaald proteïne zijn bestudeerd in chapter4. De synthese van mrna vereist dat een RNA polymerase de transcriptie initiëert, ribonucleosidetrifosfaten complementair aan de DNA coderende streng polymeriseert en dan de transcriptie beëindigt. Bij prokaryoten hebben ribosomen en translatie iniatiatie factoren onmiddelijk toegang tot de pas gevormde RNA-transcripten, die functioneren als mrna zonder enige verdere modificatie. Bij eukaryoten wordt het initiële RNA transcript echter onderworpen aan processing die aan functioneel mrna aflevert. Het mrna wordt dan getransporteerd van zijn syntheseplaats in de nucleus naar het cytoplasma, waar het vertaald wordt in een eiwit met de hulp van ribosomen, trna s en translatiefactoren. Theoretisch zou de regulatie van elk van de verschillende stappen in de genexpressie kunnen leiden tot de diffrentiële productie van eiwitten in verschillende celtypes of ontwikkelingsstadia of als antwoord op externe condities. Hoewel regulatie-voorbeelden in elk van de stappen van de genexpressie gevonden zijn, is de controle van de transcriptie-de eerste stap- hetbelangrijkste mechanisme voor de bepaling van de meeste genen of ze tot expressie komen en hoeveel coderende mrna s en bijgevolg ook hoeveel proteïnen er geproduceerd worden. De moleculaire mechanismen die de transcriptie initiatie reguleren zijn cruciaal voor vele biologische fenomenen, waaronder de ontwikkeling van een meercellig organisme uit één enkele bevruchte eicel, de immuunresponsen die ons beschermen tegen pathogene microorganismen en neurologische processeb zoals leren en geheugen. Wanneer deze regulatiemechanismen niet goed functioneren, kunnen pathologische processen zoals kanker en veroudering optreden. In deze chapter concentreren we ons op de moleculaire gebeurtenissen die bepalen wanneer transcriptie van eukaryote genen begonnen wordt en beschouwen we ook kort de controle van premature terminatie van de transcriptie. RNA processing en verschillende post-transcriptionele mechanismen voor de controle van eukaryote genexpressie worden in de volgende chapter behandeld. Latere chapters, in het bijzonder 13; 14 en 15 verlenen voorbeelden van hoe de transcriptie wordt gereguleerd door interacties tussen cellen en hoe de resulteren gen controle meewerkt aan de ontwikkeling en functionering van verschillende soorten cellen in de meercellige organismen. 11.1 overzicht van eukaryote gencontrole en RNA polymerasen Bij bacteriën dient de gencontrole voornamelijk om een enkele cel toe te laten zich aan te passen aan veranderingen in zijn omgeving zodat zijn groei en deling geoptimaliseerd kan worden. Bij meercellige orgaznismen induceren veranderingen in de omgeving ook veranderingen in de genexpressie. Een voorbeeld is de response op weinig zuurstof (hypoxia) die beschreven wordt in chapter15. Het meest typische en biologisch verreikende doel van gencontrole in meercellige organismen is echter de uitvoering van het genetische programma die de embryonale

ontwikkeling verklaart. De vorming van vele verschillende celtypes die tezamen een meercellig organisme vormen hangt af van dat de juiste genen geactiveerd worden in de juiste cellen op het juiste moment tijdens de ontwikkelingsperiode. De meeste gevallen wordt, eens een ontwikkelings stap genoemn is door een cel, deze niet meer omgekeerd. Dus zijn deze beslissingen fundamenteel verschillend van de reversibele activatie en repressie van bacteriële genen als antwoord op hun omgevings condities. Bij de uitvoering van hun genetische programma s volgen vele gediffrentiëerde cellen (vb huidcellen, rbc en antilichaamproducerende cellen) een pad dat tenslotte tot celdood leidt, zonder een nageslacht achter te laten. De vaste patronen van gencontrole leidend tot diffrentiatie dient voor het gehele organisme en niet voor het overleven van een individuele cel. Ondanks de verschillen qua doel van de gencontrole bij bacteriën en eukaryoten zijn de twee sleutelkenmerken van transcriptie controle, die eerst ontdekt werden bij bacteriën en beschreven zijn in chapter4, ook van toepassing op eukaryote cellen. Ten eerste zijn proteïne-bindende regulatorische DNA sequenties of controle elementen verbonden met genen. Ten tweede bepalen specifieke proteïnen, die binden aan gen regulatorische sequenties wanneer de transcriptie zal beginnen en activeren of onderdrukken zijn transcriptie. Zoals voorgesteld in figuur 11-1 worden in meercellige eukaryoten inactieve genen geordend in gecondenseerd chromatine, wat de binding van RNA polymerasen en algemene transcriptie factoren, vereist voor de transcriptie iniatie, remt. Activator proteïnen binden aan controle elementen vlakbij de transcriptie start site van een gen of evengoed kilobasen ervan verwijderd en promoten de chromatine decondensatie en binding van RNA polymerase aan de promotor. Repressor proteïnen binden aan andere controle elementen, wat de condensatie van chromatine in inhibitie van polymerase binding veroorzaakt. In deze chapter beschouwen we hoe activatoren en repressoren de chromatine structuur controleren en de transcriptie initiatie door RNA polymerase remmen of stimuleren. De meeste genen bij hogere eukaryoten worden gereguleerd door de controle van hun transcriptie Directe metingen van de transcriptiesnelheden van meerdere genen in verschillende celtypes heeft aangetoond dat de regulatie van transcriptie initiatie de meest verspreide vorm van gencontrole bij eukaryoten, net als bij bacteriën, is. Nascentchain analyse is een gebruikelijke methode voor de bepaling van de relatieve snelheid van transcriptie van verschillende genen in gekweekte cellen. Bij deze methode, ook run-on transcription analysis genoemd, worden geïsoleerde nuclei geïncubeerd met 32 P-gelabelde ribonucleoside trifosfaten voor een korte periode (vb 5min of minder). Tijdens deze incubatie periode bouwen RNA polymerase moleculen, die actief genen aan het afschrijven waren wanneer de nuclei geïsoleerd werden, enkele honderden gelabelde nucleotiden in in elke ontluikende (groeiende) RNA keten, maar slechts weinig initiatie van nieuwe ketens gebeurt. Het totaal van radioactieve label ingebouwd in het RNA is een maat voor de globale transcriptie snelheid. De fractie van het totale gelabelde RNA geproduceerd door de transcriptie van een bepaald gen dat wil zeggen zijn relatieve transcriptiesnelheid- wordt bepaald door hybridisatie van het gelabelde RNA met het gekloneerde DNA van dat gen gehecht aan een membraan. De resultaten van run-on transcriptie analysen geïllustreerd in figuur 11-2 tonen dat de transcriptie van genen coderend voor proteïne die specifiek in hepatocyten (het

belangrijkste celtype in de lever van zoogdieren) gemakkelijk te detecteren is in de nuclei afkomstig van de lever, maar niet in de nuclei van de hersenen of de nier. Aangezien de run-on transcriptie analyse de RNA synthese meet, duiden deze resultaten aan dat de diffrentiële synthese van lever-specifieke proteïnen gereguleerd wordt door de controle van de transcriptie van de overeenkomstige genen in de verschillende weefsels. Gelijkaardige resultaten van run-on transcriptie analysen zijn bekomen met andere celtypes en een brede variëteit aan weefsel specifieke eiwitten, wat er wijst dat de transcriptionele controle het primaire mechanisme van gencontrole is bij complexe organismen. Regulatorische elementen in eukaryotisch DNA zijn vaak vele kilobasen van de startsites verwijderd Bij eukaryoten net als bij bacteriën wordt een DNA sequentie die bepaalt waar een RNA polymerase bindt en de transcriptie van een gen initiëert een promotor genoemd. De transcriptie van een bepaalde promotor wordt gecontroleerd door DNA-bindings proteïnen, transcriptie factoren genoemd, die evenwaardig zijn aan bacteriële repressoren en activatoren. De DNA controle elementen in eukaryote genomen die transcriptiefactoren binden zijn echter vaak veel verder van de promotor gelokaliseerd die ze reguleren dan het geval is in prokaryotische genomen. In sommige gevallen binden de transcriptie factoren die de expressie van proteïnecoderende genen in hogere eukaryoten aan regulatorische sites die tienduizende baseparen upstream (tegengestelde richting van transcriptie) of downstream (zelfde richting als transcriptie)van de promotor af liggen. Als resultaat van deze ordening kan de transcriptie van een enkele promotor geregeld worden door de binding van meerdere transcriptiefactoren aan alternatieve controle elementen, wat een complexe controle van de genexpressie toelaat. Bijvoorbeeld: alternatieve transcriptie-controle elementen reguleren de expressie van het zoogdier gen dat codeerd voor transthyretine (TTR), dat thyroid hormoon transporteert in het bloed en het cerebrospinale vocht dat de hersenen en het ruggemerg omgeeft Transthyretine komt tot uitdrukking in hepatocyten, die de meeste bloedserumproteïne synthetiseren en secreteren en in de choroïde plexus cellen in de hersenen, die cerebrospinaal vocht en zijn bijhorende proteïnen secreteren. De controle elementen vereist voor de transcriptie van het TTR gen werden geïdentificeerd door de procedure geschetst op figuur 11-3. Bij deze experimentele aanpak werden DNA fragmenten met variërende grootten van upstream (vd start site) sequenties gekloneerd voor een reportergen in een bacteriële plasmide gebruik makend van recombinant DNA technieken. Reporter genen brengen enzymen tot uitdrukking die gemakkelijk geanalyseerd worden in celextracten. Veel gebruikte reportergenen omvatten het E. Coli lacz gen dat codeert voor β-galactosidase; het vuurvlieg gen coderend voor luciferase, dat energie van ATP hydrolyse omzet in licht en het kwal gen coderend voor groen fluorescent proteïne (GFP). Door de opbouw en analyse van 5 -deletie series upstream van het TTR gen identificeerden de onderzoekers twee controle elementen die de expressie van het reportergen stimuleerden in hepatocyten, maar niet in andere celtypes. Eén regio gelegen tussen +/-2,01 en 1,85 kb upstream van de TTR gen start site; de andere gelegen op tussen +/- 200 baseparen upstream en de startsite. Verdere studies toonden aan dat alternatieve DNA sequenties de TTR transcriptie in choroid plexus

cellen controleren. Dus reguleren de alternatieve controle elementen de transcriptie van het TTR gen in twee verschillende celtypes. We onderzoeken de basis moleculaire gebeurtenissen die onder deze eukaryotische transcriptionele controle liggen in latere secties. Drie eukaryote polymerasen katalyseren de vorming van verschillende RNA s De nuclei van alle eukaryote cellen tot nu toe onderzocht (vb vertebraat, Drosophila, gist en plantencellen) bevatten drie verschilllende RNA polymerasen, aangeduid als I, II en III. Deze enzymen worden bij verschillende zoutconcentraties geëlueerd tijdens ionen-wisselaar chromatografie en verschillen ook in hun gevoeligheid voor α- amanitine, een giftig cyclisch octapeptide geproduceerd door sommige paddestoelen. Polymerase I is zeer ongevoelig aan α-amanitine; polymerase II is zeer gevoelig en polymerase II heeft een middelmatige gevoeligheid. Elk eukaryotisch RNA polymerase katalyseert de transcriptie van genen coderend voor verschillende klassen van RNA. Rna polymerase I, gelokaliseerd in de nucleus, schrijft genen af coderend voor procursor rrna (pre-rrna), dat verwerkt wordt in 28S, 5,85S en 18S rrna s. RNApolymerase III schrijft genen af die coderen voor trna s, 5S rrna en een gamma aan kleine, stabiele RNA s, waaronder één betrokken in RNA splicing (U6) en de RNA component van het signaal-herkennend partikel (SRP) betrokken in de sturing van ontluikende proteïnen naar het endoplasmatisch reticulum. RNA polymerase II schrijft alle proteïne-coderende genen af; dat wil zeggen dat het functioneert in de productie van mrna s. RNA polymerase II produceert ook vier van de vijf kleine nucleaire RNA s die deelnemen in de RNA splicing. Elk van de drie eukaryote RNA polymerasen is complexer dan E. Coli RNA polymerase, hoewel hun structuren gelijkaardig zijn. Alle drie bevatten twee grote subeenheden en 10-14 kleinere subeenheden, waarvan sommigen aanwezig zijn in twee of alle drie de polymerasen. De best gekarakterisserde eukaryotische RNA polymerasen zijn deze van gist S. Cerevisiae. Elk van de gist genen coderend voor de polymerase subeenheden werd gekloond en de sequentie werd bepaald en de effecten van gen-knock-out mutaties werden gekarakteriseerd. Bovendien werd de driedimensionele structuur van gist RNA polymerase II, zonder twee nietessentiële subeenheden, bepaald. De drie nucleaire RNA polymerasen van alle eukaryoten tot nu toe onderzocht zijn zeer gelijkend op deze van gist. De twee grote subeenheden (RPB1 en RPB2) van de drie eukaryote RNA polymerasen zijn verwant aan elkaar en zijn gelijkend op respectievelijk de E. Coli β en β subeenheden. Elk van de eukaryotische polymerasen bevat ook een ω-achtige en twee niet-identieke α-achtige subeenheden. De grote gelijkaardigheid in de structuren van deze kern subeenheden in RNA polymerasen van verschillende bronnen duidt aan dat dit enzyme vroeg in de evolutie ontstond en grotendeels bewaard bleef. Dit lijkt logisch voor een enzyme dat een proces katalyseert dat zo basis is als het copiëren van RNA vanaf DNA. Naast hun kernsubeenheden verwant aan de E. Coli RNA polymerase subeenheden, bevatten alle drie gist RNA polymerasen vier bijkomende kleine subeenheden, gemeen aan elkaar(?????) maar niet aan het bacteriële RNA polymerase. Tenslotte heeft elke eukaryotisch polymerase verschillende enzyme-specifieke subeenheden die niet aanwezig zijn in de andere twee polymerasen. Gen-knockout experimenten in gist duiden aan dat de meeste van deze subeenheden essentiëel zijn voor de

leefbaarheid van de cel. Vernietiging van enkele polymerase subeenheid genen die niet absoluut essentiëel zijn voor de leefbaarheid resulteert des al niet te min in zeer zwak groeiende cellen. Dus lijkt het dat alle subeenheden noodzakelijk zijn opdat eukaryoot RNA polymerasen normaal functioneren. De grootste subeenheid in RNA polymerase II heeft een essentiële carboxylterminale herhaling Het carboxyl einde van de grootste subeenheid van RNA polymerase II (RPB1) bevat een stukje van zeven aminozuren op bijna precies herhaalde meerdere tijden. Noch RNA polymerase I noch III bevatten deze herhaarlde eenheden. Deze heptapeptide herhaling, met een consensus sequentie Tyr-Ser-Pro-Thr-Ser-Pro-Ser, is gekend als het carboxyl-terminale domein (CDT). Gist RNA polymerase II bevat 26 of meer herhalingen, het zoogdierlijke enzyme heeft 52 herhalingen en een tussenliggend aantal herhalingen komt voor in RNA polymerase II van bijna alle andere eukaryoten. Het CDT is cruciaal voor de leefbaarheid en tenminste 10kopie van de herhaling moeten aanwezig zijn opdat gist kan overleven. In vitro experimenten met model promotoren toonde eerst dat RNA polymerase II moleculen die de transcriptie initiëren een niet-gefosforyleerd CTD hebben. Eens het polymerase de transcriptie initiëert en weg begint te bewegen van de promotor, worden vele van de serine en sommige tyrosine residu s in het CDT gefosforyleerd. Analyse van polyteen chromosomen van Drosophila speeksel klieren geprepareerd juist voor de popping van de larve duiden aan dat het CDT ook gefosforyleerd wordt tijdens in vivo transcriptie. De grote chromosomale puffs op dit moment in de ontwikkeling begonnen waar het genoom zeer actief afgeschreven wordt. (?????) Kleuring met antilichamen specifiek voor het gefosforyleerde of niet-gefosforyleerde CTD toonde aan dat RNA polymerase II geasscoieerd met de sterk afgeschreven opgeblazen(puffed) regio s bevat een gefosforyleerd CTD. RNA polymerase II initieert de transcriptie aan DNA sequenties overeenkomend met de 5 cap van mrna s Verschillende experimentele benaderingen zijn gebruikt geweest om DNA sequenties te identificeren aan dewelke RNA polymerase II de transcriptie initiëert. Benaderende plaatsbepaling van de transcriptie start sit is mogelijk door de blootstelling van gekweekte cellen of geïsoleerde nuclei aan 32 P-gelabelde ribonucleotiden voor zeer korte tijden, zoals vroeger beschreven. Nadat de resulterende gelabeld ontluikende transcripten gescheiden worden op basis van hun ketenlengte, wordt elke grootte fractie geïncubeerd onder hybridisatie condities met overlappende restrictie fragmenten die de DNA regio van interesse omgeven. Het restrictie fragment dat hybridiseert aan de korste gelabelde ontluikende keten, net als aan al de langere ketens, bevat de transcriptie start site. Eén van de eerste transcriptie eenheden om geanalyseerd te worden op deze manier was de belangrijke late (?) transcriptie eenheid van het adenovirus. Deze analyse duidde aan dat de transcriptie geïnitieerd werd in een regio ongeveer 6kb van het linker einde van het viraal genoom. Het precieze basepaar waar RNA polymerase II de transcriptie in de adenovirus late transcriptie eenheid initieerd werd bepaald door de analyse van de RNA s gesynthetiseerd tijdens in vitro transcriptie van adenovirus DNA restrictie fragmenten die ietswat upstream en dowstream uitsteken van de benaderde initiatie regio bepaad door ontluikende-transcript analyse. Het grondgedachte van dit experiment

en de typische resultaten worden geïllustreerd in figuur 11-8. De RNA transcripten gesynthetiseerd in vitro door RNA polymerase II vanaf de start site bepaald in dit experiment bevatte een RNA cap structuur identiek aan deze aanwezig aan het 5 einde van bijna alle eukaryote mrna s. Deze 5 cap was toegevoegd door enzymen in het nucleaire extract, die enkel een cap kunnen toevoegen aan een RNA dat een 5 tri- of difosfaat heeft. Vermits een 5 einde geleverd door klieving van een langer RNA een 5 monofosfaat zou hebben, zou het niet gecapt kunne worden. Bijgevolg besloten onderozkers dat het gecapte nucleotide voortgebracht bij de in vitro transcriptie reactie het nucleotide moest zijn met dewelke de transcriptie geïniteerd was. De bevinding dat de sequentie aan de 5 einden van de RNA transcripten geproduceerd in vitro dezelfde is als aan het 5 einde van late adenovirus mrna s geïsoleerd van cellen bevestigde dat het gecapte nucleotide van adenovirus late mrna s samenvalt met de transcriptie-initiatie site. Gelijkaardige in vitro transcriptie analysen met andere gekloneerde eukaryote genen hebben gelijkaardige resultaten opgeleverd. In elk geval was de start site gevonden gelijk aan de gecapte 5 sequentie van het overeenkomstige mrna. Dus begint de synthese van eukaryote precursoren van mrna s door RNA polymerase II aan de DNA sequentie coderend voor het het gecapte 5 einde van het mrna. Vandaag wordt dat de transcriptie start site voor een pas gekarakteriseerd mrna gewoonlijk bepaald door simpelweg de DNA sequentie te identificeren die codeert voor het 5 einde van het mrna. KEY CONCEPTS OF SECTION 11.1 Overzicht van eukaryote gen controle en RNA polymerasen Het primaire doel van gencontrole in meercellige organismen is de uitvoering van precieze ontwikkelings beslissingen zodat de gepaste genen tot uitdrukking komen in de juiste cellen tijdens de ontwikkeling en cellulaire diffrentiatie. Transcriptionele controle is het primaire middel voor de regulatie van genexpressie in eukaryoten, net als in bacteriën. In eukaryote genomen kunnen DNA transcriptie controle elementen vele kilobasen verwijderd van de promotor die ze reguleren verwijderd zijn. Verschillende controle regio s kunnen de transcruiptie van het zelfde gen in verschillende celtypes controleren. Eukaryoten bevatten drie soorten nucleaire RNA polymerasen. Alle drie bevatten twee grote en drie kleinere kern subeenheden met homologie aan de β, β, α en ω subeenheden van E. Coli RNA polymerase, net als verschillende bijkomende kleine subeenheden. RNA polymerase I synthetiseert enkel pre-rrna. RNA polymerase II synthetiseert mrna s en bepaalde kleine nucleiare RNA s die deelnemen in mrna splicing. RNA polymerase III synthetiseert trna s, 5S rrna en verschillende andere relatief korte stabiele RNA s. Het carboxyl-terminale domein (CTD) in de grootste subeenheid van RNA polymerase II wordt gefosforyleerd tijdens de transcriptie initiatie en blijft gefosforyleerd als het enzyme de matrijs afschrijft. RNA polymerase II initieert de transcriptie van genen aan de nucleotiden in de DNA matrijs die overeenkomt met de 5 nucleotide die gecapt wordt in het gecodeerde mrna. (????)

11.2 Regulatorische sequenties in proteïne-coderende genen Zoals vermeld in de vorige sectie wordt de expressie van eukaryote proteïnecoderende genen gereguleerd door meerdere proteïne-bindende DNA sequenties, in het algemeen naar verwezen als transcriptie-controle regio s. Deze omvatten promotoren en andere soorten van controle elementen gelokaliseerd nabij de transcriptie start siten, net als sequenties gelokaliseerd ver weg van de genen die ze reguleren. In deze sectie bekijken we de eigenschappen van de verschillende controle-elementen gevonden in eukaryote proteïne)coderende genen en bepaalde technieken die gebruikt worden om hen te identificeren. De TATA box, iniatoren en CpG eilanden functioneren als promotors in eukaryotisch DNA De eerste genen, waarvan de sequentie bepaald werd en die bestudeerd waren in in vitro transcriptie systemen, waren virale genen en cellulaire proteïne-coderende genen die zeer actief afgeschreven werden ofwel op welbepaalde momenten in de celcyclus ofwel in specifiek gediffrentiëerde celtypes. In al deze snel afgeschreven genen werd een bewaarde sequentie, de TATA-box genaamd, ongeveer 25-35 bp upstream van de startsite gevonden. Mutagenese studies hebben aangetoond dat een enkel-base verandering in deze nucleotide sequentiedrastische verlagingen in vitro transcriptie door RNA polymerase II van de genen grenzend aan een TATA-box teweeg brengt. In de meeste gevallen beïnvloeden sequentie veranderingen tussen de TATA-box en de startsite de transcriptie snelheid niet aanzienlijk. Als de bp tussen de TATA-box en de normale startsite verwijderd worden, begint de transcriptie van de gewijzigde, verkorte matrijs aan een nieuwe site ongeveer 25bp downstream van de TATA-box. Als gevolg werkt de TATA-box op een gelijkaardige manier als een E. Coli promotor om RNA polymerase II te positioneren voor de transcriptie initiatie. In plaats van een TATA-box bevatten bepaalde eukaryote genen een alternatief promotor element, een initiator genoemd. De meeste natuurlijk voorkomende initiator elementen hebben een cytosine (C) aan de 1 positie en een adenine (A) residu aan de transcriptie start site (+1).Gerichtte mutagenese van zoogdier genen met een initiator-bevattende promotor heeft onthuld dat de nucleotide sequentie die de start site onmiddelijk omgeeft de sterkte bepaalt van zulke promotoren. In tegenstelling tot de bewaarde TATA-box sequentie is er echter slechts een extreem gedegenereerde initiator consensus sequentie bepaald: (5 ) Y-Y-A +1 -N-T/A-Y-Y-Y(3 ) waar A +1 de base is aan dewelke de transcriptie start, Y is een pyrimidine (C of T), N is één van de vier basen en T/A is T of A op positie +3. De transcriptie van genen met promotoren die een TATA-box of initiator element bevat, begint aan een welbepaalde initiatie site. De transcriptie van vele proteïnecoderende genen werd echter aangetoond te beginnen aan één van de meerdere mogelijke sites over een uitgestrekte regio, vaak 20-200 bp in lengte. Als resultaat geven zulke genen het ontstaan aan mrna s met meerdere alternatieve 5 einden. Deze genen, die in het algemeen aan lage snelheden worden afgeschreven (vb genen coderend voor enzymen van het intermediaire metabolisme, vaak housekeeping genen genoemd) bevatten geen TATA-box of initiator. De meeste genen van deze soort bevatten een CG-rijk stuk van 20-50 nucleotiden binnen de +/- 100bp upstream van de startsite regio. Het dinucleotide CG wordt statistisch

ondervertegenwoordigd in vertebraat DNA s en de aanwezigheid van een CG-rijke regio, of CpG eiland, juist upstream van een start site is een duidelijke nietwillekeurige distributie. Voor deze reden suggereert de aanwezigheid van een CpG eiland in genomisch DNA dat het een transcriptie-initiatie regio kan bevatten. Promotor-proximale elementen helpen eukaryote genen te reguleren Recombinant DNA technieken werden gebruikt de nucleotide sequenties upstream van de start siten van de verschillende eukaryote genen systematisch te muteren om de transcriptie-controle regio s te identificeren. Tot nu toe werden honderden eukaryote genen geanalyseerd en scores(?) van transcriptie-controle regio s werden geïdentificeerd. Naar deze controle-elementen, samen met de TATA-box of initiator wordt vaak naar verwezen als de promotor van het gen die ze reguleren. Wij verkiezen echter de term promotor te reserveren voor de TATA-box of de initiator sequenties die de initiatie site bepalen in de matrijs. We gebruiken de term promotor-proximale elementen voor de controle regio s liggend binnen de 100-200 bp upstream van de startsite. In sommige gevallen zijn de promotor-proximale elementen cel-type specifiek; dat wil zeggen dat ze enkel functioneren in specifieke gediffrentiëerde celtypes. Eén frequent genomen aanpak om de upstream grens te bepalen van een transcriptie-controle regio voor een zoogdierlijk gen heeft betrekking op de constructie van een set van 5 deleties zoals vroeger besproken. Eens de 5 grens van een transcriptie-controle regio bepaald is, kan de analyse van linker scanning mutaties de sequenties met regulatorische functies die liggen tussen de grens en de transcriptie start-site uiterst precies aanduiden. Bij deze aanpak wordt een set van constructies met opeenvolgende overlappende mutaties geanalyseerd voor hun effect op de expressie van een reporter gen of de productie van een specifiek mrna. Eén van de eerste gebruiken van dit soort analyse identificeerde de promotorproximale elementen van het thymidine kinase (tk) gen van het herpes simplex virus (HSV). De resultaten toonden aan dat de DNA regio upstream van het HSV tk gen drie gescheiden transcriptie-controle sequenties bevat: een TATA-box in het interval van 32 tot 16 en twee andere controle elementen verder upstream. Om de spatie beperkingen van de controle elementen in de HSV tk promotor regio geïdentificeerd door analyse van linker scanning mutaties te testen, vervaardigde en analyseerde de onderzoekers constructies die kleine deleties en inserties bevatten tussen de elementen. Veranderingen in de tussenliggende ruimten tussen de promotor en de promotor-proximale controle-elementen van 20 nucleotiden of minder hadden weinig effect. Inserties van 30 tot 50 bp tussen een promotor-proximaal element en de TATA box was echter gelijkwaardig aan de deletie van het element. Gelijkaardige analysen van andere eukaryote promotoren hebben ook aangeduid dat de aanzienlijke flexibiliteit in de tussenruimte tussen promotor-proximale elementen in het algemeen getolereerd wordt, maar scheidingen van verschillende tientallen bp kunnen de transcriptie verlagen (of verhogen bij remmers). Distant enhancers stimuleren vaak de transcriptie door RNA polymeraseii Zoals vroeger vermeld kan de transcriptie van vele eukaryote promotoren gestimuleerd worden door controle elementen 1000den bp van de start site verwijderd. Zulke lange afstands transcriptie-controle elementen, naar verwezen als enhancers, zijn gewoon in eukaryote genomen maar tamelijk zeldzaam in bacteriële

genomen. De eerst ontdekte enhancer die de transcriptie van eukaryote genen stimuleerde bevond zich in rrn 366-bp fragment van het simian virus 40 (SV40) genoom. Verdere analyse van deze regio van SV40 DNA onthulde dat een +/- 100- bp sequentie +/- 100 bp upstream liggend van de SV40 vroege transcriptie start site verantwoordelijk was voor zijn vermogen de transcriptie te versterken. Bij SV40 functioneert deze enhancer sequentie om de transcriptie van virale promotoren te stimuleren. De SV40 enhancer stimuleert echter de transcriptie van alle zoogdierlijke promotoren die getest werden wanneer het geïnserteerd wordt in één van beide richtingen ergens in een plasmide dat de test promotor draagt, zelfs wanneer het duizenden bp van de start site verwijderd is. Een uitvoerige linker scanning mutationele analyse van de SV40 enhancer duidde aan dat hij samengesteld is uit meerdere individuele elementen, die elk bijdragen tot de totale activiteit van de enhancer. Zoals later bepsproken is elk van deze regulatorische elementen een proteïne bindende site. Snel na de ontdekking van de SV40 enhancer werden enhancers geïdentificeerd in andere virale genomen en in eukaryotisch cellulair DNA. Sommige van deze controle-elementen waren gelokaliseerd op 50 of meer kilobasen van de promotor die ze controleerden. Analysen van vele verschillende eukaryote cellulaire enhancers hebben aangetoond dat ze upstream van een promotor, downstream van een promotor, downstream van een promotor in een intron of zelfs downstream van het finale exon kunnen voorkomen. Zoals de promotor-proximale elementen zijn vele enhancers cel-soort-specifiek. Bijvoorbeeld: de genen coderend voor antilichamen (immunoglobulines) bevatten een enhancer binnen de tweede intron die de transcriptie kan stimuleren van alle getestte promotoren, maar enkel in B lymfocyten, het celtype dat normaal antilichamen tot uitdrukking brengt. Analysen van de effecten van deleties en linker scanning mutaties in cellulaire enhancers hebben aangetoond dat ze, zoals de SV40 enhancer, gewoonlijk samengesteld zijn uit meerdere elementen die bijdragen tot de globale activiteit van de enhancer. De meeste eukaryote genen worden gereguleerd door meerdere transcriptie-controle elementen Initieel dacht men dat enhancers en promotor-proximale elementen verschillende soorten transcriptie-controle elementen waren. Als meer enhancer en promotorproximale elementen geanalyseerd waren werden de verschillen tussen hen echter minder duidelijk. Bijvoorbeeld: beide soorten elementen kunnen in het algemeen de transcriptie stimuleren zelfs wanneer omgedraaid worden en beide soorten zijn vaak cel-type-specifiek.de generale consensus is nu dat een spectrum van controle elementen de transcriptie door RNA polymerase II reguleert. Aan het ene uiteinde vindt men de enhancers, die de transcriptie kunnen stimuleren van een promotor die 10duizenden bp verwijderd is (vb de SV40 enhancer). Aan het andere uiteinde vindt men de promotor-proximale elementen, zoals de upstream elementen die het HSV tk gen controleren, die hun invloed verliezen wanneer ze een 30-50bp verder verwiderd worden van de promotor. Onderzoekers hebben een groot aantal transcriptiecontrole elementen geïdentificeerd die de transcriptie kunnen stimuleren vanop afstanden tussen deze twee extremen. Figuur 11-12a vat de lokaties van transcriptie controle sequenties voor een hypothetisch zoogdierlijk gen samen. De start site aan de welke de transcriptie begint, codeert het eerste (5 ) nucleotide van de eerste exon van een mrna, het

nucleotide dat gecapt wordt. Voor vele genen, vooral deze die overvloedig uitgedrukte eiwitten coderen, dirigeert een TATA-box gelokaliseerd op ongeveer 25-35 bp upstream van de start site het RNA polymerase II de transcriptie te beginnen aan het gepaste nucleotide. Promotor-proximale elementen, die relatief kort zijn (+/- 10-20bp) zijn gelokaliseerd binnen de eerste +/- 200bp upstream van de start site. In tegenstelling daarmee zijn enhancers gewoonlijk +/-100 bp lang en zijn ze samengesteld uit meerdere elementen van +/-10-20 bp. Enhancers kunnen gelokaliseerd zijn tot 50kilobasen upstream of downstream van de start site of binnen een intron. Vele zoogdierlijke genen worden gecontroleerd door meer dan één enhancer regio. Het S. Cerevisiae genoom bevat regulatorische elementen, upstream activating sequences (UAS s) genoemd, die functioneren op een gelijkaardige manier als de enhancers en promotor-proximale elementen bij hogere eukaryoten. De meeste gistgenen bevat enkel één UAS, dat gewoonlijk binnen een weinig 100den bp van de start site ligt. Bovendien bevat S. Cerevisiae een TATA box +/-90 bp upstream van de transcriptie start site. KEY CONCEPS OF SECTION 11.2 Regulatorische sequenties in proteïne-coderende genen De expressie van eukaryotische proteïne-coderende genen wordt in het algemeen gereguleerd via meerdere proteïne-bindende controle regio s die dicht of ver van de start site gelokaliseerd zijn. Promotoren dirigeren de binding van RNA polymerase II aan DNA, bepalen de site van transcriptie initiatie en beïnvloeden de transcriptie snelheid. De drie principiële types van promotor sequenties werden geïdentificeerd in ekaryotisch DNA. De TATA-box, de meest algemene, is overheersend aanwezig in snel afgescreven genen. Initiator promotoren worden gevonden in bepaalde genen en CpG eilanden zijn typisch voor genen die aan een lage snelheid afgeschreven worden. Promotor-proximale elementen komen voor binnen +/- 200bp upstream van een start site. Verschillende zulke elementen, zo n 10-20 bp bevattend, kunnen een bepaald gen helpen reguleren. Enhancers, die meerdere korte controle elementen bevatten, kunnen gelokaliseerd zijn van 200bp tot tientallen kilobasen upstream of downstream van een promotor, in een intron of downstream van de finale exon van een gen. Promotor-proximale elementen en enehancers zijn vaak cel-type-specifiek, enkel functionerend in specifiek gediffrentieerde celtypes. Bp=baseparen 11.3 activatoren en repressoren van transcriptie De verschillende transcriptie-controle elementen gevonden in eukaryotisch DNA zijn bindings siten voor regulatorische proteïnen. In deze sectie bespreken we de identificatie, opzuivering en structuren van deze transcriptie factoren, die functioneren om de expressie van eukaryote proteïne-coderende genen te activeren of te onderdrukken. Footprinting en gel-shift analysen detecteren proteïne-dna interacties

In gist, Drosophila en andere genetisch goed te bewerken eukaryoten werden reeds vele genen coderend voor transcriptionele activatoren en repressoren geïdentificeerd door klassieke genetische analyses zoals deze beschreven in chapter9. Bij zoogdieren en andere vertebraten, die minder ontvankelijk zijn voor zulke genetische analysen, werden de meeste transcriptie factoren eerst gedetecteerd en daarna opgezuiverd door biochemische technieken. In deze aanpak wordt een DNA regulatie element dat werd geïdentificeerd door de soorten mutationele analysen beschreven in de vorige sectie gebruikt om de cognate proteïnen te identificeren die er specifiek aan binden. Twee algemene technieken voor de opsporing van zulke cognate proteïnen zijn DNase I footprinting en de elektroforetische mobility shift analyse. DNase I footprinting neemt zijn voordeel uit het feit dat wanneer een eiwit gebonden is aan een regio van DNA, het de DNA regio beschermd tegen vertering door nucleasen. Zoals geïllustreerd in figuur 11-13, wanneer stalen van een DNa fragment die gelabeld is aan één einde worden verteerd in de aan- en afwezigheid van een DNA-bindings proteïne en dan gedenatureerd, geëlektroforeesd en de resulterende gel onderworpen aan autoradigrafie, de regio beschermd door het gebonden proteïne verschijnt als een gat of footprint in de serie van banden resulterend van de vertering in de afwezigheid van het proteïne. Wanneer footprinting wordt uitgevoerd met een DNA fragment dat een gekend DNA controle element bevat, duidt het verschijnen van een footprint op de aanwezigheid van een transcriptie factor, die bindt aan dat controle-element, in het proteïne staal dat geanalyseerd wordt. Footprinting identificeert ook de specifieke DNA sequentie waaraan de transcriptie factor bindt. De elektroforetische mobiliteit shift assay (EMSA), ook de gel-shift of band-shift analyse genoemd, is praktischer dan de footprint analyse voor de kwantitatieve analyse van DNA-bindende proteïnen. In het algemeen wordt de elektroforetische mobiliteit van een DNA fragment verlaagd wanneer het een complex gevormd heeft met een proteïne, wat een shift in de locatie van de fragment band veroorzaakt. Deze analyse kan gebruikt worden om een transcriptie factor in proteïne fracties geïncubeerd met een radiogelabelde DNA fragment (dat een gekend controle element bevat) op te sporen. Bij de biochemische isolatie van een transcriptie factor wordt een extract van celnucleus gewoonlijk opeenvolgend onderworpen aan verschillende soorten kolom chromatografie. Geëlueerde fracties van de kolommen worden geanalyseerd door DNase I footprinting of EMSA gebruik makend van DNA fragmenten die een geïdentificeerde regulatorisch element bevatten. Fracties die een proteïne bevatten dat bindt aan het regulatorische element in deze analysen bevatten waarschijnlijk een vermeende transcriptie factor. Een krachtige techniek meestal gebruikt voor de finale stap in de opzuivering van transcriptie factoren is de sequentiespecifieke DNA affiniteitchromatografie, een bepaalde soort van affiniteitchromatografie in dewelke lange DNA strengen die meerdere kopies van de transcriptie factorbinding site bevatten gekoppeld worden aan een kolommatrix. Als finale test dat een geïsoleerd proteïne in feite een transcriptie factor is, wordt zijn vermogen de transcriptie van een een matrijs die de overeenkomstige proteïne-bindings sites bevat geanalyseerd in een in vitro transcriptie reactie. Figuur 11-15 toont de resultaten van zulke analyse

voor SP1, een transcriptiefactor die bindt aan GC-rijke sequenties, daarbij de transcriptie activerend van nabijgelegen promotoren. Activatoren zijn modulaire proteïnen samengesteld uit verschillende functionele domeinen Studies met een gist transcriptie activator, GAL4 genoemd, leverde vroeg inzicht in de domein structuur van transcriptie factoren. Het gen coderend voor het GAL4 proteïne, dat de expressie van enzymen nodig om galactose te metaboliseren promoot, was geïdentificeerd door complementatie analyse van gal4 mutanten. Gestuurde mutagenese studies zoals deze vroeger beschreven identificeerde UAS s voor de genen geactiveerd door GAL4. Elk van deze UAS s bleek één of meer kopies van een verwante 17-bp sequentie, UAS GAL genoemd, te bevatten. DNase I footprinting analysen met recombinant GAL4 proteïne geproduceerd in E. coli vanaf het gist GAL4 gen toonde dat Gal4 proteïne bindt aan UAS GAL sequenties. Wanneer een kopie van UAS GAL gekloneerd was upstream van een TATA-box gevolgd door een lacz reporter gen, was de expressie van lacz geactiveerd in galactose media in wild-type cellen, maar niet in gal4 mutanten. Deze resultaten toonde dat UAS GAL een transcriptiecontrole element is geactiveerd door het GAL4 proteïne in galactose media. Een opmerkelijke set van experimenten met gal4 deletie mutanten toonde aan dat de GAL4 transcriptie factor wordt samengesteld uit scheidbare functionele domeinen: een N-terminaal DNA-bindings domein, dat bindt aan specifieke DNA sequenties en een C-terminaal activatie domein, dat interageert met andere proteïnen om de transcriptie te stimuleren van een nabijgelegen promotor. Wanneer het N-terminale DNA-bindings domein van GAL4 direct gefuseerd werd aan verschillende van zijn C- terminale fragmenten, behielden de resulterende afgeknotte proteïnen het vermogen de expressie van een reporter gen te stimuleren in een in vivo analyse zoals datgene geschets in figuur 11-16. Dus is het interne deel van het eiwit niet vereist voor het functioneren van GAL4 als transcriptie factor. Gelijkaardige experimenten met een andere gist transcriptie factor, GCN4, die de genen reguleert die vereist zijn voor de synthese van vele aminozuren, duidde aan dat het een +/- 60-aa DNA bindings domein aan zijn C-terminus bevat en een +/- 20-aa activatie domein dicht bij het midden van zijn sequentie. Verder bewijs voor het bestaan van verschillende activatie domeinen in GAL4 en GCN4 kwamen van experimenten in dewelke hun activatie domeinen gefuseerd werden aan een DNA-bindingsdomein van een geheel onverwant E. coli DNAbindings proteïne. Wanneer deze fusie proteïnen geanalyseerd werden in vivo, activeerden ze de transcriptie van een reportergen dat de cognate site van het E. coli proteïne bevatte. Dus de functionele transcriptie factoren kunnen geconstrueerd worden van geheel nieuwe combinaties van prokaryote en eukaryote elementen. Studies zoals deze zijn uitgevoerd met vele eukaryote activatoren. Het structurele model van eukaryote activatoren dat afgeleid is van deze studies is een modulair model in dewelke één of meer activatie domeinen verbonden zijn met een sequentiespecifiek DNA-bindings domein via flexibele proteïne domeinen. In sommige gevallen dragen de aminozuren in het DNA-bindings domein ook bij tot de transcriptionele activatie. Zoals besproken in latere sectie dacht men dat activatie domeinen functioneerden door de binding van andere proteïnen betrokken in de transcriptie. De aanwezigheid van flexibele domeinen die de DNA-bindings domeinen

verbinden aan de activatie domeinen kunnen verklaren waarom veranderingen in de tussenruimte tussen controle elementen zo goed getolereerd worden in eukaryotische controle regio s. Dus zelfs wanneer de posities van transcriptie factoren gebonden aan DNA verschoven worden ten opzichte van elkaar, kunnen hun activatie domeinen nog in staat zijn te interageren omdat ze vastgehecht zijn met hun DNA-bindings domeinen via flexibele proteïne regio s. Repressoren zijn de functionele tegenhangers van activatoren De eukaryote transcriptie wordt gereguleerd door repressoren net als door activatoren. Bijvoorbeeld: genetici hebben mutaties in gist geïdentificeerd die resulteren in voortdurende hoge expressie van bepaalde genen. Deze soort van ongeregelde, abnormaal hoge expressie wordt constitutieve expressie genoemd en resulteert door de inactivatie van een repressor die normaal gezien de transcriptie van deze genen remt. Gelijkaardig zijn mutanten van Drosophila en C. elegans geïsoleerd die gebrekig zijn in de embryologische ontwikkeling omdat zegenen in embryologische cellen tot uitdrukking brengen waar ze normaal onderdrukt zijn. De mutaties in deze mutanten inactiveren repressoren, wat leidt tot abnormale ontwikkeling. Repressor-bindings sites in DNA werden geïdentificeerd door systematische linker scanning mutatie analysen gelijkaardig aan deze geschetst in figuur 11-10. IN dit soort analyse leidt de mutatie van een activator-bindings site tot een verlaagde expressie van een reporter gen. Repressor proteïnen die binden aan zulke sites kunnen opgezuiverd worden en geanalyseerd gebruik makend van dezelfde biochemische technieken als vroeger beschreven voor activator proteïnen. Eukaryotische transcriptie repressoren zijn de functionele tegenhangers van de activatoren. Ze kunnen de transcriptie van een gen inhibiteren dat ze normaal gezien niet reguleren wanneer hun cognate bindings sites geplaatst worden binnen enkele honderden bp van de startsite van het gen. Zoals activatoren zijn de meeste eukaryote repressoren modulaire proteïnen die twee functionele domeinen hebben: een DNA bindings domein en een repressie domein. Zoals activatie domeinen functioneren repressie domeinen verder wanneer ze gefuseerd worden aan een ander soort DNA bindings domein. Als bindings sites voor dit tweede DNA-bindings domein ingevoegd worden binnen enkele honderden bp van een promotor, remt de expressie van de fusie de transcriptie van de promotor. Ook zoals activatie domeinen functioneren repressie domeinen door interacties met andere proteïnen zoals later besproken zal worden. De afwezigheid van gepaste repressor activiteit kan verwoestende gevolgen hebben. Bijvoorbeeld: het proteïne gecodeerd door de Wilms tumor (WT1) gen is een repressor die preferentieel uitgedrukt wordt in de ontwikkelende nier. Kinderen die mutaties in zowel de maternale als paternale WT1 genen erven, zodat ze geen functioneel WT1 proteïne produceren, ontwikkelen onveranderlijk niertumoren vroeg in hun leven. Het WT1 proteïne bindt aan de controle regio van het gen coderend voor een transcriptie activator, EGR-1 genoemd. Dit gen, zoals vele andere eukaryote genen, is onderwerp van zowel repressie als activatie. Binding door WT1 onderdrukt de transcriptie van het EGR-1 gen zonder de binding van activatoren te onderdrukken die normaal de expressie van dit gen stimuleren.

DNA-bindings domeinen kunnen opgedeeld worden in vele structurele soorten De DNA-bindings domeinen van eukaryote activatoren en repressoren bevatten een variëteit aan structurele motieven die binden aan specifieke DNA sequenties. Het vermogen van DNA-bindings proteïnen te binden aan specifieke DNA sequenties resulteert meestal van niet-covalente interacties tussen atomen in een α helix in de DNA-bindings domein en atomen aan de randen van de basen in een major groeve in het DNA. Interacties met suiker-fosfaat ruggegraat atomen en in sommige gevallen met atomen in een DNA minor groeve dragen ook bij tot de binding. De principes van specifieke proteïne-dna interacties werden voor het eerst ontdekt tijdens de studie van bacteriële repressoren. Vele bacteriële repressoren zijn dimerische proteïnen in dewelke een α helix van elke monomeer invoegt in een major groeve in de DNA helix. Deze α helix wordt de recognitie helix of sequentiereading helix genoemd omdat de meeste van de aminozuurzijketens die contact hebben met DNA uit deze helix uitsteken. De herkennings helix die uitsteken van het oppervlak van bacteriële repressoren om de DNA major groeve binnen te treden en meerdere, specifieke interacties te maken met atomen in het DNA wordt gewoonlijk ondersteund in de proteïne structuur in deel door hydrofobe interacties met een tweede α helix er juist N-terminaal aan. (????) Dit structurele element, dat aanwezig is in vele bacteriële repressoren, wordt een helix-turn-helix motief genoemd. Vele bijkomende motieven die een α helix kan presenteren aan de major groeve van DNA worden gevonden in eukaryote transcriptie factoren, die vaak opgedeeld worden volgens het soort DNA-bindings domeinen die ze bevatten. Omdat de meeste van deze motieven karakteriserende consensus aminozuur sequenties hebben, kunnen vers gekarakteriseerde transcriptie factoren vaak geklasseerd worden eens de overeenkomstige genen of cdna s gekloneerd zijn en de sequentie bepaald is. De genomen van hogere eukaryoten coderen voor dozijnen klasses van DNA bindings domeinen en honderden tot duizenden transcriptie factoren. Het humane genoom, bijvoorbeeld, codeert voor +/- 2000 transcriptie factoren. Hier introduceren we enkele veel voorkomende klassen van DNA bindings proteïnen wiens driedimensionale structuren bepaald zijn. IN al deze voorbeelden en vele andere transcriptie factoren, is er tenminste één α helix ingevoegd in een major groeve van DNA. Sommige transcriptie factoren bevatten echter alternatieve structurele motieven (vb β strengen en lussen) die interageren met DNA. Homeodomein proteïnen Vele eukaryote transcriptie factoren die functioneren tijdens de ontwikkeling bevatten een bewaarde 60-residue DNA-bindings motief dat gelijkaardig is aan het helix-turn-helix motief van bacteriële repressoren. Homeodomein proteïnen genoemd waren deze transcriptie factoren de eerste geïdentificeerde in Drosofila mutanten in dewelke één lichaamsdeel getransformeerd was in een ander tijdens de ontwikkeling. De bewaarde homeodomezin sequentie werd ook gevonden in vertebraat transcriptie factoren, waaronder deze die een gelijkaardige master controle functie hebben in de menselijke ontwikkeling. Zink-vinger proteïnen Een aantal verschillende eukaryote proteïnen hebben regio s die vouwen rond een centraal Zn2+ ion, een compact domein producerend van een

relatief korte lengte van de polypeptide keten. Een zinkvinger genoemd werd dit structurele motief voor het eerst herkend in DNA-bindings domeinen maar nu is gekend dat ze ook voorkomen in proteïnen die niet binden aan DNA. Hier beschrijven we twee van de verschillende klassen zinkvinger motieven die geïdentificeerd zijn in eukaryote transcriptie factoren. De C2H2 zinkvinger is het meest voorkomende DNA-bindings motief gecodeerd in het humane genoom en de genomen van de meeste andere meercellige dieren. Het is ook algemeen in meercellige planten, maar het is niet het dominante soort van DNA-bindings domein in planten zoals het is in dieren. Dit motief heeft een 23- tot 26 residue consensus sequenties die twee bewaarde cysteïne en twee bewaarde histidine (H) residu s bevat, wiens zijketen één Zn2+ ion binden. De naam zinkvinger was verzonnen omdat een tweedimensioneel diagram van de structuur op een vinger leek. Wanneer de driedimensionale structuur opgelost was, werd duidelijk dat de binding van het Zn2+ ion door de twee cysteïne en twee histidine residu s het relatief korte polypeptide vouwt in een compact domein, dat kan een α helix ingevoegd in de major groeve van DNA zijn. Vele transcriptie factoren bevatten meerdere C2H2 zinkvingers, die interageren met opeenvolgende groepen van bp binnen de major groeve zoals de proteïnen de rond de DNA dubbele helix omgeslagen liggen. Een tweede soort zinkvinger structuur, aangeduid als de C4 zinkvinger (omdat het vier bewaarde cysteïne in contact staan met het Zn2+), wordt gevonden in +/- 50 humane transcriptie factoren. De eerste leden van deze klasse waren geïdentificeerd als specifieke intracellulaire hoge-affiniteits bindings proteïnen, of receptoren, voor steroïd hormonen, leiden tot de naam steroïd receptor superfamilie. Vermits gelijkaardige intracellulaire receptoren voor niet-steroïd hormonen later werden gevonden, worden deze transcriptie factoren nu gewoonlijke nucleaire receptoren genoemd. Het karakteristieke kenmerk van C4 zinkvingers is de aanwezigheid van twee groepen van vier cruciale cysteïnes, één naar elk einde van het 55- of 56-residu domein. Hoewel de C4 zinkvinger initiëel was genoemd naar de analogie met de C2H2zinkvinger, bleken de driedimensionale structuren van de proteïnen die deze bindingsmotieven bevatten nogal verschillend. Een bijzonder belangrijk verschil tussen de twee is dat de C2H2 zinkvinger proteïnen in het algemeen twee of meer herhaalde ving eenheden bevatten en binden als monomeren, terwijl C4 zinkervinger proteïnen gewoonlijk slechts twee vinger eenheden bevatten en in het algemeen binden aan DNA als homodimeren of heterodimeren. Homodimeren van de C4 zinkvinger DNA-bindings domeinen hebben een tweevoudige rotationele symmetrie. Als gevolg binden homodimerische nucleaire receptoren aan de consensus DNA sequenties die omgekeerde herhalingen zijn. Leucine-zipper proteïnen Een ander structureel motief aanwezig in de DNAbindings domeinen van een grote klasse van transcriptiefactoren bevat het hydrofobe aminozuur leucine aan elke zevende positie in de sequentie. Deze proteïnen binden aan DNA dimeren en mutagenese van de leucines toonde dat ze vereist waren voor de dimerisatie. Als gevolg was de naam leucine-zipper verzonnen om dit structurele motief aan te duiden. Het DNA-bindings domein van de gist GCN4 transcriptie factor vroeger vermeld is een leucine-zipper domein. X-ray kristallografie analyse van complexen tussen DNA

en het GCN4 DNA-bindings domein heeft getoond dat het dimerische proteïne twee uitstekende α helices bevat die het DNA molecule vastgrijpen, zoals de twee benen van een schaar, aan twee aangrenzende major groeves gescheiden door ongeveer een halve turn van de dubbele helix. De porties van de α helices die contact maken met het DNA omvatten positief geladen (basische) residu s die interageren met fosfaten in de DNA ruggengraat en bijkomende residu s die interageren met specifieke basen in de major groeve. GCN4 vormt dimeren via hydrofobe interacties tussen de C-terminale regio s van de α helices, een coiled-coil structuur vormend. Deze structuur is gewoon in proteïnen die amfipathische α helices bevatten in dewelke hydrofobe aminozuur residu s regelmatig geplaatst zijn afwisselend drie of vier posities uiteen in de sequentie, een lijn naar beneden aan één zijde van de α helix vormend. Deze hydrofobe stroken vormen de interagerende oppervlakken tussen de α helicale monomeren in een coiled-coil dimeer. Hoewel de eerste leucine-zipper transcriptie factors die geanalyseerd werden leucine residu s bevatten aan elke zevende positie in de dimerisatie regio, werden daarna bijkomende DNA-bindings proteïnen geïdentificeerd die andere hydrofobe aminozuren in deze posities bevatten. Zoals leucine-zipper proteïnen vormen ze dimeren die een C-terminale coiled-coil dimerisatie regio en een N-terminaal DNAbindingsdomein bevatten. De term leucine-zipper (bzip) wordt nu frequent gebruikt om te verwijzen naar alle proteïnen met deze gemeenschappelijke kenmerken. Vele basic-zipper transcriptie factoren zijn heterodimeren van twee verschillende polypeptide ketens, die elk één basic-zipper domein bevatten. Basic Helix-Loop-Helix (bhlh) proteïnen Het DNA bindings domein van een andere klasse van dimerische transcriptie factoren bevat een structureel motief zeer gelijkend op het basic-zipper motief, met uitzondering dat een niet-helicale lus van de polypeptide keten twee α helicale regio s scheidt in elke monomeer. Een basic helixloop-helix (bhlh) genoemd werd voorspeld dit motief uit de aminozuursequenties van deze proteïnen, die een N-terminale α helix met basische residu s die interageren met DNA, een midden loop regio en een C-terminale regio met hydrofobe aminozuren geplaatst aan de intervallen karakteristiek voor een amfipatische α helix bevatten. Zoals bij de basic-zipper proteïnen kunnen verschillende bhlh proteïnen heterodimeren vormen. Transcriptie-factor interacties verhogen gen-controle opties Twee soorten van DNA-bindings proteïnen besporken in de vorige sectie basiczipper proteïnen en bhlh proteïnen- bestaan vaak in alternatieve heterodimerische combinaties van monomeren. Andere klassen van transcriptie factoren (hier niet besproken) vormen ook heterodimerische proteïnen. Bij bepaalde heterodimerische transcriptiefactoren, heeft elke monomeer een DNA-bindings domein met evenwaardige sequentie specificiteit. In deze proteïnen beïnvloedt de vorming van alternatieve heterodimeren de DNA-bindings specificiteit niet, maar laat eerder toe dat de activatiedomeinen verbonden met elke monomeer bij elkaar gebracht worden in alternatieve combinaties in een enkele transcriptiefactor. Zoals we later zullen zien en in de volgende chapters kan de activiteit van individuele transcriptiefactoren gereguleerd worden door meerdere mechanismen. Als gevolg kan een enkel bzip of bhlh DNA regulatorisch element in de controle regio van een gen verschillende

transcriptionele responsen teweeg brengen naar gelang welke bzip of bhlh monomeren binden aan die site worden uitgedrukt in een bepaalde cel op een bepaald moment en hoe de activiteiten worden gereguleerd.(?????) Bij sommige heterodimerische transcriptiefactoren heeft elke monomeer echter een verschillende DNA-bindings specificiteit. De resulterende coimbinatie mogelijkheden verhogen het aantal van potentiële DNA sequenties die een familie transcriptiefactoren kan binden. Drie verschillende factor monomeren zouden theoretisch kunnen combineren om zes homo- en heterodimerische factoren te vormen, zoals geïllustreerd in figuur 11-23a. Vier verschillende factor monomeren zouden een totaal van 10 dimerische factoren vormen; vijf monomeren, 16 dimerische factoren; en zoverder. Bovendien zijn er inhibitorische factoren gekend die binden aan bepaalde basic-zipper en bhlh monomeren, daarbij hun binding aan DNA blokkerend. Wanneer deze inhibitie factoren uitgedrukt worden, onderdrukken ze transcriptionele activatie door de factoren waarmee ze interageren. De regels die de interacties van leden van een heterodimerische transcriptie-factor klasse bepalen zijn complex. Deze combinationele complexiteit breidt zowel het aantal DNA site vanwaar deze factoren de transcriptie activeren als de manieren waarop ze gereguleerd kunnen worden uit. Gelijkaardige combinationele transcriptionele regulatie wordt bereikt via de interactie van structureel onverwante transcriptie factoren gebonden aan dicht bij elkaar geplaatste bindings sites in DNA. Een voorbeeld is de interactie van de twee transcriptiefactoren, NFAT1 en AP1, die binden aan naburige sites in een samengesteld promotor-proximaal element dat het gen reguleerd dat codeert voor interleukon-2 (IL-2). De expressie van het IL-2 gen is cruciaal voor de immuunrespons, maar abnormale expressie van IL-2 kan leiden tot autoimmuun ziekten zoals rheumatoid arthritis. Noch NFAT noch AP1 binden aan zijn site in de IL- 2 controle regio in de afwezigheid van de ander. De affiniteiten van de factoren voor deze bepaalde NA sequenties zijn te laag opdat de individuele factoren een stabiel complex met DNA vormen. Wanneer echter zowel NFAT als AP1 aanwezig zijn, stabiliseren proteïne-proteïne interacties tussen hen het DNA ternaire complex samengesteld uit NFAT, AP1 en DNA. Zulke coöperatieve DNA binding van verschillende transcriptie factoren resulteert in een aanzienlijke combinatie complexiteit van de transcriptionele controle. Als resultaat kunnen de ongeveer 2000 transcriptiefactoren gecodeerd in het menselijke genoom binden aan DNA via een groter aantal coöperatieve interacties, resulterend in een unieke transcriptionele controle voor elk van de verschillende tienduizenden menselijke genen. In het geval van IL-2 gebeurt de transcriptie enkel wanneer NFAT geactiveerd wordt, resulterend in zijn transport van het cytoplasma naar de nucleus én de twee subeenheden van AP1 gesynthetiseerd worden. Deze gebeurtenissen worden gecontroleerd door gescheiden signaal trnasductie paden, wat de strenge controle van de IL-2 expressie toelaat. De coöperatieve binding door NFAT en AP1 gebeurt enkel wanneer hun zwakke bindings sites gelokaliseerd zijn aan op een precieze afstand, nogal dicht bij elkaar in het DNA. Recente studies hebben getoond dat de vereisten voor coöperatieve binding niet zo streng zijn in het geval van sommige andere transcriptie factoren en controle regio s. Bijvoorbeeld: de EGR-1 controle regio bevat een samengestelde bindings site aan dewelke de SRF en TCF transcriptie factoren coöperatief binden.

Vermits een TCF een lang, flexibel domein heeft, dat interageert met SRF, kunnen de twee proteïnen coöperatief binden wanneer hun individuele sites in het DNA gescheiden zijn door eenders welke afstand tot 10bp of zijn omgekeerde relatieve van elkaar. Structureel diverse activatie en repressie domeinen reguleren de transcriptie Experimenten met fusie proteïnen samengesteld uit het GAL4 DNA-bindings domein en willekeurige segmenten van E. coli proteïnen toonde aan dat een diverse groep van aminozuursequenties kannen functioneren als activatie domeinen, ~1% van alle E. coli sequenties, zelfs als ze geëvolueerd zijn om andere functies te vervullen. Vele transcriptie factoren bevatten activatie domeinen gekenmerkt door een ongewoon hoog percentage van bepaalde aminozuren. GAL4, GCN4 en de meeste gist transcriptie factoren bijvoorbeeld hebben activatie domeinen die rijk zijn aan zure aminozuren (asparaginezuur en glutamine zuur). Deze zogenaamde zure activatie domeinen zijn in het algemeen in staat de transcriptie te stimuleren in bijna alle soorten eukaryote cellen -fungale, dierlijke en plantencellen. Activatiedomeinen van bepaalde Drosophila en zoogdierlijke transcriptiefactoren zijn glutamine-rijk en sommige zijn proline-rijk; nog andere zijn rijk aan de nauw verwante aminozuren serine en threonine, die beide hydroxylgroepen hebben. Bepaalde sterke activatie domeinen zijn echter niet bijzonder rijk aan enig specifiek aminozuur. Biofysische studies duiden aan dat zuren activatie domeinen een ongestructureerde, willekeurige coil conformatie hebben. Deze domeinen stimuleren de transcriptie wanneer ze gebonden zijn aan een proteïne co-activator. De interactie met een coactivator doet het activatie domein een meer gestructureerde α helix conformatie in het activatie domein-co-activator complex aannemen. Een goed-bestudeerd voorbeeld van transcriptie factor met een zuur activatie domein is het zoogdierlijk CREB proteïne, dat gefosforyleerd wordt als antwoord op verhoogde concentraties van camp. Deze gereguleerde fosforylatie is vereist om CREB te binden aan zijn coactivator CBP (CREB binding proteïne), wat resulteert in de transcriptie van genen wiens controle regio s een CREB-bindings site bevatten. Wanneer het gefosforyleerde willekeurige coil activatie domein van CREB interageert met CBP, ondergaat het een conformationele verandering om twee α helices te vormen die rond het interagerende domein van CBP omgeslagen liggen. Bepaalde activatie domeinen zijn groten en meer gestructureerd dan zure activatie domeinen. Bijvoorbeeld: de ligand-bindings domeinen van nucleaire receptoren functioneren als activatie domeinen wanneer ze hun specifieke ligand binden. Binding van een ligand induceert een grote conformationele verandering die toelaat het ligand-bindings domein met gebonden hormoon te interageren met een korte α helix in nucleaire-receptor co-activatoren; het resulterende complex kan dan de transcriptie van de genen activeren wiens controle regio s de nucleaire receptor binden. Dus vertegenwoordigen het zure activatie domein in CREB en het ligand-bindings activatie domein in nucleaire receptoren twee structurele uitersten. Het CREB zure activatie domein is een willekeurige coil die vouwt in twee α helices wanneer het bindt aan het oppervlak van een globulair domein in een co-activator. In tegenstelling is het nucleaire-receptor lingand-bindings activatie domein een gestructureerd globulair domein dat interageert met een korte α helix in een co-activator, die

waarschijnlijk een willekeurige coil is voordat het gebonden is. In beide gevallen laten specifieke proteïne-proteïne interacties tussen co-activatoren en de activatie domeinen de transcriptiefactoren toe de gen expressie te stimuleren. Op dit moment is er minder geweten over de structuur van de repressie domeinen. De globulaire ligand-bindings domeinen van bepaalde nucleaire receptoren functioneren als repressie domeinen in de afwezigheid van hun specifieke hormoon ligand. Zoals activatie domeinen kunnen repressie domeinen relatief kort zijn, 15 of minder aminozuren bevattend. Biochemische en genetische studies duiden aan dat repressie domeinen ook bemiddelen(?) proteïne-proteïne interacties en binden aan co-repressor proteïnen, een complex vormend dat de transcriptie initiatie verhinderd door mechanismen die later in de chapter besproken worden. Multiproteïne complexen vormen aan enhancers Zoals vroeger vermeld variëren enhancers gewoonlijk in lengte van ongeveer 50 tot 200 bp en omvatten bindingssiten voor verschillende transcriptiefactoren. De meerdere transcriptiefactoren die binden aan een enkele enhancer worden gedacht te interagen. Analysen van de +/-70-bp enhancer die de expressie van β-interferon, een belangrijk proteïne in de verdediging tegen virale infecties bij mensen, reguleert, verleent een goed voorbeeld van zulke transcriptie-factor interacties. De β-interferon enhancer bevat vier controle elementen die tegelijk vier verschillende transcriptiefactoren bindt. In de aanwezigheid van een klein, overvloedig aanwezig proteïne geassocieerd met chromatine HMGI genoemd, is de binding van de transcriptiefactoren sterk coöperatief, gelijkend op de binding van NFAT en AP1 aan de samengestelde promotor-proximale site in de IL-2 controle regio. Deze coöperatieve binding produceert een multiproteïne complex aan het β-interferon enhancer DNA. De term enhanccesoom werd verzonnen om zulke grote nucleoproteïne complexen te beschrijven die gevormd worden van transcriptiefactoren als ze coöperatief binden aan hun multiple bindings siten in een enhancer. HMGI bindt aan de minor groeve van DNA ongeacht de sequentie en buigt als resultaat het DNA molecule scherp. Deze buiging van het DNA laat de gebonden transcriptiefactoren toe gepast te interageren. De inherent zwakke, niet-covalente proteïne-proteïne interacties tussen transcriptiefactoren worden versterkt door hun binding aan naburige DNA siten, die de proteïnen aan zeer hoge relatieve concentraties houden. Vermits de aanwezigheid van flexibele regio s die de DNA-bindings domeinen verbinden en activatie of repressie domeinen in transcriptiefactoren en het vermogen van gebonden proteïnen om het DNA te buigen is aanzienlijke speelruimte in de tussenruimte tussen de regulatorische elementen in transcriptie-controle regio s toelaatbaar. Deze eigenschap is waarschijnlijk verleend door de snelle evolutie van gencontrole bij eukaryoten. Transposities van DNA sequenties en reconbinatie tussen herhaalde sequenties over evolutionaire tijd creëerde waarschijnlijk nieuwe combinaties van controle elementen die onderworpen waren aan natuurlijke selectie en behouden bleven als ze beneficial bleken. De speelruimte in tussenruimte tussen regulatorische elementen laat waarschijnlijk veel meer functionele combinaties toe om onderworpen te worden aan deze evolutionaire experimentaite dan het geval zou

zijn als de beperking omtrent de tussenruimten tussen regulatorische elementen strikt was. KEY CONCEPTS OF SECTION 11.3 activatoren en repressoren van transcriptie Trnascriptie factoren, die de transcriptie stimuleren of onderdrukken, binden aan promotor-proximale regulatorische elementen en enhancers in eukaryotisch DNA. Transcriptie activatoren en repressoren zijn in het algemeen modulaire proteïnen die een enkiel DNA-bindings domein bevatten en één of een weinig activatie domeinen (voor activatoren) of repressie domeinen (voor repressoren). De verschillende domeinen zijn vaak verbonden via flexibele polypeptide regio s. Tussen de meest algemene structurele motieven gevonden in de DNA-bindings domeinen van eukaryote transcriptie factoren zijn de C2H2 zinkvinger, homeodomeinen, basis helix-loop-helix (bhlh) en basis zipper (leucine zipper). Al deze en vele andere DNA-bindings motieven bevatten één of meer α helices die interageren met major groeves in hun cognate site in DNA. De transcriptie-controle regio s van de meeste genen bevatten bindings siten voor meerdere transcriptie factoren. De transcriptie van zulke genen varieert afhankelijk van het bepaalde repertoire van transcriptiefactoren die uitgedrukt en geactiveerd worden in een bepaalde cel op een bepaald ogenblik. Combinatie complexiteit in transcriptie controle resulteert van alternatieve combinaties van monomeren die heterodimerische transcriptie factoren vormen en van coöperatieve binding van transcriptiefactoren aan samengestelde controle sites. Activatie en repressie domeinen in trnascriptiefactoren vertonen een variëteit aan aminozuursequenties en driedimensionale structuren. In het algemeen interageren deze functionele domeinen met co-activatoren of co-repressoren, die cruciaal zijn voor het vermogen van transcriptiefactoren om de genexpressie te veranderen. De coöperatieve binding van meerdere activatoren aan nabijgelegen sites in een enhancer vormt een multiproteïne complex, een enhancesoom genoemd. De samenstelling van een enhancesoome vereist vaak kleine proteïnen die binden aan de DNA minor groeve en het DNA scherp buigen, wat de gebonden proteïnen aan beide zijden van de buiging toelaat gemakkelijker te interageren. 11.4 transcriptie initiatie door RNA polymerase II In vorige secties werden vele van de eukaryote proteïnen en DNA sequenties die deelnemen in de transcriptie en zijn controle geïntroduceerd. In deze sectie concentreren we ons op de samenstelling van transcriptie preinitiatie complexen met betrekking op RNA polymerase II (Pol II). Herinner dat dit eukaryotisch RNA polymerase de synthese van mrna s en enkele kleine nucleaire RNA s (snrna s) katalyseert. De mechanismen die de assemblage van de Pol II transcriptie preinitiatie complexen controleren en vandaar de snelheid van de transcriptie van proteïnecoderende genen, worden beschouwd in de volgende sectie. De algemene transcriptiefactoren positioneren RNA polymerase II aan de startsites en assisteren bij de initiatie In vitro transcriptie door opzuiverd RNA polymerase II vereist de toevoeging van verschillende initiatiefactoren die gescheiden worden van het polymerase tijdens de opzuivering. Deze initiatie factoren, die polymerase moleculen positioneren aan transcriptie startsiten en helpen de DNA strengen te smelten zodat de matrijsstreng kan binnentreden in de actieve asite van het enzyme, worden algemene