Bio-informatica Structuur
|
|
|
- Michiel Aalderink
- 10 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Bio-informatica Structuur 10
2 Structuur niveaus Primaire structuur Sequentie Secundaire structuur Basis structuur elementen Tertiaire structuur 3D structuur Posttranslationele (posttranscriptionele) modificaties Helices (binding korte complementaire gebieden) in RNA Alpha helices, beta sheets,... in proteïnes signaal peptide cleavage, glycosylatie, Quaternaire structuur Complexen van 2 of meer ketens Niet covalente binding Specifieke ratios en 3D configuratie Predictie moeilijk
3
4 CATH Proteïne structuur klassificatie Klasse (C) Architectuur (A) Algemene vorm domein structuur Orientatie secundaire structuur bv.: barrel, 3-layer sandwich Topologie (fold) (T) Samenstelling secundaire structuur Mainly-alpha, mainly-beta, alpha-beta, low secundary structure Fold families met gelijkaardige algemene vorm en connectiviteit van de secundaire Structuur bv. alpha-beta 3-layer sandwich Homologe superfamilie (H) Zelfde afkomst Hoge sequentie identiteit (>35%) en/of SSAP (Sequential Structure Alignment Program) score
5 CATH
6 SCOP proteine klassificatie SCOP Database over alle proteinen met gekende 3D structuur Geeft structurele en evolutionaire verwantschappen aan Classificatie Familie Superfamilie duidelijke evolutionaire verwantschap Gewoonlijk sequentie identiteit > 30% Soms kleinere identiteit wanneer structurele en functionele gelijkenissen zeer overtuigend zijn Waarschijnlijke evolutionaire verwantschap Lage sequentie identiteit Structurele en functionale eigenschappen sugereren gemeenschappelijke afkomst Fold Grote structurele gelijkenis
7 Proteïne domeinen HLA-A2
8 Proteïne domeinen Modulaire opbouw Proteinen bestaan vaak uit verschillende herkenbare delen (domeinen) met vaak specifieke functies Domein Structureel: deel van een polypeptideketen dat onafhankelijk vouwt tot een ruimtelijk te onderscheiden structurele eenheid (fold) Functioneel: goed-gedefinieerde regio in een proteïne dat overeenkomt met een specifieke functie Binding ligand, transmembranair element, catalytische site, DNA-binding,...
9 Domein structuur Domeinen best afzonderlijk bekijken Domeinstrucuur voorspellen grote sequenties (>500) vrijwel altijd multidomein deel sequentie homologie met gekende proteinen domein databanken domeinen vaak gescheiden door low complexity sequence Kan voorspeld worden met programma SEG transmembranaire segmenten coiled-coils secundaire structuur kan soms aanwijzingen geven "all α domein", "all β domein"
10 Experimentele 3D structuur Methoden X-straal diffractie De Referentie Veel werk, tijd, rekentijd (atomaire structuur berekenen) Vaak moeilijk / niet altijd mogelijk NMR Kristallisatie, stabiliteit, flexibiliteit, grootte Vnl voor dynamische structuur Databank van experimenteel bepaalde structuren PDB (protein data bank) Verzameling van de gekende 3D structuren Viewers,...
11 Andere experimentele methoden Analyse van de zwavelbruggen Cysteines die zwavelbrug vormen bevinden zich in elkaars buurt (in 3d structuur) Spectroscopische data Site-directed mutagenesis aminozuren veranderen heeft effect op structuur en/of functie in het aktief centrum bij bindingsplaatsen Proteolytische klievingsplaatsen idee over de secundaire structuur van het eiwit toegankelijkheid betrokken aminozuren post-translationele modificaties toegankelijkheid betrokken aminozuren
12 Kwaliteit structuur predictie CASP Critical Assessment of Techniques for Protein Structure Prediction Workshop waar verschillende groepen/programmas structuur voorspellen van proteinen waarvoor de structuur experimenteel bepaald is maar nog niet publiek beschikbaar (vergelijkbaar met EGASP) Verschillende categorien tertiaire structuur, secundaire structuur, complexen, domein grenzen, functie, model refinement,... Verdere opdeling tertaire structuur voorspelling homology modeling, fold recognition, de novo predictie ( nu new fold omdat vaak gebruik gemaakt word van gekende folds voor training ML) sinds CASP7: Template based modeling, Template free modeling
13 Proteïne secundaire structuur DSSP Database of secondary structure assignments secundaire structuur sequentie van secundaire structuur elementen gebaseerd op coordinaten in PDB files met programma DSSP (Definition of Secondary Structure of Proteins) Secundaire structuur elementen in database H B E G alpha helix beta-sheet extended strand 3/10 helix Belang Alignatie Klassificatie Actieve sites I pi helix T hydrogen bonded turn S bend
14 Proteïne secundaire structuur predictie Statistische methoden Residu waarschijnlijkheden voor verschillende staten (empirisch afgeleid) Sliding window Hydrofoob moment Assymetrie van hydrophobiciteit van een AZ keten b.v. Alfa helix (periodiciteit 3.6) met een kant in de core: Typisch hydrophobiciteits patroon Comparatief Patronen van conservatie Structuur wordt beter geconserveerd dan sequentie want heeft een rechtstreeks belang voor de functie Gebaseerd op alignementen Gly hoge ws. in reverse turns, Pro weinig ws. in helix, sterke verbetering predictie Machine learning methoden Trainingset: gekende proteïnen en proteïne structuren DSSP databank NN, HMM
15 Proteïne secundaire structuur Programma's JPRED2 PHD, PHDsec, PHDacc Verbeterde versie van PHD Profile-based neuraal netwerk predictie JPRED Secundaire structuur, solvent accessibiliteit Neurale netwerken Op basis van alignementen (10% betere predictie dan op basis van 1 sequentie) PROF, PROFseq, PROFacc Combinatie van verschillende methoden (PHD, PREDATOR,...) Consensus voorspelling 2 3-layer neurale netwerken (sliding window) PSIPRED Neurale netwerken die positie-specifieke score matrix in PSI-BLAST output analyseren
16 Transmembranaire regios Transmembranaire regios Typishe hydrophobiciteits profiel Herkenning transmembranaire elementen Patroonherkennings algoritmen NN HMM
17 Transmembranaire regios Programma's PHDhtm TMHMM multiple alignmenten: als slechts 1 sequentie, zoekt andere in db propensity values voor midden en uiteinde transmembranaire regio weging volgens conservatie TopPred HMM TMAP Locatie en topologie van transmembranaire helices Op basis van alignementen Neurale netwerken, verfijning met empirische filter en dynamic programming ~95% correcte predictie Hydrofobiciteits patronen DAS Hydrofobiciteits patronen
18 Coiled Coils Coiled coils verschillende α-helixen op hun beurt nog eens in elkaar gedraaid bv. in myosine of fibrine programma COILS waarschijnlijkheid dat de sequentie een coiled coil conformatie zal aannemen similariteits score in databank van gekende coiled-coil structuren (~ alignatie) vergeleken met distributie scores met gekende globulaire en coiled coil eiwitten specifiek voor linksdraaiende coiled coils gewogen scan coiled coil vnl. hydrofiel behalve aminozuren op plaats 1 en 4 ongewogen hydrofiele aminozuren erg bevoordeeld gewogen scan plaatsen 1 en 4 extra gewicht
19 Andere structuur elementen Programma's CYSPRED Welke Cys residus vormen disulfide bruggen Neuraal netwerk Predictie score 72% (81% voor alingementen) GLOBE Predictie van globulariteit proteine
20 3D proteïne structuur
21 Databank zoektocht Patronen Domein databanken Gekende domeinen Kunnen informatie opleveren over structuur en functie van delen Sequentie methoden PDB BLAST, FASTA,BLITZ, SCANPS PSI-BLAST, HMMer: verhoging gevoeligheid Gekende 3D structuren Structuur naar homologie Proteine databanken Geen gekende structuur Multiple alignementen van homologe sequenties met gelijkaardige structuur Kunnen gebruikt worden om predictie te verbeteren
22 Proteïne 3D structuur Theoretische methoden Homology modeling Threading / Fold herkenning Gekende structuur met goede similariteit (>30% identiteit) Minder goede / geen similariteit Ab initio Geen homologen
23 Homology modelling Methode Homologie searches sequenties met gekende 3D structuur BLASTP, MAXHom, PSIBlast duidelijke globale similariteit Structurele alignatie Modelleer backbone vertrekkend vanaf alignment ~ rekening houden met indel Modelleer zijketens Energie optimalisatie (structuur met minimum free energy) tijdsrovend Resultaten 90% id.: resultaat vergelijkbaar met X-straal diffractie 50% id.: fouten tot 1.5Å en grotere locale fouten 25% id.: grote fouten (slechte alignatie)
24 Homology modelling Programma's SWISS-MODEL MODELLER WHAT IF CPHmodels BLASTP2: Zoek similaire sequenties met gekende structuur in database (ExNRL) SIM: Selecteer templates met id>20%, model langer dan 20AZ, detecteer domeinen ProModII: genereer modellen Gromos96: energie minimalisatie van alle modellen dat ProModII genereert Collectie databases en methoden imoltalk...
25 Fold herkenning Beperkt aantal mogelijke folds zijn energetisch interessant Proteinen vaak zelfde fold, zelfs zonder significante similariteit Voor veel proteinen geschikte structuur in de databanken Niet gevonden wegens gebrek aan similariteit Databanken van gekende folds Fold herkenning (Inverse folding problem) Voorspelling welke fold best past op een gegeven sequentie Alle mogelijke structuren voorspellen: tijdsrovend evt. gebruik maken van gegevens over secundaire structuur, om zoektocht te beperken
26 Threading Threading (~techniek fold herkenning) Database van gekende folds thread sequentie door meest waarschijnlijke / alle structuren Selecteer beste structuur Predictie gebaseerde threading Verre homologen zonder significante sequentie gelijkenis (0-25%) Detectie van gelijkaardige patronen van sec. structuur en accessibiliteit tussen ongekende sequentie en gekende fold Voorspel sec. structuur onbekende sequentie Alignatie met DSSP Verhoog zo mogelijkheid tot gebruik homologie gegevens
27 Threading/fold recognition programma's TOPITS Predictie gebaseerd threading programma Zoekt naar structurele homologen in de DSSP databank Gekende 3D structuren in de vorm van 1D strings van sec. structuur en solvent accessibiliteit Predictie SS en solvent accessibiliteit van query sequentie met PHD -> string Alignatie strings met dynamic programming Eerste hit in 30% van de gevallen correct (beter bij hogere score) Threader 2 Database van folds Dynamic programming voor alignatie sequentie structuur Afgeleid van gekende structuren (geen sequentie info) Scoring op basis van continue, statistische afgeleide potentiaal Werkt met volledige database Test query sequentie t.o.v. alle folds Bereken energie -> laagste energie is beste match
28 Ab initio Ab initio methoden Wanneer er geen gekende structuur op de onbekende sequentie past Enkel vertrekkende van de sequentie Energie minimalisatie; minimale energie berekenen Simulaties van folding (molecular dynamics) Problemen Zeer rekenintensief Enkel kleine molecules Beperkt succes Rosetta Gebruikt wel homologie wanneer gevonden (~geen zuivere ab initio ) De novo modeling wanneer geen homologie Fragmenten van bestaande PDB structuren als gids Combinatie met energie functies is niet puur ab initio
29 Conclusie structuur predictie Secundaire structuur Relatief betrouwbare resultaten wanneer we vertrekken van een alignement Gebruik en vergelijk verschillende methoden Tertiaire structuur Betrouwbare resultaten wanneer goed gekend homoloog voorhanden is Problematischer bij minder duidelijke of geen homologen Gebruik en vergelijk verschillende methoden
30 Homologie en functie Genfamilies Groepen genen die homoloog zijn door duplicatie (paralogen) ~ binnen 1 soort door speciatie (orthologen) ~ tussen verschillende soorten Vaak dezelfde of gelijkaardige functie b.v. transporter eiwitten Niet altijd dezelfde/gelijkaardige functie: kan soms compleet anders zijn Domein analyse Belangrijke stap bij bekijken onbekend proteïne Domein databanken: sequentie patronen profielen, weight matrices,... Interpro,... Komt vaak overeen met typische folds Domeinen hebben vaak een typische functie, maar kan toch verschillen in bv. specificiteit
31 RNA structuur Primary structure AG U C... Secondary structure GA U. A G A.. A A G G.. UC G A.. CC A U G. C G. U C C A
32 Belang RNA structuur Invloed structuur Translationele controle in mrna Replicatie controle bij virussen Vele functionele/actieve RNA moleculen die niet coderen voor AZ (ncrna) rrna (ribosomaal RNA): translatie snrna (small nuclear RNAs): splicing snorna (small nulceolar RNAs): constructie ribosomen, telomeren mirna (microrna): regulatie van expressie sirna: targetting voor afbraak...
33 Base interacties in RNA Canonische paren (Watson-Crick type) Wobble paren AU en GC zoals bv. 3d base in anticodon met 1st base codon GU paar wordt vaak gevonden in RNA structuur Vrijwel zelfde gedrag als canonische paren Niet - canonische paren experimenteel vastgesteld (X-straal diffractie van kleine artificiële RNAs) b.v. GA paar komt vrij regelmatig voor (vaak uiteinde helix) Er zijn verschillen in de waarschijnlijkheid van voorkomen van niet-canonische paren
34 Secundaire RNA structuur 1. Helix 3 duplex (A-form) van minstens 2 baseparen 2. Enkelstrengige gebieden 3. Hairpin tetraloops UUCG, GCAA, CUUG 4. Bulge loop 5. Internal loop 6. Junctie of multibranched loop
35 Tertiaire structuur interacties Tertiaire base paringen loop-loop interacties Pseudoknopen Vaak zeldzame interactions segment in hairpin vormt helix met segment buiten de hairpin helix Moeilijk te zeggen welke interactie secundair en welke tertiair is Andere tertiaire interacties intercalatie base triples helix - helix interacties
36 Pseudoknoop
37 RNA Structuur voorspelling Experimenteel Chemische en enzymatische methoden X-straal diffractie Single of double strand specifieke modificatie, crosslinking,... Maken van kristallen is moeilijk NMR Voorspellen Thermodynamische methoden Probabilistische modellen Comparatieve methoden
38 Thermodynamische methoden Vinden van de energetisch meest voordelige structuur MFE (minimum Free Energy) Theoretisch mogelijk Problemen: experimenteel bepaalde thermodynamische data is niet altijd accuraat Invloed van interacties met solvent, ionen, proteinen, etc. moeilijk te quantificeren dikwijls niet in rekening gebracht computationeel complex zware vereenvoudigingen zijn noodzakelijk
39 Thermodynamische methoden Vrije energie parameters Variatie van parameters tot gekende structuren (trna and 5S) correct voorspeld worden experimentele studies op de stabiliteit van structuren gevormd door kleine oligoribonucleotides Door Calorimetrie (bepalen smeltcurves) Stabiliteit basepaar (door waterstofbruggen) wordt beinvloed door zijn omgeving Nearest neighbor model simplificatie: stabiliteit van de interacties is enkel afhankelijk van vlakbij gelegen base paren loop regios: enkel afhankelijk van lengte Niet correct: b.v. tetraloops (sommige sequenties van 4 basen in de loop zijn veel stabieler dan andere sequnties)
40 Thermodynamische methoden Combinatorische Algoritmen Algoritme Voordelen Lijst van alle mogelijke helices (op basis canonische en wobble paren) Combinatie met laagste vrije energie Niet nearest neigbor interacties kunnen in rekening gebracht worden Pseudo-knopen zijn mogelijk Nadelen Aantal mogelijkheden stijgt te snel voor grotere sequenties
41 Thermodynamische methoden Dynamic programming algoritme Algoritme Voordeel Bereken laagste energie voor segment S met lengte i-j S(i,j) voor elke subsequentie ri...rj: is afhankelijk van subsequenties Start met pentanucleotides, dan hexanucleotides, etc. Herhaal tot laagste vrije energie voor de volledige sequentie wordt gevonden Vind de structuur door backtracing snelheid Nadeel Enkel nearest-neighbor kan in rekening gebracht worden Geen pseudoknopen
42 Thermodynamische methoden Dynamic programming algoritme e(ri,rj) = vrije energie bij paren van ri en rj S(i,j) = optimale vrije energie van segment ri...rj S(i+1,j) S(i,j-1) S(i+1,j-1)+e(ri,rj) S(i,k)+S(k+1,j) De optimale vrije energie van een segment van positie i tot j = beste van alle mogelijkheden hierboven Laatste mogelijkheid maakt vertakkingen mogelijk k varieert tussen I en j
43 Thermodynamische methoden programma's Mfold Nearest-neighbor, geen pseudoknopen Dynamic programming om energie optimalisatie te doen Verschillende verbeteringen Grote complexiteit: O(n3) tijd, O(n2) ruimte Vienna RNA Package Verschillende dynamic programming algoritmes Suboptimale folds, experimentele constraints Minimum free energy (~mfold) Partition function Suboptimal folding Rnadraw Dynamic programming (~ mfold)
44 Probabilistische modelen Probabilistische modellen statistische modellen van RNA structuur ~ vergelijkbaar met HMM, maar HMM veronderstellen dat alle posities onafhankelijke, niet interagerende distributies hebben. Dit klopt niet voor RNA structuur b.v. stochastic context free grammars (SCFG) komen van computationele linguistiek parameters worden berekend op basis van gekende sequenties structuur relaties (set geannoteerde RNA sequenties) Programmas CONTRAfold conditional log-linear models (extensie van SCFGs)
45 Pobabilistische modellen Stochastic Context Free grammars set van formele regels (productions). bv. (simpel) Opeenvolging van regels (=parse) sequentie ws. vorige parse = ps asu ps gsc ps us ps e Mapping van een parse structuur bv. sequentie agucu: S asu agscu aguscu agucu Meerdere parses mogelijk voor zelfde sequentie waarschijnlijkheden voor verschillende mogelijkheden S asu usa csg gsc gsu usg as cs gs us e Base paar wanneer twee letters worden gegenereerd in dezelfde stap Training: gegeven een set sequenties waarschijnlijkheden invullen
46 Comparatieve methode Basis secondaire structuur van functioneel RNA wordt geconserveerd in de evolutie Zoeken naar een structuur model dat past op een set van homologe sequenties Structuur model gemeenschappelijk in een set van homologe sequenties
47 Comparatieve methode
48 Comparatieve Analyse Compenserende base veranderingen Verandering van een base in een helix wordt gecompenseerd door een verandering op de complementaire positie om de baseparing te behouden Bevestigt de aanwezigheid van een interactie Covariatie 2 posities varieren gelijktijdig (zonder per se canonieke base paren te vormen) duidt op constraints in de structuur mutual information I ( X ; Y )= p ( x, y )log ( p(x, y) ) p( x ) p ( y) y Y y X Maat voor covariatie tussen 2 posities berekend op basis van voorkomen van elk paar basen op de twee posities t.o.v. hoeveel we ze verwachten terug te vinden bij toeval =0 als posities onafhankelijk (log van verhouding, die 1 is als toeval)
49 Automatische comparatieve analyse Alignement gevolgd door covariatie analyse Covariatie scores voor mogelijke baseparen met b.v. mutual-information Combinatie met MFE methoden ILM (Iterative Loop Matching) supporteert ook pseudoknopen Vienna RNA pakket (als nieuwe methode) Probabilistische modelen parameters worden berekend op basis van gekende sequentie structuur relaties Pfold stochastic context free grammars probabiliteit van structuur gegeven alignement en boom
50 automatische comparatieve analyse Simultane alignatie en structuur predictie Sankoff-Algorithm zoeken naar structureel geconserveerde ankers en iteratieve extensie binnen deze ankers zeer computationeel intens (traag, beperkte grootte) vb. Carnac, Foldalign, Dynalign, Pmcomp vb. RNAscf (RNA stacks based consensus folding), carnac Structuur alignatie Bij zeer slecht aligneerbare sequenties methode Predictie structuur sequenties afzonderlijk Alignatie van structuur Zoeken naar consensus structuur bv. RNAforester, MARNA
51 Overzicht
52 Plan A: align, then fold Plan B: align and fold Scores Plan C: fold and compare folds
53 Comparatieve methode Voordelen enkel sequencing experimenten Geen hinder van interacties met andere moleculen Succesvol nieuwe structurele elementen voorgesteld op basis van comparatieve analyse zijn later bewezen op basis van hoge resolutie experimentele methoden (pseudo-knoop, niet-canonische paringen, tetraloops) correcte predictie structuur (t.o.v. latere resultaten met X-straal diffractie) trna ribosomaal RNA
54 Comparatieve methode Nadelen (groot) aantal verwante sequenties nodig Volledig geconserveerde regios kunnen niet opgelost worden Arbeidsintensief Zeer variable regios Problemen met alignement (maar alignement kan verbeterd worden met behulp van structuur informatie) Locale variaties in structuur zijn altijd mogelijk Inserties die slechts terugevonden worden in een beperkt aantal sequenties sequentie fouten
55
56
57 X straal diffractie
58
Examen structurele bioinformatica Naam:
1. Uit welke onderdelen bestaat elk aminozuur? Leg kort uit waarvoor ze verantwoordelijk zijn (vanuit structureel oogpunt). centraal koolstofatoom (C α ) amino groep (NH 2 ) => peptidebinding carboxyl
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te werken,
DAR Approximate string matching Casus: biological sequence alignment
DAR Approximate string matching Casus: biological sequence alignment 1 Text search Approx string matching dynamic programming, edit distance example application: Google search Text indexing inverted list
Bio-informatica Similariteit Searches. Peter De Rijk
Bio-informatica Similariteit Searches Peter De Rijk 6 Similariteit searches Zoeken naar gelijkende sequenties in sequentie databanken Korte sequentie (b.v. EST) waar we meer van willen weten Andere korte
DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008
DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA 1. Hieronder zie je de schematische weergave van een dubbelstrengs DNA-keten. Een
De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.
Tentamen Genoombiologie, 28 Oktober 2009, 9.00-11.45 h De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.
Bio-informatica Similariteit. Peter De Rijk
Bio-informatica Similariteit Peter De Rijk 5 Similariteit, niet zo simpel Similariteit Similariteit is afhankelijk van de gekozen parameters Grootte, Kleur Functie Afkomst... Globale similariteit (families)
Bio-informatica Genpredictie
Bio-informatica Genpredictie 9 Genpredictie Genpredictie opsporen van functionele gebieden en elementen die verantwoordelijk zijn voor de genstructuur, genregulatie en gentranscriptie in genomische sequenties
Nederlandse samenvatting
Nederlandse samenvatting Nederlandse samenvatting Om te kunnen overleven moeten micro-organismen voedingsstoffen opnemen uit hun omgeving en afvalstoffen uitscheiden. Het inwendige van een cel is gescheiden
DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life
DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life De vragen die voorkomen in het COO-programma DNA & eiwitsynthese zijn op dit formulier weergegeven. Het is de bedoeling dat je,
4. Een heeft een zowel een gunstig patroon van waterstofbruggen en φ en ψ waarden die binnen het toegelaten gebied van een Ramachandran diagram vallen
1. Dialyse gebruikt een semipermeable membraan die: a. Kleine moleculen en water tegenhoudt maar eiwitten doorlaat b. Eiwitten scheidt op basis van hun lading c. Eiwitten scheidt op basis van hun densiteit
GEPE. Deeltoets 1 CURSUSJAAR 2015-2016. 28 september 2015. 13.30-16.00 uur
GEPE Deeltoets 1 CURSUSJAAR 2015-2016 28 september 2015 13.30-16.00 uur Naam: (in blokletters) Registratienummer 1. Begin met je naam en overige gegevens in te vullen. 2. Gebruik voor de beantwoording
Bio-informatica Boom constructie. Peter De Rijk
Bio-informatica Boom constructie Peter De Rijk 8 Waarom boomconstructie Evolutionaire analyse: verwantschap tussen genen en/of species Studie oorsprong en divergentietijden bv. divergentie mens-mensapen,
Afsluitende les. Leerlingenhandleiding. Proteomics voor de massa
Afsluitende les Leerlingenhandleiding Proteomics voor de massa Computeropdracht Inleiding - data van een massaspectrometer Bij dit computerpracticum gaan jullie zelf de data van de analyse van een eiwit
Transcriptie en de Genetische code
Transcriptie en de Genetische code DNA getranscripteerd tot RNA, 3 grote groepen mrna: codeert voor proteïnen rrna: onderdeel van de Ribosomen trna: koppeling tussen AZ en het mrna De informatieflow gaat
ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT
ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT ANTWOORDEN 6.5 /TM 6.8 Codering 1.een juiste aanvulling van het schema : nucleotiden in mrna juist nucleotiden in DNA juist 3 kant en 5 kant bij mrna en DNA juist
1 (~20 minuten; 20 punten)
TENTAMEN Moleculaire Cel Biologie (8A840) Prof. Dr. Ir. L. Brunsveld & Dr. M. Merkx 27-01-2012 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal + 1 bonusvraag! (aangegeven tijd is indicatie) Gebruik
Humane levenscyclus 1
Humane levenscyclus 1 Genexpressie 2 8 september 2011 Doel: Genexpressie (via welke stappen de informatie die in het DNA is opgeslagen gebruikt kan worden om eiwitten te vormen. Differentiële genexpressie
a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P)
HERTENTAMEN Eindtoets BIOCHEMIE (8RA00) Prof. Dr. Ir. L. Brunsveld 16-08-2013 09:00 12:00 (totaal 100 punten) 6 opgaven in totaal! (aangegeven tijd is indicatie) Gebruik geen rode pen! 1 Peptiden en eiwitten
Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.
Centraal Dogma Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al., 6e druk Mei 2016 Van DNA naar mrna Hier zie je een deel van de sequentie
Classification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Docentenhandleiding. Afsluitende module. Op zoek naar een gen in een databank
Docentenhandleiding Afsluitende module Op zoek naar een gen in een databank Ontwikkeld door het Cancer Genomics Centre in samenwerking met het Freudenthal Instituut voor Didactiek van Wiskunde en Natuurwetenschappen
Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie
Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s
TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie)
TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld 25-01-2010 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie) 1 (~30 minuten; 20 punten) Onderstaand is een stukje
Hetzelfde DNA in elke cel
EIWITSYNTHESE (H18) Hetzelfde DNA in elke cel 2 Structuur en functie van DNA (1) Genen bestaan uit DNA Genen worden gedragen door chromosomen Chromosomen bestaan uit DNAmoleculen samengepakt met eiwitten
Bioinformatica en Systeembiologie (BIS)
Waarom een major Bioinformatica en Systeembiologie? Huidige methoden van onderzoek, zoals de DNAchiptechnologie, leveren enorme hoeveelheden gegevens op die met bestaande statistische methoden niet meer
Oplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
Samenvatting. Figuur 1. Algemene structuur van een nucleotide (links) en de structuren van de verschillende basen (rechts).
DA is het molecuul dat in levende organismen alle genetische informatie bevat. et komt doorgaans voor als een dimeer van twee complementaire nucleotide-polymeren, waarbij de individuele nucleotiden in
Hoofdstuk 8 Samenvatting in het Nederlands
Hoofdstuk 8 Samenvatting in het Nederlands 135 Inleiding Het stoppen van een bloeding bestaat uit twee processen: bloedstelping en bloedstolling. Tijdens de bloedstelping worden bloedplaatjes aan de beschadigde
1 Peptiden en eiwitten (~20 minuten; 20 punten)
1 Peptiden en eiwitten (~20 minuten; 20 punten) a. Beschouw bovenstaand synthetisch peptide. Het bevat het aminozuur ornithine, een intermediair in de biosynthese van arginine, welke normaal gesproken
Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen
Tom Heskes IRIS, NIII Inhoud De bouwstenen van het zenuwstelsel: neuronen en synapsen Complex gedrag uit eenvoudige elementen McCulloch-Pitts neuronen Hopfield netwerken Computational neuroscience Lerende
a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P) LLORETDEMAR (iedere fout -1P)
TENTAMEN BIOCHEMIE (8RA00) Prof. Dr. Ir. L. Brunsveld 28-06-2013 09:00 12:00 (totaal 100 punten) 6 opgaven in totaal! (aangegeven tijd is indicatie) Gebruik geen rode pen! 1 Peptiden en eiwitten (~15 minuten;
Figuur 1. Representatie van de dubbele helix en de structuren van de verschillende basen.
Het DNA molecuul is verantwoordelijk voor het opslaan van de genetische informatie die gebruikt wordt voor de ontwikkeling en het functioneren van levende organismen. Aangezien het de instructies voor
BOUWSTENEN VAN HET LEVEN
BOUWSTENEN VAN HET LEVEN Pearson Basisboek Biologie 10voorBiologie VWO Hoofdstuk 1 L. Grotenbreg (MSc.) Bouwstenen van het leven Organische moleculen, groot of klein, bevatten chemische energie en zijn
94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten
94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten Transcriptie bij prokaryoten: Prokaryoten hebben geen celkern, waardoor het DNA los in het cytoplasma ligt. Hier vindt de transcriptie
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie
Onderstaand is een stukje peptide getoond dat deel uit maakt van een groter eiwit en de naam draagt van een lokaal beroemde biochemicus:
1 Onderstaand is een stukje peptide getoond dat deel uit maakt van een groter eiwit en de naam draagt van een lokaal beroemde biochemicus: a. Geef de 1-lettercode van de 6 uitgeschreven aminozuren in de
Naam: Studentnummer: Opleiding:..
1 2 3 4 5 6 B EINDTOETS Biochemie (8RA00) en TENTAMEN Biochemie (8S135) Prof. Dr. Ir. L. Brunsveld 15-08-2014 09:00 12:00 (totaal 100 punten, plus max. 5 extra voor bonus) 6 opgaven in totaal + 1 bonusvraag!
Nederlandse Samenvatting
Nederlandse Samenvatting Samenvatting De mogelijkheid om genen op een specifieke wijze te reguleren creëert diverse manieren om genfunctie te kunnen bestuderen of moduleren. Artificiële transcriptiefactoren
Samenvatting Biologie B2
Samenvatting Biologie B2 Samenvatting door Jacco 2000 woorden 22 mei 2018 10 1 keer beoordeeld Vak Methode Biologie Biologie voor jou 1. Wat kun je doen met DNA DNA bevat eigenschappen over een organisme.
Modeluitwerking Tentamen Computationele Intelligentie Universiteit Leiden Informatica Vrijdag 11 Januari 2013
Modeluitwerking Tentamen Computationele Intelligentie Universiteit Leiden Informatica Vrijdag Januari 20 Opgave. Python Gegeven is de volgende (slechte) Python code:. def t(x): 2. def p(y):. return x*y
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van 8.45-10.45 uur in zaal Q105 NB: geef je antwoorden op dit formulier. Er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken
2,4. Samenvatting door R woorden 5 maart keer beoordeeld. Biologie voor jou. Stofwisseling Biologie. Atomen en Moleculen
Samenvatting door R. 1478 woorden 5 maart 2014 2,4 30 keer beoordeeld Vak Methode Biologie Biologie voor jou Stofwisseling Biologie Atomen en Moleculen -Stof à moleculen à atomen (in kleine hoeveelheden
Neurale Netwerken en Deep Learning. Tijmen Blankevoort
Neurale Netwerken en Deep Learning Tijmen Blankevoort De toekomst - Internet of Things De toekomst - sluiertipje Je gezondheid wordt continue gemonitored Je dieet wordt voor je afgestemd -> Stroomversnelling
Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA.
Het menselijk genoom Het menselijk genoom (DN) bestaat uit: Mega Basenparen (MB),,, C,. Inleiding Medisch echnische Wetenschappen Bioinformatica Deel Michael Egmont-Petersen Het menselijk DN is ingedeeld
Samenvatting Dit proefschrift gaat over Monte Carlo simulatie van polymeersystemen. Polymeren zijn grote moleculen die opgebouwd zijn uit kleinere chemische eenheden die monomeren genoemd worden. Bekende
SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen
SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder
Samenvatting Zure gassen zijn veelvuldig aanwezig in verschillende concentraties in industriële gassen. Deze moeten vaak verwijderd worden vanwege corrosie preventie, operationele, economische en/of milieu
2 e SMT Workshop Moleculaire Typeringen spa typering en MLST
2 e SMT Workshop Moleculaire Typeringen spa typering en MLST 28 30 Januari, 2013 UMC Utrecht en RIVM Leo M Schouls Laboratorium voor Infectieziekten en Screening (LIS) Centrum voor Infectieziektebestrijding
Optimalisatie van de eerste klinische studies in bi ondere patie ntengroepen: op weg naar gebruik van semifysiologische
Nederlandse samenvatting Optimalisatie van de eerste klinische studies in bi ondere patie ntengroepen: op weg naar gebruik van semifysiologische farmacokinetische modellen Algemene inleiding Klinisch onderzoek
DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma
DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma De vragen die voorkomen in het COO-programma DNA & eiwitsynthese zijn op dit formulier weergegeven. Het is de bedoeling dat je, als
Afsluitende les. Leerlingenhandleiding. Visualiseren van eiwitten
Afsluitende les Leerlingenhandleiding Visualiseren van eiwitten Leerlingenhandleiding Visualiseren van Eiwitten Deze les gaat over de structuur van eiwitten. De les bestaat uit vier opdrachten: 1. Hoe
Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.
Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information
AI introductie voor testers
AI introductie voor testers De basis van deep learning TestNet werkgroep Testen met AI Martin van Helden Sander Mol Introductie Artificial Intelligence (AI) is anders dan traditioneel programmeren. Traditioneel
Summary in Dutch 179
Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse
Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu
Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu Samenvatting Met dit proefschrift richten we onze aandacht op object herkenning en detectie voor een beter begrip in afbeeldingen.
Uitwerking Tentamen Datamining (2II15) 26/06/09
Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a)
In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen.
Leerlijn programmeren In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Deze leerlijn is opgebouwd aan de
IWEX 3D imaging. Content 11/03/2015
IWEX 3D imaging Content Introductie Imaging (beeldvorming) technologieën in andere veld applicaties Principe van ultrasoon imaging met IWEX: Full matrix capture Data display 2D en 3D IWEX imaging in de
Dataconversie met Oracle Spatial
Realworld klantendag 19 september 2013 Voorstellen 1 2 Computer Science & Engineering (TU/e) 3 Realworld Systems 4 Datamigraties Alliander Stedin Agenda 1 Architectuur Inleiding Ontwerp migratie 2 Rapportage
Path-Metadynamics. A Computational Study of Conformational Transitions in Proteins G. Díaz Leines
Path-Metadynamics. A Computational Study of Conformational Transitions in Proteins G. Díaz Leines Path-Metadynamics A computational study of conformational transitions in proteins Grisell Díaz Leines Computational
studie waarmee we de principes van de analyse willen demonstreren. Een volledig beschrijving van de algoritmen en de resultaten zijn te vinden in
Bio-informatica kan omschreven worden als het toepassen van algoritmen om meerwaarde te verkrijgen uit data afkomstig van biomedisch en/of biologisch onderzoek. In bio-informatica wordt onderzoek gedaan
Samenvatting en algemene discussie Het DNA, de drager van alle genetische informatie, wordt constant bedreigd door verschillende factoren.
152 Samenvatting en algemene discussie Het DNA, de drager van alle genetische informatie, wordt constant bedreigd door verschillende factoren. Door een reactie met het DNA veranderen deze factoren de moleculaire
94 Samenvatting te vervormen, wordt de huid bijzonder stijf bij grotere vervormingen. Uit onderzoek is gebleken dat deze eigenschap deels toe te schri
Samenvatting De biofysica kan worden beschouwd als het grensgebied tussen de natuurkunde en de biologie. In dit vakgebied worden natuurkundige methoden gebruikt om biologische systemen te analyseren en
Data Mining: Classificatie
Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen
1 (~20 minuten; 20 punten)
HERTENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld 28-01-2013 09:00 12:00 (totaal 100 punten + 5 bonuspunten) 6 opgaven in totaal + 1 bonusvraag! (aangegeven tijd is indicatie) Gebruik geen rode
Bio-informatica Sequentie Patronen. Peter De Rijk
Bio-informatica Sequentie Patronen Peter De Rijk 7 Patroon Herkenning Patroon Herkenning Patroon Herkenning Afhankelijk van groepsspecificaties! Doel Patroon Herkenning Met een gegeven set sequenties Behoort
4,4. Praktische-opdracht door een scholier 2016 woorden 4 november keer beoordeeld
Praktische-opdracht door een scholier 2016 woorden 4 november 2005 4,4 5 keer beoordeeld Vak ANW Voorwoord Het leven, wat heeft er allemaal met het leven te maken. Het leven is erg ingewikkeld, een goede
We wensen je veel succes met studeren en het halen van jouw tentamens!
Voorwoord Beste geneeskundestudent, Voor je ligt de samenvatting van Blok 1.1.1 Deel 2 voor de studie geneeskunde. SlimStuderen.nl heeft de belangrijkste informatie uit alle verplichte literatuur voor
Biologie Vraag 1 <A> <B> <C> <D> Vraag 1. Dit zijn een aantal gegevens over een nucleïnezuur.
Biologie Vraag 1 Dit zijn een aantal gegevens over een nucleïnezuur. 1. Het is een enkelvoudige keten. 2. Het bevat als basen: G A C T. 3. Het varieert naargelang de soort cel binnen één organisme. 4.
Biofysische Scheikunde: NMR-Spectroscopie
De Scalaire Koppeling Vrije Universiteit Brussel 13 maart 2012 Outline 1 De Invloed van Andere Kernen 2 Outline 1 De Invloed van Andere Kernen 2 Opnieuw Ethanol (1) Met een nauwkeuriger NMR-instrument
Tentamen Biochemie,, onderdeel Abrahams, 2e jaar MST, Antwoorden
Tentamen Biochemie,, onderdeel Abrahams, 2e jaar MST, 26-09-2014 Antwoorden 1. Hieronder is de structuur weergegeven van octadecyl rhodamine B chloride. Let op de alifatische (CH 2 ) 17 keten die is veresterd
Hoe kijken we naar het DNA van een patiënt?
Hoe kijken we naar het DNA van een patiënt? Ies Nijman UMC Utrecht Dept of Genetics, Centre for Molecular Medicine Center for Personalized Cancer Treatment (CPCT), Hartwig Medical Foundation 1994 DNA sequenties,
Personiceren van stemmen met Deep Learning
Personiceren van stemmen met Deep Learning Kan het Nationaal Archief straks teksten voorlezen met de stem van Joop den Uyl? Esther Judd-Klabbers 20 September 2016 Overzicht Introduction Statistische Parametrische
Theoretische Biologie: 13 april Vraag 1: Dit zijn multiple choice vragen. Om-cirkel het meest correcte antwoord.
Theoretische Biologie: 13 april 2012 1 Naam: Collegekaartnummer: Vraag 1: Dit zijn multiple choice vragen. Om-cirkel het meest correcte antwoord. 1.1 Beschouw de functie: y = (a x 2 )(x b), a < b; Welke
