Bio-informatica Genpredictie

Maat: px
Weergave met pagina beginnen:

Download "Bio-informatica Genpredictie"

Transcriptie

1 Bio-informatica Genpredictie 9

2 Genpredictie Genpredictie opsporen van functionele gebieden en elementen die verantwoordelijk zijn voor de genstructuur, genregulatie en gentranscriptie in genomische sequenties

3 Prokaryoten Bacteriele genomen Dense, compacte genomen 85-88% coderend Continue genen Korte intergenische afstanden Elementen prokaryote genen Promotor Een beperkt aantal σ factoren Herkenning specifieke promotors Consensus rond -35 en -10 t.o.v transcriptie start Meest courante σ70 consensus TATAAT op -10 Andere regulatoren in/achter promotor, vaak negatieve regulatie Verschillende genen vaak samen afgeschreven in 1 operon 5' Promotor CDS DNA

4 Prokaryoten Start translatie Shine-Delgarno sequentie (AGGAGGU) Vaak vlak achter promotor, vlak voor start codon Start codon AUG (zelden UUG of GUG) Terminatie transcriptie Geinverteerde repeat Kan haarspeld structuur vormen Kan RNA polymerase doen pauzeren Een zestal opeenvoldende Uracil nucleotiden vlak na deze repeat Zwakkere binding

5 Prokaryoten Open Reading Frame (ORF) = Stuk sequentie zonder stopcodons (in coderend stuk zitten er nl. Geen stopcodons) Detectie van genen door grotere ORF te zoeken Meeste genen > 60 codons Willekeurig: 1 stopcodon per 21 codons (3/64) > 60 codons -> ws. Gen

6 Prokaryoten Genpredictie in prokaryoten Continue genen Meestal lange ORFs (> 60 codons) Relatief simpel herkenbare promotors Herkenbaar einde transcriptie Meeste nucleotiden zijn coderend Problemen Korte genen (~korter dan 60 codons) Sequentie fouten (ORF is hier gevoelig voor) Overlappende genen op beide strands

7 Eukaryoten Eukaryote genomen Slechts enkele procenten zijn coderend Complexe genstructuur splicing Geneste en overlappende genen Alternatieve splicing ~ verschillende isovormen Lange genen CDS verspreid over grote gebieden (lange intronen) Niet simpelweg zoeken naar ORFs Promotor geconserveerde sequenties diffuser en veel verder van start

8 Van DNA tot proteine Upstream Downstream Genomisch DNA Promotor Intron 1 Intron 2 Intron 3 Intron 4 Genomisch DNA 5' 3' Exon 1 Exon 2 Exon 3 Exon 4 Exon 5 DNA Transcriptie en processing CAP Intron 1 Intron 2 Intron 3 Intron 4 PolyA (7-methylguanosine) Exon 1 Exon 2 Exon 3 Exon 4 Exon 5 pre-mrna Splicing CAP 5'UTR CDS 3'UTR PolyA mrna Translatie Proteïne Posttranslationele processing

9 GFF GFF General Feature Format (vroeger Gene Feature Format ) Eenvoudig, standaard formaat voor identificatie regios in een sequentie (exon, CDS,...) Verschillende velden met vaste volgorde (gescheiden door TAB karakters) Eerste lijn commentaar (begint met #) die file formaat en versie aanduid Volgende lijnen data Gemakkelijk te bekijken, vergelijken, testen, integreren

10 GFF ##gff-version 3 SEQ1 EMBL mrna ID=gene1 SEQ1 EMBL CDS Parent=gene1 SEQ1 EMBL splice SEQ1 netgene splice SEQ1 EMBL CDS Parent=gene1 seqid bron feature start einde score streng fase attributen seqid: naam van de sequentie bron: programma, publieke database annotatie, experimenteel feature: feature type, karaktereigenschappen start: getal dat begin van feature op sequentie aangeeft (nummering start met 1) einde: getal dat einde feature aangeeft score: getal waarschijnlijkheid dat deze voorspelling correct is (. voor geen score) streng: +, - or. (. wordt gebruikt wanneer niet relevant) fase: 0,1,2 or. Geeft aan waar deze feature zit t.o.v. het reading frame hoeveel nucleotiden vanaf start feature horen nog bij vorige codon [group/attributen]: optioneel, in de vorm van tag1=value1;tag2=value2; ID en Parent tags kunnen worden gebruikt om een hierarchie aan te geven [comments]: optionele string

11 Accuraatheid Vergelijking methoden Met gekende genen (test set) voorspellingen van verschillende methoden vergelijken testset eigenlijk liefst zo representatief mogelijk voor wat je gaat vergelijken Standaard test en trainings datasets (Burset and Guigo, Reese) Maar Bias in training data door welke genen aanwezig zijn in de databases Bias naar standaard test sets/genen 1 gen per sequentie vs meerdere/partiele in reëele data Toelaten organisme specifieke training? In hoeverre zijn deze standaard test/training sets representatief

12 Accuraatheid EGASP ENCODE Genome Annotation Assessment Project Workshop om accuraatheid voorspellingen na te gaan ENCODE, HAVANA hoge kwaliteit annotatie op manuele en experimentele basis (langdurig en kostelijk) een deel hiervan vrij gegeven (als trainings data) deelnemers werden gevraagd om met hun methoden de overige encode regios te annoteren (zonder kennis van de experimentele annotatie) vergelijking automatische predictie met annotatie verschillende categorien: 1. eender welke informatie 2. enkel ab-initio 3. extrinsieke methoden 4. comparatieve methoden 5. nieuwe genen 6. ongewone genen 7. exon-only Doel Hoe goed reproduceren verschillende automatische methodes deze annotatie hoe ver rijkt onze kennis: predicties niet in de manuele annotaties worden uitgebreid experimenteel gecontroleerd via RT-PCR

13 Accuraatheid Categorie: Exon level TP = True Positives, TN = True Negatives FP = False Positives, FN = False Negatives Sensitiviteit: Sn = TP/(TP+FN) Proportie van echte exonen die correct voorspeld werd (beide einden exact correct)(start-stop op juiste positie) Specificiteit (volgens EGASP): Sp = TP/(TP+FP) Volgens klassieke definities heet deze maat eigenlijk de precision, de specificiy volgens klasieke definitie, TN/(TN+FN), kan hier niet gemakkelijk berekend worden Proportie van voorspelde exonen die correct voorspeld werd Hoe hoger Sp: hoe minder vals positieven Hoe hoger Sn: hoe minder vals negatieven Andere Hoeveel missing exons (niet voorspelde exonen)? Hoeveel wrong exons (volledig incorrecte voorspelling)? Hoeveel half exons (een uiteinde correct)?

14 Accuraatheid Categorie: Nucleotide level Sensitiviteit (Sn) = TP / (TP + FN) Proportie van exonische nucleotiden die correct voorspeld werd Specificiteit (Sp) (volgens EGASP) = TP / (TP + FP) Proportie van nucleotiden die voorspeld werden exonisch te zijn waarbij die voorspelling correct is

15 Accuraatheid Matthews Correlatie coefficient Probeert Sn en Sp samen te vatten in 1 getal 1 maat voor de globale accuraatheid van nucleotide predictie CC=(TP x TN FP x FN)/(ANxAPxPPxPN)-2 AN = Actual Negatives (FP+TN) AP = Actual Positives (TP+FN) PP = Predicted Positives (TP+FP) PN = Predicted Negatives (TN+FN) Tussen -1 and 1 1: perfecte predictie -1: perfect verkeerde predictie Waarde 0 betekent geen correlatie tussen predictie en werkelijkheid: ~ random toewijzing

16 Typische problemen Training Species specificiteit van signalen, training, parameters Goede datasets zijn moeilijk te vinden Experimenteel geverifieerd Representatief?! Alternatieve splicing is moeilijk te voorspellen Geneste genen

17 Overzicht methoden Extrinsieke methoden Vergelijking met cdna, ESTs, gekende proteinen Externe data BLAST, FASTA met databases -> exonen Spliced alignment Intrinsieke methoden Patroonherkenning Signal sensors Splice sites, start en stop codons, polya site,... Content sensors Coderende regios Geintegreerde methoden Comparative genomics Conservatie bij vergelijking van verschillende genomen Analyse pipelines

18 Extrinsieke methode: Spliced alignement Spliced alignement Alignatie van cdna ( enkel exonen), proteïne t.o.v. genomische sequentie Rekening houdend met intronen Grote gaps Positionering van gaps op intron grenzen Moeilijker door mogelijke overlap van alignmenten Upstream Promotor Intron 1 Intron 2 Intron 3 Intron 4 Downstream Genomisch DNA Exon 1 Exon 2 Exon 3 Exon 4 Exon 5 Genomisch DNA 5' 3' DNA CAP 5'UTR 3'UTR PolyA mrna

19 Spliced RNA alignement Soorten RNA EST Veel Lage sequentie kwaliteit, korte stukken transcript mrna, geclusterde ESTs Langer/volledig transcript Gen structuren Minder beschikbaar Interessantste goede spliced alignment van mrna ~ experimenteel bewijs! Annotatie van genomische regio Geschikte RNA sequenties evt. Vinden in databanken met bv. BLAST

20 Problemen Spliced RNA alignement Bias naar sterk geexpresseerde genen Meer informatie over sterk geëxpresseerde genen Weinig/facultatief geexpresseerde genen worden gemakkelijker gemist Sequentie kwaliteit bij fouten in de sequentie is correct alignatie moeilijker Contaminatie met genomische sequenties Wanneer er nog een intron in een mrna sequentie zit). Modellering splice sites

21 Spliced RNA alignement Programma's Spidey (zie oefeningen) Alignatie mrna, ESTS (lokaal alignement exonen) Gebaseerd op BLAST algoritme GeneSeqer sim4 Construct genomic windows: stringente BLAST, sorteren, consistente hits Alignement in windows: weinig stringente BLAST + Dotview Detectie splice sites (met PWM) in gebieden waar alignementen van exonen overlappen Beste splice sites (score) die de alignementen het minst verstoren Niet consistente hits worden eruit gefilterd. Ook minder verwante ESTs

22 Spliced proteïne alignement Spliced alignement met verwante, gekende proteïne sequenties Programma's Procrustes beste combinatie mogelijke exonen met dynamic programming Genewise (WISE2) dynamic programming, statistische modellen van splice sites Problemen Bias naar gekende genen/genfamilies Databases (SWISS PROT/TrEMBLE) met b.v. ook hypothetische/verkeerd geannoteerde proteïnen Modellering splice sites

23 Intrinsieke methoden Patroonherkenning Signal sensors Patronen met specifieke positie in genstructuur Splice sites, start en stop codons, polya site,... Methoden: Consensus sequenties, weight matrices, HMM, NN,... Content sensors Patronen in een regio (dus niet 1 specifieke positie) in genstructuur Coderende regios Methoden: Statistische analyse in window, HMM, Geintegreerde systemen Integratie van verschillende sensoren tot volledige genstructuur predictie meest gebruikt Ook wel eens ab-initio methoden genoemd = Vanuit eerste beginselen, zonder gebruik te maken van extra data (Maar: veel methoden gebruiken wel trainingsdata om patronen te leren...)

24 Promotor herkenning Polymerasen RNA polymerase I -40 tot +20 simpel rrna, snrna RNA polymerase II... tot -25 zeer complex coderende genen (belangrijkste) RNA polymerase III +50 tot +100 simpel trna, small RNAs Herkenbare elementen (~ niet altijd aanwezig) CpG eilanden bij sommige promotoren Initiator (Inr) sequentie [CT][CT]CA[GA][GA] rond +1 Transcriptie factoren (TF) Basale transcriptie factor bindende site rond -25 consensus TATA[AT]A[AT] TATA box Vele andere TF binding sites, en combinaties Dicht bij transcriptie start b.v. CAAT-box: zelfde orientatie, -80 Enhancers kunnen werken op grote afstand van transcriptie start, en in verschillende orientaties

25 Promoter herkenning TF databases TF binding sites gebaseerd op profielen/matrices TRANSFAC Zeer uitgebreid, commercieel JASPAR Open alternatief, kleiner, niet redundant, curated

26 Promoter herkenning Problemen TATA-loze promoters Transcriptie factor binding sites zijn zeer kort komen veelvuldig voor, ook buiten promotoren Zoeken naar combinaties Promotor kan groot gebied beslaan Context is belangrijk! Niet zoveel uitgebreid experimenteel bepaald

27 Promoter herkenning Programma's PromoterScan database van bindingssites van gekende transcriptie factoren MatInd en MatInspector Consensus matches met gekende TF bindingsplaatsen (TRANSFAC) TSSG/TSSW LDA combinatie van herkenning verschillende features (TATA-box, Inr signaal, upstream regio) CBS Promoter 2.0 Neurale netwerken geoptimaliseerd m.b.v genetische algoritmen CorePromoter QDA (Quadratic Discrimination Analysis) Zoekt TSS en core promoter in sequentie van beperkte lengte Neural Network Promoter Prediction time-delay neural network Markov Chain Promoter Finder

28 Splice sites Herkenbare elementen Donor consensus [CA]AG^GT[AG]AGt Acceptor consensus (T>C)nN(C>T)AG^gt Branch site tussen 18 en 40 basen upstream van 3' splice junctie Meestal in combinatie met coding bias Problemen overpredictie Context! U12 afhankelijke (AT-AC) splice sites Andere types intronen (vnl. In non-coding genes)

29 Splice site programma's NetGene2 Combinatie neurale netwerken en en rule-based systemen NNSPLICE Multi-layered feed-forward neural network BCM Genefinder HSPL (human) Triplet frequenties in de functionele gebieden van de splice regio in combinatie met codon statistieken SplicePredictor Logitlinear models Match t.o.v. Splice site consensus Lokaal compositioneel contrast

30 Startcodon Kozak rules Meestal eerste methionine van 5' dat je in transcript tegen komt = startcodon Consensus [AG]CCAUGG Programma's Netstart Neuraal netwerk gebaseerd op lokale start codon informatie en globale sequentie informatie Getraind op cdna sequenties ATGpr lineaire discriminant analyse

31 PolyA PolyA Herkenning plaats waar poly-a tail ( A's) wordt aangehangen herkenning sequenties A[AT]TAAA ~20 basen voor knipplaats Zwak geconserveerd GT gebaseerd motief Werkt enkel in de juiste context! dikwijls laatste exon Programma's BCM GeneFinder POLYAH Triplet frequenties in functionele delen LDA

32 Coding potential Hoe coderend is een sequentie? Moet werkzaam proteïne produceren Evolutie van coderende sequenties wordt sterk beinvloed door het gecodeerde product Vele methoden om de coderendheid van sequenties te herkennen Van statistiek over een window van een bepaalde grootte Tot complexe machine learning technieken Moeilijker exacte grenzen te bepalen ~ combinatie met splice donor/acceptor

33 Coding potential Methoden gebaseerd op de (vertaalde) AZ sequentie ORF: afwezigheid van stop codons AZ of diaz gebruik Codon gebruik Codon usage vector: frequentie van 64 mogelijke codons Verschillen o.w.v. verschillend AZ gebruik, codon voorkeuren Bias in base samenstelling tussen codon posities Meest frequente codons RNY ([AG][UCAG][UC]) Positie assymetrie: assymetrie in basensamenstelling op de drie verschillende codon posities Periodiciteit Coderende sequence (CDS) heeft een inherente periodiciteit van 3 Vooral duidelijk in lange CDS; moeilijk voor korte CDS Auto-correlatie, FFT (fourier transformaties),...

34 Coding potential Invloed reading frame AZ samenstelling in coding frame vs niet-coding frame (meer stop codons dan bij toeval) Codon samenstelling in alle frames Codon positie correlaties (dinucleotide distributie) In-phase woorden Frequenties van voorkomen van woorden (lengte N) Hexameer frequenties zeer succesvol Omvat eigenlijk meeste hiervoor vermelde elementen Brengen correlaties over korte regios in rekening b.v. Codon eindigend op een G wordt meestal niet gevolgd door een codon dat begint met een G Machine Learning gebaseerde methoden HMM, NN training op gekende sets (experimenteel bepaalde CDS)

35 Coding potential Programma's GRAIL I GeneMark Glimmer Neuraal netwerk met shifting window Inhomogene Markov chain models Interpolated Markov chains

36 Geintegreerde systemen Vinden van volledige genstructuren kan via verschillende methoden Integratie van de resultaten van een aantal sensoren m.b.v. HMMs, neurale netwerken and decision trees Integratie binnen 1 systeem b.v. HMM Beste combinatie exonen met dynamic programming Evt. incorporatie homologie informatie

37 Genscan Forward Strand Model Genscan HMM Cirkels en ruiten functionele eenheden (toestanden) van een gen N neutraal (niet in een gen) Prom promotor 5' start transcriptie Exon Sngl voor genen die uit 1 enkel exon bestaan Exonen (Exon 0,1,2) en intronen (I0,I 1,I 2 ) worden geassocieerd met de fase (t.o.v. het reading frame) Bij test sequentie wordt elke base toegewezen aan een toestand Volledig model Getoonde model enkel forward strand ditzelfde ook nog eens voor reverse strand Genen in beide richtingen tegelijk voorspeld Reverse Strand gelijkaardig aan hierboven

38 Geintegreerde systemen GENSCAN Meerdere signaal en content modellen, HMM sensoren Verschillende modellen afh. Van GC Zeer goede resultaten AUGUSTUS Generalized HMM annoteert ook UTR, alternatieve transcripten. incorporatie van extrinsieke data is mogelijk (AUGUSTUS+) lijkt nog acurater dan Genscan (EGASP) TWINSCAN Gebaseerd op GENSCAN Incorporeert homologie informatie uit genome comparison GeneID, GeneID+ Signalen met Position Weight Matrices, coding potential met MM Combinatie exonen met dynamic programming GeneID+ incorporeert homologie data Goede resultaten, snelheid en geheugenverbruik

39 Geintegreerde systemen Eugène Combinatie van vele systemen, plugins Vnl. Getraind op plant genomen MORGAN Decision trees, dynamic programming GRAIL Verschilende sensoren+nn (neural networks) Combinatie rule-based GRAILExp Verbeterde sensoren Incorporatie EST/cDNA data GeneParser NN, dynamic programming Andere FGENEH, Genemark, Genemark.hmm, NetGene2, SORFIND, GenLang,VEIL, GENIE, HMMgene,...

40 Genome comparison Methode Vergelijking homologe genomische regios binnen verwante soorten bv. mens muis Studie van conservatie Regios met belangrijke functies (CDS, regulatoire gebieden) worden sterker geconserveerd Problemen Interessante homologe region moet beschikbaar zijn voldoende geconserveerd, maar niet helemaal Soms ook conservatie buiten CDS,... Conservatie duidt op belang regio, zegt niet direct welke functie (CDS, regulatie)

41 Genome comparison PipMaker Alignatie gebieden met BLASTZ pip: percent identity plot Percent identiteit van gap-vrije gealigneerde segmenten Uitzetten in grafiek positie in sequentie similariteit van de gealigneerde segmenten Veel/Langere alignmenten met hoge similariteit exonen, regulatoire elementen

42 PipMaker Pipmaker output Exonen in groen aangeduid Regulatoire gebieden in rood Intronen in het geel

43 Genome comparison AGenDA Kandidaat exonen Fragmenten gevonden met dialign alignatie algoritme Splice sites met PWM en start/stop codons in buurt van geconserveerde regios Beste combinatie met dynamic programming

44 AGenDa Agenda example

45 Genome comparison SLAM SGP2 Twinscan Simultane alignatie en predictie GPHMM (Generilized Pair HMM) onderscheid tussen conserved non-coding sequence (CNS; UTR, regulatoire elementen,...) en conserved coding sequence tblastx tussen 2 anonieme homologe genomische sequenties Geneid combineert hit data met ab-initio genpredictie Genscan gebaseerd algoritme combineert hit data met ab-initio genpredictie

46 Annotatie pipelines Pipeline Scripts/programma's die automatisch opeenvolging/combinatie van verschillende analyse programma's regelen Vaak parallelle computer systemen Alle annotatie wordt centraal verzameld, beschikbaar gesteld Voorbeelden Ensembl NCBI mapviewer

Transcriptie en de Genetische code

Transcriptie en de Genetische code Transcriptie en de Genetische code DNA getranscripteerd tot RNA, 3 grote groepen mrna: codeert voor proteïnen rrna: onderdeel van de Ribosomen trna: koppeling tussen AZ en het mrna De informatieflow gaat

Nadere informatie

Bio-informatica Similariteit Searches. Peter De Rijk

Bio-informatica Similariteit Searches. Peter De Rijk Bio-informatica Similariteit Searches Peter De Rijk 6 Similariteit searches Zoeken naar gelijkende sequenties in sequentie databanken Korte sequentie (b.v. EST) waar we meer van willen weten Andere korte

Nadere informatie

Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.

Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al. Centraal Dogma Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al., 6e druk Mei 2016 Van DNA naar mrna Hier zie je een deel van de sequentie

Nadere informatie

Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105

Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te werken,

Nadere informatie

DAR Approximate string matching Casus: biological sequence alignment

DAR Approximate string matching Casus: biological sequence alignment DAR Approximate string matching Casus: biological sequence alignment 1 Text search Approx string matching dynamic programming, edit distance example application: Google search Text indexing inverted list

Nadere informatie

Docentenhandleiding. Afsluitende module. Op zoek naar een gen in een databank

Docentenhandleiding. Afsluitende module. Op zoek naar een gen in een databank Docentenhandleiding Afsluitende module Op zoek naar een gen in een databank Ontwikkeld door het Cancer Genomics Centre in samenwerking met het Freudenthal Instituut voor Didactiek van Wiskunde en Natuurwetenschappen

Nadere informatie

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 31 maart 2006 van uur in zaal Q105

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 31 maart 2006 van uur in zaal Q105 Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 31 maart 2006 van 8.45-10.45 uur in zaal Q105 NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te

Nadere informatie

Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA.

Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA. Het menselijk genoom Het menselijk genoom (DN) bestaat uit: Mega Basenparen (MB),,, C,. Inleiding Medisch echnische Wetenschappen Bioinformatica Deel Michael Egmont-Petersen Het menselijk DN is ingedeeld

Nadere informatie

94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten

94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten 94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten Transcriptie bij prokaryoten: Prokaryoten hebben geen celkern, waardoor het DNA los in het cytoplasma ligt. Hier vindt de transcriptie

Nadere informatie

Hetzelfde DNA in elke cel

Hetzelfde DNA in elke cel EIWITSYNTHESE (H18) Hetzelfde DNA in elke cel 2 Structuur en functie van DNA (1) Genen bestaan uit DNA Genen worden gedragen door chromosomen Chromosomen bestaan uit DNAmoleculen samengepakt met eiwitten

Nadere informatie

Humane levenscyclus 1

Humane levenscyclus 1 Humane levenscyclus 1 Genexpressie 2 8 september 2011 Doel: Genexpressie (via welke stappen de informatie die in het DNA is opgeslagen gebruikt kan worden om eiwitten te vormen. Differentiële genexpressie

Nadere informatie

DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008

DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA 1. Hieronder zie je de schematische weergave van een dubbelstrengs DNA-keten. Een

Nadere informatie

waarin de op dit moment relevante bron data als ook de analyse technieken worden geintegreerd.

waarin de op dit moment relevante bron data als ook de analyse technieken worden geintegreerd. 129 Samenvatting Bioinformatica is een interdisciplinair onderzoeksveld waarbij methoden uit de computer wetenschappen, wiskunde en statistiek worden gebruikt met het specifieke doel betekenis te geven

Nadere informatie

De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.

De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr. Tentamen Genoombiologie, 28 Oktober 2009, 9.00-11.45 h De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.

Nadere informatie

DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life

DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life De vragen die voorkomen in het COO-programma DNA & eiwitsynthese zijn op dit formulier weergegeven. Het is de bedoeling dat je,

Nadere informatie

ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT

ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT ANTWOORDEN 6.5 /TM 6.8 Codering 1.een juiste aanvulling van het schema : nucleotiden in mrna juist nucleotiden in DNA juist 3 kant en 5 kant bij mrna en DNA juist

Nadere informatie

Probabilistische modellen in de bio-informatica. Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002

Probabilistische modellen in de bio-informatica. Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002 Probabilistische modellen in de bio-informatica Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002 Overzicht Wat is bio-informatica? Waarom bio-informatica? Planning

Nadere informatie

1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5'

1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5' proefexamen 1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5' CTAAATC 3' 5' GGAACC 3' Restriction Endonucleases

Nadere informatie

Groeiende hoeveelheid data. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 4. Structuur van een database. Selectie uit NIH-databases

Groeiende hoeveelheid data. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 4. Structuur van een database. Selectie uit NIH-databases Groeiende hoeveelheid data Inleiding Medisch Technische Wetenschappen Naarmate de technieken voor de analyse van het DNA en de duizenden processen in de cel verbeteren, groeit de hoeveelheid proteïnesequenties

Nadere informatie

Bioinformatica tentamen D2 voor 2MNW op maandag 29/05/2006 van :45 in KC159. Studentnummer:

Bioinformatica tentamen D2 voor 2MNW op maandag 29/05/2006 van :45 in KC159. Studentnummer: Bioinformatica tentamen D2 voor 2MNW op maandag 29/05/2006 van 08.45-10:45 in KC159 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd om antwoorden verder uit te werken, mocht je over

Nadere informatie

Samenvatting Biologie B2

Samenvatting Biologie B2 Samenvatting Biologie B2 Samenvatting door Jacco 2000 woorden 22 mei 2018 10 1 keer beoordeeld Vak Methode Biologie Biologie voor jou 1. Wat kun je doen met DNA DNA bevat eigenschappen over een organisme.

Nadere informatie

a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P)

a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P) HERTENTAMEN Eindtoets BIOCHEMIE (8RA00) Prof. Dr. Ir. L. Brunsveld 16-08-2013 09:00 12:00 (totaal 100 punten) 6 opgaven in totaal! (aangegeven tijd is indicatie) Gebruik geen rode pen! 1 Peptiden en eiwitten

Nadere informatie

HERKANSINGSTENTAMEN Moleculaire Biologie deel 2, 5 Jan 2007

HERKANSINGSTENTAMEN Moleculaire Biologie deel 2, 5 Jan 2007 HERKANSINGSTENTAMEN Moleculaire Biologie deel 2, 5 Jan 2007 NAAM: STUDENTNUMMER: CONTROLEER OF DIT TENTAMEN 14 PAGINA S BEVAT. Veel succes! o Je mag de achterkant van het papier ook zo nodig gebruiken,

Nadere informatie

Bioinformatica tentamen D2 voor 2MNW op maandag 29/05/2007 van :45 in Q105

Bioinformatica tentamen D2 voor 2MNW op maandag 29/05/2007 van :45 in Q105 Bioinformatica tentamen D2 voor 2MNW op maandag 29/05/2007 van 08.45-10:45 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd om antwoorden verder uit te werken, mocht je over een

Nadere informatie

Tentamen Kunstmatige Intelligentie (INFOB2KI)

Tentamen Kunstmatige Intelligentie (INFOB2KI) Tentamen Kunstmatige Intelligentie (INFOB2KI) 30 januari 2014 10:30-12:30 Vooraf Mobiele telefoons dienen uitgeschakeld te zijn. Het tentamen bestaat uit 7 opgaven; in totaal kunnen er 100 punten behaald

Nadere informatie

Leerlingenhandleiding

Leerlingenhandleiding Leerlingenhandleiding Zelfstandige module Op zoek naar een gen in een databank Op zoek naar een gen in een databank Met behulp van databanken kun je informatie opzoeken over genen. Een databank is een

Nadere informatie

Assembleren van het DNA van organismen uit miljoenen korte fragmenten

Assembleren van het DNA van organismen uit miljoenen korte fragmenten Assembleren van het DNA van organismen uit miljoenen korte fragmenten Stap 1: chemisch proces 1. CGGTTC 2. ACGCGG 3. TTCCGG 4. CGGGCT 5. TCACGG 6. CGGACG. korte stukjes DNA TCA TTC CGG GCT ACG Stap 2:

Nadere informatie

Tentamen Genetica 22-10-2004 Studentnr:

Tentamen Genetica 22-10-2004 Studentnr: CONTROLEER OF DIT TENTAMEN 11 PAGINA S BEVAT. Veel succes! Je mag de achterkant van het papier ook zo nodig gebruiken, maar beantwoord vragen 1-6 niet op blaadjes van vraag 7 en de daarop volgende. 1.

Nadere informatie

1 (~20 minuten; 20 punten)

1 (~20 minuten; 20 punten) TENTAMEN Moleculaire Cel Biologie (8A840) Prof. Dr. Ir. L. Brunsveld & Dr. M. Merkx 27-01-2012 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal + 1 bonusvraag! (aangegeven tijd is indicatie) Gebruik

Nadere informatie

STEMPEL DE WEG VAN GEN NAAR EIWIT

STEMPEL DE WEG VAN GEN NAAR EIWIT A LIFE TYPEFACE STEMPEL DE WEG VAN GEN NAAR EIWIT De eiwitsynthese is één van de belangrijkste processen die zich in de cel afspelen. Eiwitten staan aan de basis van het functioneren van de cel. Wat een

Nadere informatie

Neurale Netwerken en Deep Learning. Tijmen Blankevoort

Neurale Netwerken en Deep Learning. Tijmen Blankevoort Neurale Netwerken en Deep Learning Tijmen Blankevoort De toekomst - Internet of Things De toekomst - sluiertipje Je gezondheid wordt continue gemonitored Je dieet wordt voor je afgestemd -> Stroomversnelling

Nadere informatie

Leerlingenhandleiding

Leerlingenhandleiding Leerlingenhandleiding Afsluitende module Op zoek naar een gen in een databank Op zoek naar een gen in een databank Tijdens het DNA-lab Lees de taal van de tumor hebben jullie drie genen onderzocht. Welke

Nadere informatie

User Profile Repository Testrapportage kwaliteit

User Profile Repository Testrapportage kwaliteit CatchPlus User Profile Repository Testrapportage kwaliteit Versie 1.1 User Profile Repository Testrapportage kwaliteit Versie: 1.1 Publicatiedatum: 20-4-2012 Vertrouwelijk GridLine B.V., 2012 Pagina 1

Nadere informatie

Moleculaire diagnostiek

Moleculaire diagnostiek Moleculaire diagnostiek van infectieziekten Arjan de Jong 8 december 2015 Moleculaire diagnostiek Diagnostiek op basis van moleculair biologische (DNA/RNA) technieken Moleculaire diagnostiek van infecties

Nadere informatie

Bio-informatica Structuur

Bio-informatica Structuur Bio-informatica Structuur 10 Structuur niveaus Primaire structuur Sequentie Secundaire structuur Basis structuur elementen Tertiaire structuur 3D structuur Posttranslationele (posttranscriptionele) modificaties

Nadere informatie

Bio-informatica Boom constructie. Peter De Rijk

Bio-informatica Boom constructie. Peter De Rijk Bio-informatica Boom constructie Peter De Rijk 8 Waarom boomconstructie Evolutionaire analyse: verwantschap tussen genen en/of species Studie oorsprong en divergentietijden bv. divergentie mens-mensapen,

Nadere informatie

DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma

DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma De vragen die voorkomen in het COO-programma DNA & eiwitsynthese zijn op dit formulier weergegeven. Het is de bedoeling dat je, als

Nadere informatie

Bioinformatica en Systeembiologie (BIS)

Bioinformatica en Systeembiologie (BIS) Waarom een major Bioinformatica en Systeembiologie? Huidige methoden van onderzoek, zoals de DNAchiptechnologie, leveren enorme hoeveelheden gegevens op die met bestaande statistische methoden niet meer

Nadere informatie

Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.

Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo. Grootste examentrainer en huiswerkbegeleider van Nederland Biologie Trainingsmateriaal De slimste bijbaan van Nederland! lyceo.nl Traininingsmateriaal Biologie Lyceo-trainingsdag 2015 Jij staat op het

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

INZET VAN MACHINE LEARNING

INZET VAN MACHINE LEARNING INZET VAN MACHINE LEARNING VOORSTELLEN INHOUD Context wat is de staat van de verzekeringsindustrie? Machine Learning - wat is het eigenlijk en is het nieuw? Toepassingen waar wordt ML met succes toegepast?

Nadere informatie

Voorbereiding toelatingsexamen arts/tandarts. Biologie: Erfelijke informatie in de cel 6/29/2013. dr. Brenda Casteleyn

Voorbereiding toelatingsexamen arts/tandarts. Biologie: Erfelijke informatie in de cel 6/29/2013. dr. Brenda Casteleyn Voorbereiding toelatingsexamen arts/tandarts Biologie: Erfelijke informatie in de cel 6/29/2013 dr. Brenda Casteleyn Met dank aan: Leen Goyens (http://users.telenet.be/toelating) en studenten van forum

Nadere informatie

Hoe goed is een test?

Hoe goed is een test? Hoe goed is een test? 1.0 het ideale plaatje Als we een test uitvoeren om te ontdekken of iemand ziek is hebben we het liefst een test waarbij de gezonde en de zieke groepen duidelijk gescheiden zijn.

Nadere informatie

biologie vwo 2017-I Gespierder door gendoping

biologie vwo 2017-I Gespierder door gendoping Gespierder door gendoping Het overdragen van genetisch materiaal naar menselijke cellen voor de behandeling van ziektes bevindt zich nog in een experimenteel stadium. Deze techniek zou ook gebruikt kunnen

Nadere informatie

Opgave 2 ( = 12 ptn.)

Opgave 2 ( = 12 ptn.) Deel II Opgave 1 (4 + 2 + 6 = 12 ptn.) a) Beschouw bovenstaande game tree waarin cirkels je eigen zet representeren en vierkanten die van je tegenstander. Welke waarde van de evaluatiefunctie komt uiteindelijk

Nadere informatie

Continuous Learning in Computer Vision S.L. Pintea

Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision S.L. Pintea Continuous Learning in Computer Vision Natura non facit saltus. Gottfried Leibniz Silvia-Laura Pintea Intelligent Sensory Information Systems University

Nadere informatie

Gentechnologie & moleculaire analysetechnieken Godelieve Gheysen 1999-2000 eerste zit

Gentechnologie & moleculaire analysetechnieken Godelieve Gheysen 1999-2000 eerste zit Gentechnologie en moleculaire analysetechnieken Godelieve Gheysen 1 Gentechnologie & moleculaire analysetechnieken Godelieve Gheysen 1999-2000 eerste zit Gentechnologie en moleculaire analysetechnieken

Nadere informatie

Uitwerking Tentamen Datamining (2II15) 26/06/09

Uitwerking Tentamen Datamining (2II15) 26/06/09 Uitwerking Tentamen Datamining (2II15) 26/06/09 1. (3p) (Clustering) Welke van de volgende uitspraken zijn correct? Voor de correcte uitspraken: leg uit, voor de incorrecte: geef een tegenvoorbeeld. (a)

Nadere informatie

Hoe kijken we naar het DNA van een patiënt?

Hoe kijken we naar het DNA van een patiënt? Hoe kijken we naar het DNA van een patiënt? Ies Nijman UMC Utrecht Dept of Genetics, Centre for Molecular Medicine Center for Personalized Cancer Treatment (CPCT), Hartwig Medical Foundation 1994 DNA sequenties,

Nadere informatie

Examen structurele bioinformatica Naam:

Examen structurele bioinformatica Naam: 1. Uit welke onderdelen bestaat elk aminozuur? Leg kort uit waarvoor ze verantwoordelijk zijn (vanuit structureel oogpunt). centraal koolstofatoom (C α ) amino groep (NH 2 ) => peptidebinding carboxyl

Nadere informatie

SAMENVATTING IN HET NEDERLANDS

SAMENVATTING IN HET NEDERLANDS SAMENVATTING IN HET NEDERLANDS Een organisme bestaat uit verschillende weefsels, die opgebouwd zijn uit cellen. Cellen zijn dus de bouwblokken van elk levend organisme. De ontwikkeling van slechts een

Nadere informatie

vwo eiwitsynthese 2010

vwo eiwitsynthese 2010 vwo eiwitsynthese 2010 Aan- en uitzetten van genen Escherichia coli leeft in de dikke darm van onder andere de mens. Deze bacterie heeft vijf structurele genen die coderen voor enzymen die betrokken zijn

Nadere informatie

Molecular Pathology for Pathologists. Pr P. Pauwels

Molecular Pathology for Pathologists. Pr P. Pauwels Molecular Pathology for Pathologists Pr P. Pauwels NGS moleculair pathologie rapport ontcijferen Nomenclatuur waarin gerapporteerd wordt: EGFR c.2573t>g, p.(leu858arg) Coderende sequentie Eiwit/proteïne

Nadere informatie

TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie)

TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie) TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld 25-01-2010 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie) 1 (~30 minuten; 20 punten) Onderstaand is een stukje

Nadere informatie

Biotechnologie deel I

Biotechnologie deel I Biotechnologie deel I Hand-out bij de eerste oefen- en zelftoetsmodule van Biotechnologie & maatschappij behorende bij hoofdstuk 2,3, 4 en 5 van Introduction to Biotechnology, Thieman & Palladino, 3 e

Nadere informatie

Samenvatting Biologie DNA

Samenvatting Biologie DNA Samenvatting Biologie DNA Samenvatting door Magali 3748 woorden 30 december 2016 5,5 15 keer beoordeeld Vak Methode Biologie Biologie voor jou Biologie 5VWO DNA zie plaatsjes in het boek voor referentie

Nadere informatie

Overzicht. Celbiologie. Overzicht. Celbiologie (3) Celbiologie (2)

Overzicht. Celbiologie. Overzicht. Celbiologie (3) Celbiologie (2) Overzicht Celbiologie Eiwitten Metabolisme DNA Biologie voor informatici (in zes eenvoudige lessen) Dick de Ridder Genen Transcriptie Translatie Moleculaire biologie Experimenten Metingen Delft University

Nadere informatie

GENOMISCH KOOKBOEK LEERLINGENHANDLEIDING

GENOMISCH KOOKBOEK LEERLINGENHANDLEIDING GENOMISCH KOOKBOEK LEERLINGENHANDLEIDING LEERLINGENHANDLEIDING GENOMISCH KOOKBOEK 1 HOOFDSTUK 1 DNA EN DE ROL VAN RNA BIJ TRANSCRIPTIE 1.1 Hieronder zie je een vak met daarin de begrippen DNA en RNA. Maak

Nadere informatie

Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis)

Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis) Afsluitende les Leerlingenhandleiding Wat voor eiwit ben jij? (Basis) Deel 1 In het DNA ligt het erfelijk materiaal van een organisme in code opgeslagen. Deze code is opgebouwd uit vier nucleotiden: adenosine

Nadere informatie

Intermezzo, De expressie van een eiwit.

Intermezzo, De expressie van een eiwit. Samenvatting Bacteriën leven in een omgeving die voortdurend en snel verandert. Om adequaat te kunnen reageren op deze veranderingen beschikken bacteriën over tal van sensor systemen die de omgeving in

Nadere informatie

Toelatingsexamen arts geel Biologie Vraag 1

Toelatingsexamen arts geel Biologie Vraag 1 Biologie Vraag 1 Structuren zoals de arm van een mens, de vleugel van een vleermuis en de vin van een dolfijn, bevatten dezelfde beenderen. Deze beenderen kennen eenzelfde embryonale oorsprong. Hoe worden

Nadere informatie

Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie

Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s

Nadere informatie

Validatiestudie van de nationale surveillance van nosocomiale infecties op IZ

Validatiestudie van de nationale surveillance van nosocomiale infecties op IZ Validatiestudie van de nationale surveillance van nosocomiale infecties op IZ Ann Versporten, Ingrid Morales, Carl Suetens National Surveillance of Infections in Hospitals 1 Algemene doelstelling Valideren

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information

Nadere informatie

BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6

BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6 BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6 Henry N. Hassankhan Scholengemeenschap Lelydorp [HHS-SGL] ARTHUR A. HOOGENDOORN ATHENEUM - VRIJE ATHENEUM - AAHA Docent: A. Sewsahai DOELSTELLINGEN:

Nadere informatie

Computer Ondersteund Onderwijs (COO).

Computer Ondersteund Onderwijs (COO). Computer Ondersteund Onderwijs (COO). Over DNA en eiwit is er een computer praktikum. Bij dit COO leer je via een interactieve manier omgaan met de stof. Opstarten COO. Ga naar de site van het departement

Nadere informatie

1. Welk(e) van de volgende baseparen komt(en) van nature voor in een DNA dubbele helix. Omcirkel deze. C-G

1. Welk(e) van de volgende baseparen komt(en) van nature voor in een DNA dubbele helix. Omcirkel deze. C-G Tentamen Biochemie MST. Deel 2 29 oktober 201 1:0-1:0u (17:00u met handicap) Antwoorden invullen op dit vel. 90 punten is een Den, 0 punten is een 1 Naam: Studentnr: 1. Welk(e) van de volgende baseparen

Nadere informatie

MCB: Hoofdstuk 11: genexpressie RNA polymerase gen controle 11.1 overzicht van eukaryote gencontrole en RNA polymerasen

MCB: Hoofdstuk 11: genexpressie RNA polymerase gen controle 11.1 overzicht van eukaryote gencontrole en RNA polymerasen MCB: Hoofdstuk 11: In vorige chapters hebben we gezien dat de acties en eigenschappen van elk celtype bepaald wordt door de proteïnen die het bevat. In deze en de volgende chapter beschouwen we hoe de

Nadere informatie

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016 Artificial Intelligence in uw dagelijkse praktijk Hilversum, 22 September 2016 Agenda 09:30 Welkom en introductie 09:35 Artificial Intelligence, al meer dan 50 jaar een actief onderzoeksgebied Jaap van

Nadere informatie

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105 Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van 8.45-10.45 uur in zaal Q105 NB: geef je antwoorden op dit formulier. Er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken

Nadere informatie

Bio-informatica Sequentie Patronen. Peter De Rijk

Bio-informatica Sequentie Patronen. Peter De Rijk Bio-informatica Sequentie Patronen Peter De Rijk 7 Patroon Herkenning Patroon Herkenning Patroon Herkenning Afhankelijk van groepsspecificaties! Doel Patroon Herkenning Met een gegeven set sequenties Behoort

Nadere informatie

The mitochondrial genome has bases and codes for 37 genes: 13 polypeptides, 22 trnas and 2 ribosomal RNAs.

The mitochondrial genome has bases and codes for 37 genes: 13 polypeptides, 22 trnas and 2 ribosomal RNAs. Genome density The genome of an organism is the whole of hereditary infromation in a cell. This hereditary information is either coded in DNA or for some types of viruses in RNA. Genes are structural components

Nadere informatie

Oplossingen Datamining 2II15 Juni 2008

Oplossingen Datamining 2II15 Juni 2008 Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:

Nadere informatie

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop

Nadere informatie

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument.

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument. Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument. Behorend bij: Evidence-based logopedie, hoofdstuk 3. Toelichting bij de criteria voor

Nadere informatie

Examen structurele bioinformatica Naam:

Examen structurele bioinformatica Naam: 1. Naast helices en beta strengen kunnen we nog een derde type van secundaire structuur onderscheiden in eiwitten. Welke, waar vinden we ze typisch in de 3D structuur en hoe worden ze nog verder onderverdeeld?

Nadere informatie

Bio-informatica Similariteit. Peter De Rijk

Bio-informatica Similariteit. Peter De Rijk Bio-informatica Similariteit Peter De Rijk 5 Similariteit, niet zo simpel Similariteit Similariteit is afhankelijk van de gekozen parameters Grootte, Kleur Functie Afkomst... Globale similariteit (families)

Nadere informatie

Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016

Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016 AI Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Hersenen De menselijke

Nadere informatie

Gebruikershandleiding

Gebruikershandleiding Gebruikershandleiding Installeren van het programma Het programma heeft geen verdere installatie nodig dan het downloaden van de bestanden. Na het downloaden kunt u op GUI dubbelklikken om het programma

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Kun je met statistiek werkelijk alles bewijzen?

Kun je met statistiek werkelijk alles bewijzen? Kun je met statistiek werkelijk alles bewijzen? Geert Verbeke Biostatistisch Centrum, K.U.Leuven International Institute for Biostatistics and statistical Bioinformatics geert.verbeke@med.kuleuven.be http://perswww.kuleuven.be/geert

Nadere informatie

AI en Software Testing op de lange termijn

AI en Software Testing op de lange termijn AI en Software Testing op de lange termijn Is het een appel? Traditioneel programmeren AI Kleur = rood, groen, geel Vorm = rond Textuur = glad Artificial Intelligence Machine Learning Methods Technologies

Nadere informatie

Programmeermethoden NA. Week 5: Functies (vervolg)

Programmeermethoden NA. Week 5: Functies (vervolg) Programmeermethoden NA Week 5: Functies (vervolg) Kristian Rietveld http://liacs.leidenuniv.nl/~rietveldkfd/courses/prna/ Bij ons leer je de wereld kennen 1 Functies Vorige week bekeken we functies: def

Nadere informatie

Data Mining: Classificatie

Data Mining: Classificatie Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/22619 holds various files of this Leiden University dissertation. Author: Iterson, Maarten van Title: The power of high-dimensional data in genomics research

Nadere informatie

LEERPLAN 2014005. LEERPLANDOELSTELLINGEN: De leerlingen kunnen LEERINHOUDEN

LEERPLAN 2014005. LEERPLANDOELSTELLINGEN: De leerlingen kunnen LEERINHOUDEN Hoofdstuk1: Erfelijke informatie in de cel... 2 1. Bouw van de kern tijdens de interfase... 2 2. Nucleïnezuren... 2 2.1. Primaire structuur van nucleïnezuren... 2 2.1.1. Bouwstenen... 2 2.1.2. Binding

Nadere informatie

Literatuuronderzoek. Systematische Review Meta-Analyse. KEMTA Andrea Peeters

Literatuuronderzoek. Systematische Review Meta-Analyse. KEMTA Andrea Peeters Literatuuronderzoek Systematische Review Meta-Analyse KEMTA Andrea Peeters Waarom doen? Presentatie 1. Begrippen systematische review en meta-analyse 2. Hoe te werk gaan bij het opzetten van een review

Nadere informatie

Validatie van moleculaire methodes in een drinkwaterlaboratorium. Adrie Atsma

Validatie van moleculaire methodes in een drinkwaterlaboratorium. Adrie Atsma Validatie van moleculaire methodes in een drinkwaterlaboratorium Adrie Atsma Drinkwater laboratorium Nederland Controleren drinkwater van bron tot tap Chemisch Fysiologisch Micro-organismen Controleren

Nadere informatie

Gegevensverwerving en verwerking

Gegevensverwerving en verwerking Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie

Nadere informatie

Hertentamen Bioinformatic Data Analysis (1/3 deel van de cursus Systems Biology) July 2 nd 2015, 9:00-12:00, Educatorium Alfa

Hertentamen Bioinformatic Data Analysis (1/3 deel van de cursus Systems Biology) July 2 nd 2015, 9:00-12:00, Educatorium Alfa Hertentamen Bioinformatic Data Analysis (1/3 deel van de cursus Systems Biology) July 2 nd 2015, 9:00-12:00, Educatorium Alfa Cursuscode: B-B1SYSB09 Enkele regels van orde (niet uitputtend): - De eerste

Nadere informatie

Referentie Handleiding

Referentie Handleiding Version 1.1.5 Referentie Handleiding DiscretePhoton H.264 encoder DiscretePhoton www.discretephoton.com Referentie Handleiding Over DiscretePhoton H.264-encoder DiscretePhoton H.264 encoder Windows versie

Nadere informatie

Summary in Dutch 179

Summary in Dutch 179 Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse

Nadere informatie

Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken

Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken Hoe AI kan ingezet worden voor de analyse van asbesthoudende daken Earth Observation Data Sciences www.vlaanderen.be/informatievlaanderen www.vito.be Workshop: Asbestinventarisatie en analyse Weerslag

Nadere informatie

Brochure ExomeScan. Whole Exome Sequencing. Achtergrond

Brochure ExomeScan. Whole Exome Sequencing. Achtergrond Brochure Whole Exome Sequencing De laatste jaren is er een schat aan informatie gepubliceerd over de genetische achtergrond van overerfbare en somatische aandoeningen. In grootschalige Next Generation

Nadere informatie

Practicum Kwantitatieve Inhoudsanalyse

Practicum Kwantitatieve Inhoudsanalyse Januari 2015 Overzicht 1 Wat is kwantitatieve inhoudsanalyse? 2 Automatische inhoudsanalyse met AmCAT 3 Handmatig coderen met AmCAT 4 Tips voor de Thesis Kwantitatieve inhoudsanalyse ˆ Meting van tekst

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Mee-naar-huis-neem boodschappen dec. 2016

Mee-naar-huis-neem boodschappen dec. 2016 COIG cursusdag Genoom & Genetica Mee-naar-huis-neem boodschappen dec. 2016 klinische moleculaire genetica klinisch genetisch redeneren ethische / maatschappelijke aspecten van erfelijkheidsonderzoek next

Nadere informatie

Achtergrondinformatie - Het immuunsysteem en HIV

Achtergrondinformatie - Het immuunsysteem en HIV Achtergrondinformatie - Het immuunsysteem en HIV De mens wordt aangevallen door allerlei ziekteverwekkers. Pathogenen zoals virussen, schimmels en bacteriën proberen de mens binnen te komen om daar voedsel

Nadere informatie