Probabilistische modellen in de bio-informatica. Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002



Vergelijkbare documenten
Hetzelfde DNA in elke cel

Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.

Overzicht. Celbiologie. Overzicht. Celbiologie (3) Celbiologie (2)

van de cel Bioinformatica het probleem Inleiding Medisch Technische Wetenschappen Bioinformatica Deel 1 Celbiologie Elementaire celbiologie

Humane levenscyclus 1

DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008

DNA & eiwitsynthese Vragen bij COO-programma bij hoofdstuk 11 en 12 Life

4,4. Praktische-opdracht door een scholier 2016 woorden 4 november keer beoordeeld

Docentenhandleiding. Afsluitende module. Op zoek naar een gen in een databank

We wensen je veel succes met studeren en het halen van jouw tentamens!

DNA & eiwitsynthese (Junior College Utrecht) Vragen bij COO-programma

ANTWOORDEN HOOFDSTUK 6 VAN GEN TOT EIWIT

vwo eiwitsynthese 2010

Computer Ondersteund Onderwijs (COO).

Transcriptie en de Genetische code

94 Transcriptie en vorming van mrna bij prokaryoten en eukaryoten

Groeiende hoeveelheid data. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 4. Structuur van een database. Selectie uit NIH-databases

Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA.

1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5'

Bioinformatica en Systeembiologie (BIS)

8,6. Samenvatting door Jasmijn 2032 woorden 9 januari keer beoordeeld. Biologie voor jou. Biologie samenvatting hoofdstuk 4 Genetica

Desoxyribose heeft 5 C-atomen. De fosfaatgroep zit aan het 5e C-atoom en de stikstofbase aan het 1e C-atoom.

Periode 9 - deel 1 MOLECULAIRE GENETICA

2,4. Samenvatting door R woorden 5 maart keer beoordeeld. Biologie voor jou. Stofwisseling Biologie. Atomen en Moleculen

TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie)

Samenvatting Biologie B2

a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P)

Samenvatting Biologie DNA

GENOMISCH KOOKBOEK LEERLINGENHANDLEIDING

Rondleiding door de cel

BOUWSTENEN VAN HET LEVEN

DNA, RNA en eiwitten: rules and regulations

BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6

Examen Voorbereiding DNA. Teylingen College Leeuwenhorst 2015/ JasperOut.nl. Thema 2 DNA

Biochemie van Leven college 6 uit de serie Het Levend Heelal

Inhoud. 1 Introductie Evolutionaire druk vormt het leven 15 Kernpunten 22 Relevante literatuur 22

Figuur 1. Representatie van de dubbele helix en de structuren van de verschillende basen.

Scheikunde Chemie Overal Hoofdstuk 5 Hoofdstuk 15 Hoofdstuk 18

6,4. Samenvatting door E woorden 6 december keer beoordeeld. Biologie voor jou

HERKANSINGSTENTAMEN Moleculaire Biologie deel 2, 5 Jan 2007

LEERPLAN LEERPLANDOELSTELLINGEN: De leerlingen kunnen LEERINHOUDEN

DAR Approximate string matching Casus: biological sequence alignment

Biotechnologie deel I

<A> Thymine is een pyrimidinebase en vormt 3 waterstofbruggen met adenine. <B> Adenine is een purinebase en vormt 2 waterstofbruggen met thymine.

<A> Adenine is een purinebase en vormt 2 waterstofbruggen met thymine. <B> Guanine is een pyrimidinebase en vormt 2 waterstofbruggen met cytosine.

1 (~20 minuten; 20 punten)

2 Leg uit hoe de verschillende subtypes van Chlamydia trachomatis zijn ontstaan. Beschrijf de rol van antibioticagebruik hierin.

Moleculaire- en Biologische klokken

Genetica & Evolutie Deeltentamen 1

Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis)

(~30 minuten; 20 punten)

University of Groningen. To be competent or not Smits, Wiep Klaas

Boekenlijst LS&T Studiejaar

Samenvatting. Samenvatting

De logica van bacteriele groei

Begrippenlijst DNA adenine Eén van de nucelotidebasen die in DNA en RNA voorkomen. Adenine (A) vormt een basenpaar met thymine (T) in het DNA en met

De indeling van de sector Natuur

Hoe kijken we naar het DNA van een patiënt?

door dr. W. H. Mager Vakgroep Biochemie en Moleculaire Biologie Vrije Universiteit Amsterdam

Computational Methods In Molecular Biology CS-67693, Spring Class 1: Introduction. Introduction. The Cell. Example: Tissues in Stomach

Nederlandse samenvatting

Tentamen Genetica Studentnr:

Genetic code. Assignment

Synthetische biologie in de praktijk. igem TU Eindhoven 2016

Samenvatting. Figuur 1. Algemene structuur van een nucleotide (links) en de structuren van de verschillende basen (rechts).

Intermezzo, De expressie van een eiwit.


Voorbereiding toelatingsexamen arts/tandarts. Biologie: Erfelijke informatie in de cel 6/29/2013. dr. Brenda Casteleyn

GENOMISCH KOOKBOEK DOCENTENHANDLEIDING

HANDLEIDING VOOR DOCENTEN Versie september 2011

De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.

Toelatingsexamen arts geel Biologie Vraag 1

Hoofdstuk 1. Cells and Genomes. Eukaryot cel met kern Prokaryot zonder vaste kern / bacteriën

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 31 maart 2006 van uur in zaal Q105

Genoom=de complete set aan informatie in het DNA van een organisme Template=de streng waar de nieuwe complementaire streng op wordt gebouwd

Een rondleiding door de cel (COO 2)

STEMPEL DE WEG VAN GEN NAAR EIWIT

waarin de op dit moment relevante bron data als ook de analyse technieken worden geintegreerd.

Het moet ook duidelijk zijn dat dit niet betekent dat

DNA knip techniek (CRISPR/Cas9) bij cystinose

Stand van zaken subcommissie Biologie VC3EEE. Op weg naar een joint degree bachelor biologische wetenschappen

Van data, via informatie naar kennis en omgekeerd

Rondleiding door de cel

Samenvatting Biologie Hoofdstuk 3: Cellen

Bio-informatica Genpredictie

Samenvatting. Samenvatting

Intracellulaire compartimenten en transport

Visie: Je DNA sequencen wordt routineklus

Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis)

Examen structurele bioinformatica Naam:

Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica / /

Voortplanting en celdeling

STEMPEL DE WEG VAN GEN NAAR EIWIT

a. Geef de 1-lettercode van de aminozuren in het peptide in de corresponderende volgorde. (4P) LLORETDEMAR (iedere fout -1P)

Naam: Studentnummer: Opleiding:..

DNA: een allesomvattend begrip voor het leven

Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.

Transcriptie:

Probabilistische modellen in de bio-informatica Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002

Overzicht Wat is bio-informatica? Waarom bio-informatica? Planning van de cursus Elementen van de moleculaire biologie

Practische regelingen

Uurrooster Les Week 39-40 Donderdag 8:25-10:25 Lokaal 00.57 Geen les op 4 october en op 1 november Oefenzittingen Vr 23 nov 2001 14.00 91.33 Di 27 nov 2001 10.30 91.33 Di 04 dec 2001 10.30 91.33 Vr 14 dec 2001 14.00 91.33 Ma 17 dec 2001 10.30 91.33

Kernreferenties Hoofdreferentie: R. Durbin, A. Krogh, S. Eddy, G. Mitchinson, Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Oxford University Press, 199x. B. Alberts, D. Bray, A. Johnson, J. Lewis, M. Raff, K. Roberts, P. Walter, Essential Cell Biology: An Introduction to the Molecular Biology of the Cell, Garland Publishing, 1998 (+ Interactive CD). P. Baldi, S. Brunak, Bioinformatics: The Machine Learning Approach, MIT Press, 2001. A. Baxevanis, B. Ouellette, Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley-Interscience, 2001. Twee kopieën zullen beschikbaar zijn in de bibliotheek TELE

Cursusoverzicht Inleiding tot de moleculaire biologie Aligneren van biologische sequenties Globale aligneringsmethoden Locale aligneringsmethoden Motieven vinden in sequenties I Meerdere aligneringen Consensussequentie Positie-gewichtmatrices Motieven vinden in sequenties II Verborgen Markovketens Leeralgoritmes

Cursusoverzicht Genvoorspelling Prokaryoten Eukaryoten Analyse van genuitdrukking Microroostertechnologieen Clusteranalyse Ontdekking van regulatiemotieven Frequentiemethoden Expectation-Maximization Gibbs sampling

Overzicht van de oefenzittingen Oefenzitting 1 Web resources, BLAST, CLUSTALW Oefenzitting 2 Ontwikkeling van een verborgen Markovketen Oefenzitting 3 Genvoorspelling Oefenzitting 4 Microroosteranalyse Oefenzitting 5 Ontdekking van motieven

Bio-informatica

Wat is bio-informatica? Computers in de biologie en de geneeskunde Medische informatica Computationele biologie Chemo-informatica Bio-informatica

Wat is bio-informatica? Oefenzittingen Moleculaire Biologie DNA RNA Proteïnen Lessen Databanken Gedistribueerde software Supercomputing Information Technologie Algoritmiek Wiskunde Statistiek Patroonherkenning A.I.

Waarom bio-informatica? Human Genome Project Menselijk genoom: 3 miljard basenparen Celera: shotgun grootste burgerlijke computercluster Post-genomica Pharma & biotech Genomica levert massale hoeveelheden data Pharma: Kostprijs per drug: ~ $500.000.000 Return per drug daalt Pijplijn moet gestroomlijnd worden Biotech: onderzoekspijplijn voor Transgenische gewassen (Gentse specialiteit) Nutraceuticals (e.g., Procter & Gamble, kanker-beschermende broccoli) Productie van medicamenten en moleculen met hoge toegevoegde waarde (e.g., Pharming)

Pharma/biotech in Belgïe Janssen Pharmaceutica GlaxoSmithKline Aventis Crop Science Tibotec-Virco DevGen CropDesign

Bio-informatica op ESAT Onderzoeksteam van 12 mensen Elekt. ir., CW, statistiek, physica, wiskunde Bioingenieurs, arts Microroostergegevensanalyse

Moleculaire machines DNA replication fork mrna translation Safecrackers Uit Essential Cell Biology Interactive CD, Alberts et al., Garland Publishing, 1999

Complexiteit in de moleculaire biologie Kyoto Encyclopedia of Genomes and Genes Evolutie van Genbank en Swissprot Publieke databanken van genomische informatie MEDLINE query (cancer, tp53)

Moleculaire paden Kyoto Encyclopedia of Genomes and Genes - Biosynthesepad

Evolutie van sequentiedatabanken Genbank SWISSProt

Publieke databanken van genomische informatie

MEDLINE

Elementen van de moleculaire biologie Illustraties uit Molecular Biology of the Cell en Essential Cell Biology + interactive CD

Tree of Life Eukaryoten / prokaryoten (bacteriën + archaeabacteriën) Phylogenie

Modelorganismen E. coli (3 µm) Arabidopsis thaliana (20 cm) Caenorrabdhitis elegans (1mm) Muis (Mus musculus) Gist (10 µm) (Saccharomyces Cerevisae) Fruitvlieg (Drosophila melanogaster) Mens (Homo sapiens)

De cel Bacteriën/prokaryoten hebben geen celkern om hun genoom te beschermen Eukaryoten hebben een celkern

DNA makes RNA makes proteins Centraal dogma Verschillende mechanisme voor prokaryoten en eukaryoten

DNA DNA helix (6.1) Complementaire strengen (A-T, G-C) Draait clockwise, 10 nucleotiden per omwenteling

Chemische structuur van het DNA Deoxyribonucleïnezuur Adenine Thymine Cytosine Guanine Structuur Suiker (ribose) Phosphaatgroep Ringverbinding Basecomplementariteit via waterstofverbinding Orientatie: van 5 naar 3

RNA Adenine Uracil (vs. Thymine), Guanine Cytosine Enkelvoudige streng (A-U paar zwakker dan A-T) Waarschijnlijk voorouder van DNA Dient vooral als informatiedrager van DNA naar proteïne

Functioneel RNA RNA heeft ook belangrijke en complexe functionele rollen Functionele RNAs hebben een complexe structuur RNA ribosomal subunit 30S

Proteïnen Grote polymeren van 20 aminozuren F S Y C L P H Q W R I M T N K S R V A D E G

Tridimensionale structuur van proteïnen Basis tridimensionale structuren Alpha helix (ECBI 5.2) Beta sheet (ECBI 5.3) Loop Voorbeelden van proteïnen Antilichaam (ECBI 5.4) Neuramidase (ECBI 5.5) Elongation factor EF-Tu (ECBI 5.6) Computationele biologie

Proteïnerollen Proteïne hebben veel functies in cellen Katalyse (enzymen) Bouwstructuur Vervoer Motor Moleculaire opslag Signalisatie Receptoren Regulatie Voorspelling van proteïnefamilies

Kleine moleculen Allerhande kleine organische moleculen zijn nodig voor de cel en zijn betrokken bij het metabolisme Enzymen zijn proteïne die de chemische transformatie van deze moleculen catalyseren. Glucose (ECBI 2.1) Adenosine triphospaat (ECBI 2.3)

Energieproductie

Glycolyse

Metabolisme Databanken van moleculaire paden

DNA makes RNA makes proteins Genen dragen de informatie voor de productie van proteïnen Transcriptie (van DNA naar mrna) door RNA polymerase Translatie (van mrna naar proteïne) door ribosomen Genvoorspelling

Aminozuren en de genetische code 64 codons Start & Stop codon 6 reading frames

Operons in prokaryoten Prokaryoten hebben operons waar meerdere genen tegelijk worden getranscribeerd.

RNA splitsing in eukaryoten In eukaryoten wordt het gen getranscribeerd naar pre-mrna, na welke intronen verwijderd worden langs de splice sites om een boodschapper mrna van exonen te vormen De mrna wordt getranslateerd van de START codon tot de STOP codon (de 5 en 3 UnTranslated Regions worden niet getranslateerd)

Alternatieve splitsing Alternatieve splitsing genereert meerdere proteïnenvarianten uit één gen

Voorbeeld van alternatieve splicing

Controle van regulatie Om transcriptie te kunnen beginnen moet een uitgebreide complex van proteïnen aanwezig zijn De controle van regulatie gebeurdt via de promotor Bindingplaats Bindingproteïne / transcriptie factor Promotorvoorspelling en motif finding

Promotor-architectuur Kernpromotor: TATA box TATA binding protein, RNA polymerase II, Distale promoter: enhancers, repressoren

Enhancers en repressoren Homeodomain (8.1) Zinc finger motif (8.2) Leucine zipper motif (8.3) TATA-binding protein (8.4)

Combinatoriale controle Complexe integratie van signalen bepaalt de genactiviteit Microroostergegevensanalyse van coexpressie-experimenten