DAR Approximate string matching Casus: biological sequence alignment
|
|
|
- Mathilda Bos
- 10 jaren geleden
- Aantal bezoeken:
Transcriptie
1 DAR Approximate string matching Casus: biological sequence alignment 1
2 Text search Approx string matching dynamic programming, edit distance example application: Google search Text indexing inverted list q-grams Casus: protein strings similarity, specific for biological domein application of q-gram indexing: BLAST 2 2
3 Biological sequence alignment 3 3
4 Biological sequence alignment Ik heb een sequentie S die bij soort A eigenschap X bepaalt. Kan ik in de genomen van andere soorten sequences vinden die grote gelijkenis vertonen met S? Ik heb een aantal patiënten met aandoening Y. Kan ik in hun genoom een sequentie vinden die zij gemeenschappelijk hebben en die afwijkt in vergelijking met niet-patiënten? 4
5 DNA sequencing: mijlpalen 1953 Crick & Watson ontdekken moleculaire structuur van het DNA (dubbele helix) 1975 Sanger ontdekt sequencing techniques human genome sequenced Anno nu: onderzoek naar individuele genetische verschillen 5 5
6 Sequence basics Model: een DNA sequence is een string over het alphabet {A,C,G,T} DNA segmenten worden gekopieerd naar een sequentie van messenger RNA om een eiwit te produceren (U in RNA = T in DNA) triplet structure definieert vertaling naar sequentie van aminozuren (codons) 6 6
7 Sequence basics 7 7
8 Sequence basics Een gen is een DNA-fragment dat een proteine codeert (versimpeld) Een proteine = sequentie van aminozuren (20 letter alphabet) ATGACCAGGATCTTTAAGTGA start codon = ATG stop codon = TGA codons: ATG-ACC-AGG-ATC-TTT-AAG-TGA methionine-threonine-arginine- MTR 6 manieren om een DNA-string af te lezen 8 8
9 Biological sequence databases SWISSPROT, GENBANK, Zowel proteines als ACGT-sequenties Generieke vorm query: find protein sequences similar to MKYMTVTDLNNAGATV 9 9
10 Biological sequence databases SWISSPROT example entries (FASTA format) >gi sp P42268 NDD_BPR70 NUCLEAR DISRUPTION PROTEIN MKYMTVTDLNNAGATVIGTIKGGEWFLGTPHKDILSKPGFYFLVSEFDGSCV SARFYVGNQRSKQGFSAVLSHIRQRRSQLARTIANNNMAYTVFYLPASKM KPLTTGFGKGQLALAFTRNHHSEYQTLEEMNRMLADNFKFVLQAY >gi sp P05228 HRP2_PLAFA HISTIDINE-RICH PROTEIN PRECURSOR (CLONE PFHRP-III) MVSFSKNKVLSAAVFASVLLLDNNNSEFNNNLFSKNAKGLNSNKRLLHESQA HAGDAHHAHHVADAHHAHHVADAHHAHHAANAHHAANAHHAANAHHAANA HHAANAHHAANAHHAANAHHAANAHHAANAHHAANAHHAANAHHAANAHH AANAHHAADANHGFHFNLHDNNSHTLHHAKANACFDDSHHDDAHHDGAHH DDAHHDGAHHDDAHHDGAHHDGAHHDGAHHNATTHHLH 10 10
11 Protein based data similarity Twee fragmenten DNA zijn homoloog als ze overeenkomsten vertonen die gebaseerd zijn op gemeenschappelijk afstamming We zoeken een concept sequence similarity dat gapping ondersteunt en rekening houdt met letter distance GSAQVKGHGKKVA HV---D--DMPNAL G+ +VK+HGKKV ++ +L GNPKVKAHGKKVL QLQVTGVVVTDATL 11 11
12 Similarity Doel 1: een probabilistisch model opstellen ter onderbouwing van notie van sequence similarity Doel 2: algoritmen opstellen om optimale alignments te vinden 12 12
13 Scoring model Twee fragmenten DNA zijn homoloog als ze overeenkomsten vertonen die gebaseerd zijn op gemeenschappelijk afstamming Men heeft collecties van paren strings verzameld die corresponderen met homologieën Op grond van deze collecties kunnen we tellingen doen betreffende de frequenties van matching van paren aminozuren Door (bio)chemische oorzaken zijn niet alle matches even waarschijnlijk 13 13
14 Scoring model String x bestaat uit een reeks symbolen x i Symbool x i heeft een waarschijnlijkheid q x i Volgens random model R (er is geen sprake van een homologie) hebben twee strings x en y een waarschijnlijkheid 14 14
15 Scoring model Volgens het Match model komen paren strings voor met een gezamenlijke waarschijnlijkheid, uitgaande van gemeenschappelijke afstamming van een symbool c De odds-ratio (voor wel/geen homologie) is dan 15 15
16 Scoring model Om mathematisch-technische redenen werken we liever met log-odds De log-odds ratio voor strings x en y is 16 16
17 BLOSUM matrices Op basis van tellingen zijn matrices ter representatie van s(a,b) opgesteld; hieronder een fragment van de BLOSUM50-matrix D, E en K charged; V, I en L hydrofoob Variatie t.b.v. sensitiviteit (50, 62, 80) 17 17
18 Scoring model: gaps Penalty voor gap met lengte g optie 1 optie 2 (d = gap open, e = gap extension) 18 18
19 Alignment algoritmen Aantal mogelijke alignments voor sequences met lengte m en n is erg groot Dynamic programming: druk de optimale alignment van twee sequences uit in de optimale oplossingen voor deelsequences 19 19
20 Needleman-Wunsch (global) Globale match Eenvoudige gap penalty We zoeken de optimale match van x 1.. x m en y 1.. y n We hebben optimale matches van x 1.. x m-1 en y 1.. y n-1 x 1.. x m-1 en y 1.. y n x 1.. x m en y 1.. y n
21 Needleman-Wunsch De optimale match van x 1.. x m en y 1.. y n verkrijg je door de beste optie te kiezen uit: x 1.. x m-1 en y 1.. y n-1, waarbij x m gepaard wordt aan y n x 1.. x m-1 en y 1.. y n : x m gepaard aan gap x 1.. x m en y 1.. y n-1 : y n gepaard aan gap 21 21
22 Needleman-Wunsch De keuze uit deze drie mogelijkheden wordt bepaald aan de hand van de scorefunctie F 22 22
23 Needleman-Wunsch De keuze uit deze drie mogelijkheden wordt bepaald aan de hand van de scorefunctie F In de matrix: F (i-1, j-1) F (i, j-1) F (i-1, j) F (i, j) Via trace-back pijlen geven we de herkomst van de oplossing weer 23 23
24 Needleman-Wunsch Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A -- 0 P A W 24 24
25 Needleman-Wunsch Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P -8 A -16 W
26 Needleman-Wunsch Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P -8-2 A -16 W
27 Match HEAGAWGHEE en PAWHEAE Needleman-Wunsch From: Biological Sequence Analysis; Durbin, Eddy e.a
28 Needleman-Wunsch Alignment is klaar als je het veld rechtsonderin bereikt. Deze bevat de globale score van de match Time complexity: O(mn) 28 28
29 Smith-Waterman (local) Voorbeeld Globale match: score = +1 HEAGAWGHE-E --P-AW-HEAE Lokale match: score = +21 HEA HEA \Lokale matches zijn interessanter 29 29
30 Smith-Waterman (local) Vraag Hoe pas je Needleman-Wunsch aan zodanig dat je lokale matches vindt? Antwoord 1. Zorg dat je op elk punt in de matrix met een schone lei begint: zet negatieve scores direct op 0 2. Je mag overal stoppen 30 30
31 Smith-Waterman (local) De keuze uit de mogelijkheden wordt bepaald aan de hand van de scorefunctie F 31 31
32 Smith-Waterman Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P 0 A 0 W
33 Smith-Waterman Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P A W
34 Smith-Waterman Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P A W
35 Smith-Waterman (local) Alignment kan op elk punt in de matrix eindigen From: Biological Sequence Analysis; Durbin, Eddy e.a
36 Heuristieken In principe is ons probleem opgelost via dynamic programming Complexiteit O(mn) m: lengte query string n: lengte database! Behoefte aan heuristiek: Blast Methode: filtering gebaseerd op 3-grams 36 36
37 Blast Als twee strings een 3-gram delen, noemen we dat een hit HEAGAWGHEE en PAWHEAE Idee van filtering: Zoek via 3-gram hits kansrijke posities Pas op zo n kansrijke positie een lokaal expansiealgoritme toe 37 37
38 Blast Als twee strings een q-gram delen, noemen we dat een hit HEAGAWGHEE en PAWHEAE Het hebben van één hit geeft veel false positives; Hoe kunnen we spelen met selectiviteit en sensitiviteit? 38 38
39 Blast Extensie van hit-notie Twee q-grams zijn similar als hun onderlinge matchscore boven een bepaalde drempel komt (default = 11) HEAGAWGHEE en PAWHEAE Effecten: verhoging sensitivity (recall) verlaging selectivity (precision) 39 39
40 BLAST2 (PBLAST) Eis voor selectie is Two-hit diagonal principe: paar hits met dezelfde onderlinge afstand in query en db-string query = CWYWRWYYC dbstr = RRWYWAWYYRR OK! query = CWYWRWYYC dbstr = RRWYWABCWYYRR FOUT! Wat gebeurt er met sensitivity/selectivity? 40 40
41 Blast: expansie Eenvoudige ungapped expansie: ga uit van match op hits schuif naar rechts totdat match-score een val van 8 punten heeft gemaakt ten opzichte van optimum idem naar links 41 41
42 Blast: expansie Gapped expansie: pas lokaal een variant van Smith-Waterman (dynamic programming) toe 42 42
43 43
44 PBLAST: an RDB approach 44 44
45 PBLAST: an RDB approach Oefening: Druk BLAST-filtering uit in Relationele algebra (of SQL) 45 45
Wie? Advanced Databases blok 4 2011. DB vs IR. Wat? Canonical application (DB) Canonical application (DB)
Advanced Databases blok 4 2011 Wie? Hans Philippi: docent/practicumleider René Kersten: assistent bij practicum Hans Philippi 1 2 Wat? DB vs IR 2005 XML (Siebes) 2007 Google ranking (Siebes) 2009/2011
Bio-informatica Similariteit Searches. Peter De Rijk
Bio-informatica Similariteit Searches Peter De Rijk 6 Similariteit searches Zoeken naar gelijkende sequenties in sequentie databanken Korte sequentie (b.v. EST) waar we meer van willen weten Andere korte
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te werken,
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder
Bio-informatica Similariteit. Peter De Rijk
Bio-informatica Similariteit Peter De Rijk 5 Similariteit, niet zo simpel Similariteit Similariteit is afhankelijk van de gekozen parameters Grootte, Kleur Functie Afkomst... Globale similariteit (families)
Implementatie LIMS binnen afdeling Genetica van het Radboudumc. Ermanno Bosgoed [email protected] 27 03 2014
Implementatie LIMS binnen afdeling Genetica van het Radboudumc Ermanno Bosgoed [email protected] 27 03 2014 Inleiding Wie? Wat? Hoe? Historie LIMS Implementatie Labvantage Toekomst plannen
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van 8.45-10.45 uur in zaal Q105 NB: geef je antwoorden op dit formulier. Er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken
DNA practicum De modellenwereld van DNA
DNA practicum De modellenwereld van DNA Inleiding Alle eigenschappen van een plant, zoals de grootte, de vorm van het blad, en de enzymen die nodig zijn voor de fotosynthese, liggen opgeslagen in het DNA.
Mee-naar-huis-neem boodschappen dec. 2016
COIG cursusdag Genoom & Genetica Mee-naar-huis-neem boodschappen dec. 2016 klinische moleculaire genetica klinisch genetisch redeneren ethische / maatschappelijke aspecten van erfelijkheidsonderzoek next
Afsluitende les. Leerlingenhandleiding. Proteomics voor de massa
Afsluitende les Leerlingenhandleiding Proteomics voor de massa Computeropdracht Inleiding - data van een massaspectrometer Bij dit computerpracticum gaan jullie zelf de data van de analyse van een eiwit
De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.
Tentamen Genoombiologie, 28 Oktober 2009, 9.00-11.45 h De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.
Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA.
Het menselijk genoom Het menselijk genoom (DN) bestaat uit: Mega Basenparen (MB),,, C,. Inleiding Medisch echnische Wetenschappen Bioinformatica Deel Michael Egmont-Petersen Het menselijk DN is ingedeeld
Hetzelfde DNA in elke cel
EIWITSYNTHESE (H18) Hetzelfde DNA in elke cel 2 Structuur en functie van DNA (1) Genen bestaan uit DNA Genen worden gedragen door chromosomen Chromosomen bestaan uit DNAmoleculen samengepakt met eiwitten
AFO 113 Authoritybeheer
AFO 113 Authoritybeheer 113.1 Inleiding Authority records die gebruikt worden in de catalogusmodule kunnen via deze AFO beheerd worden. U kunt hier records opzoeken, wijzigen, verwijderen of toevoegen.
2 e SMT Workshop Moleculaire Typeringen spa typering en MLST
2 e SMT Workshop Moleculaire Typeringen spa typering en MLST 28 30 Januari, 2013 UMC Utrecht en RIVM Leo M Schouls Laboratorium voor Infectieziekten en Screening (LIS) Centrum voor Infectieziektebestrijding
Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis)
Afsluitende les Leerlingenhandleiding Wat voor eiwit ben jij? (Basis) Deel 1 In het DNA ligt het erfelijk materiaal van een organisme in code opgeslagen. Deze code is opgebouwd uit vier nucleotiden: adenosine
extra oefening algoritmiek - antwoorden
extra oefening algoritmiek - antwoorden opgave "Formule 1" Maak een programma dat de gebruiker drie getal A, B en C in laat voeren. De gebruiker zorgt ervoor dat er positieve gehele getallen worden ingevoerd.
Molecular Pathology for Pathologists. Pr P. Pauwels
Molecular Pathology for Pathologists Pr P. Pauwels NGS moleculair pathologie rapport ontcijferen Nomenclatuur waarin gerapporteerd wordt: EGFR c.2573t>g, p.(leu858arg) Coderende sequentie Eiwit/proteïne
Vragen Genetica (Diederik de Bruijn) Omcirkel bij vraag 1 t/m 12 het juiste antwoord. Naam: Studentnummer:
Vragen Genetica (Diederik de Bruijn) Omcirkel bij vraag 1 t/m 12 het juiste antwoord 1. Onderstaande stamboom is van een familie waarin het EEC syndroom voorkomt. Er is sprake van autosomaal dominante
LDA Topic Modeling. Informa5ekunde als hulpwetenschap. 9 maart 2015
LDA Topic Modeling Informa5ekunde als hulpwetenschap 9 maart 2015 LDA Voor de pauze: Wat is LDA? Wat kan je er mee? Hoe werkt het (Gibbs sampling)? Na de pauze Achterliggende concepten à Dirichlet distribu5e
Next Generation Sequencing voor moleculaire diagnostiek. Aniek O. de Graaf, PhD, EurClinChem Laboratory Hematology
Next Generation Sequencing voor moleculaire diagnostiek EQA voor NGS? Aniek O. de Graaf, PhD, EurClinChem Laboratory Hematology Sequentie analyse Old school Sanger sequentie analyse (Sanger, 1977) Sequencing-by-synthesis
Data Mining: similariteit en visuele data exploratie
Data Mining: similariteit en visuele data exploratie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht: wat zagen we vorige les? Data karakteristieken
Ranking database queries. Ranking in IR. Classic ranking in IR. Ranking in IR. Ranking in IR: score. Advanced Databases
Advanced Databases Topic 3: ranking van database queries Ranking database queries Outline ranking in IR toepassing ranking bij database queries: many-answer problem zero-answer problem 1 2 Classic ranking
Neanderthaler Genoom PROBUS 25 november 2015. Presentatie van Allan R. de Monchy
Neanderthaler Genoom PROBUS 25 november 2015 Presentatie van Allan R. de Monchy Onze Erfelijkheid; Genetische en cel kennis opfrissen. Als we in de eerste plaats kijken naar de mens dan bestaan wij uit
Tentamen Genetica 22-10-2004 Studentnr:
CONTROLEER OF DIT TENTAMEN 11 PAGINA S BEVAT. Veel succes! Je mag de achterkant van het papier ook zo nodig gebruiken, maar beantwoord vragen 1-6 niet op blaadjes van vraag 7 en de daarop volgende. 1.
Les 10 : Aanmaken van een database (deel2).
Les 10 : Aanmaken van een database (deel2). Wat is een database? Een centrale opslagruimte voor gegevens. Alle informatie wordt centraal opgeslagen en kan door iedereen geraadpleegd worden. Voordelen van
ContentSearch. Deep dive
ContentSearch Deep dive 2 Waarvoor in te zetten? Alternatief voor database queries Waar performance een issue kan zijn Daadwerkelijk frontend Site Search Mogelijk niet de beste optie maar wel goedkoop
Bioinformatica en Systeembiologie (BIS)
Waarom een major Bioinformatica en Systeembiologie? Huidige methoden van onderzoek, zoals de DNAchiptechnologie, leveren enorme hoeveelheden gegevens op die met bestaande statistische methoden niet meer
Probabilistische modellen in de bio-informatica. Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002
Probabilistische modellen in de bio-informatica Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002 Overzicht Wat is bio-informatica? Waarom bio-informatica? Planning
Elastic Search wat heb je aan data als je er niets mee doet.. Oscar Buse 11 juli 2017 Linux User Group Nijmegen
Elastic Search wat heb je aan data als je er niets mee doet.. Oscar Buse 11 juli 2017 Linux User Group Nijmegen Inleiding Dit praatje gaat over Elasticsearch. De onderwerpen die aan bod komen: Wat is Elasticsearch?
Subrapporten. 5.1 Inleiding
5 Subrapporten 5.1 Inleiding Een subrapport is een rapport in een rapport. Een subrapport maak je dan ook net zoals je een gewoon rapport maakt. Een subrapport heeft bijna alle eigenschappen die een normaal
Databank - Basis 1. Inhoud. Computervaardigheden en Programmatie. Hoofdstuk 4 Databank - Basis. Terminologie. Navigeren door een Venster
4. 4. Inhoud rste BAC Toegepaste Biologische Wetenschappen Hoofdstuk 4 Databank Terminologie, Navigeren, Importeren Tabellen Records/Velden manipuleren Queries (Vragen) [Ook in SQL] sorteren filter volgens
Het omzetten van een ER-diagram naar SQL
Het omzetten van een ER-diagram naar SQL Huub de Beer Eindhoven, 4 juni 2011 Omzetting ER-diagram naar SQL in twee stappen 1: ER-Diagram relationeel model Onderwerp van hoofdstuk 3 Entiteittype relatie,
20 maart Prof. Dr. Katrien Verleye
20 maart 2018 Prof. Dr. Katrien Verleye Voorbereiding Nvivo sessie Start Nvivo op (Athena Academic Nvivo) BELANGRIJK: klik geregeld op save tijdens deze sessie Data-analyse met Nvivo NVivo does not prescribe
Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.
Centraal Dogma Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al., 6e druk Mei 2016 Van DNA naar mrna Hier zie je een deel van de sequentie
Informatievaardigheden Introductie EndNote
Informatievaardigheden Introductie EndNote TU Delft Library Delft University of Technology Challenge the future TU Delft Library HowInformatievaardigheden to find and use scientific / EndNote information
BRAF rondzending SKML 2012
BRAF rondzending SKML 2012 Presentatie van de resultaten op de deelnemersbijeenkomst 5 februari 2013 Riki Willems Patricia Groenen Willeke Blokx Adriaan van den Brule Casus 1 Langerhanscel histiocytose
Met een LightSwitch applicatie een OData service uit de Windows Azure Marketplace consumeren
Met een LightSwitch applicatie een OData service uit de Windows Azure Marketplace consumeren Om eens wat ervaring op te doen met de Windows Azure Marketplace heb ik een publieke en gratis databron gekozen
Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen:
Gist demo Toelichting op de interface en werking van de tool. v0.1, 20 januari 2016, Erik Boertjes v0.2, 1 februari 2016, Rianne Kaptein v0.3, 9 mei 2016, Rianne Kaptein Doel Met behulp van de tool beschreven
Van big data naar smart data. Stappenplan voor B2B leadgeneratie.
Van big data naar smart data. Stappenplan voor B2B leadgeneratie. Van big data naar smart data Door big data te verzamelen en om te zetten in werkelijk bruikbare smart data creëert u nieuwe inzichten,
Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016
Artificial Intelligence in uw dagelijkse praktijk Hilversum, 22 September 2016 Agenda 09:30 Welkom en introductie 09:35 Artificial Intelligence, al meer dan 50 jaar een actief onderzoeksgebied Jaap van
High through put automatisering in de Genetica. Ermanno Bosgoed [email protected] 19 11 2014
High through put automatisering in de Genetica Ermanno Bosgoed [email protected] 19 11 2014 Inleiding Wie? Wat? Hoe? Automatisering / Robotisering Toekomst plannen Medewerkers Afdeling Genetica
Algoritmiek. 2 februari Introductie
College 1 Algoritmiek 2 februari 2017 Introductie 1 Introductie -1- docent: Rudy van Vliet [email protected] assistent werkcollege: Bart van Strien [email protected] website: http://www.liacs.leidenuniv.nl/~vlietrvan1/algoritmiek/
Databases - Inleiding
Databases Databases - Inleiding Een database is een verzameling van een aantal gegevens over een bepaald onderwerp: een ledenbestand van een vereniging, een forum, login gegevens. In een database worden
Figuur 1. Representatie van de dubbele helix en de structuren van de verschillende basen.
Het DNA molecuul is verantwoordelijk voor het opslaan van de genetische informatie die gebruikt wordt voor de ontwikkeling en het functioneren van levende organismen. Aangezien het de instructies voor
Bio-informatica Boom constructie. Peter De Rijk
Bio-informatica Boom constructie Peter De Rijk 8 Waarom boomconstructie Evolutionaire analyse: verwantschap tussen genen en/of species Studie oorsprong en divergentietijden bv. divergentie mens-mensapen,
Examen structurele bioinformatica Naam:
1. Uit welke onderdelen bestaat elk aminozuur? Leg kort uit waarvoor ze verantwoordelijk zijn (vanuit structureel oogpunt). centraal koolstofatoom (C α ) amino groep (NH 2 ) => peptidebinding carboxyl
Naar High Throughput DNA data analyse
Naar High Throughput DNA data analyse Laboratorium automatisering seminar Jan-Peter Nap Hanze University Groningen 8/10/10 1 van 24 gisteren CLC bio, a comprehensive platform for NGS analysis nu: Super-scale
SQL datadefinitietaal
SQL datadefinitietaal We kunnen er het schema van de database mee bepalen: metadata toevoegen, wijzigen en verwijderen uit een database. Basiscommando's: CREATE : toevoegen van metagegevens DROP : verwijderen
DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008
DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA 1. Hieronder zie je de schematische weergave van een dubbelstrengs DNA-keten. Een
BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6
BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6 Henry N. Hassankhan Scholengemeenschap Lelydorp [HHS-SGL] ARTHUR A. HOOGENDOORN ATHENEUM - VRIJE ATHENEUM - AAHA Docent: A. Sewsahai DOELSTELLINGEN:
TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie)
TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld 25-01-2010 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie) 1 (~30 minuten; 20 punten) Onderstaand is een stukje
Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica 2011-2012 / 2012-2013 / 2013-2014
Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica 2011-2012 / 2012-2013 / 2013-2014 versie 1.0, maart 2012, Deze Body of Knowledge and Skills (BoKS) is een weergave van de kenniscomponent
Informatie Systeem Ontwikkeling ISO 2R290
Informatie Systeem Ontwikkeling ISO 2R290 docent: Prof. dr. Paul De Bra Gebaseerd op: Database System Concepts, 5th Ed. doel van dit vak kennis van en inzicht in basisbegrippen over informatiesystemen
Inleiding Programmeren 2
Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te
Bio-informatica Genpredictie
Bio-informatica Genpredictie 9 Genpredictie Genpredictie opsporen van functionele gebieden en elementen die verantwoordelijk zijn voor de genstructuur, genregulatie en gentranscriptie in genomische sequenties
Inleiding Programmeren 2
Inleiding Programmeren 2 Gertjan van Noord November 28, 2016 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te
Waardelijsten. Vormen van waardelijsten.
Waardelijsten Introductie Bij de opbouw van een applicatie is zuiverheid van informatie van zeer groot belang. Het gebruik van waardelijsten beperkt/vegemakkelijkt de invoer van gegevens in bepaalde velden.
Bio-informatica Sequentie Patronen. Peter De Rijk
Bio-informatica Sequentie Patronen Peter De Rijk 7 Patroon Herkenning Patroon Herkenning Patroon Herkenning Afhankelijk van groepsspecificaties! Doel Patroon Herkenning Met een gegeven set sequenties Behoort
1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5'
proefexamen 1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5' CTAAATC 3' 5' GGAACC 3' Restriction Endonucleases
Synthetische biologie in de praktijk. igem TU Eindhoven 2016
Synthetische biologie in de praktijk Doelgroep: Vakgebied: Tijdsduur: HAVO/VWO bovenbouw Biologie ± 40 minuten Inleiding Synthetische biologie is het (her)programmeren van een biologisch systeem (cellen
Information Retrieval.
Information Retrieval [email protected] Zoekterm... Data retrieval IR uit gestructureerde gegevens ongestructureerde documenten Bv. html, doc, txt, jpg,... artificiële vraagtaal natuurlijk
Moleculaire diagnostiek
Moleculaire diagnostiek van infectieziekten Arjan de Jong 8 december 2015 Moleculaire diagnostiek Diagnostiek op basis van moleculair biologische (DNA/RNA) technieken Moleculaire diagnostiek van infecties
Leerlingenhandleiding
Leerlingenhandleiding Zelfstandige module Op zoek naar een gen in een databank Op zoek naar een gen in een databank Met behulp van databanken kun je informatie opzoeken over genen. Een databank is een
Oplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
Demultiplexing reads FASTA format genome sequencing reads run
Demultiplexing reads In bioinformatics, FASTA format is a text-based format for representing either nucleotide sequences or peptide sequences, in which nucleotides or amino acids are represented using
Temperatuur logger synchronisatie
Temperatuur logger synchronisatie Juni 10, 2010 1 / 7 Temperatuur logger synchronisatie Introductie Twee of meerdere ontvangers van het Multilogger systeem kunnen met de temperature logger synchronisatie
Proteomics. Waarom DNA alleen niet genoeg is
Proteomics Waarom DNA alleen niet genoeg is Reinout Raijmakers Netherlands Proteomics Centre Universiteit Utrecht, Biomolecular Mass Spectrometry and Proteomics Group Van DNA naar organisme Eiwitten zijn
Koppeling met een database
PHP en MySQL Koppeling met een database 11.1 Inleiding In PHP is het eenvoudig om een koppeling te maken met een database. Een database kan diverse gegevens bewaren die met PHP aangeroepen en/of bewerkt
Genetische testen. Professor Martina Cornel and Professor Heather Skirton Gen-Equip Project.
Genetische testen Professor Martina Cornel and Professor Heather Skirton Gen-Equip Project. Inzicht krijgen in genetische testen en testresultaten Inhoud Wat is genetisch testen? Klinische toepassingen
HLA-B*27 diagnostiek: is sequentie analyse the way to go?
HLA-B*27 diagnostiek: is sequentie analyse the way to go? 14 juni 2011 Bouke Hepkema Transplantatie-Immunologie Laboratoriumgeneeskunde UMCG Kwaliteit in Harmonisatie of Harmonisatie in Kwaliteit UMCG
1 (~20 minuten; 20 punten)
TENTAMEN Moleculaire Cel Biologie (8A840) Prof. Dr. Ir. L. Brunsveld & Dr. M. Merkx 27-01-2012 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal + 1 bonusvraag! (aangegeven tijd is indicatie) Gebruik
Informatie & Databases
Informatie Wat is informatie en waaruit het bestaat? Stel op een kaart staat het getal 37 geschreven. Wat kun je dan zeggen van het cijfer 37? Niets bijzonders, toch? Alleen dat het een getal is. Gaat
SQL Aantekeningen 3. Maarten de Rijke [email protected]. 22 mei 2003
SQL Aantekeningen 3 Maarten de Rijke [email protected] 22 mei 2003 Samenvatting In deze aflevering: het selecteren van tuples, operaties op strings, en aggregatie functies. Verder kijken we naar iets
Data Manipulatie. Query Talen. / Informatica
Data Manipulatie Query Talen 1 Queries maken in TC en SQL (ter verduidelijking) We kijken nog even naar bier-query q: Geef alle paren van drinkers die niet samen naar een kroeg kunnen gaan en daar allebei
take home messages COIG Genoom& Genetica juni 2017 Clinical Genetics UMCG
take home messages COIG Genoom& Genetica juni 2017 Clinical Genetics UMCG take home messages COIG juni 2017 Klinisch Genetisch Redeneren Denk genetisch: genetische basisbegrippen: nog steeds belangrijk
ODS: Open Directory service. Wat is ODS?
Wat is ODS? Wat is ODS? Geïntegreerde Meta-directorie voor OpenScape Office LX/MX/HX voor het zoeken van contacten in verschillende databasen en directories. Toegang verlenen naar verschillende directories.
Kunstmatige Intelligentie (AI) Hoofdstuk van Russell/Norvig = [RN] Genetische algoritmen. voorjaar 2016 College 11, 3 mei 2016
AI Kunstmatige Intelligentie (AI) Hoofdstuk 4.1.4 van Russell/Norvig = [RN] Genetische algoritmen voorjaar 2016 College 11, 3 mei 2016 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Introductie Er zijn allerlei
Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.
Grootste examentrainer en huiswerkbegeleider van Nederland Biologie Trainingsmateriaal De slimste bijbaan van Nederland! lyceo.nl Traininingsmateriaal Biologie Lyceo-trainingsdag 2015 Jij staat op het
Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015
AI Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Introductie
