DAR Approximate string matching Casus: biological sequence alignment

Maat: px
Weergave met pagina beginnen:

Download "DAR Approximate string matching Casus: biological sequence alignment"

Transcriptie

1 DAR Approximate string matching Casus: biological sequence alignment 1

2 Text search Approx string matching dynamic programming, edit distance example application: Google search Text indexing inverted list q-grams Casus: protein strings similarity, specific for biological domein application of q-gram indexing: BLAST 2 2

3 Biological sequence alignment 3 3

4 Biological sequence alignment Ik heb een sequentie S die bij soort A eigenschap X bepaalt. Kan ik in de genomen van andere soorten sequences vinden die grote gelijkenis vertonen met S? Ik heb een aantal patiënten met aandoening Y. Kan ik in hun genoom een sequentie vinden die zij gemeenschappelijk hebben en die afwijkt in vergelijking met niet-patiënten? 4

5 DNA sequencing: mijlpalen 1953 Crick & Watson ontdekken moleculaire structuur van het DNA (dubbele helix) 1975 Sanger ontdekt sequencing techniques human genome sequenced Anno nu: onderzoek naar individuele genetische verschillen 5 5

6 Sequence basics Model: een DNA sequence is een string over het alphabet {A,C,G,T} DNA segmenten worden gekopieerd naar een sequentie van messenger RNA om een eiwit te produceren (U in RNA = T in DNA) triplet structure definieert vertaling naar sequentie van aminozuren (codons) 6 6

7 Sequence basics 7 7

8 Sequence basics Een gen is een DNA-fragment dat een proteine codeert (versimpeld) Een proteine = sequentie van aminozuren (20 letter alphabet) ATGACCAGGATCTTTAAGTGA start codon = ATG stop codon = TGA codons: ATG-ACC-AGG-ATC-TTT-AAG-TGA methionine-threonine-arginine- MTR 6 manieren om een DNA-string af te lezen 8 8

9 Biological sequence databases SWISSPROT, GENBANK, Zowel proteines als ACGT-sequenties Generieke vorm query: find protein sequences similar to MKYMTVTDLNNAGATV 9 9

10 Biological sequence databases SWISSPROT example entries (FASTA format) >gi sp P42268 NDD_BPR70 NUCLEAR DISRUPTION PROTEIN MKYMTVTDLNNAGATVIGTIKGGEWFLGTPHKDILSKPGFYFLVSEFDGSCV SARFYVGNQRSKQGFSAVLSHIRQRRSQLARTIANNNMAYTVFYLPASKM KPLTTGFGKGQLALAFTRNHHSEYQTLEEMNRMLADNFKFVLQAY >gi sp P05228 HRP2_PLAFA HISTIDINE-RICH PROTEIN PRECURSOR (CLONE PFHRP-III) MVSFSKNKVLSAAVFASVLLLDNNNSEFNNNLFSKNAKGLNSNKRLLHESQA HAGDAHHAHHVADAHHAHHVADAHHAHHAANAHHAANAHHAANAHHAANA HHAANAHHAANAHHAANAHHAANAHHAANAHHAANAHHAANAHHAANAHH AANAHHAADANHGFHFNLHDNNSHTLHHAKANACFDDSHHDDAHHDGAHH DDAHHDGAHHDDAHHDGAHHDGAHHDGAHHNATTHHLH 10 10

11 Protein based data similarity Twee fragmenten DNA zijn homoloog als ze overeenkomsten vertonen die gebaseerd zijn op gemeenschappelijk afstamming We zoeken een concept sequence similarity dat gapping ondersteunt en rekening houdt met letter distance GSAQVKGHGKKVA HV---D--DMPNAL G+ +VK+HGKKV ++ +L GNPKVKAHGKKVL QLQVTGVVVTDATL 11 11

12 Similarity Doel 1: een probabilistisch model opstellen ter onderbouwing van notie van sequence similarity Doel 2: algoritmen opstellen om optimale alignments te vinden 12 12

13 Scoring model Twee fragmenten DNA zijn homoloog als ze overeenkomsten vertonen die gebaseerd zijn op gemeenschappelijk afstamming Men heeft collecties van paren strings verzameld die corresponderen met homologieën Op grond van deze collecties kunnen we tellingen doen betreffende de frequenties van matching van paren aminozuren Door (bio)chemische oorzaken zijn niet alle matches even waarschijnlijk 13 13

14 Scoring model String x bestaat uit een reeks symbolen x i Symbool x i heeft een waarschijnlijkheid q x i Volgens random model R (er is geen sprake van een homologie) hebben twee strings x en y een waarschijnlijkheid 14 14

15 Scoring model Volgens het Match model komen paren strings voor met een gezamenlijke waarschijnlijkheid, uitgaande van gemeenschappelijke afstamming van een symbool c De odds-ratio (voor wel/geen homologie) is dan 15 15

16 Scoring model Om mathematisch-technische redenen werken we liever met log-odds De log-odds ratio voor strings x en y is 16 16

17 BLOSUM matrices Op basis van tellingen zijn matrices ter representatie van s(a,b) opgesteld; hieronder een fragment van de BLOSUM50-matrix D, E en K charged; V, I en L hydrofoob Variatie t.b.v. sensitiviteit (50, 62, 80) 17 17

18 Scoring model: gaps Penalty voor gap met lengte g optie 1 optie 2 (d = gap open, e = gap extension) 18 18

19 Alignment algoritmen Aantal mogelijke alignments voor sequences met lengte m en n is erg groot Dynamic programming: druk de optimale alignment van twee sequences uit in de optimale oplossingen voor deelsequences 19 19

20 Needleman-Wunsch (global) Globale match Eenvoudige gap penalty We zoeken de optimale match van x 1.. x m en y 1.. y n We hebben optimale matches van x 1.. x m-1 en y 1.. y n-1 x 1.. x m-1 en y 1.. y n x 1.. x m en y 1.. y n

21 Needleman-Wunsch De optimale match van x 1.. x m en y 1.. y n verkrijg je door de beste optie te kiezen uit: x 1.. x m-1 en y 1.. y n-1, waarbij x m gepaard wordt aan y n x 1.. x m-1 en y 1.. y n : x m gepaard aan gap x 1.. x m en y 1.. y n-1 : y n gepaard aan gap 21 21

22 Needleman-Wunsch De keuze uit deze drie mogelijkheden wordt bepaald aan de hand van de scorefunctie F 22 22

23 Needleman-Wunsch De keuze uit deze drie mogelijkheden wordt bepaald aan de hand van de scorefunctie F In de matrix: F (i-1, j-1) F (i, j-1) F (i-1, j) F (i, j) Via trace-back pijlen geven we de herkomst van de oplossing weer 23 23

24 Needleman-Wunsch Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A -- 0 P A W 24 24

25 Needleman-Wunsch Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P -8 A -16 W

26 Needleman-Wunsch Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P -8-2 A -16 W

27 Match HEAGAWGHEE en PAWHEAE Needleman-Wunsch From: Biological Sequence Analysis; Durbin, Eddy e.a

28 Needleman-Wunsch Alignment is klaar als je het veld rechtsonderin bereikt. Deze bevat de globale score van de match Time complexity: O(mn) 28 28

29 Smith-Waterman (local) Voorbeeld Globale match: score = +1 HEAGAWGHE-E --P-AW-HEAE Lokale match: score = +21 HEA HEA \Lokale matches zijn interessanter 29 29

30 Smith-Waterman (local) Vraag Hoe pas je Needleman-Wunsch aan zodanig dat je lokale matches vindt? Antwoord 1. Zorg dat je op elk punt in de matrix met een schone lei begint: zet negatieve scores direct op 0 2. Je mag overal stoppen 30 30

31 Smith-Waterman (local) De keuze uit de mogelijkheden wordt bepaald aan de hand van de scorefunctie F 31 31

32 Smith-Waterman Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P 0 A 0 W

33 Smith-Waterman Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P A W

34 Smith-Waterman Voorbeeld Match HEAGAWGHEE en PAWHEAE d = 8 -- H E A P A W

35 Smith-Waterman (local) Alignment kan op elk punt in de matrix eindigen From: Biological Sequence Analysis; Durbin, Eddy e.a

36 Heuristieken In principe is ons probleem opgelost via dynamic programming Complexiteit O(mn) m: lengte query string n: lengte database! Behoefte aan heuristiek: Blast Methode: filtering gebaseerd op 3-grams 36 36

37 Blast Als twee strings een 3-gram delen, noemen we dat een hit HEAGAWGHEE en PAWHEAE Idee van filtering: Zoek via 3-gram hits kansrijke posities Pas op zo n kansrijke positie een lokaal expansiealgoritme toe 37 37

38 Blast Als twee strings een q-gram delen, noemen we dat een hit HEAGAWGHEE en PAWHEAE Het hebben van één hit geeft veel false positives; Hoe kunnen we spelen met selectiviteit en sensitiviteit? 38 38

39 Blast Extensie van hit-notie Twee q-grams zijn similar als hun onderlinge matchscore boven een bepaalde drempel komt (default = 11) HEAGAWGHEE en PAWHEAE Effecten: verhoging sensitivity (recall) verlaging selectivity (precision) 39 39

40 BLAST2 (PBLAST) Eis voor selectie is Two-hit diagonal principe: paar hits met dezelfde onderlinge afstand in query en db-string query = CWYWRWYYC dbstr = RRWYWAWYYRR OK! query = CWYWRWYYC dbstr = RRWYWABCWYYRR FOUT! Wat gebeurt er met sensitivity/selectivity? 40 40

41 Blast: expansie Eenvoudige ungapped expansie: ga uit van match op hits schuif naar rechts totdat match-score een val van 8 punten heeft gemaakt ten opzichte van optimum idem naar links 41 41

42 Blast: expansie Gapped expansie: pas lokaal een variant van Smith-Waterman (dynamic programming) toe 42 42

43 43

44 PBLAST: an RDB approach 44 44

45 PBLAST: an RDB approach Oefening: Druk BLAST-filtering uit in Relationele algebra (of SQL) 45 45

Wie? Advanced Databases blok 4 2011. DB vs IR. Wat? Canonical application (DB) Canonical application (DB)

Wie? Advanced Databases blok 4 2011. DB vs IR. Wat? Canonical application (DB) Canonical application (DB) Advanced Databases blok 4 2011 Wie? Hans Philippi: docent/practicumleider René Kersten: assistent bij practicum Hans Philippi 1 2 Wat? DB vs IR 2005 XML (Siebes) 2007 Google ranking (Siebes) 2009/2011

Nadere informatie

Bio-informatica Similariteit Searches. Peter De Rijk

Bio-informatica Similariteit Searches. Peter De Rijk Bio-informatica Similariteit Searches Peter De Rijk 6 Similariteit searches Zoeken naar gelijkende sequenties in sequentie databanken Korte sequentie (b.v. EST) waar we meer van willen weten Andere korte

Nadere informatie

Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105

Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te werken,

Nadere informatie

Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105

Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105 Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder

Nadere informatie

Bio-informatica Similariteit. Peter De Rijk

Bio-informatica Similariteit. Peter De Rijk Bio-informatica Similariteit Peter De Rijk 5 Similariteit, niet zo simpel Similariteit Similariteit is afhankelijk van de gekozen parameters Grootte, Kleur Functie Afkomst... Globale similariteit (families)

Nadere informatie

Implementatie LIMS binnen afdeling Genetica van het Radboudumc. Ermanno Bosgoed [email protected] 27 03 2014

Implementatie LIMS binnen afdeling Genetica van het Radboudumc. Ermanno Bosgoed ermanno.bosgoed@radboudumc.nl 27 03 2014 Implementatie LIMS binnen afdeling Genetica van het Radboudumc Ermanno Bosgoed [email protected] 27 03 2014 Inleiding Wie? Wat? Hoe? Historie LIMS Implementatie Labvantage Toekomst plannen

Nadere informatie

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105

Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105 Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van 8.45-10.45 uur in zaal Q105 NB: geef je antwoorden op dit formulier. Er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken

Nadere informatie

DNA practicum De modellenwereld van DNA

DNA practicum De modellenwereld van DNA DNA practicum De modellenwereld van DNA Inleiding Alle eigenschappen van een plant, zoals de grootte, de vorm van het blad, en de enzymen die nodig zijn voor de fotosynthese, liggen opgeslagen in het DNA.

Nadere informatie

Mee-naar-huis-neem boodschappen dec. 2016

Mee-naar-huis-neem boodschappen dec. 2016 COIG cursusdag Genoom & Genetica Mee-naar-huis-neem boodschappen dec. 2016 klinische moleculaire genetica klinisch genetisch redeneren ethische / maatschappelijke aspecten van erfelijkheidsonderzoek next

Nadere informatie

Afsluitende les. Leerlingenhandleiding. Proteomics voor de massa

Afsluitende les. Leerlingenhandleiding. Proteomics voor de massa Afsluitende les Leerlingenhandleiding Proteomics voor de massa Computeropdracht Inleiding - data van een massaspectrometer Bij dit computerpracticum gaan jullie zelf de data van de analyse van een eiwit

Nadere informatie

De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.

De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr. Tentamen Genoombiologie, 28 Oktober 2009, 9.00-11.45 h De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.

Nadere informatie

Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA.

Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA. Het menselijk genoom Het menselijk genoom (DN) bestaat uit: Mega Basenparen (MB),,, C,. Inleiding Medisch echnische Wetenschappen Bioinformatica Deel Michael Egmont-Petersen Het menselijk DN is ingedeeld

Nadere informatie

Hetzelfde DNA in elke cel

Hetzelfde DNA in elke cel EIWITSYNTHESE (H18) Hetzelfde DNA in elke cel 2 Structuur en functie van DNA (1) Genen bestaan uit DNA Genen worden gedragen door chromosomen Chromosomen bestaan uit DNAmoleculen samengepakt met eiwitten

Nadere informatie

AFO 113 Authoritybeheer

AFO 113 Authoritybeheer AFO 113 Authoritybeheer 113.1 Inleiding Authority records die gebruikt worden in de catalogusmodule kunnen via deze AFO beheerd worden. U kunt hier records opzoeken, wijzigen, verwijderen of toevoegen.

Nadere informatie

2 e SMT Workshop Moleculaire Typeringen spa typering en MLST

2 e SMT Workshop Moleculaire Typeringen spa typering en MLST 2 e SMT Workshop Moleculaire Typeringen spa typering en MLST 28 30 Januari, 2013 UMC Utrecht en RIVM Leo M Schouls Laboratorium voor Infectieziekten en Screening (LIS) Centrum voor Infectieziektebestrijding

Nadere informatie

Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis)

Afsluitende les. Leerlingenhandleiding. Wat voor eiwit ben jij? (Basis) Afsluitende les Leerlingenhandleiding Wat voor eiwit ben jij? (Basis) Deel 1 In het DNA ligt het erfelijk materiaal van een organisme in code opgeslagen. Deze code is opgebouwd uit vier nucleotiden: adenosine

Nadere informatie

extra oefening algoritmiek - antwoorden

extra oefening algoritmiek - antwoorden extra oefening algoritmiek - antwoorden opgave "Formule 1" Maak een programma dat de gebruiker drie getal A, B en C in laat voeren. De gebruiker zorgt ervoor dat er positieve gehele getallen worden ingevoerd.

Nadere informatie

Molecular Pathology for Pathologists. Pr P. Pauwels

Molecular Pathology for Pathologists. Pr P. Pauwels Molecular Pathology for Pathologists Pr P. Pauwels NGS moleculair pathologie rapport ontcijferen Nomenclatuur waarin gerapporteerd wordt: EGFR c.2573t>g, p.(leu858arg) Coderende sequentie Eiwit/proteïne

Nadere informatie

Vragen Genetica (Diederik de Bruijn) Omcirkel bij vraag 1 t/m 12 het juiste antwoord. Naam: Studentnummer:

Vragen Genetica (Diederik de Bruijn) Omcirkel bij vraag 1 t/m 12 het juiste antwoord. Naam: Studentnummer: Vragen Genetica (Diederik de Bruijn) Omcirkel bij vraag 1 t/m 12 het juiste antwoord 1. Onderstaande stamboom is van een familie waarin het EEC syndroom voorkomt. Er is sprake van autosomaal dominante

Nadere informatie

LDA Topic Modeling. Informa5ekunde als hulpwetenschap. 9 maart 2015

LDA Topic Modeling. Informa5ekunde als hulpwetenschap. 9 maart 2015 LDA Topic Modeling Informa5ekunde als hulpwetenschap 9 maart 2015 LDA Voor de pauze: Wat is LDA? Wat kan je er mee? Hoe werkt het (Gibbs sampling)? Na de pauze Achterliggende concepten à Dirichlet distribu5e

Nadere informatie

Next Generation Sequencing voor moleculaire diagnostiek. Aniek O. de Graaf, PhD, EurClinChem Laboratory Hematology

Next Generation Sequencing voor moleculaire diagnostiek. Aniek O. de Graaf, PhD, EurClinChem Laboratory Hematology Next Generation Sequencing voor moleculaire diagnostiek EQA voor NGS? Aniek O. de Graaf, PhD, EurClinChem Laboratory Hematology Sequentie analyse Old school Sanger sequentie analyse (Sanger, 1977) Sequencing-by-synthesis

Nadere informatie

Data Mining: similariteit en visuele data exploratie

Data Mining: similariteit en visuele data exploratie Data Mining: similariteit en visuele data exploratie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht: wat zagen we vorige les? Data karakteristieken

Nadere informatie

Ranking database queries. Ranking in IR. Classic ranking in IR. Ranking in IR. Ranking in IR: score. Advanced Databases

Ranking database queries. Ranking in IR. Classic ranking in IR. Ranking in IR. Ranking in IR: score. Advanced Databases Advanced Databases Topic 3: ranking van database queries Ranking database queries Outline ranking in IR toepassing ranking bij database queries: many-answer problem zero-answer problem 1 2 Classic ranking

Nadere informatie

Neanderthaler Genoom PROBUS 25 november 2015. Presentatie van Allan R. de Monchy

Neanderthaler Genoom PROBUS 25 november 2015. Presentatie van Allan R. de Monchy Neanderthaler Genoom PROBUS 25 november 2015 Presentatie van Allan R. de Monchy Onze Erfelijkheid; Genetische en cel kennis opfrissen. Als we in de eerste plaats kijken naar de mens dan bestaan wij uit

Nadere informatie

Tentamen Genetica 22-10-2004 Studentnr:

Tentamen Genetica 22-10-2004 Studentnr: CONTROLEER OF DIT TENTAMEN 11 PAGINA S BEVAT. Veel succes! Je mag de achterkant van het papier ook zo nodig gebruiken, maar beantwoord vragen 1-6 niet op blaadjes van vraag 7 en de daarop volgende. 1.

Nadere informatie

Les 10 : Aanmaken van een database (deel2).

Les 10 : Aanmaken van een database (deel2). Les 10 : Aanmaken van een database (deel2). Wat is een database? Een centrale opslagruimte voor gegevens. Alle informatie wordt centraal opgeslagen en kan door iedereen geraadpleegd worden. Voordelen van

Nadere informatie

ContentSearch. Deep dive

ContentSearch. Deep dive ContentSearch Deep dive 2 Waarvoor in te zetten? Alternatief voor database queries Waar performance een issue kan zijn Daadwerkelijk frontend Site Search Mogelijk niet de beste optie maar wel goedkoop

Nadere informatie

Bioinformatica en Systeembiologie (BIS)

Bioinformatica en Systeembiologie (BIS) Waarom een major Bioinformatica en Systeembiologie? Huidige methoden van onderzoek, zoals de DNAchiptechnologie, leveren enorme hoeveelheden gegevens op die met bestaande statistische methoden niet meer

Nadere informatie

Probabilistische modellen in de bio-informatica. Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002

Probabilistische modellen in de bio-informatica. Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002 Probabilistische modellen in de bio-informatica Yves Moreau 3de jr. Burg. Ir. Elektrotechniek Dataverwerking & Automatisatie 2001-2002 Overzicht Wat is bio-informatica? Waarom bio-informatica? Planning

Nadere informatie

Elastic Search wat heb je aan data als je er niets mee doet.. Oscar Buse 11 juli 2017 Linux User Group Nijmegen

Elastic Search wat heb je aan data als je er niets mee doet.. Oscar Buse 11 juli 2017 Linux User Group Nijmegen Elastic Search wat heb je aan data als je er niets mee doet.. Oscar Buse 11 juli 2017 Linux User Group Nijmegen Inleiding Dit praatje gaat over Elasticsearch. De onderwerpen die aan bod komen: Wat is Elasticsearch?

Nadere informatie

Subrapporten. 5.1 Inleiding

Subrapporten. 5.1 Inleiding 5 Subrapporten 5.1 Inleiding Een subrapport is een rapport in een rapport. Een subrapport maak je dan ook net zoals je een gewoon rapport maakt. Een subrapport heeft bijna alle eigenschappen die een normaal

Nadere informatie

Databank - Basis 1. Inhoud. Computervaardigheden en Programmatie. Hoofdstuk 4 Databank - Basis. Terminologie. Navigeren door een Venster

Databank - Basis 1. Inhoud. Computervaardigheden en Programmatie. Hoofdstuk 4 Databank - Basis. Terminologie. Navigeren door een Venster 4. 4. Inhoud rste BAC Toegepaste Biologische Wetenschappen Hoofdstuk 4 Databank Terminologie, Navigeren, Importeren Tabellen Records/Velden manipuleren Queries (Vragen) [Ook in SQL] sorteren filter volgens

Nadere informatie

Het omzetten van een ER-diagram naar SQL

Het omzetten van een ER-diagram naar SQL Het omzetten van een ER-diagram naar SQL Huub de Beer Eindhoven, 4 juni 2011 Omzetting ER-diagram naar SQL in twee stappen 1: ER-Diagram relationeel model Onderwerp van hoofdstuk 3 Entiteittype relatie,

Nadere informatie

20 maart Prof. Dr. Katrien Verleye

20 maart Prof. Dr. Katrien Verleye 20 maart 2018 Prof. Dr. Katrien Verleye Voorbereiding Nvivo sessie Start Nvivo op (Athena Academic Nvivo) BELANGRIJK: klik geregeld op save tijdens deze sessie Data-analyse met Nvivo NVivo does not prescribe

Nadere informatie

Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.

Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al. Centraal Dogma Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al., 6e druk Mei 2016 Van DNA naar mrna Hier zie je een deel van de sequentie

Nadere informatie

Informatievaardigheden Introductie EndNote

Informatievaardigheden Introductie EndNote Informatievaardigheden Introductie EndNote TU Delft Library Delft University of Technology Challenge the future TU Delft Library HowInformatievaardigheden to find and use scientific / EndNote information

Nadere informatie

BRAF rondzending SKML 2012

BRAF rondzending SKML 2012 BRAF rondzending SKML 2012 Presentatie van de resultaten op de deelnemersbijeenkomst 5 februari 2013 Riki Willems Patricia Groenen Willeke Blokx Adriaan van den Brule Casus 1 Langerhanscel histiocytose

Nadere informatie

Met een LightSwitch applicatie een OData service uit de Windows Azure Marketplace consumeren

Met een LightSwitch applicatie een OData service uit de Windows Azure Marketplace consumeren Met een LightSwitch applicatie een OData service uit de Windows Azure Marketplace consumeren Om eens wat ervaring op te doen met de Windows Azure Marketplace heb ik een publieke en gratis databron gekozen

Nadere informatie

Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen:

Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen: Gist demo Toelichting op de interface en werking van de tool. v0.1, 20 januari 2016, Erik Boertjes v0.2, 1 februari 2016, Rianne Kaptein v0.3, 9 mei 2016, Rianne Kaptein Doel Met behulp van de tool beschreven

Nadere informatie

Van big data naar smart data. Stappenplan voor B2B leadgeneratie.

Van big data naar smart data. Stappenplan voor B2B leadgeneratie. Van big data naar smart data. Stappenplan voor B2B leadgeneratie. Van big data naar smart data Door big data te verzamelen en om te zetten in werkelijk bruikbare smart data creëert u nieuwe inzichten,

Nadere informatie

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016

Artificial Intelligence in uw dagelijkse praktijk. Hilversum, 22 September 2016 Artificial Intelligence in uw dagelijkse praktijk Hilversum, 22 September 2016 Agenda 09:30 Welkom en introductie 09:35 Artificial Intelligence, al meer dan 50 jaar een actief onderzoeksgebied Jaap van

Nadere informatie

High through put automatisering in de Genetica. Ermanno Bosgoed [email protected] 19 11 2014

High through put automatisering in de Genetica. Ermanno Bosgoed ermanno.bosgoed@radboudumc.nl 19 11 2014 High through put automatisering in de Genetica Ermanno Bosgoed [email protected] 19 11 2014 Inleiding Wie? Wat? Hoe? Automatisering / Robotisering Toekomst plannen Medewerkers Afdeling Genetica

Nadere informatie

Algoritmiek. 2 februari Introductie

Algoritmiek. 2 februari Introductie College 1 Algoritmiek 2 februari 2017 Introductie 1 Introductie -1- docent: Rudy van Vliet [email protected] assistent werkcollege: Bart van Strien [email protected] website: http://www.liacs.leidenuniv.nl/~vlietrvan1/algoritmiek/

Nadere informatie

Databases - Inleiding

Databases - Inleiding Databases Databases - Inleiding Een database is een verzameling van een aantal gegevens over een bepaald onderwerp: een ledenbestand van een vereniging, een forum, login gegevens. In een database worden

Nadere informatie

Figuur 1. Representatie van de dubbele helix en de structuren van de verschillende basen.

Figuur 1. Representatie van de dubbele helix en de structuren van de verschillende basen. Het DNA molecuul is verantwoordelijk voor het opslaan van de genetische informatie die gebruikt wordt voor de ontwikkeling en het functioneren van levende organismen. Aangezien het de instructies voor

Nadere informatie

Bio-informatica Boom constructie. Peter De Rijk

Bio-informatica Boom constructie. Peter De Rijk Bio-informatica Boom constructie Peter De Rijk 8 Waarom boomconstructie Evolutionaire analyse: verwantschap tussen genen en/of species Studie oorsprong en divergentietijden bv. divergentie mens-mensapen,

Nadere informatie

Examen structurele bioinformatica Naam:

Examen structurele bioinformatica Naam: 1. Uit welke onderdelen bestaat elk aminozuur? Leg kort uit waarvoor ze verantwoordelijk zijn (vanuit structureel oogpunt). centraal koolstofatoom (C α ) amino groep (NH 2 ) => peptidebinding carboxyl

Nadere informatie

Naar High Throughput DNA data analyse

Naar High Throughput DNA data analyse Naar High Throughput DNA data analyse Laboratorium automatisering seminar Jan-Peter Nap Hanze University Groningen 8/10/10 1 van 24 gisteren CLC bio, a comprehensive platform for NGS analysis nu: Super-scale

Nadere informatie

SQL datadefinitietaal

SQL datadefinitietaal SQL datadefinitietaal We kunnen er het schema van de database mee bepalen: metadata toevoegen, wijzigen en verwijderen uit een database. Basiscommando's: CREATE : toevoegen van metagegevens DROP : verwijderen

Nadere informatie

DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008

DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA 1. Hieronder zie je de schematische weergave van een dubbelstrengs DNA-keten. Een

Nadere informatie

BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6

BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6 BIOLOGIE MOLECULAIRE GENETICA EIWITSYNTHESE VWO KLASSE 6 Henry N. Hassankhan Scholengemeenschap Lelydorp [HHS-SGL] ARTHUR A. HOOGENDOORN ATHENEUM - VRIJE ATHENEUM - AAHA Docent: A. Sewsahai DOELSTELLINGEN:

Nadere informatie

TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie)

TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld :00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie) TENTAMEN BIOCHEMIE (8S135) Prof. Dr. Ir. L. Brunsveld 25-01-2010 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal (aangegeven tijd is indicatie) 1 (~30 minuten; 20 punten) Onderstaand is een stukje

Nadere informatie

Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica 2011-2012 / 2012-2013 / 2013-2014

Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica 2011-2012 / 2012-2013 / 2013-2014 Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica 2011-2012 / 2012-2013 / 2013-2014 versie 1.0, maart 2012, Deze Body of Knowledge and Skills (BoKS) is een weergave van de kenniscomponent

Nadere informatie

Informatie Systeem Ontwikkeling ISO 2R290

Informatie Systeem Ontwikkeling ISO 2R290 Informatie Systeem Ontwikkeling ISO 2R290 docent: Prof. dr. Paul De Bra Gebaseerd op: Database System Concepts, 5th Ed. doel van dit vak kennis van en inzicht in basisbegrippen over informatiesystemen

Nadere informatie

Inleiding Programmeren 2

Inleiding Programmeren 2 Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te

Nadere informatie

Bio-informatica Genpredictie

Bio-informatica Genpredictie Bio-informatica Genpredictie 9 Genpredictie Genpredictie opsporen van functionele gebieden en elementen die verantwoordelijk zijn voor de genstructuur, genregulatie en gentranscriptie in genomische sequenties

Nadere informatie

Inleiding Programmeren 2

Inleiding Programmeren 2 Inleiding Programmeren 2 Gertjan van Noord November 28, 2016 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te

Nadere informatie

Waardelijsten. Vormen van waardelijsten.

Waardelijsten. Vormen van waardelijsten. Waardelijsten Introductie Bij de opbouw van een applicatie is zuiverheid van informatie van zeer groot belang. Het gebruik van waardelijsten beperkt/vegemakkelijkt de invoer van gegevens in bepaalde velden.

Nadere informatie

Bio-informatica Sequentie Patronen. Peter De Rijk

Bio-informatica Sequentie Patronen. Peter De Rijk Bio-informatica Sequentie Patronen Peter De Rijk 7 Patroon Herkenning Patroon Herkenning Patroon Herkenning Afhankelijk van groepsspecificaties! Doel Patroon Herkenning Met een gegeven set sequenties Behoort

Nadere informatie

1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5'

1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5' proefexamen 1. Welk van de onderstaande DNA sequenties zijn mogelijke herkenning-sites voor restrictie-enzymen? c 5' GAATTC 3' c 5' GGGGCCCC 3' c 5' CTGCAG 3' 5' CTAAATC 3' 5' GGAACC 3' Restriction Endonucleases

Nadere informatie

Synthetische biologie in de praktijk. igem TU Eindhoven 2016

Synthetische biologie in de praktijk. igem TU Eindhoven 2016 Synthetische biologie in de praktijk Doelgroep: Vakgebied: Tijdsduur: HAVO/VWO bovenbouw Biologie ± 40 minuten Inleiding Synthetische biologie is het (her)programmeren van een biologisch systeem (cellen

Nadere informatie

Information Retrieval.

Information Retrieval. Information Retrieval [email protected] Zoekterm... Data retrieval IR uit gestructureerde gegevens ongestructureerde documenten Bv. html, doc, txt, jpg,... artificiële vraagtaal natuurlijk

Nadere informatie

Moleculaire diagnostiek

Moleculaire diagnostiek Moleculaire diagnostiek van infectieziekten Arjan de Jong 8 december 2015 Moleculaire diagnostiek Diagnostiek op basis van moleculair biologische (DNA/RNA) technieken Moleculaire diagnostiek van infecties

Nadere informatie

Leerlingenhandleiding

Leerlingenhandleiding Leerlingenhandleiding Zelfstandige module Op zoek naar een gen in een databank Op zoek naar een gen in een databank Met behulp van databanken kun je informatie opzoeken over genen. Een databank is een

Nadere informatie

Oplossingen Datamining 2II15 Juni 2008

Oplossingen Datamining 2II15 Juni 2008 Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:

Nadere informatie

Demultiplexing reads FASTA format genome sequencing reads run

Demultiplexing reads FASTA format genome sequencing reads run Demultiplexing reads In bioinformatics, FASTA format is a text-based format for representing either nucleotide sequences or peptide sequences, in which nucleotides or amino acids are represented using

Nadere informatie

Temperatuur logger synchronisatie

Temperatuur logger synchronisatie Temperatuur logger synchronisatie Juni 10, 2010 1 / 7 Temperatuur logger synchronisatie Introductie Twee of meerdere ontvangers van het Multilogger systeem kunnen met de temperature logger synchronisatie

Nadere informatie

Proteomics. Waarom DNA alleen niet genoeg is

Proteomics. Waarom DNA alleen niet genoeg is Proteomics Waarom DNA alleen niet genoeg is Reinout Raijmakers Netherlands Proteomics Centre Universiteit Utrecht, Biomolecular Mass Spectrometry and Proteomics Group Van DNA naar organisme Eiwitten zijn

Nadere informatie

Koppeling met een database

Koppeling met een database PHP en MySQL Koppeling met een database 11.1 Inleiding In PHP is het eenvoudig om een koppeling te maken met een database. Een database kan diverse gegevens bewaren die met PHP aangeroepen en/of bewerkt

Nadere informatie

Genetische testen. Professor Martina Cornel and Professor Heather Skirton Gen-Equip Project.

Genetische testen. Professor Martina Cornel and Professor Heather Skirton Gen-Equip Project. Genetische testen Professor Martina Cornel and Professor Heather Skirton Gen-Equip Project. Inzicht krijgen in genetische testen en testresultaten Inhoud Wat is genetisch testen? Klinische toepassingen

Nadere informatie

HLA-B*27 diagnostiek: is sequentie analyse the way to go?

HLA-B*27 diagnostiek: is sequentie analyse the way to go? HLA-B*27 diagnostiek: is sequentie analyse the way to go? 14 juni 2011 Bouke Hepkema Transplantatie-Immunologie Laboratoriumgeneeskunde UMCG Kwaliteit in Harmonisatie of Harmonisatie in Kwaliteit UMCG

Nadere informatie

1 (~20 minuten; 20 punten)

1 (~20 minuten; 20 punten) TENTAMEN Moleculaire Cel Biologie (8A840) Prof. Dr. Ir. L. Brunsveld & Dr. M. Merkx 27-01-2012 14:00 17:00 (totaal 100 punten) 6 opgaven in totaal + 1 bonusvraag! (aangegeven tijd is indicatie) Gebruik

Nadere informatie

Informatie & Databases

Informatie & Databases Informatie Wat is informatie en waaruit het bestaat? Stel op een kaart staat het getal 37 geschreven. Wat kun je dan zeggen van het cijfer 37? Niets bijzonders, toch? Alleen dat het een getal is. Gaat

Nadere informatie

SQL Aantekeningen 3. Maarten de Rijke [email protected]. 22 mei 2003

SQL Aantekeningen 3. Maarten de Rijke mdr@science.uva.nl. 22 mei 2003 SQL Aantekeningen 3 Maarten de Rijke [email protected] 22 mei 2003 Samenvatting In deze aflevering: het selecteren van tuples, operaties op strings, en aggregatie functies. Verder kijken we naar iets

Nadere informatie

Data Manipulatie. Query Talen. / Informatica

Data Manipulatie. Query Talen. / Informatica Data Manipulatie Query Talen 1 Queries maken in TC en SQL (ter verduidelijking) We kijken nog even naar bier-query q: Geef alle paren van drinkers die niet samen naar een kroeg kunnen gaan en daar allebei

Nadere informatie

take home messages COIG Genoom& Genetica juni 2017 Clinical Genetics UMCG

take home messages COIG Genoom& Genetica juni 2017 Clinical Genetics UMCG take home messages COIG Genoom& Genetica juni 2017 Clinical Genetics UMCG take home messages COIG juni 2017 Klinisch Genetisch Redeneren Denk genetisch: genetische basisbegrippen: nog steeds belangrijk

Nadere informatie

ODS: Open Directory service. Wat is ODS?

ODS: Open Directory service. Wat is ODS? Wat is ODS? Wat is ODS? Geïntegreerde Meta-directorie voor OpenScape Office LX/MX/HX voor het zoeken van contacten in verschillende databasen en directories. Toegang verlenen naar verschillende directories.

Nadere informatie

Kunstmatige Intelligentie (AI) Hoofdstuk van Russell/Norvig = [RN] Genetische algoritmen. voorjaar 2016 College 11, 3 mei 2016

Kunstmatige Intelligentie (AI) Hoofdstuk van Russell/Norvig = [RN] Genetische algoritmen. voorjaar 2016 College 11, 3 mei 2016 AI Kunstmatige Intelligentie (AI) Hoofdstuk 4.1.4 van Russell/Norvig = [RN] Genetische algoritmen voorjaar 2016 College 11, 3 mei 2016 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Introductie Er zijn allerlei

Nadere informatie

Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.

Grootste examentrainer en huiswerkbegeleider van Nederland. Biologie. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo. Grootste examentrainer en huiswerkbegeleider van Nederland Biologie Trainingsmateriaal De slimste bijbaan van Nederland! lyceo.nl Traininingsmateriaal Biologie Lyceo-trainingsdag 2015 Jij staat op het

Nadere informatie

Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015

Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015 AI Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Introductie

Nadere informatie