Bio-informatica Similariteit Searches. Peter De Rijk
|
|
|
- Annelies van der Woude
- 9 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Bio-informatica Similariteit Searches Peter De Rijk 6
2 Similariteit searches Zoeken naar gelijkende sequenties in sequentie databanken Korte sequentie (b.v. EST) waar we meer van willen weten Andere korte sequenties annotatie gegevens (mogelijk) uitbreiding sequentie (mogelijk) Homologe sequenties? (vergelijkende analyse) Genomische regio, gen Plaatsing in context Annotatie van grote sequenties b.v. Genomische regio's, kandidaat gebieden Waar liggen b.v. mrna's, EST's, genen, gekende eiwit sequenties, etc.
3 Low complexity sequenties Low complexity sequenties bv. Tandem repeats, GC rijke regio... Geven zeer gemakkelijk hits bij toeval (met niet gerelateerde sequenties) Om deze te maskeren gebruikt men Filters SEG voor proteïne HILCDEVNEGDEENEDFLPS HILCXXXXXXXXXXXXFLPS DUST voor DNA GCTCAAAAAATAAAAACACG GCTCNNNNNNNNNNNNCACG
4 Low complexity sequenties Repeats Simple repeats: korte herhaalde sequenties Stukken sequentie die vaak voorkomen in een genoom b.v. t.g.v transposons Moeten gemaskeerd worden voor een zoektocht Geven enorm veel, niet informatieve hits Kunnen informatieve hits maskeren RepeatMasker Identificeert en maskeert repeats Methode Database van gekende repeats (in verschillende genomen) Vergelijking query met database met behulp van dynamic programming
5 Dynamic programming search Methode Optimale locale alignatie met dynamic programming -> zeer traag (voor alle sequenties in database) Om te versnellen gebruikt men zeer grootte parallelle systemen (bv Maspar: verschillende PC's berekenen elk een deel...) Hardware acceleratie Servers BLITZ Swsrch CPU specifiek voor bepaalde algorithmen maken (bv. Bioccelerator, Genematcher, ) Speciale functies (oorspronkelijk voor versnelling van multimedia) van gewone cpus/gpus (bv. CLC Bio)
6 Heuristiek Vorige (dynamic programming) Alle mogelijke alignmenten van de query sequentie met alle databank sequenties worden gecontroleerd steeds optimale oplossing (gegeven parameters) traag Heuristiek of approximatie Niet alle mogelijkheden worden onderzocht, wel de meest waarschijnlijke bv. We kijken eerst op een andere snellere manier of een databank sequentie enigszins lijkt op de query, we gaan enkel verder met degene waarvoor dit het geval is vind veel sneller gelijkende sequenties in grote databanken Geen garantie dat alle gelijkende sequenties worden gevonden
7 Fasta FastA Fast Alignement, Methode van Pearson & Lipman Eerste veel gebruikte programma om similariteits searches te doen in databanken FASTA zoekt locale alignementen Gebruikt een heuristiek Varianten fastn (nucleïnezuren) fastp (proteïnen) fastx (vergelijkt DNA met proteïne sequenties)
8 FastA algoritme database sequence query sequence Zoekt naar korte identieke segmenten van lengte k (k-tuples, woorden) Maakt tabel met posities van elk woord in query Offset tabel met per positie: verschillen positie van woord t.o.v. posities in query ~ diagonalen in matrix Lengte k: belangrijk! bv. k = 10 er is minstens 1 match van 10 identieke opeenvolgende basen/az nodig. Default AZ: k = 2 NZ: k = 6 Lagere k waardes Grotere sensitiviteit Langere zoektijd
9 Offset table Simpele voorbeeld offset tabel voor k=1 protein 1 n c s p t a..... protein a c s p r k position in offset amino acid protein 1 protein 2 pos 1 pos a c k - 11 n 1 - p r - 10 s t common offset for the 3 amino acids c,s and p protein 1 n c s p t a protein 2 a c s p r k
10 FastA algoritme database sequence query sequence Zoekt 10 beste regios of diagonalen In offset tabel: woord matches met dezelfde offset liggen op dezelfde diagonaal Beste regio met meeste identiteiten (woord matches) Woord matches dicht bij elkaar Scoort initial regions met behulp van de PAM matrix init1 score (= score beste regio) Gaat enkel verder wanneer init1 > cutoff
11 FastA algoritme database sequence Verwijdert intial regions < een opgegeven cutoff Verbindt segmenten eventueel nu ook op verschillende diagonalen) initn score = som van scores samengestelde initiele regios aftrekken van joining penalties voor elke gap query sequence
12 FastA algoritme database sequence Beste lokaal alignement Terug te vinden binnen gebied gedefinieerd door segmenten Via Dynamic programming Geeft een optimized score s (opt score) query sequence
13 Scores van database searches Met welke score weet je zeker of 2 sequenties verwant zijn? Ideaal: perfecte discriminatie Realiteit: overlap cutoff cutoff? Aantal sequenties niet verwante sequenties verwante sequenties Aantal sequenties niet verwante sequenties verwante sequenties Alignements score Alignements score FN FP
14 FastA scores Statistiek om na te gaan hoe goed de scores zijn S-μ z-score Significantie van een alignment score S Correctie voor de verschillen in lengte n van de databank sequentie Frequentie μ s σ s Alignements score Figuur: Distributie scores van niet verwante sequenties S is significanter naarmate het verschil met het gemiddelde groter is minder significant wanneer spreiding groter S σ S = standaard deviatie S μ S = gemiddelde van S Parameters worden geschat door fitting aan laag scorende alignementen in de databank 'laag' : arbitrair gekozen
15 FastA scores Probability P Kans dat een databank sequentie (lengte n) en de query sequentie (lengte m) bij toeval een alignement met dezelfde of betere z-score zou opleveren Expect Hoeveel hits met gelijkaardige of beter score kunnen op basis van toeval verwacht worden Liefst zo klein mogelijk (cut off standaard = 10) E = NP (N = aantal sequenties in databank; P= probabilteit) Hoe meer sequenties in een databank, hoe groter de kans dat er per toeval hits worden gevonden. Bitscore Score gecorrigeerd voor de schaal van het score systeem Onafhankelijk van het scoring systeem (vergelijking mogelijk tussen verschillende programmas, settings, databanken)
16 FastA beschikbaarheid WWW EBI Lokaal kan gedownload worden
17 BLAST Basic Local Alignment Search Tool Meest gebruikte programma voor zoeken van locale alignementen via bv.ncbi Gebruikt ook heuristiek Database Blastall vergelijkt query in fasta formaat database in binair formaat binair: 4 basen in 1 byte; zoektocht gaat sneller (itt FastA: waar de database ook in FastA formaat is) gemaakt met commando formatdb Met bl2seq kunnen ook 2 sequenties in fasta formaat vergeleken worden
18 BLAST programs Query Database blastp Proteïne tblastn blastx blastn DNA Proteïne DNA BLAST search gevoeliger op protein niveau dan op DNA niveau tblastx 6 frame translation Beide sequenties omgezet naar alle mogelijke translaties, en dan vergeleken
19 6 frame translation We willen alle mogelijke vertalingen van de DNA sequentie Start op positie 1, 2 en 3 geeft verschillende vertalingen (blauw, rood, groen) Start op positie 4 geeft dezelfde vertaling als positie1 (zonder het eerste AZ), 5 als 2,... zelfde reading frame 6 frame translatie 3 reading frames in een sequentie Proteine kan afgeschreven worden van zowel forward als reverse strand 6 reading frames
20 BLAST algoritme BLAST zoekt eerst snel naar identieke sequenties van lengte W in de query en db word hits Word size W Default W = 3 voor AZ W = 11 voor NZ Lagere W Grotere sensitiviteit Langere zoektijd
21 BLAST algoritme query sequentie: RLEGDCVFDGMIGSDQGSLRFDGFDVECDSPG RLE LEG hashtable hash EGD Table position position in seq RLE:1 EGD: Snelle search naar word hits 999 LEG:2 alle woorden van lengte W in de 1000 query worden opgeslagen in een hash table De databank sequentie word sequentieel gescand database sequentie: DLEGDCFFDGMIGSDWGSLRFDGFDVECDSPG DLE LEG hash EGD... in hashtable in query 3 Leeg niet in query 999 LEG:2 positie 2 2 RLE:1 EGD:3 positie 3
22 BLAST algoritme query sequentie: RLEGDCVFDGMIGSDQGSLRFDGFDVECDSPG GSD 16 GAD 13 GTD 13 GDD 12 Neighborhood word list GED 12 Ook gelijkende woorden GGD 12 in hash table GSE 12 afhankelijk van score matrix GCD 11 GHD 11 GMD 11 GSN 11 GID 10 GLD 10 GVD 10 gelijkenis score voor elke mogelijkheid T = 11 Opgenomen tot een bepaalde score T
23 BLAST algoritme BLAST1: Word hits worden uitgebreid tot HSPs HSP: High-scoring Segment Pair Optimaal lokaal alignement zonder gaps Paar van segmenten uit query en database sequentie van gelijke lengte Alignement score kan niet meer worden verbeterd door het gebied uit te breiden of in te krimpen Score bepaald op basis van score matrix default BLOSUM62 Score beter dan een vooraf opgegeven 'treshold' of 'cutoff' waarde
24 BLAST algoritme...dgmigsdqgsl g G+D GS NGQRGTDVGSV... totaalscore Woord hit links en rechts uitbreiden uitbreiden Voor elk paar gealigneerde AZ score uit score matrix bij totaal tellen Stop wanneer totaal score onder een gegeven waarde zakt Segment afkappen op maximale score Uit Score matrix G S D Q G S L R F D G F D V E C G T D V G S V M D E I P N D F E
25 BLAST 2 (gapped BLAST) 2 hit criterium woord hit wordt slechts uitgebreid als er een tweede woord hit is binnen een afstand A (default = 40 AZ); dit verhoogt de snelheid van de search Optimaal lokaal alignement met gaps Als de score van HSP hoger is dan een gegeven score S g Dynamic programming methode om alignement te zoeken
26 BLAST scores Expect value Aantal verwachte toevallige hits met dezelfde of betere score dan de score S van deze hit E = mnke -λs m= lengte query n = lengte database (som lengte van alle sequenties db) K en λ λ en K zijn parameters geassocieerd met het score systeem In BLAST 1 zijn deze parameters theoretisch afgeleid In BLAST2 Kan niet theoretisch afgeleid worden door de gaps fit aan gesimuleerde resultaten met random seq en random databases (random sequentie model) Voor een selectie van score matrices, gap costs enkel deze combinaties kunnen gebruikt worden als parameters
27 BLAST scores Probability P Kans dat alignement met een score S per toeval zou kunnen gevonden worden Kan afgeleid worden van Expect value E P = 1 e -E Bit score Score gecorrigeerd voor de schaal van het score systeem. Maakt het mogelijk om scores van verschillende soorten searches te vergelijken Afhankelijk van berekende parameters en score
28 BLAST beschikbaarheid Via web: EBI NCBI Lokaal kan gedownload worden Zelf database maken Commandline client Blastcl2 Locale databases of databases op web
29 Specifieke vormen BLAST Varianten/op BLAST gebaseerde tools Megablast Blat sneller zoeken naar sterk gelijkende sequenties, langere seq mogelijk (grotere word size, greedy alignment) Sneller zoeken naar (sterk gelijkende) sequenties in genoom db (genoom) wordt in hashtable bijgehouden ipv. query Specifieke vormen (patroon gerelateerde) PSI-BLAST: Position Specific Iterative BLAST PHI-BLAST: Pattern Hit Initiated BLAST RPS-BLAST: Reverse Position Specific BLAST Zie Hoofdstuk 7: Profielen
30 Conclusies Proteïne searches zijn gevoeliger dan DNA groter alfabet (DNA bij toeval 25% identiteit) score matrices Query mogelijk coderend DNA: beter searches op proteïne niveau: blastx, tblastn, tblastx Welk programma BLAST beter dan FastA op proteïne niveau Neighboring words: grotere sensitiviteit HSP's komen vaak op geconserveerde kern FastA beter voor niet coderend DNA Meer inserties/deleties -> geconserveerde kernen zijn kleiner
31 BLAST of FastA Snelheid SW fasta BLAST1 BLAST2 Sensitiviteit bij zoeken naar proteïne of vertaalde DNA sequenties fasta BLAST1 BLAST2 SW Sensitiviteit bij zoeken naar DNA sequenties BLAST fasta SW SW: Smith & Waterman: Dynamic Programming
32 Conclusies Databank groter grotere E values Meer vals positieven Gebruik kleinere databanken kan noise beperken Beperken databank tot een sub set bv. Enkel humane sequenties, enkel mrna,... kleinere databank (indien mogelijk/nuttig) bv. humane genoom databank ipv. Volledige nucleotide db bv. swissprot ipv. Volledige proteine db
33 Gevaren Als een gebied van query heel veel hits geeft b.v. frequent voorkomend domein Andere hits worden gemaskeerd Nieuwe search met query waar dit gebied uitgefilterd werd Similariteit betekent niet steeds homologie, homologie betekent niet steeds zelfde functie De beschrijving van een hit sequentie slaat niet per se op de regio waar de hit zich bevindt Database annotaties zijn niet altijd betrouwbaar Incompleet, putative (= mogelijk/niet zeker), fouten
DAR Approximate string matching Casus: biological sequence alignment
DAR Approximate string matching Casus: biological sequence alignment 1 Text search Approx string matching dynamic programming, edit distance example application: Google search Text indexing inverted list
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te werken,
Bio-informatica Similariteit. Peter De Rijk
Bio-informatica Similariteit Peter De Rijk 5 Similariteit, niet zo simpel Similariteit Similariteit is afhankelijk van de gekozen parameters Grootte, Kleur Functie Afkomst... Globale similariteit (families)
Bio-informatica Genpredictie
Bio-informatica Genpredictie 9 Genpredictie Genpredictie opsporen van functionele gebieden en elementen die verantwoordelijk zijn voor de genstructuur, genregulatie en gentranscriptie in genomische sequenties
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder
Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode.
Verificatie Shen en Carpenter RDEC methodiek voor de karakterisering van asfaltvermoeiing; vergelijking van verschillende methoden voor het berekenen van de parameters. Jan Telman, Q-Consult Bedrijfskundig
Bio-informatica Boom constructie. Peter De Rijk
Bio-informatica Boom constructie Peter De Rijk 8 Waarom boomconstructie Evolutionaire analyse: verwantschap tussen genen en/of species Studie oorsprong en divergentietijden bv. divergentie mens-mensapen,
Bio-informatica Sequentie Patronen. Peter De Rijk
Bio-informatica Sequentie Patronen Peter De Rijk 7 Patroon Herkenning Patroon Herkenning Patroon Herkenning Afhankelijk van groepsspecificaties! Doel Patroon Herkenning Met een gegeven set sequenties Behoort
Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie
Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s
Oplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van 8.45-10.45 uur in zaal Q105 NB: geef je antwoorden op dit formulier. Er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken
Referentie Handleiding
Version 1.1.5 Referentie Handleiding DiscretePhoton H.264 encoder DiscretePhoton www.discretephoton.com Referentie Handleiding Over DiscretePhoton H.264-encoder DiscretePhoton H.264 encoder Windows versie
Classification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Geheugenbeheer. ICT Infrastructuren 2 december 2013
Geheugenbeheer ICT Infrastructuren 2 december 2013 Doelen van geheugenbeheer Reloca>e (flexibel gebruik van geheugen) Bescherming Gedeeld/gemeenschappelijk geheugen Logische indeling van procesonderdelen
Memory Management. Virtual Memory. Eisen Memory Management. Verdelen geheugen over meerdere processen
Memory Management Process control information Entry point to program Process Control Block Verdelen geheugen over meerdere processen Program Branch instruction Virtual Memory Data Reference to data Processen
De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.
Tentamen Genoombiologie, 28 Oktober 2009, 9.00-11.45 h De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.
Het menselijk genoom. Inleiding Medisch Technische Wetenschappen. Bioinformatica Deel 2. Gevouwen chromosoom. X chromosoom DNA.
Het menselijk genoom Het menselijk genoom (DN) bestaat uit: Mega Basenparen (MB),,, C,. Inleiding Medisch echnische Wetenschappen Bioinformatica Deel Michael Egmont-Petersen Het menselijk DN is ingedeeld
Hoe goed is een test?
Hoe goed is een test? 1.0 het ideale plaatje Als we een test uitvoeren om te ontdekken of iemand ziek is hebben we het liefst een test waarbij de gezonde en de zieke groepen duidelijk gescheiden zijn.
Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms
Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms Giso Dal (0752975) Pagina s 5 7 1 Deelverzameling Representatie
Leerlingenhandleiding
Leerlingenhandleiding Afsluitende module Op zoek naar een gen in een databank Op zoek naar een gen in een databank Tijdens het DNA-lab Lees de taal van de tumor hebben jullie drie genen onderzocht. Welke
DNA practicum De modellenwereld van DNA
DNA practicum De modellenwereld van DNA Inleiding Alle eigenschappen van een plant, zoals de grootte, de vorm van het blad, en de enzymen die nodig zijn voor de fotosynthese, liggen opgeslagen in het DNA.
Tentamen Beeldverwerking TI2716-B Woensdag 28 januari 2015 14.00-17.00
Tentamen Beeldverwerking TI2716-B Woensdag 28 januari 2015 14.00-17.00 De 2D Gaussische fimctie e-' = 037 e'^ =0.14 e"'' = 0.082 e-' =0.018 deze toets bestaat uit 4 opgaven en 8 pagina's Opgave 1 en 2
DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008
DNA & eiwitsynthese Oefen- en zelftoetsmodule behorende bij hoofdstuk 16 en 17 van Campbell, 7 e druk December 2008 DNA 1. Hieronder zie je de schematische weergave van een dubbelstrengs DNA-keten. Een
Wie? Advanced Databases blok 4 2011. DB vs IR. Wat? Canonical application (DB) Canonical application (DB)
Advanced Databases blok 4 2011 Wie? Hans Philippi: docent/practicumleider René Kersten: assistent bij practicum Hans Philippi 1 2 Wat? DB vs IR 2005 XML (Siebes) 2007 Google ranking (Siebes) 2009/2011
Leerlingenhandleiding
Leerlingenhandleiding Zelfstandige module Op zoek naar een gen in een databank Op zoek naar een gen in een databank Met behulp van databanken kun je informatie opzoeken over genen. Een databank is een
Databank - Basis 1. Inhoud. Computervaardigheden en Programmatie. Hoofdstuk 4 Databank - Basis. Terminologie. Navigeren door een Venster
4. 4. Inhoud rste BAC Toegepaste Biologische Wetenschappen Hoofdstuk 4 Databank Terminologie, Navigeren, Importeren Tabellen Records/Velden manipuleren Queries (Vragen) [Ook in SQL] sorteren filter volgens
Data Mining: Clustering
Data Mining: Clustering docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Wat is clustering? Het onderverdelen van de objecten in een database in homogene
Zoeken in PubMed. Bert Berenschot Medische Bibliotheek OLVG locatie Oost Amsterdam
Zoeken in PubMed Bert Berenschot Medische Bibliotheek OLVG locatie Oost Amsterdam [email protected] 020-5992975 Wat gebeurt er met je zoekterm Zet CVA in de zoekregel en klik Search Het zoekwoord wordt
Brochure ExomeScan. Whole Exome Sequencing. Achtergrond
Brochure Whole Exome Sequencing De laatste jaren is er een schat aan informatie gepubliceerd over de genetische achtergrond van overerfbare en somatische aandoeningen. In grootschalige Next Generation
Inhoud. Introductie... 2. Bridge Abstract... 3. Bridge Abstract Scores...4
John Sample Inhoud Introductie... 2 Bridge Abstract... 3 Bridge Abstract Scores...4 Introductie De resultaten uit dit rapport zijn vertrouwelijk en alleen bedoeld voor de persoon die de test heeft ingevuld.
Summary in Dutch 179
Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse
9. Strategieën en oplossingsmethoden
9. Strategieën en oplossingsmethoden In dit hoofdstuk wordt nog even terug gekeken naar alle voorgaande hoofdstukken. We herhalen globaal de structuren en geven enkele richtlijnen voor het ontwerpen van
extra oefening algoritmiek - antwoorden
extra oefening algoritmiek - antwoorden opgave "Formule 1" Maak een programma dat de gebruiker drie getal A, B en C in laat voeren. De gebruiker zorgt ervoor dat er positieve gehele getallen worden ingevoerd.
MatrixKozijn Productentabel versie Service Pack 3
MatrixKozijn versie 2.0 - Service Pack 3 Compatibiliteit De MatrixKozijn 2.0-SP3 met database revisie: 2.0.6 is compatibel met: MatrixKozijn Hout 3.4-SP7 MatrixKozijn Hout 3.5 (is enkel nog beschikbaar
ES1 Project 1: Microcontrollers
ES1 Project 1: Microcontrollers Les 5: Timers/counters & Interrupts Timers/counters Hardware timers/counters worden in microcontrollers gebruikt om onafhankelijk van de CPU te tellen. Hierdoor kunnen andere
Bioinformatica en Systeembiologie (BIS)
Waarom een major Bioinformatica en Systeembiologie? Huidige methoden van onderzoek, zoals de DNAchiptechnologie, leveren enorme hoeveelheden gegevens op die met bestaande statistische methoden niet meer
Starten van de tool De tool wordt opgestart door een web browser te openen (bij voorkeur Google Chrome) en in de adresbalk te typen:
Gist demo Toelichting op de interface en werking van de tool. v0.1, 20 januari 2016, Erik Boertjes v0.2, 1 februari 2016, Rianne Kaptein v0.3, 9 mei 2016, Rianne Kaptein Doel Met behulp van de tool beschreven
1. Gegeven zijn de itemsores van 8 personen op een test van 3 items
1. Gegeven zijn de itemsores van 8 personen op een test van 3 items item Persoon 1 2 3 1 1 0 0 2 1 1 0 3 1 0 0 4 0 1 1 5 1 0 1 6 1 1 1 7 0 0 0 8 1 1 0 Er geldt: (a) de p-waarden van item 1 en item 2 zijn
De statespace van Small World Networks
De statespace van Small World Networks Emiel Suilen, Daan van den Berg, Frank van Harmelen [email protected], [email protected], [email protected] VRIJE UNIVERSITEIT AMSTERDAM 2 juli
Implementatie LIMS binnen afdeling Genetica van het Radboudumc. Ermanno Bosgoed [email protected] 27 03 2014
Implementatie LIMS binnen afdeling Genetica van het Radboudumc Ermanno Bosgoed [email protected] 27 03 2014 Inleiding Wie? Wat? Hoe? Historie LIMS Implementatie Labvantage Toekomst plannen
IJkingstoets burgerlijk ingenieur juni 2014: algemene feedback
IJkingstoets burgerlijk ingenieur 30 juni 2014 - reeks 1 - p. 1 IJkingstoets burgerlijk ingenieur juni 2014: algemene feedback In totaal namen 716 studenten deel aan de ijkingstoets burgerlijk ingenieur
Naar High Throughput DNA data analyse
Naar High Throughput DNA data analyse Laboratorium automatisering seminar Jan-Peter Nap Hanze University Groningen 8/10/10 1 van 24 gisteren CLC bio, a comprehensive platform for NGS analysis nu: Super-scale
EXAMEN INFORMATIETHEORIE I (5JJ40 / 5K020) 25 maart 2004, 9u00 12u00-1 -
EXAMEN INFORMATIETHEORIE I (5JJ40 / 5K020) 25 maart 2004, 9u00 12u00-1 - Zet de antwoorden in de daarvoor bestemde vakjes en lever alleen deze bladen in! LET OP: Dit werk bevat zowel de opgaven voor het
Project 4 - Centrale Bank. Rick van Vonderen TI1C
Project 4 - Centrale Bank Rick van Vonderen 0945444 TI1C 23 mei 2018 Inhoudsopgave 1 Inleiding 2 2 Beheren 3 2.1 Git...................................................... 3 2.2 Risicolog...................................................
SQL Aantekeningen 3. Maarten de Rijke [email protected]. 22 mei 2003
SQL Aantekeningen 3 Maarten de Rijke [email protected] 22 mei 2003 Samenvatting In deze aflevering: het selecteren van tuples, operaties op strings, en aggregatie functies. Verder kijken we naar iets
Unieke factoren in het menselijk DNA. Jeroen F. J. Laros. Begeleiders: Peter Taschner Hendrik Jan Hoogeboom Walter Kosters
Unieke factoren in het menselijk DNA Jeroen F. J. Laros Begeleiders: Peter Taschner Hendrik Jan Hoogeboom Walter Kosters 1 DNA is opgebouwd uit 4 letters: A, T, C en G Er zijn ongeveer 3 10 9 van deze
S u b n e t t e n. t h e t r u e s t o r y 1100 0000. 1010 1000. 0000 0001. 0000 0001 1111 1111. 1111 1111. 1111 1111. 0000 0000.
S u b n e t t e n t h e t r u e s t o r y 1100 0000. 1010 1000. 0000 0001. 0000 0001 1111 1111. 1111 1111. 1111 1111. 0000 0000 Part 1 Inhoud Wat is een subnet?... 2 Waarom?... 3 Het begin.... 3 Een voorbeeld...
Hetzelfde DNA in elke cel
EIWITSYNTHESE (H18) Hetzelfde DNA in elke cel 2 Structuur en functie van DNA (1) Genen bestaan uit DNA Genen worden gedragen door chromosomen Chromosomen bestaan uit DNAmoleculen samengepakt met eiwitten
Invloed van de genomische context op genexpressie van gedupliceerde genen.
Faculteit Wetenschappen Vakgroep Moleculaire Genetica Departement Plant Systems Biology VIB Invloed van de genomische context op genexpressie van gedupliceerde genen. James Cauwelier Scriptie voorgelegd
Information Retrieval.
Information Retrieval [email protected] Zoekterm... Data retrieval IR uit gestructureerde gegevens ongestructureerde documenten Bv. html, doc, txt, jpg,... artificiële vraagtaal natuurlijk
Resultaten Brugklas. Tevredenheidonderzoek 2015-2016. Inleiding
Resultaten Brugklas Tevredenheidonderzoek 2015-201 Inleiding De jaarlijkse enquête onder leerlingen brugklas is in 2015-201 weer in het najaar 2015 gehouden, de respons was 1% en de enquête is daarmee
De Grids van het Actueel Hoogtebestand Nederland
Ministerie van Verkeer en Waterstaat jklmnopq Adviesdienst Geo-informatie en ICT De Grids van het Actueel Hoogtebestand Nederland Versie 1.3 28 januari 2004 Ministerie van Verkeer en Waterstaat jklmnopq
Inleiding Programmeren 2
Inleiding Programmeren 2 Gertjan van Noord November 28, 2016 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te
Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al.
Centraal Dogma Hand-out bij de oefen- en zelftoets-module bij hoofdstuk 7 van 'The Molecular Biology of the Cell', Alberts et al., 6e druk Mei 2016 Van DNA naar mrna Hier zie je een deel van de sequentie
Bio-informatica Computers and networks. Peter De Rijk
Bio-informatica Computers and networks Peter De Rijk 2 Operating/Besturings - systemen Windows / Mac Dikwijls gebruikt voor client software - betalen per PC Commerciele software Unix Meeste bioinformatica
Molecular Pathology for Pathologists. Pr P. Pauwels
Molecular Pathology for Pathologists Pr P. Pauwels NGS moleculair pathologie rapport ontcijferen Nomenclatuur waarin gerapporteerd wordt: EGFR c.2573t>g, p.(leu858arg) Coderende sequentie Eiwit/proteïne
n-queens minimale dominantie verzamelingen Chessboard Domination on Programmable Graphics Hardware door Nathan Cournik
n-queens minimale dominantie verzamelingen Chessboard Domination on Programmable Graphics Hardware door Nathan Cournik Rick van der Zwet 4 augustus 2010 Samenvatting Dit schrijven zal
Informatiebrochure gebruik van de Flexibiliteits Index Test (FIT-60)
Informatiebrochure gebruik van de Flexibiliteits Index Test (FIT-60) Auteurs: T. Batink, G. Jansen & H.R.A. De Mey. 1. Introductie De Flexibiliteits Index Test (FIT-60) is een zelfrapportage-vragenlijst
Inleiding Programmeren 2
Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te
Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015
AI Kunstmatige Intelligentie (AI) Hoofdstuk 6 van Russell/Norvig = [RN] Constrained Satisfaction Problemen (CSP s) voorjaar 2015 College 7, 31 maart 2015 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Introductie
Uitwerking tentamen Algoritmiek 9 juli :00 13:00
Uitwerking tentamen Algoritmiek 9 juli 0 0:00 :00. (N,M)-game a. Toestanden: Een geheel getal g, waarvoor geldt g N én wie er aan de beurt is (Tristan of Isolde) b. c. Acties: Het noemen van een geheel
Heuristieken en benaderingsalgoritmen. Algoritmiek
Heuristieken en benaderingsalgoritmen Wat te doen met `moeilijke optimaliseringsproblemen? Voor veel problemen, o.a. optimaliseringsproblemen is geen algoritme bekend dat het probleem voor alle inputs
Les 7 & 8: MSW Logo Mieke Depaemelaere
Faculteit Psychologische en Pedagogische Wetenschappen ACADEMISCHE INITIËLE LERARENOPLEIDING Academiejaar 2001-2002 Vakdidactiek informatica : praktijkgerichte seminaries Lesgevers : Prof. A. Hoogewijs
Bio-informatica. Dr. Pieter De Bleser
Bio-informatica Dr. Pieter De Bleser Bioinformatics Core. Department for Molecular Biomedical Research, VIB, Ghent, Belgium Department of Biomedical Molecular Biology, Ghent University, Ghent, Belgium
DRUGS OF ABUSE. In deze ronde werd GHB door 17 van de 67 deelnemers aangetoond en door 16 gekwantificeerd.
DOA Ronde 2014.1A Casus: Fictieve casus dus graag drugstest ook als dit normaal niet uw lab policy zou zijn: Patiënt komt bij vroeg in de ochtend, bij de SEH, werd wakker en voelde zich niet goed. Dacht
Docentenhandleiding. Afsluitende module. Op zoek naar een gen in een databank
Docentenhandleiding Afsluitende module Op zoek naar een gen in een databank Ontwikkeld door het Cancer Genomics Centre in samenwerking met het Freudenthal Instituut voor Didactiek van Wiskunde en Natuurwetenschappen
ACT Algemene Intelligentie
Rapport Datum ACT Algemene Intelligentie Voor u ligt het rapport van de ACT Algemene Intelligentie. Door middel van subtests zijn uw cognitieve capaciteiten gemeten. Allereerst wordt uw totaalscore weergegeven.
Deel 1: Arduino kennismaking. Wat is een microcontroller, structuur van een programma, syntax,
Deel 1: Arduino kennismaking Wat is een microcontroller, structuur van een programma, syntax, Wat is een microcontroller Wat is een microcontroller? Microcontroller = kleine dedicated computer. - Beperkt
Brochure ExomeScan. Whole Exome Sequencing. Achtergrond
Brochure Whole Exome Sequencing De laatste jaren is er een schat aan informatie gepubliceerd over de genetische achtergrond van overerfbare en somatische aandoeningen. In grootschalige Next Generation
Workshop XIMPEL TV Winoe Bhikharie Vrije Universiteit Amsterdam www.ximpel.net / [email protected]
Workshop XIMPEL TV Winoe Bhikharie Vrije Universiteit Amsterdam www.ximpel.net / [email protected] In deze workshop maak je kennis met XIMPEL TV en interactieve video. Bij interactieve video kun je de video
AANVALLEN OP WES3 + LEN SPEK & HIDDE WIERINGA
AANVALLEN OP WES3 + LEN SPEK & HIDDE WIERINGA Inleiding De uitdagende opdracht van het vak Algebra & Security luidde als volgt: Vind de sleutel die is gebruikt bij het encrypten van de gegeven plain-cyphertext
Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling
Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop
2 e SMT Workshop Moleculaire Typeringen spa typering en MLST
2 e SMT Workshop Moleculaire Typeringen spa typering en MLST 28 30 Januari, 2013 UMC Utrecht en RIVM Leo M Schouls Laboratorium voor Infectieziekten en Screening (LIS) Centrum voor Infectieziektebestrijding
OPEN VRAGEN. Genetica en Evolutie (5502GEEV9Y) Biologie en Biomedische Wetenschappen. Deeltoets 2
Genetica en Evolutie (5502GEEV9Y) Biologie en Biomedische Wetenschappen Deeltoets 2 OPEN VRAGEN Datum: donderdag 18 december 2014 Tijdstip: 13:00 uur tot 16:00 uur Naam Studentnummer 1 OPEN VRAGEN 35a
SQL SERVER 2008. Werking van Database Snapshots
KATHOLIEKE HOGESCHOOL KEMPEN GEEL SQL SERVER 2008 Werking van Database Snapshots ELINE STEYVERS BRAM DE SMEDT JOEY LEMMENS WOORD VOORAF Werking van Database Shapshots is bedoeld om mensen wegwijs te maken
