Bio-informatica Sequentie Patronen. Peter De Rijk
|
|
|
- Sonja Mertens
- 10 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Bio-informatica Sequentie Patronen Peter De Rijk 7
2 Patroon Herkenning
3 Patroon Herkenning
4 Patroon Herkenning Afhankelijk van groepsspecificaties!
5 Doel Patroon Herkenning Met een gegeven set sequenties Behoort een sequentie tot de set of niet Behoort een deel (en welk) van een sequentie tot de set Motieven of patronen definiëren samenvatting wetmatigheden in een bepaald type van (sub)sequentie Bij multiple alignatie: geconserveerde gebieden Vaak belangrijke rol: structureel of functioneel (domeinen) Methoden om patronen te vast te leggen en te herkennen: Van zeer simpel (string) tot zeer complex (HMM)
6 Patroon Herkenning Toepassing: Domeinen in sequentie herkennen Toewijzing sequentie aan gekend type, familie Onbekende sequentie vergelijken met database van motieven -> idee over functie, familie Verdere verwantschappen (cfr. PSI-BLAST: zie later) Herkenning van signalen (bv. Splice donor) in sequentie Correcter en sensitiever? Sequentie voldoet aan basis wetmatigheden van alle sequenties in een set/groep
7 String searching Exact matching Patroon voorstellen door (training) set zelf Zoeken of de query sequentie (of een deel van de query) identiek in de set zit Zoeken is gemakkelijk Vele optmalisaties (bv. Knuth-Morris-Pratt, Boyer-Moore) goed als set volledig is Vaak zoeken naar multiple strings Zoeken welke van een set strings voorkomt bv. Restrictie enzyme analyse, translatie (welk codon),... Vele optimalisaties: trees, hashtable
8 Inexact matching String searching Patroon voorstellen door (training) set zelf Meestal set onvolledig vat niet echt wetmatigheden in hele set samen Similariteit zoeken met alignatie technieken Similariteit met 1 of meer sequenties van de set behoort ws. tot set
9 Consensus sequenties Ambiguiteitscodes (IUPAC notatie) code beschrijft welke AZ/NZ mogelijk zijn (op een positie) Voor NZ ambiguiteitscodes beschikbaar voor alle mogelijke combinaties bv. S (G of C), W (A of T),... Voor AZ weinig ambiguiteitscodes beschikbaar (vrijwel alle letters zijn al bezet, zeer veel combinaties) X voor eender welk AZ
10 Consensus sequenties Consensus sequentie = string met ambiguiteitscodes op plaatsen met meer dan 1 mogelijk AZ/NZ Vaak meer dan 1 consensus sequentie nodig om patroon goed te beschrijven Voorbeeld: tyrosine phosphorylation site RXXDXXXY RXXEXXXY KXXDXXXY KXXEXXXY Eigenschappen Beperkte flexibiliteit, enkel simpele patronen Kan gebruikt worden met snelle zoek algoritmes Bij zoeken kan gebruik gemaakt worden van score matrices
11 Regular expressions Reguliere expressies (RE) Expressie (string met controle karakters met specifieke betekenis) die kan vertaald worden in een eindige set van strings Flexibelere mogelijkheden om ambiguiteiten aan te duiden (met meerdere controle karakters) bv. [RKY] om R, K of Y aan te duiden ook verschillen in aantallen mogelijk Speciale karakters en hun betekenis kunnen verschillen bij verschillende programmas
12 Regular expressions. Eender welk karakter * Nul of meer + 1 of meer [] Een van [^] Niet een van {x,y} Aantal tussen x en y T..A TTTA, TAAA, TGCA, TGGA,... TG*A TA, TGA, TGGA, TGGGGA,... TG+A TGA, TGGA, TGGGGA,... T[GC]A TGA, TCA T[^GC]A TAA, TTA TG{2,4}A TGGA, TGGGA, TGGGGA Voorbeelden tyrosine phosphorylation site [RK]X{2}[DE]X{3}Y Zinc Finger (C2H2 type) C.{2,4}C.{12}H.{3,5}H N-Glycosylation Site N[^P][ST][^P] Homeobox Domain Signature [LIVMF].{5}[LIVM].{4}[IV][RKQ].W.{8}[RK]
13 Regular expressions Eigenschappen Flexibeler dan consensus, sneller Strikte matching binair resultaat: match of geen match sterk gelijkende sequenties met 1 klein verschil (niet voorzien in de reguliere expressie worden gemist Keuze van motief soms moeilijk: gekozen motief kan later toch variabeler blijken Sterk geconserveerde motieven (10-20 AZ) met typisch een belangrijke rol
14 Regular expressions Automatisch vinden van (nieuwe) regular expression patronen EmotifMaker Vindt patronen (~ regular expression) in gealigneerde sequenties Vindt ook patronen voor subsets van het alignement (subfamilies) Pratt Vindt regular expression in ongealigneerde sequenties
15 Sequentie logo's Sequentie logo's Grafische voorstelling Verdeling afhankelijk van voorkomen verschillende elementen Totale hoogte grafiek geeft een aanduiding van de conservatie
16 Sequentie logo's Sequentie logo Grafische representatie patroon, gestapelde karakters Hoogte proportioneel tot frequentie karakter Meest frequente karakter bovenaan Totale hoogte positie hangt af van de informativiteit/conservatie Voordelen Meer correct dan consensus sequentie Significante residuen zijn duidelijk Subtiele sequentie patronen worden minder gemakkelijk gemist Aangename voorstelling voor onderzoekers Maar Niet voor automatische herkenning
17 Profielen Profiel Statistische representatie van het volledige alignement van een similariteitsgroep Mogelijke informatie Welke karakters kunnen voorkomen op elke positie, en in welke verhoudingen Welke posities zijn belangrijk/geconserveerd Welke regios kunnen wegvallen, inserties krijgen Verschillende methoden mogelijk om deze informatie bij te houden en te gebruiken (benamingen kunnen verschillen afhankelijk van auteurs) Weight matrices: profielen die geen indels toelaten, PSSM: position specific scoring matrices, wel indels door scoring via alignment
18 Position Weight Matrices (PWM)
19 Position Weight Matrices (PWM) PWM = matrix met Lijn voor elk mogelijk karakter Kolom voor elke positie Waarden die aangeven hoe ws. Het is dat dit karakter voorkomt op deze positie, bv. log-likelihood Log-odds Logaritme van de ratio van hoe dikwijls we dit karakter zien op deze positie in de set t.o.v. Hoeveel we het verwachten (frequentie van voorkomen) Eigenschappen Rechtstreeks gemaakt op basis alignement elke positie onafhankelijk van andere posities geen indels
20 Position Weight Matrices (PWM) PWM score geeft aan hoe ws. het is dat een test string tot de groep behoort. som van positie-specifieke scores voor elk symbool in de test string (wanneer PWM log waarden bevat) bv. bij PWM met log-odds ->PWM score = log-odds dat de test string gegenereerd werd door het motief versus gegenereerd door de background MEME (Multiple EM for Motif Elicitation) Vindt automatisch weight matrices voor set van sequentie statistische modelering om de beste grootte, aantal, en beschijving van elk motief te kiezen
21 Fingerprints Fingerprint = Groep van motieven voor karakterisatie van familie Locale Alignementen zonder gaps van alle geconserveerde delen Matrices Unweighted Matrices met frequenties geobserveerd op de verschillende posities Vaak onvoldoende variatie in basis alignemten slechte herkenning verdere verwanten Iteratief werken: hoe meer sequenties, hoe meer mogelijke variaties goed herkend kunnen worden Weighted Weging matrix met b.v. PAM matrix Betere herkenning verdere verwanten Veel lagere specificiteit en dus veel meer ruis
22 PSSM (Gribskov) PSSM = Positie Specifieke Score matrix Matrix met per positie de score voor de vervanging/alignment met elk mogelijk AZ Gemaakt op basis proteïne alignement voor elke positie analyse distributie van verschillende AZ replacement scores berekenen voor de vervanging door alle AZ, gebaseerd op een PAM matrix M(p,a) = Σ W(p,b) Y(a,b) W(p,b) is gewicht voorkomen van AZ b op positie p Y(a,b) is PAM matrix Variabele gap opening en extension penalties (op basis van gaps gezien in het alignement)
23 Consensus sequentie PSSM DEAD box (Gribskov) Cons A B C D E F G H I K L M N P Q R S T V W Y Z Gap Len.. G T D T K G L B L D K V K F L V L D E A D R rhle_ecoli NA...VKLDQVEILVLDEADR dbp2_schpo NK...TNLRRVTYLVLDEADR dbp2_yeast GK...TNLKRVTYLVLDEADR dbpa_ecoli GT...VSLDALNTLVMDEADR rm62_drome GS...TNLKRCTYLVLDEADR p68_human GK...TNLRRTTYLVLDEADR rhlb_ecoli NH...INLGAIQVVVLDEADR yn21_caeel TK...GFNLKALKFLIMDEADR yhm5_yeast TK...GFSLRKLKFLVMDEADR me31_drome KV...ADMSHCRILVLDEADK drs1_yeast SA...SFNVDSVEILVMDEADR if4a_rabit RY...LSPKYIKMFVLDEADE if41_human RY...LSPKYIKMFVLDEADE vasa_drome TF...ITFEDTRFVVLDEADR srmb_ecoli EN...FDCRAVETLILDEADR dead_ecoli GT...LDLSKLSGLVLDEADE if4a_orysa QS...LRPDYIKMFVLDEADE dead_klepn GT...LDLSKLSGLVLDEADE pl10_mouse GK...IGLDFCKYLVLDEADR p54_human GV...AKVDHVQMIVLDEADK if4a_drome KL...RTQYIKLFVLDEADE ded1_yeast GK...ISLANVKYLVLDEADR ms16_yeast YS...NKFFRFVDYKVLDEADR pr28_yeast HL...LVMKQVETLVLDEADK if4n_human RS...LRTRAIKMLVLDEADE an3_xenla GK...IGLDFCKYLVLDEADR dbp1_yeast GK...VSLANIKYLVLDEADR if4a_yeast RR...FRTDKIKMFILDEADE spb4_yeast PA...VKTSACSMVVMDEADR if4a_caeel NA...LDTSRIKMFVLDEADE pr05_yeast ND.GKLLSTKRITFVVMDEADR if42_mouse RY...LSPKWIKMFVLDEADE dhh1_yeast KV...ADLSDCSLFIMDEADK db73_drome TK...GFCLKSLKFLVIDEADR yk04_yeast TKVIKEQLSQSLRYIVLDEGDK ybz2_yeast DN.TLIKRFSKVNTLILDEADR yhw9_yeast SGDDTVGGLMRAKYLVLDEADI glh1_caeel GT...IKLDKCRFFVLDEADR
24 PSSM (Gribskov) Testen sequentie Alignatie (dynamic programming) van test sequentie met de PSSM Score van alignatie van een positie in de PSSM met een positie in de test sequentie uit matrix gehaald Positief of negatief effect van vervangingen in geconserveerd gebied (rood) is veel groter Weging van gaps is ook afhankelijk van de positie bv. in het magenta gebied met gaps in het alignment is de gap penalty (Gap) en indel penalty (Len) lager Verbeteringen Houdt wel rekening met indels Geeft rechtstreeks een score rekening houdend met wat de kans is dat je dat bepaald karakter kan tegenkomen.
25 PSSM (Gribskov) PSSM conclusies Sensitiever door gebruik score matrix gelijkende AZ kunnen ook goed matchen Mogelijk wel lagere specificiteit Houd rekening met Indels Informatie indels in de set worden gebruikt in patroon Laat ook andere indels toe (test via alignment) Mogelijke verbeteringen verschillende weging sequenties om overrepresentatie eigenschappen van vele sterk verwante sequenties vermijden Gap penalties gebaseerd op gemiddelde gap lengte Profile alignementen t.o.v. 6-frame translaties van DNA sequenties
26 PSI-BLAST Position Specific Iterative BLAST Doel Vinden van sequentie families inclusief verre verwanten weinig overeenkomst) Patroon (PSSM) van deze familie Methode Gewone BLAST search PSSM (Position-Specific Score Matrix) profiel op basis van alle significante alignementen Evt. eerst selectie correcte hits Doorzoek databank met PSSM (ipv sequentie) Voeg sequenties toe van dezelfde familie die mogelijk nog niet gevonden werden Iteratief maak nieuw profiel met nieuwe sequenties en herhaal
27 Nog andere BLASTS PHI-BLAST Patern Hit Initiated BLAST Sequenties die matchen aan een gegeven query sequentie EN een gegeven patroon PSSM gebaseerd op (omgeving van) patroon Vaak begin van PSI-BLAST RPS-BLAST Reverse Position Specific BLAST Query t.o.v databank van voorgecompileerde PSSM's bv. CDD: Conserved Domain Database
28 Hidden Markov Modellen (HMM) HMM (Hidden Markov Model) Veel gebruikte techniek voor patroonherkenning Kan complexe patronen herkennen Machine learning techniek leert zelf patronen herkennen op basis van trainings/voorbeeld data
29 Hidden Markov Modellen (HMM) Markov Model Aantal toestanden waarin een waarneming wordt gedaan Verbindingen tussen toestanden met een gewicht dat de waarschijnlijkheid van doorgang bepaald Pad: opeenvolging van toestanden in het model Rainy 0.6 Start Sunny Simpel voorbeeld dat het weer per dag modeleert Cirkels = toestanden het weer op een bepaalde dag: Rainy of Sunny Pijlen = verbindingen/overgangen bv. Wanneer het vandaag regenachtig is, is er 30% kans dat het morgen zonnig is
30 Hidden Markov Modellen (HMM) Hidden Markov Model toestand kan niet direct waargenomen worden: serie waarnemings waarschijnlijkheden Evt. Begin en eindtoestand zonder waarneming (non-emitting) Walk Rainy Start Sunny Clean We kunnen de toestand (weer) niet direct waarnemen We krijgen wel de activiteiten van een persoon te weten (waarnemingen) Waarschijnlijkheid activiteiten is afhankelijk van het weer bv. als het regenachtig is, is er slechts 10% kans dat er gewandeld werd Shop
31 Hidden Markov Modellen (HMM) Evaluatie wat is de kans dat een serie waarnemingen gegenereerd wordt door een gegeven model (Forward algoritme) Padvinden Wat is het meest waarschijnlijke pad door het model gegeven een serie waarnemingen (Viterbi algoritme) toewijzen van toestand aan elke waarneming Walk Rainy Start Shop Sunny Clean
32 Hidden Markov Modellen (HMM) Training van een HMM Gegeven Model waarbij parameters (gewichten, ) niet zijn ingevuld een aantal waarnemingen = trainings data Automatische instelling parameters (gewichten,...) van het model om zo goed mogelijk de observaties te produceren (Forward-Backward algoritme)
33 Profile of lineair HMM Statistisch model vergelijkbaar met profiel Aan elke verbinding is een waarschijnlijkheid verbonden Staten Match: match een karakter aan een kolom in een multiple alignement (meerdere emissies mogelijk) Insert: emit karakters niet gemodelleerd door het HMM Delete: sla een kolom over Alignement Elk karakter in de sequentie wordt geassocieerd met een match of insert staat Pad van hoogste probabiliteit door HMM
34 Profile of lineair HMM Probabiliteit pad Alignement uit het profiel halen vermenigvuldiging probabiliteiten van alle overgangen op het pad en de probabiliteiten dat het specifiek AZ wordt gevonden in elke staat in het pad Klein! optelling via log odds Programma's: HMMer, SAM
35 Profile of lineair HMM Voordelen (t.o.v. Profielen) Betere afhandeling deleties en inserties Kan automatisch getraind worden op ongealigneerde sequenties Probleem: Overfitting Statistisch insignificante AZ distributies per positie door klein aantal sequenties: bv. 2 seq. met H op positie 2 kans 0 dat er een ander AZ op die positie kan komen Oplossing: Pseudocounts Aangepaste scores die geen waarschijnlijkheid van '0' toelaten Belang trainingset!
36 Neurale netwerken Model gebaseerd op werking neuronen Gebaseerd op verschillende lagen neuronen/perceptrons Elke neuron/perceptron combineert informatie uit de onderliggende laag Perceptronen werken samen om patronen te herkennen
37 Perceptron Perceptron mathematische contructie die een set regels omvat 1 invoer sequentie gegevens met discreet aantal posities Gewichts functie: elke verschillende invoer heeft een bepaald gewicht Uitvoer Getal > 1 sequentie behoort tot de set / bevat de feature Getal < -1 sequentie behoort niet tot de set
38 Perceptron Training Met een Dataset (trainings set) die bestaat uit: aantal positieve sequenties (behoren tot de set) aantal negatieve sequenties (lijken sterk op de set maar behoren niet tot de set) Iteratief proces Afwisselend positieve en negatieve sequentie aanbieden Score berekenen Als pos. score < 0 of neg. score > 0 gewichten aanpassen Herhalen tot gewichten gelijk blijven bij 1 iteratie over de hele lijst
39 Neurale netwerken Neuraal netwerk Verschillende lagen samenwerkende neuronen/perceptrons Parameters: invoer gewichten, treshhold, uitvoer gewicht Training: feed-forward, back-propagation Voordelen Zeer complexe patronen mogelijk Enkel trainingsdata nodig: geen vooraf opgesteld model Nadelen Model kan niet gemakkelijk worden afgeleid (Veel) positieve en negatieve trainingsdata nodig Wat wordt er getraind?
40 Patroon databanken Databanken van patronen/motieven Patronen/motieven met gegevens (functie, structuur) afgeleid van alignmenten van sequenties in primaire databanken t.o.v. Sequentie databanken minder redundatie 1 patroon ipv. veel gelijkende sequenties in db bv. in primaire db. Kunnen de vele hits voor 1 domein de enkele, minder duidelijke hits voor een ander domein verdoezelen Kortere weg naar mogelijke structuur en functie Geen problemen met plaats van hit, domeinen annotatie Vaak gevoeliger voor verdere verwantschappen Echter niet compleet
41 Patroon databanken: PROSITE regular expressions Een van de eerste patroon databanken Gebruikt regular expressions om patronen weer te geven Motieven specifiek voor een proteine familie nadruk op de meest geconserveerde en functioneel belangrijke residues Vaak functioneel belangrijke motieven Korte, zeer strikte patronen Geen volledige domeinen Minder geschikt voor minder sterk verwante sequenties Vaak niet genoeg informatie om statistisch significante 'matches' in grote proteïne databanken op te leveren
42 Patroon databanken: PROSITE Formaat Patroon en hits file Formaat ~ SWISS-PROT ID id, AC (accessie nummer) PA (patroon) NR diagnostic power: aantal correct herkende leden familie in SWISS-PROT, aantal vals positieven en vals negatieven CC commentaar: evt. repeats, functionele sites,... DR accessie nummers Documentatie file Details over de gekarakteriseerde familie Beschrijving biologische rol motief/motieven, bibliografie Vrije text
43 Patroon databanken: PROSITE Definitie patroon IUPAC 1 letter codes voor AZ X eender welk AZ [] keuze uit verschillende AZ {} keuze uit alle AZ behalve degene tussen de accolades - scheiding elementen (x) x maal het voorgaand (x,y) tussen x en y maal het voorgaande < N-terminus > C-terminus Any : eender welk karakter Voorbeelden [AC]-x-V-x(4)-{ED} vertaald als: [Ala or Cys]-any-Val-any-any-any-any-{alles behalve Glu or Asp} <A-x-[ST](2)-x(0,1)-V In de N-terminal van de sequentie (`<'): Ala-any-[Ser or Thr]-[Ser or Thr]-(any or none)-val
44 id PROSITE documentatie regular expression
45 Patroon databanken: via alignementen PRINTS Fingerprints: meeste/alle motieven in sequenties van de families als diagnostische signatuur Lokale alignementen zonder gaps Uitgebreide annotatie Prodom Alignementen met gaps uit SWISS-PROT Blocks Lokale alignementen zonder gaps
46 Patroon databanken: profielen PROSITE profile library Profielen Worden gebruikt om patronen beter voor te stellen Ook informatie variabelere stukken, indels Zoeken naar complete domeinen Detectie van veel verdere verwanten Zelfde annotatie standaard als PROSITE Formaat Gelijkaardig aan PROSITE MA matrix lijnen i.p.v. patroon lijn (PA) Bevatten alle parameters zoals alfabet,cut-off scores en positie specifieke scores voor match posities (/M) en indels posities (/I)
47 Prosite profile entry ID AC DT DE MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA... KRINGLE_2; MATRIX. PS50070; NOV-1997 (CREATED); NOV-1997 (DATA UPDATE); JUN-2013 (INFO UPDATE). Kringle domain profile. /GENERAL_SPEC: ALPHABET='ABCDEFGHIKLMNPQRSTVWYZ'; LENGTH=79; /DISJOINT: DEFINITION=PROTECT; N1=6; N2=74; /NORMALIZATION: MODE=1; FUNCTION=LINEAR; R1=.7529; R2= ; TEXT='-LogE'; /CUT_OFF: LEVEL=0; SCORE=813; N_SCORE=8.5; MODE=1; TEXT='!'; /CUT_OFF: LEVEL=-1; SCORE=603; N_SCORE=6.5; MODE=1; TEXT='?'; /DEFAULT: D=-20; I=-20; B1=-50; E1=-50; MI=-105; MD=-105; IM=-105; DM=-105; /I: B1=0; BI=-105; BD=-105; /M: SY='D'; M=-15,29,-30,44,37,-36,-15,1,-34,5,-25,-24,10,-6,13,-4,0,-10,-30,-34,-19,25; /M: SY='C'; M=-10,-20,120,-30,-30,-20,-30,-30,-30,-30,-20,-20,-20,-40,-30,-30,-10,-10,-10,-50,-30,-30; /M: SY='Y'; M=-11,-21,-25,-25,-20,16,-27,-1,10,-12,9,15,-20,-25,-12,-12,-18,-9,3,1,31,-18; /M: SY='H'; M=-13,-8,-26,-9,0,-9,-23,16,-13,-2,-9,-1,-5,-15,2,2,-8,-6,-13,-19,4,-1; /M: SY='G'; M=-4,-5,-11,-4,-14,-29,45,-17,-38,-18,-28,-21,0,-21,-17,-19,-1,-17,-27,-26,-28,-16; /M: SY='N'; M=-9,19,-22,11,2,-22,-10,1,-19,4,-22,-14,26,-17,5,5,5,0,-21,-32,-14,3; /M: SY='G'; M=0,-10,-30,-10,-20,-30,70,-20,-40,-20,-30,-20,0,-20,-20,-20,0,-20,-30,-20,-30,-20; /M: SY='E'; M=-10,-1,-27,1,17,-26,-19,0,-19,11,-16,-7,-2,-11,16,8,-4,-8,-17,-25,-11,16; /M: SY='S'; M=-1,8,-18,3,-2,-19,5,-6,-22,-7,-25,-17,16,-15,-2,-7,17,6,-18,-33,-18,-2; /M: SY='Y'; M=-20,-20,-30,-20,-20,30,-30,20,0,-10,0,0,-20,-30,-10,-10,-20,-10,-10,30,80,-20; /M: SY='R'; M=-18,-7,-30,-7,3,-21,-19,1,-27,25,-18,-7,0,-18,12,54,-9,-10,-20,-21,-10,4; /M: SY='G'; M=0,-10,-30,-10,-20,-30,70,-20,-40,-20,-30,-20,0,-20,-20,-20,0,-20,-30,-20,-30,-20; /M: SY='T'; M=-4,2,-18,-4,-3,-17,-18,-12,-16,5,-16,-10,5,-10,-3,1,8,21,-9,-28,-11,-4; /M: SY='V'; M=-1,-19,-19,-22,-17,-2,-21,-13,5,-12,2,5,-16,-21,-13,-12,-7,-1,9,-13,0,-16; /M: SY='S'; M=14,6,-13,2,-1,-20,-1,-9,-19,-8,-25,-18,12,-12,-3,-10,25,10,-12,-35,-19,-2; /M: SY='T'; M=-5,-8,-17,-14,-10,-10,-23,-15,-4,-2,-7,-4,-7,-15,-9,-3,3,20,5,-27,-8,-10; /M: SY='T'; M=0,2,-12,-6,-9,-12,-19,-19,-10,-10,-11,-10,1,-10,-9,-11,17,41,-1,-30,-11,-9; /M: SY='V'; M=-4,-12,-20,-14,-5,-12,-22,-13,-2,-2,-5,0,-11,-17,-7,-2,-4,3,5,-20,-9,-7; /M: SY='S'; M=5,0,-13,-5,-5,-17,-6,-11,-15,-7,-19,-12,6,-12,-4,-9,22,21,-8,-33,-15,-5; /M: SY='G'; M=0,-10,-30,-10,-19,-30,68,-20,-40,-19,-30,-20,0,-20,-19,-19,0,-20,-30,-20,-30,-19;
48 Prosite profile entry MA /M: SY='R'; M=-7,-2,-25,-2,5,-22,-17,-3,-18,8,-17,-8,-1,-12,13,14,0,-3,-15,-23,-9,7; MA /M: SY='C'; M=-10,-20,120,-30,-30,-20,-30,-30,-30,-30,-20,-20,-20,-40,-30,-30,-10,-10,-10,-50,-30,-30; MA /I: E1=0; IE=-105; DE=-105; NR /RELEASE=2013_08,540732; NR /TOTAL=219(94); /POSITIVE=219(94); /UNKNOWN=0(0); /FALSE_POS=0(0); NR /FALSE_NEG=0; /PARTIAL=1; CC /MATRIX_TYPE=protein_domain; CC /SCALING_DB=reversed; CC /AUTHOR=K_Hofmann; CC /TAXO-RANGE=??E??; /MAX-REPEAT=38; CC /FT_KEY=DOMAIN; /FT_DESC=Kringle; CC /VERSION=1; DR P08519, APOA_HUMAN, T; P14417, APOA_MACMU, T; P98140, FA12_BOVIN, T; DR Q04962, FA12_CAVPO, T; P00748, FA12_HUMAN, T; Q80YC5, FA12_MOUSE, T; DR O97507, FA12_PIG, T; D3ZTE0, FA12_RAT, T; Q5E9Z2, HABP2_BOVIN, T; DR Q14520, HABP2_HUMAN, T; Q8K0D2, HABP2_MOUSE, T; Q6L711, HABP2_RAT, T; DR Q6QNF4, HGFA_CANFA, T; Q04756, HGFA_HUMAN, T; Q9R098, HGFA_MOUSE, T; DR Q24K22, HGFL_BOVIN, T; P26927, HGFL_HUMAN, T; P26928, HGFL_MOUSE, T; DR Q76BS1, HGF_BOVIN, T; Q867B7, HGF_CANFA, T; Q9BH09, HGF_FELCA, T; DR P14210, HGF_HUMAN, T; Q08048, HGF_MOUSE, T; P17945, HGF_RAT, T; DR Q96MU8, KREM1_HUMAN, T; Q99N43, KREM1_MOUSE, T; Q924S4, KREM1_RAT, T; DR Q90Y90, KREM1_XENLA, T; Q8NCW0, KREM2_HUMAN, T; Q8K1S7, KREM2_MOUSE, T; DR Q16609, LPAL2_HUMAN, T; Q2TV78, MST1L_HUMAN, T; Q8AXY6, MUSK_CHICK, T; DR Q5G270, NETR_GORGO, T; P56730, NETR_HUMAN, T; Q5G267, NETR_MACMU, T; DR O08762, NETR_MOUSE, T; Q5G268, NETR_NOMLE, T; Q5G271, NETR_PANTR, T; DR Q5G269, NETR_PONPY, T; G3V801, NETR_RAT, T; Q5G265, NETR_SAGLB, T; DR Q5G266, NETR_TRAPH, T; Q1RMT9, P3IP1_BOVIN, T; Q7SXB3, P3IP1_DANRE, T; DR Q96FE7, P3IP1_HUMAN, T; Q7TMJ8, P3IP1_MOUSE, T; Q5RCS3, P3IP1_PONAB, T; DR Q56A20, P3IP1_RAT, T; P06868, PLMN_BOVIN, T; P80009, PLMN_CANFA, T; DR Q7M323, PLMN_CAPHI, T; Q29485, PLMN_ERIEU, T; P80010, PLMN_HORSE, T;...
49 Patroon databanken: HMMs PFAM Herkenning via HMMs, maar ook lokale alignementen met gaps PFAM-A gecurateerd PFAM-B Kleine families gebaseerd op de Prodom database (lokale alignementen met gaps uit Swiss-Prot) die niet overlappen met PFAM-A Niet gecurateerd/nagekeken SMART Uitgebreid geannoteerd TIGRFAMs PIR SuperFamily Superfamily
50 Interpro Samengestelde patroon databank Samenwerking curatoren verschillende databanken Unificatie in documentatie en identificatie Zoektocht met verschilende methoden Resultaten worden samengesteld na toepassing alle methodes Databanken in Interpro PROSITE (regular expressions + profielen) PRINTS PFAM-A PRODOM UniProt SMART TIGRFAMs PIRSF (PIR Super Family)) Superfamily
51 Interpro
52 InterPro Korte hits: regular expression Hidden Markov model: match over groter deel van de sequentie Fingerprinting: kleine korte stukjes matchen
53 Conserved Domain Database CDD Samengestelde patroon/motief databank PSSM Doorzocht met RPS-BLAST Databanken gebaseerd op SMART PFAM Lokale contributies
54 CDD
Bio-informatica Similariteit Searches. Peter De Rijk
Bio-informatica Similariteit Searches Peter De Rijk 6 Similariteit searches Zoeken naar gelijkende sequenties in sequentie databanken Korte sequentie (b.v. EST) waar we meer van willen weten Andere korte
DAR Approximate string matching Casus: biological sequence alignment
DAR Approximate string matching Casus: biological sequence alignment 1 Text search Approx string matching dynamic programming, edit distance example application: Google search Text indexing inverted list
Bio-informatica Similariteit. Peter De Rijk
Bio-informatica Similariteit Peter De Rijk 5 Similariteit, niet zo simpel Similariteit Similariteit is afhankelijk van de gekozen parameters Grootte, Kleur Functie Afkomst... Globale similariteit (families)
Oplossingen Datamining 2II15 Juni 2008
Oplossingen Datamining II1 Juni 008 1. (Associatieregels) (a) Zijn de volgende beweringen juist of fout? Geef een korte verklaring voor alle juiste beweringen en een tegenvoorbeeld voor alle foute be-weringen:
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105
Bioinformatica tentamen D2 voor 2MNW op maandag 30/05/2005 van 13:30-16:30 in Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder uit te werken,
Inhoud. Neuronen. Synapsen. McCulloch-Pitts neuron. Sigmoids. De bouwstenen van het zenuwstelsel: neuronen en synapsen
Tom Heskes IRIS, NIII Inhoud De bouwstenen van het zenuwstelsel: neuronen en synapsen Complex gedrag uit eenvoudige elementen McCulloch-Pitts neuronen Hopfield netwerken Computational neuroscience Lerende
Parking Surveillance. foreground/background segmentation - objectherkenning. Examen Beeldverwerking Pieter Vancoillie
Parking Surveillance foreground/background segmentation - objectherkenning Examen Beeldverwerking Pieter Vancoillie Doel van het (deel)project Uit beelden van een camera voetgangers, fietsers en auto s
Neurale Netwerken en Deep Learning. Tijmen Blankevoort
Neurale Netwerken en Deep Learning Tijmen Blankevoort De toekomst - Internet of Things De toekomst - sluiertipje Je gezondheid wordt continue gemonitored Je dieet wordt voor je afgestemd -> Stroomversnelling
Classification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Tentamen Kunstmatige Intelligentie (INFOB2KI)
Tentamen Kunstmatige Intelligentie (INFOB2KI) 30 januari 2014 10:30-12:30 Vooraf Mobiele telefoons dienen uitgeschakeld te zijn. Het tentamen bestaat uit 7 opgaven; in totaal kunnen er 100 punten behaald
Afsluitende les. Leerlingenhandleiding. Proteomics voor de massa
Afsluitende les Leerlingenhandleiding Proteomics voor de massa Computeropdracht Inleiding - data van een massaspectrometer Bij dit computerpracticum gaan jullie zelf de data van de analyse van een eiwit
SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen
SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen
HOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Bio-informatica Genpredictie
Bio-informatica Genpredictie 9 Genpredictie Genpredictie opsporen van functionele gebieden en elementen die verantwoordelijk zijn voor de genstructuur, genregulatie en gentranscriptie in genomische sequenties
In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen.
Leerlijn programmeren In Vlaanderen bestaat er nog geen leerlijn programmeren! Hierdoor baseren wij ons op de leerlijn die men in Nederland toepast voor basisscholen. Deze leerlijn is opgebouwd aan de
Het omzetten van reguliere expressies naar eindige automaten, zie de vakken Fundamentele Informatica 1 en 2.
Datastructuren 2016 Programmeeropdracht 3: Patroonherkenning Deadlines. Woensdag 23 november 23:59, resp. vrijdag 9 december 23:59. Inleiding. Deze opdracht is gebaseerd op Hoofdstuk 13.1.7 in het boek
start -> id (k (f c s) (g s c)) -> k (f c s) (g s c) -> f c s -> s c
Een Minimaal Formalisme om te Programmeren We hebben gezien dat Turing machines beschouwd kunnen worden als universele computers. D.w.z. dat iedere berekening met natuurlijke getallen die met een computer
Inleiding Programmeren 2
Inleiding Programmeren 2 Gertjan van Noord November 26, 2018 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te
Combinatorische Algoritmen: Binary Decision Diagrams, Deel III
Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Sjoerd van Egmond LIACS, Leiden University, The Netherlands [email protected] 2 juni 2010 Samenvatting Deze notitie beschrijft een nederlandse
11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Zelftest Inleiding Programmeren
Zelftest Inleiding Programmeren Document: n0824test.fm 22/01/2013 ABIS Training & Consulting P.O. Box 220 B-3000 Leuven Belgium TRAINING & CONSULTING INLEIDING BIJ DE ZELFTEST INLEIDING PROGRAMMEREN Deze
Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu
Recognition and Detection of Objects Using Visual and Textual Cues S. Karaoğlu Samenvatting Met dit proefschrift richten we onze aandacht op object herkenning en detectie voor een beter begrip in afbeeldingen.
Een computerprogramma is opgebouwd uit een aantal instructies die op elkaar volgen en die normaal na elkaar uitgevoerd worden.
2 Programmeren 2.1 Computerprogramma s Een computerprogramma is opgebouwd uit een aantal instructies die op elkaar volgen en die normaal na elkaar uitgevoerd worden. (=sequentie) Niet alle instructies
3 De stelling van Kleene
18 3 De stelling van Kleene Definitie 3.1 Een formele taal heet regulier als hij wordt herkend door een deterministische eindige automaat. Talen van de vorm L(r) met r een reguliere expressie noemen we
Bio-informatica Boom constructie. Peter De Rijk
Bio-informatica Boom constructie Peter De Rijk 8 Waarom boomconstructie Evolutionaire analyse: verwantschap tussen genen en/of species Studie oorsprong en divergentietijden bv. divergentie mens-mensapen,
Inleiding Programmeren 2
Inleiding Programmeren 2 Gertjan van Noord November 28, 2016 Stof week 3 nogmaals Zelle hoofdstuk 8 en recursie Brookshear hoofdstuk 5: Algoritmes Datastructuren: tuples Een geheel andere manier om te
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch
studie waarmee we de principes van de analyse willen demonstreren. Een volledig beschrijving van de algoritmen en de resultaten zijn te vinden in
Bio-informatica kan omschreven worden als het toepassen van algoritmen om meerwaarde te verkrijgen uit data afkomstig van biomedisch en/of biologisch onderzoek. In bio-informatica wordt onderzoek gedaan
Automaten. Informatica, UvA. Yde Venema
Automaten Informatica, UvA Yde Venema i Inhoud Inleiding 1 1 Formele talen en reguliere expressies 2 1.1 Formele talen.................................... 2 1.2 Reguliere expressies................................
Exponentiële Functie: Toepassingen
Exponentiële Functie: Toepassingen 1 Overgang tussen exponentiële functies en lineaire functies Wanneer we werken met de exponentiële functie is deze niet altijd gemakkelijk te herkennen. Daarom proberen
Query SQL Boekje. Fredrik Hamer
Query SQL Boekje Query SQL Boekje Fredrik Hamer Schrijver: Fredrik Hamer Coverontwerp: Fredrik Hamer ISBN: 9789402162103 Fredrik Hamer Inhoudsopgave A. Aanhef bepalen 17 Aantal 18 Aantal dagen tussen
Les 15 : updaten van gegevens in de database (deel2).
Les 15 : updaten van gegevens in de database (deel2). In de volgende reeks lessen zal alle vorige leerstof uitgebreid aan het bod komen. Zie ook de vorige lessen en documenten om informatie op te zoeken
QR-code op aanvoerbrief 2.xx.0: Specificaties
QR-code op aanvoerbrief 2.xx.0: Specificaties Door: Bert Velthuijs Datum 1e versie: 5 april 2012 (versie 0.xx) Datum laatste wijziging 20 september 2012 Huidige Versie: 2.xx.0 Wijzigingen 19 juli 2012
Lineaire algebra 1 najaar Lineaire codes
Lineaire algebra 1 najaar 2008 Lineaire codes Bij het versturen van digitale informatie worden in principe ketens van bits verstuurd die de waarde 0 of 1 kunnen hebben. Omdat de transmissiekanalen door
1 Complexiteit. of benadering en snel
1 Complexiteit Het college van vandaag gaat over complexiteit van algoritmes. In het boek hoort hier hoofdstuk 8.1-8.5 bij. Bij complexiteitstheorie is de belangrijkste kernvraag: Hoe goed is een algoritme?
1 In deze opgave wordt vijftien maal telkens drie beweringen gedaan waarvan er één juist is. Kruis de juiste bewering aan. (2pt. per juist antwoord).
Tentamen Optimalisering (IN2805-I) Datum: 3 april 2008, 14.00 17.00. Docent: Dr. J.B.M. Melissen Naam: Studienummer: 1 In deze opgave wordt vijftien maal telkens drie beweringen gedaan waarvan er één juist
FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j
FLIPIT JAAP TOP Een netwerk bestaat uit een eindig aantal punten, waarbij voor elk tweetal ervan gegeven is of er wel of niet een verbinding is tussen deze twee. De punten waarmee een gegeven punt van
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW, 3I, 3PHAR op vrijdag 30 maart 2007 van 8.45-10.45 uur in zaal Q105 NB: geef je antwoorden op dit formulier. Er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken
Tentamen Data Mining
Tentamen Data Mining Algemene Opmerkingen Dit is geen open boek tentamen, noch mogen er aantekeningen gebruikt worden. Laat bij het uitvoeren van berekeningen zien hoe je aan een antwoord gekomen bent.
Opdracht 2 Het Multilayer Perceptron
Opdracht 2 Het Multilayer Perceptron Doel: - Inzicht verkrijgen in een neuraal netwerk (het multilayer perceptron). - Begrijpen van het backpropagation algoritme. - Een toepassing van een neuraal netwerk
Vakgroep CW KAHO Sint-Lieven
Vakgroep CW KAHO Sint-Lieven Objecten Programmeren voor de Sport: Een inleiding tot JAVA objecten Wetenschapsweek 20 November 2012 Tony Wauters en Tim Vermeulen [email protected] en [email protected]
1. Mendeliaanse overerving - koppelingsanalyse
1. Mendeliaanse overerving - koppelingsanalyse 1.1 Inleiding Genetische kenmerken die afhangen van één enkel gen (meer precies : locus) noemen wij mendeliaans. Mendeliaanse kenmerken segregeren in families
Data Mining: Classificatie
Data Mining: Classificatie docent: dr. Toon Calders Gebaseerd op slides van Tan, Steinbach, and Kumar. Introduction to Data Mining Overzicht Wat is classificatie? Leren van een beslissingsboom. Problemen
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1.4 Oefenen Opgave 9 Bekijk de genoemde dataset
Stageopdrachten Zilveren Kruis
Stageopdrachten Zilveren Kruis Opdracht 1: Subgroup Discovery -> regionale analyse 2 Opdracht 2: Profiling: wie zijn de fraudeurs? 4 Opdracht 3: Modelleren van Risico s in een Bayesian Network 5 Opdracht
A. Week 1: Introductie in de statistiek.
A. Week 1: Introductie in de statistiek. Populatie en steekproef. In dit vak leren we de basis van de statistiek. In de statistiek probeert men erachter te komen hoe we de populatie het beste kunnen observeren.
Beknopte handleiding voor Derive 5.0 for Windows
- Lesbrief Beknopte handleiding voor Derive 5.0 for Voorspelbaarheid en Populaties in de tijd Doelgroep Klas 5 t/m 6 havo en vwo Vakken en domeinen Algemene natuurwetenschappen VWO Wiskunde VWO: A domein
RSLigR 3.00. Programma voor t berekenen van betonplaten, betonbalken en de systeemvloeren volgen Eurocode 2 en VBC 92: - Traditioneel/Voorgespannen:
RSLigR 3.00 Programma voor t berekenen van betonplaten, betonbalken en de systeemvloeren volgen Eurocode 2 en VBC 92: - Traditioneel/Voorgespannen: - Breedplaat vloer - Kanaalplaat vloer - Ribben vloer
Skills matrix - Methodiek voor technische training en kennismanagement
Dit artikel beschrijft een methodiek om opleidingscurricula te maken voor technische bedrijfsopleidingen waarbij technische vaardigheden getraind moeten worden. De methode is met name bruikbaar om flexibele
2 Data en datasets verwerken
Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.3 Representaties In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1 Data presenteren 1.1 Introductie In
Stelsels Vergelijkingen
Hoofdstuk 5 Stelsels Vergelijkingen Eén van de motiverende toepassingen van de lineaire algebra is het bepalen van oplossingen van stelsels lineaire vergelijkingen. De belangrijkste techniek bestaat uit
Graphical modelling voor Mediastudies Data
Graphical modelling voor Mediastudies Data De analyse Alle analyses zijn gedaan met MIM, een analyseprogramma ontworpen voor graphical modelling (Versie 3.2.07, Edwards,1990,1995). Modellen zijn verkregen
Uitleg: In de bovenstaande oefening zie je in het eerste blokje een LEES en een SCHRIJF opdracht. Dit is nog lesstof uit het tweede trimester.
In onderstaande oefeningen zijn kleuren gebruikt. Deze dienen aleen om de structuren makkelijker terug te kunnen herkennen. Ze worden niet standaard zo gebruikt. De dunne rood/roze balken zijn ook geen
2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?
2.1.4 Oefenen Opgave 9 Bekijk de genoemde dataset GEGEVENS154LEERLINGEN. a. Hoe lang is het grootste meisje? En de grootste jongen? b. Welke lengtes komen het meeste voor? c. Is het berekenen van gemiddelden
Hoe goed is een test?
Hoe goed is een test? 1.0 het ideale plaatje Als we een test uitvoeren om te ontdekken of iemand ziek is hebben we het liefst een test waarbij de gezonde en de zieke groepen duidelijk gescheiden zijn.
Gaap, ja, nog een keer. In één variabele hebben we deze formule nu al een paar keer gezien:
Van de opgaven met een letter en dus zonder nummer staat het antwoord achterin. De vragen met een nummer behoren tot het huiswerk. Spieken achterin helpt je niets in het beter snappen... 1 Stelling van
8. Analyseren van samenhang tussen categorische variabelen
8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde
Tentamen Beeldverwerking TI2716-B Woensdag 28 januari 2015 14.00-17.00
Tentamen Beeldverwerking TI2716-B Woensdag 28 januari 2015 14.00-17.00 De 2D Gaussische fimctie e-' = 037 e'^ =0.14 e"'' = 0.082 e-' =0.018 deze toets bestaat uit 4 opgaven en 8 pagina's Opgave 1 en 2
8.1 Herleiden [1] Herleiden bij vermenigvuldigen: -5 3a 6b 8c = -720abc 1) Vermenigvuldigen cijfers (let op teken) 2) Letters op alfabetische volgorde
8.1 Herleiden [1] Herleiden bij vermenigvuldigen: -5 3a 6b 8c = -720abc 1) Vermenigvuldigen cijfers (let op teken) 2) Letters op alfabetische volgorde Optellen: 5a + 3b + 2a + 6b = 7a + 9b 1) Alleen gelijksoortige
De bouwstenen van het programmeren 1
De bouwstenen van het programmeren 1 I DE BOUWSTENEN VAN HET PROGRAMMEREN. Een programma is een beschrijving van acties (operaties, opdrachten) die moeten uitgevoerd worden. Deze acties spelen in op bepaalde
Netwerkdiagram voor een project. AOA: Activities On Arrows - activiteiten op de pijlen.
Netwerkdiagram voor een project. AOA: Activities On Arrows - activiteiten op de pijlen. Opmerking vooraf. Een netwerk is een structuur die is opgebouwd met pijlen en knooppunten. Bij het opstellen van
Computer Vision: Hoe Leer ik een Computer Zien?
Computer Vision: Hoe Leer ik een Computer Zien? Michael H.F. Wilkinson Instituut voot Wiskunde en Informatica Rijksuniversiteit Groningen 27 April 2006 Overzicht 1 of 19 Wat is Computer Vision? Wat zijn
Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:
Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan
Summary in Dutch 179
Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse
Populaties beschrijven met kansmodellen
Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.
2. Geef een voorbeeld van hoe datamining gebruikt kan worden om frauduleuze geldtransacties te identificeren.
1. Veronderstel dat je als datamining consultant werkt voor een Internet Search Engine bedrijf. Beschrijf hoe datamining het bedrijf kan helpen door voorbeelden te geven van specifieke toepassingen van
naar sporen Forensisch expert worden
Speuren B naar sporen Forensisch expert worden 3. Vaststellen identiteit Deze les ga je je verdiepen in één specifiek forensisch onderzoeksgebied. Je wordt als het ware zelf een beetje forensisch expert.
Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode.
Verificatie Shen en Carpenter RDEC methodiek voor de karakterisering van asfaltvermoeiing; vergelijking van verschillende methoden voor het berekenen van de parameters. Jan Telman, Q-Consult Bedrijfskundig
Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.
Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information
Samenvatting Nederlands
Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105
Bioinformatica tentamen D1 voor 2MNW op woensdag 30 maart 2005 van 9.30-12.30 uur in zaal Q105 Naam: Studentnummer: NB: er zijn extra vellen achteraan bijgevoegd die je kunt gebruiken om antwoorden verder
String Matching. Algoritmiek
String Matching Algoritmiek String Matching Gegeven string (haystack): aabaabbabaaba zoek patroon abba (needle) 4 algoritmen: Naïef Rabin-Karp Eindige Automaat Knuth-Morris-Pratt 2 String Matching (formeel)
INLEIDING. Definitie Stochastisch Proces:
Definitie Stochastisch Proces: INLEIDING Verzameling van stochastische variabelen die het gedrag in de tijd beschrijven van een systeem dat onderhevig is aan toeval. Tijdparameter: discreet: {X n, n 0};
360 FEEDBACK 15/06/2012. Thomas Leiderschap Vragenlijst. Thomas Voorbeeld. Persoonlijk & Vertrouwelijk
360 FEEDBACK 15/06/2012 Thomas Leiderschap Vragenlijst Thomas Voorbeeld Persoonlijk & Vertrouwelijk S Hamilton-Gill & Thomas International Limited 1998-2013 http://www.thomasinternational.net 1 Inhoud
VBA voor Doe het Zelvers deel 20
VBA voor Doe het Zelvers deel 20 Handleiding van Auteur: leofact Augustus 2015 handleiding: VBA voor Doe het Zelvers deel 20 Vorige aflevering In het vorige deel werd besproken hoe je de structuur en vensteropbouw
Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016
AI Kunstmatige Intelligentie (AI) Hoofdstuk 18.7 van Russell/Norvig = [RN] Neurale Netwerken (NN s) voorjaar 2016 College 9, 19 april 2016 www.liacs.leidenuniv.nl/ kosterswa/ai/ 1 Hersenen De menselijke
Projectieve Vlakken en Codes
Projectieve Vlakken en Codes 1. De Fanocode Foutdetecterende en foutverbeterende codes. Anna en Bart doen mee aan een spelprogramma voor koppels. De ene helft van de deelnemers krijgt elk een kaart waarop
Voorbereiding toelatingsexamen arts/tandarts. Wiskunde: Logaritmen en getal e. 23 juli 2015. dr. Brenda Casteleyn
Voorbereiding toelatingsexamen arts/tandarts Wiskunde: Logaritmen en getal e 23 juli 2015 dr. Brenda Casteleyn Met dank aan: Atheneum van Veurne (http://www.natuurdigitaal.be/geneeskunde/fysica/wiskunde/wiskunde.htm),
Reanimatiescores uitgelegd. Herzien op 19 november 2013
Reanimatiescores uitgelegd Herzien op 19 november 2013 Introductie Tijdens het gebruik van een Laerdal QCPR-oefenpop, worden de reanimatieprestaties gescoord van 0% tot 100%. Indien de reanimatie exact
