Naar High Throughput DNA data analyse



Vergelijkbare documenten
HPC CLOUD INTRODUCTIE. Jan Bot, SURFsara 5 augustus 2015

New sequencing technologies:

Agenda Wat zijn de gevolgen van Cloud en Gridcomputing voor de gebruikersorganisatie en de beheersfunctie.

Cloud Computing: Met HPC in de wolken Ron Trompert

ENlIGhTEN YOUR RESEARch 3 de winnaars

Brochure ExomeScan. Whole Exome Sequencing. Achtergrond

Brochure ExomeScan. Whole Exome Sequencing. Achtergrond

Research Data Zone. Joyce Nijkamp, UvA Peter Hinrich, SURFnet

Hoe kijken we naar het DNA van een patiënt?

Elke digitale reis start met een vertrekpunt Hyperconverged Infrastructure as a Service

Bioinformatica en Systeembiologie (BIS)

Efficiënt en veilig werken met cliëntgegevens. Zorg & ICT beurs 15 maart 2017

De antwoorden op vragen 1 en 2, 3 en 4, en 5 t/m 8 graag op verschillende vellen schrijven. Vergeet ook niet op de 3 vellen je naam en studentnr.

Business Process Management

Een alledaags gegeven

DE PRIVATE CLOUD. Johan Bos & Erik de Meijer

HPC CLOUD INTRODUCTIE. Jan$Bot,$SURFsara$ 15$oktober$2015$

Body of Knowledge and Skills (BoKS) van de opleidingen Bio-informatica / /

Automatisering van NGS processen Ewart de Bruijn. Hubrecht Institute

Research Data Netherlands, SURFsara en het Landelijk Coördinatiepunt Research Data Management. Ingeborg Verheul (SURFsara)

De Reizende DNA-labs. 2-3 uur practicum met inleidende en afsluitende lessen voor docent

Welkom bij Interconnect. Maartje van Alem Marketing Manager

Slide 1. Slide 2 Introduktie. Slide 3 Deze les: 2 onderwerpen. Les 1 Definities en belang Informatie Technologie. Intro docent Opzet/tentamenstof

Werken met onderzoeksdata Services en repositories voor de onderzoeker in Nederland

Sectie Genoom Diagnostiek 12 laboratorium specialisten, 75 analisten >20,000 genetics tests Karyotypering SNP & Oligo Arrays FISH Sequentie analyse

Cloud, cloud, cloud. Wolfgang Ververgaert Wiljan Oomen

SOFTWARE ENERGY FOOTPRINT LAB

Wageningen University & Research. Wageningen, 14 Oktober 2017 Prof. dr Arthur Mol, Rector Magnificus

Van Papier naar Papierloos met iventionles,

DYNAMIC INFRASTRUCTURE Helping build a smarter planet

Research Bio-markers Concept Conference NIOC Probleem

vra + NSX and it all comes together

Data en Applicatie Migratie naar de Cloud

Voorlichtingsavond HBO & WO Opleidingen maandag 5 oktober 2015

Implementatie LIMS binnen afdeling Genetica van het Radboudumc. Ermanno Bosgoed

VDI WORKSPACE. 3D CAD virtualisatie & Next Gen. Grafische werkplek. PTC Userdag 2017

Trainingen: Biologische effecten van straling Dosimetrie (in de ruimte)

INNOVATIES & FUNCTIONEEL BEHEER. Bij welke innovaties heeft Functioneel Beheer een rol?

Rapport Onderzoek Visie en ambitie van ICT professionals. In opdracht van:

Systeemeisen PB-Software

Moleculaire diagnostiek

Haerst is een jong innovatief bedrijf dat opereert op de grens van videotechnologie en diagnostiek.

Dutch Sports Infrastructure. Nationaal Export Event. Ruben Dubelaar

Making the Internet of Things work.

Op weg naar snelheid in het lab, door herinrichting, high throughput, biobanking en tracing. Neurogenetics Unit, UMCUtrecht. P.

Onderwijs- en examenregeling van de masteropleiding

BOM s horen niet in spreadsheets

Parasoft toepassingen

Industrie 4.0 Smart Industry. Principes en kansen voor het bedrijfsleven, Ing. F.R. Wijlhuizen MBA, Windesheim UAS

Proef! Bio-informatica. De opleiding en het werkveld

Agenda. Wat kost het MIS Waarom JorSoft. Over JorSoft. Diensten Het MIS. Vervolgstappen IT infrastructuur

Wageningen University & Research. Wageningen, 04 November 2017 Prof. dr Arthur Mol, Rector Magnificus

OPEN DAGEN WO NOVEMBER 2016

van Leids Universitair Medisch Centrum (LUMC) Laboratorium voor Diagnostische Genoomanalyse (LDGA), Afd klinische Genetica

Voorlichtingsavond HBO & WO Opleidingen woensdag 5 oktober 2016

Kenniscentrum Risicomanagement

Belangrijke deelgebieden van dit vakgebied

Voorlichtingsavond HBO & WO Opleidingen maandag 5 oktober 2015

Enterprise Resource Planning. Hoofdstuk 1

Bio-informatica. Dr. Pieter De Bleser

Trends in Laboratory Informatics

Smart Industry 4.0. Edwin van Rensch/Eric Megens

FYSIEKE MIGRATIE NAAR EEN VIRTUELE ICT-OMGEVING JOHAN VINK PRODUCTMANAGER INTERCONNECT

Transcriptie:

Naar High Throughput DNA data analyse Laboratorium automatisering seminar Jan-Peter Nap Hanze University Groningen 8/10/10 1 van 24

gisteren CLC bio, a comprehensive platform for NGS analysis nu: Super-scale sequence data analysis with hybrid core computing Accurate next gen sequencing data analysis on cloud computing 8/10/10 2 van 24

8/10/10 3 van 24

DNA structuur & dimensies 8/10/10 4 van 24

DNA structuur en dimensies 10 bp = 3.4 nm => 3 * 10 9 bp = 1 m (* 2 per iedere cel) menselijk lichaam:. 3 miljard bp humane genoom klaar in 2000 kosten: ~1 30 miljard US$ 12-15 jaar technologische ontwikkelingen: 1000-100$/genoom in een dag dan alles mogelijk 8/10/10 5 van 24

Een Illumina run Ruwe data: 30 TB (mega-giga-tera-peta-exa) High resolutie opnamen laserexcitatie ~ 300 GB data (HiSEQ 2000; 2*100) Humane genoom (3 * 10 9 ) ~ 700 MB Ruwe data worden asap weggegooid! 8/10/10 6 van 24

Voorspelling 2010: 100 Gb DNA sequenties 2011: 1 Tb 2012:? 8/10/10 7 van 24

Voorspelling 2011: 100 Gb DNA sequenties 2012: 1 Tb 2013:?? PER DAG. Eindelijk interesse fysica/it etc. 8/10/10 8 van 24

Wat komt er dus aan. vloed springvloed tsunami? 8/10/10 9 van 24

en computers zijn er erg goed in Allemaal data.. DNA in iedere cel 3 x 109 basen per cel (= het genoom) saai alfabet: maar 4 letters: AGCT mantra: 8/10/10 10 van 24

Van DNA naar informatie Wat hoort bij elkaar assembly Wat doet het en wanneer? annotatie Pan omics Alles met alles in relatie brengen Gebruik van de informatie Biomedisch (diagnose, behandeling) Landbouwkundig (plantenveredeling, opbrengst) 8/10/10 11 van 24

Assembly Informatie in DNA I Aan elkaar plakken van reads 75 nt, maar groeiend Structuur van genomen en chromosomen Structuur/functie relaties Vergelijkingen ziek gezond droog - nat En nu dus HTP genome wide 8/10/10 12 van 24

Annotatie Informatie in DNA II DNA geeft RNA geeft eiwit Maar welk en wanneer en hoe? Vergelijkingen Blast eva Laboratorium/veld experimenten En nu dus HTP genome wide 8/10/10 13 van 24

Informatie in DNA III Andere data types/bepalingen OOK meer HTP RNA sequenties Epigenoom sequencing Eiwit data Proteomics MS Metaboliet data MS 8/10/10 14 van 24

hardware Moore s law? software algorithmen datastructuren Uitdagingen experimental design training & communicatie Life science professional als (halve?) IT er kosten 8/10/10 15 van 24

Grid applicaties Hardware BigGrid + Dutch Life Sciences Grid E-bioscience grid Cloud? GPGPU General Purpose Graphical Processing Unit Democratiseren (supercomputer) infrastructuur Bruikbaar voor HTP DNA applicaties? 8/10/10 16 van 24

Voorbeeld GPGPU Smith-Waterman algorithme vergelijken van sequenties bewezen het beste Te langzaam voor HPC Blast etc. Implementatie op GPGPU geen bruikbare implementatie(s) publiek onderzoeker wil alignments (kunnen) zien vereist specifieke kennis/kunde (CUDA) Testen suggereren rendabele/haalbare/snelle aanpak 8/10/10 17 van 24

Grid applicaties Hardware BigGrid + Dutch Life Sciences Grid E-bioscience grid Cloud GPGPU FPGA (Field Programmable Gate Arrays) Kosten? 8/10/10 18 van 24

Software Huidige algorithmen zijn oud kan het beter? Veel heuristiek blast 8/10/10 19 van 24

Software Work flow management systemen OS: Taverna, Galaxy, Trident (MS!) Commercieel: CLC bio Aanpassen aan werkveld? excel Parallelisatie GPGPU; FPGA, ander 8/10/10 20 van 24

Experimental design Niet meer alles opslaan? Is more less? Meer cross-experiment analyses Meer standaarden/ontologien/sop s? 8/10/10 21 van 24

Voorbeelden toepassingen Genome-wide association studies (GWAS) Welke SNPs zijn gerelateerd aan ziekte X in een patientenpopulatie Y en gezond panel Z Metagenomics: alle bacteriele DNA voor energie productie in relatie tot gezondheid 8/10/10 22 van 24

NBIC Training & communicatie BRS; BioAssist BSc Hogescholen MSc and up Universiteiten Europees/internationaal 8/10/10 23 van 24

Nieuw: E-lab assistent Laborant met (veel) IT kennis Kennis en kunde van hardware/biosoftware Kennis van life sciences Eigen projectjes+helpdesk functie Ervaring (Groningen/CBSG/PRI Wageningen) erg positief 8/10/10 24 van 24