Data Vault in het Business Intelligence onderwijs. Dineke Romeijn HAN, ICA



Vergelijkbare documenten
BI appliance op maat. Ruud Geerlings

Self Service BI. de business

Business Intelligence. Toepassing BI Database en Datawarehouse BI proces BI Organisatie Implementatie BI

Conceptueel Modelleren GEÏNTEGREERD DATA MODELLEREN MET DEMO EN DATA VAULT

Curriculum Vitae Ishak Atak. Naam : Ishak Atak Roepnaam : Ishak. Woonplaats : Utrecht Geboorte datum :

Versnelling in BI-ambitie

Data Vault master class. BI Retail Community

Medical Intelligence in de praktijk

Datawarehouse-modelleren met Data Vault

Historische informatie in een Spatial Dynamisch Data Warehouse. Wil de Jong Enterprise Architect

DATA- WAREHOUSE ONTWIKKELING

Afstudeeropdracht bachelor informatica

Johannes Koning. Koning Automatiseringsdiensten & Advies. A Nieuwe Schoolweg 2 A 9756 BB Glimmen T E info@koningautomatisering.

BI Roadmap: Highway to success

Naam: Clint Huijbers Functie: Senior Microsoft Business Intelligence consultant

Toekomstvast datawarehouse

Magnutude 2012 Efficient BI. 18 september Joost de Ruyter van Steveninck

De kracht van BI & Architectuur

BOKS HBO-ICT NIOC APRIL 2013 MISCHA BECKERS

Testen van Datawarehouses en Informa2e. Kan het 2x zo snel, 2x zo goedkoop en 2x zo volledig?

Business Intelligence White Paper

BIWA SIG Bijeenkomst. ODI op Exadata. Robbert Naastepad LinkedIn:

OP KOERS NAAR EEN DATAGEDREVEN ORGANISATIE?

Curriculum Vitae Henri Groenevelt

Data Driven: Show & tell

Betekent SOA het einde van BI?

Presentatie Rapportage Met SAP Business Objects

occurro Vertrouwt u uw gegevens? BI wordt volwassen Kasper de Graaf 31 maart 2009 De kracht van BI en Architectuur in de praktijk - Centraal Boekhuis

BUSINESS INTELLIGENCE

Help je Power BI Analytics project om zeep 6 succesfactoren. Marc Wijnberg Gebruikersdag 2018

CLOUDSTRATEGIE. voor Stedin Netbeheer. v1.0 26/03/2019

Solvency II: Een ander soort uitdaging voor BI?

Mag het een (opslag)laagje meer zijn?

Meer dan rapportages KEMBIT

Het belang van. Data Modellering. GEMINIT Training. Data Modellering. Frédéric BARBIER

Data transformeren naar actiegerichte inzichten REPORTS ANALYTICS

Cursus PowerPivot voor Excel 2016 Level I

Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures

Profiel Manfred Dousma

Azure en BI: niet alleen voor grote bedrijven

Big Data en Testen samen in een veranderend speelveld. Testnet 10 april 2014 Paul Rakké

Power BI. TOP 10 Leerpunten uit de praktijk. Donderdag 23 juni 2016

Testen bij DWH-projecten

In 3 stappen naar de juiste keuze voor marketing software

Agile Testen van Business Intelligence. Assepoester 2.0

Genereren van mappings

CURRICULUM VITAE. CERTIFICERINGEN Microsoft Technology Associate:.NET Fundamentals Microsoft 2014

Stichting NIOC en de NIOC kennisbank

Medical Intelligence Strategiestudie Vernieuwing Zorg-ICT

In 3 stappen naar de juiste keuze voor marketing software

I N H O U D V l a a m s M i n i s t e r - p r e s i d e n t K r i s P e e t e r s

Webapplicatie-generatie NIOC 2013

Model Driven Development. Kosten, baten, organisatie

DATAMANAGEMENT MET OPEN SOURCE

Zorginstelling Reinier de Graaf Groep realiseert solide business intelligence-systeem

Curriculum Vitae. Personalia. Samenvatting. Wouter Tangelder Adres Leoninusstraat 41. Telefoonnummer Geboortedatum 30 juli 1979

Tools voor canonieke datamodellering Bert Dingemans

Sterschema s als starschema s

Inhoud. Wat is Power BI? Voorbeelden gemaakt met Power BI Beginnen met Power BI Werkruimte uitleg... 7

De volgende generatie EDW (2)

Posthogeschoolvorming rond Enterprise Content Management Business Process Management Service Oriented Architectures

Experts in Groener leven

BE A LEADER. (Play smart)

Continuous Delivery. Sander Aernouts

Vernieuwing Bacheloropleidingen Informatica en Informatiekunde

Een platformaanpak voor moderne architectuurontwikkeling

Profiel Manfred Dousma

Curriculum Vitae. Personalia. Profielschets

SQL & Datamodelleren

Curriculum Vitae. Personalia. Profielschets

Introductie. NAV performance. Derk Jan Oelemans. Manager Development, BI en E-Business Qurius Business Solutions

Real-time data Warehousing

MINOR SOFTWARE KWALITEIT EN TESTEN. 15 mei 2019 Maurice van Haperen

De Digitale Transformatie en de impact op IT. Capgemini Edwin Leinse

Korte sessie open deuren intrappen Meestal bekend, maar te vaak over het hoofd gezien

Master Software Engineering. Inhoud, begeleiding, tentamen dr. Anda Counotte Docent en mentor

WI(B)ON + INSPIRE UN. verstandshuwelijk of moetje? Ing. Ad van Houtum Msc. Geonovum Open Geodag Utrecht

De Omslag in het ICT Onderwijs: Duurzaamheid voor Systeembeheerders. Ervaringen met een Pilot

Model driven Application Delivery

Living Labs : NFI & RvdK Samen onderweg naar meer grip op data. JenV I-tour presentatie 24 april 2018

case Het enterprise warehouse van Centraal Boekhuis architectuur Bedrijfsdoelen vertalen in de datastructuur

Model Driven Software Development: Geen toekomst maar realiteit. 4 juni 2009, WTC, Amsterdam.

openelectronic Health Record

Comakerships & praktijkopdrachten Windesheim Flevoland Economie & Management, ICT en Bouwkunde

BiZZdesign. Bouwen van sterke en wendbare organisaties met behulp van standaarden, methode, technieken en tools. Research & Development

Enterprise Resource Planning. Hoofdstuk 7 ERP-systemen: human resources. Pearson Education, 2007; Enterprise Resource Planning door Mary Sumner

Enterprise warehouse architectuur Het definiëren van een informatiearchitectuur in de praktijk.

Informatiebeheer: een nieuw tijdperk

Sparse columns in SQL server 2008

Master in de toegepaste economische wetenschappen: Handelsingenieur in de Beleidsinformatica

Asset 1 van 9. Vermijd BI-valkuilen. Gepubliceerd op 17 september 2010

Brochure Certified Business Intelligence Professional (CBIP)

CD Aanvraag van informatie (RFI) Business Intelligence Oplossingen

AAG Analytics 28 maart 2019

MCA Gemini Groep & Healthy Data Vault on budget

Opgaven - De intelligente organisatie 3 e editie

Op weg naar uniformiteit

Nieuwe BI-omgeving van ApplicationNet is waardevolle bron van informatie voor facturatie, rapportages, kostenbesparing en marketing

Transcriptie:

Data Vault in het Business Intelligence onderwijs Dineke Romeijn HAN, ICA

Voorstellen Dineke Romeijn Docent Minor Business Intelligence (teamtrekker) Master Onderzoeker lectoraat M-BIS Studieloopbaanbegeleider DT I, BIM, TI Kennischeck

Inhoud Data Vault BI in het curriculum van HAN Data Vault in Minor BI -Ervaringen Bedrijfscontacten

Inhoud Data Vault BI in het curriculum van HAN Data Vault in Minor BI-Ervaringen Bedrijfscontacten

Wat is Data Vault? Een gegevensmodel voor een DWH Een architectuur

Data Vault: het model Ontworpen door Dan Linstedt vanaf 2002 Volgens Linstedt: A collection of detail-oriented, history-tracing, and uniquely linked collection of normalized tables A hybrid approach combining the best of 3NF and dimensional modelling Flexible, scalable, consistent and adjustable to business needs Handle high-speed data loads in parallel

Data Vault elementen Drie componenten: Hubs: bevatten de bedrijfssleutels van entiteiten Links: relaties tussen entiteiten, afhankelijke entiteiten Satellieten: alle andere relevante attributen van een entiteit of relatie Surrogaatsleutels voor hubs, eventueel ook voor links Voor alle elementen een verwijzing naar de bron en een timestamp voor de laaddatum Voor satellieten is de timestamp deel van de sleutel (vergelijkbaar met SCD van Kimball)

Data Vault: een voorbeeld Twee bronsystemen Stock system Stock Warehouse warehouse code warehouse name address length width Order system Product (O) product code product description sales price cost price product type productgroup code warehouse code product code number in stock Product (S) product code product weight Product group productgroup code productgroup description

Source: Stock system Sat_Warehouse warehouse id load datetime stamp end datetime stamp record source warehouse name address length width Sat_Stock warehouse id product id load datetime stamp end datetime stamp record source number in stock Sat_Product_Stock product id load datetime stamp end datetime stamp record source product weight Sat_Product_Order Hub_Warehouse warehouse id warehouse code load datetime stamp record source Link_Stock warehouse id product id load datetime stamp record source Hub_Product product id product code load datetime stamp record source product id load datetime stamp end datetime stamp record source product decription sales price cost price product type Data Vault: voorbeeld Link_ProductGroup product id productgroup id load datetime stamp record source Hub_ProductGroup productgroup id producgroup code load datetime stamp record source Sat_ProductGroup productgroup id load datetime stamp end datetime stamp record source productgroup description Source: Order system

Klassieke architectuur Business Rules Source specific transformations big T integration Business wide transformations + 3 NF, stars, snowflakes, with or without history sources source staging area business staging area enterprise DWH Staging area out datamarts

Data Vault Architectuur Business Rules integration transformations big T DV System of fact sources source staging area business staging area enterprise DWH Staging area out

Data Vault Architectuur (uitgebreid) Bedrijfsbrede transformaties Processpecifieke transformaties Source Data Vault Business Vault

Voordelen beroepspraktijk Opslag complete historie mogelijk Compliance + auditibility 3 simpele elementen Schaalbaar, flexibel System of fact: feiten zoals bekend in de bronnen Volledig bronafhankelijk niet regelafhankelijk Scheiding verantwoordelijkheden IT en business

Model driven generation Model-gedreven generatie mogelijk Parallel laden mogelijk, ETL snel en genereerbaar Lagere ontwikkel- en onderhoudskosten Ware explosie van tooling op dit vlak Topic in BI Dutch 15+ tools in 2011 http://www.linkedin.com/groups/is-datawarehouse- generatiie-de-nieuwe- 46641.S.49985459?trk=group_search_item_list-0-bttl&goback=%2Egna_46641

Nadelen 1 Gebrek aan standaardisatie: Geen heldere formele beschrijving Gesloten bedenker daardoor veel discussiepunten en variaties Discussie over best practices

Nadelen 2 Technisch: Kan leiden tot extra (evt. virtuele) lagen Kan leiden tot extra modellen ETL complexer bij handmatige ontwikkeling Geen nadeel maar ook geen voordeel: Aan de big T wil niemand de vingers branden, ook DV niet.

Inhoud Data Vault BI in het curriculum van HAN Data Vault in Minor BI-Ervaringen Bedrijfscontacten

Waarom Data Vault in curriculum? Waarom BI en DWH überhaupt? Toenemende vraag naar analyse van gegevens Data explosie Schatting sommige consultants: 80 % van DWH projecten, nieuw of herziening bestaande oplossing, maakt gebruik van Data Vault Volgens anderen wat optimistisch, maar toch.. Hoewel er anderssoortige oplossingen bij komen, blijft klassiek datawarehousing in de praktijk nog steeds zeer belangrijk.

Historie BI onderwijs HAN Vanaf 1998 tot 2002: Keuzemodule Datawarehousing / Business Intelligence voor de Hogere Informatica opleiding Vanaf 2002 tot 2008: Business Intelligence in het oude curriculum voor BI, I en TI opleidingen Vanaf 2003-2012: Business Intelligence in de Master Opleiding Information Systems Development Vanaf febr. 2009: Minor Business Intelligence

BI in huidig curriculum HAN Voorbereiding in semesters: DIS, ABI Basis in semester DECO Zwaartepunt in minor Business Intelligence Afstudeeropdrachten

Minor BI Onderzoeksminor Verdiepende minor voor BIM, I Voorkennis studenten wisselend, jaar 2, 3 of 4 Verbredend voor studenten FEM en Technische bedrijfskunde (FT), alleen na voorbereidingstraject

Minor BI - onderdelen Course 1(Basiskennis): 7,5 ec Voortraject BI (VB) Prototypetraject BI (PB) Course 2 (BI thema s): 7,5 ec Project: 15 ec Een in overleg gekozen onderzoek uitvoeren Start met onderzoeksvaardigheden

Course 1: Voortraject Onderwerpen: De Business Intelligence (BI) processen Doelstellingen voor bedrijfsprocessen Strategische doelstellingen (Meet-)gegevens, een meetplan en een actieplan opstellen voor een doelstelling Presenteren en verspreiden van informatie BI-projecten, beheer en exploitatie, outsourcing Business Intelligence implementeren BI promoten

Course 1: Voortraject Opdrachten: Een BI advies voor een bedrijfsprocessen Doelstellingen, (meet-)gegevens, meetplan, actieplan, business case en implementatieplan opstellen Een Strategisch BI advies Doelstellingen en strategisch informatieplan opstellen

Course 1: Prototypetraject Centrale beroepstaken: Hoe ontwerp je een systeem dat snel, accuraat en flexibel de gewenste informatie levert? Hoe realiseer je vervolgens een prototype van dit systeem?

Course 1: Prototypetraject Onderwerpen: transactional processing vs analytical processing datawarehouses, datamarts BI architecturen Data Vault sterren en dimensies historie van gegevens het ontwikkelproces en ondersteunende methoden ETL

Course 1: Prototypetraject Casus: Integreert voortraject en prototypetraject Ontwerp en realiseer een BI omgeving

Course 1: Prototypetraject Leermiddelen Literatuur: Sterren en dimensies, H. van der Lek, F. Habers, M. Schmitz Business Intelligence en datawarehousing, Tweede editie, K. Verhagen Diverse uit te reiken artikelen: Scholar Software: Microsoft Excel 2003/2007/2010 SQL Server 2008 R2, eventueel 2005 (incl service pack 3) SQL Server Business Intelligence Studio Power Designer Front-end tool naar keuze

Inhoud Data Vault BI in het curriculum van HAN Data Vault in Minor BI ervaringen Bedrijfscontacten

Data Vault in minor BI Historie: 2008 eenmalige, op zichzelf staande les Via: Losse workshop halve dag en Aanvullende opdracht bij casus Naar: Volledig geïntegreerd in casus en lessen Centrale methode voor modelleren DWH

Data Vault in de minor BI Drie aspecten: Data Vault model Data Vault architectuur Model gedreven generatie

Data Vault model Het gegevensmodel voor een DWH 2 dagdelen aan begin van prototypetraject Inleidende presentaties Gericht oefenen met kleine voorbeelden Via vaardigheidstraining goede basis leggen Integraal onderdeel casus Complexere modelleerkwesties zitten in casus verwerkt Met goede basis ontdekken de meeste studenten dit zelf Nadere uitleg a.d.h.v. vragen Bespreken alternatieven

Voorbeeld oefeningen Design a Data Vault for the following 3NF logical relational schemas: Video title duration... <pk> Rental title name rate return_date... <pk,fk1> <pk,fk2> Customer name address... <pk> Boat boatname <pk> Reservations boatname start_date name end_date nr_of_persons <pk,fk1> <pk> <fk2> Customer name address <pk>

Casus Uitgangspunt: KPI s uit het voortraject Ontwerp en realiseer een DWH (Data Vault) uitgaande van de gegeven brondatabase Ontwerp en realiseer een DM (ster) uitgaande van de gegeven brondatabase en de KPI s Ontwerp en realiseer het ETL proces Ontwerp en genereer een dimensionele kubus Analyseer de gegevens in de kubus met Excel andere front-end tool Controleer en vergelijk de resultaten en werkwijzen.

De casus: De groei van Arnhem Biker Couriers

Knelpunten Voor BIM studenten ETL lastig: Goede voorbeelden Gebruik tooling in SSIS Benadrukken belang goede kennis SQL Voorkennis studenten verschillend, niet allemaal bekend met ERM of FOM Één van de eerste onderdelen van de casus: Blijven hangen Overschatten belang Er is niet één standaard, alternatieven maakt zaak complexer: Leuk voor goede studenten Verwarrend voor anderen

Data Vault architectuur Vanaf week 1 steeds terugkerend thema Oplopend in complexiteit Land pas echt goed na diepgaand inzicht in BI, meestal aan eind van de minor Deels vraaggestuurd, n.a.v. de stof komen veel studenten met vragen om nadere uitleg Dan ook alternatieven bespreken Inzicht bieden in architectuur blijkt veel lastiger dan model

Model gedreven generatie Gastpresentatie en workshop: Genereren sterschema s en Data Vault via tooling praktijkvoorbeeld uit bedrijfsleven QOSQO Lulzim Bilali Quipu open souce tool Presentatie vanuit lectoraat: Transformatie vanuit een conceptueel model naar DV Knelpunt wisselende voorkennis studenten

Inhoud Data Vault BI in het curriculum van HAN Data Vault in Minor BI-Ervaringen Bedrijfscontacten

Contacten bedrijfsleven NLDVGG Martijn Evers Organisatie studiedagen informatiemodellering voor deskundigen bedrijfsleven en medewerkers M-BIS Via bedrijfsbezoeken en gastpresentaties Organisatie van Cursussen met en voor bedrijfsleven MATTER Congressen, bv Data Modeling Zone Europe 2013

Bron: http://despelendefilosoof.nl/wp-content/uploads/2011/02/vragen.png