Data (mis-)management Een gebruikers perspectief R.L. Zijdeman IISH / Utrecht University / Stirling University June 24, 2013
Outline Introductie Ervaringen met het gebruik van data Ervaringen met het deponeren van data Aandachtspunten
Het belang van deponeren van data
Het belang van deponeren van data
Introductie Ervaringen met het gebruik van data Ervaringen met het deponeren van data Het belang van deponeren van data Aandachtspunten
Vindplaats Bijv. DANS EASY: https://easy.dans.knaw.nl/ui/home Overzichtelijk zoeken op kernbegrippen Weergave per item en categorie Identifiers van datasets
Vindplaats Bijv. DANS EASY: https://easy.dans.knaw.nl/ui/home Overzichtelijk zoeken op kernbegrippen Weergave per item en categorie Identifiers van datasets Nog te wensen: Internationale koppeling van archieven Zoeken op variabele-namen
Vindplaats Bijv. DANS EASY: https://easy.dans.knaw.nl/ui/home Overzichtelijk zoeken op kernbegrippen Weergave per item en categorie Identifiers van datasets Nog te wensen: Internationale koppeling van archieven Zoeken op variabele-namen
Gebruiksgemak Normalisatie van variabelen beroepen: (H)ISCO, HISCAM, ISEI plaatsen: Amsterdamse code etc. Mail met referentie data en databronnen (IPUMS) Mail met updates van gebruikte databronnen Mail met syntax (script) om data in te lezen
Kwaliteit Data in platte tekst (.txt,.csv,.xml) Minder afhankelijk van veranderingen in software over de tijd Toegankelijkheid data zonder licentie-kosten Dus niet zoals de belangrijke Enquete Beroeps Bevolking in DANS EASY
Kwaliteit Data in platte tekst (.txt,.csv,.xml) Minder afhankelijk van veranderingen in software over de tijd Toegankelijkheid data zonder licentie-kosten Dus niet zoals de belangrijke Enquete Beroeps Bevolking in DANS EASY Data-signature Bijvoorbeeld: http://www.stata.com/manuals13/ddatasignature.pdf
Kwaliteit Standaard checks, zoals aantal cases over tijd en plaats
Zelf deponeren van data Eenvoudig Relatief onbekend bij collega s Weinig erkenning
Coherentie Internationale coherentie in vereisten bij deponering Maar ook de basale zaken: Author ID
Coherentie Internationale coherentie in vereisten bij deponering Maar ook de basale zaken: Author ID
Opleiding Data management ontbreekt in de opleiding Hoe noem ik mijn variabelen? Wat is UTF-8? Hoe koppel ik bestanden? Waar moet een codeboek aan voldoen? Waar deponeer ik mijn data?
Valorisatie Nu vooral: Nut voor bedrijven en publiek Zou ook moeten zijn: Gedegen deponeren data