Tekstuele databestanden



Vergelijkbare documenten
Text Mining/Linked Data

Political Mashup Kickoff Meeting

Entry Point Retrieval

Cloud Computing. Cloud Computing. Welkom allemaal hier op het science park.

Dit boek heeft het keurmerk Makkelijk Lezen gekregen. Wilt u meer weten over dit keurmerk kijk dan op de website:

Lekker in je vel in 7 stappen. Life Balance

(VIDEO) Review ZEEF Wat is ZEEF en wat kan je hiermee?

Vragenlijst: Wat vind jij van je

CHATTEN. verborgen verdriet MARIAN HOEFNAGEL

Luisteren: muziek (B2 nr. 1)

De voorzitter van de Tweede Kamer der Staten-Generaal Postbus EA DEN HAAG

Bijlage interview meisje

Debat: regionaal en nationaal

Inhoud. Mentale Training & Begeleiding. Mythes & misvattingen. Mentale training. Doel. Elke training is mentale training

Cultuur & Media Werkgroep 1 Introductie

10 onderdelen die niet mogen ontbreken in een online briefing

Inhoud. 1 Wil je wel leren? 2 Kun je wel leren? 3 Gebruik je hersenen! 4 Maak een plan! 5 Gebruik trucjes! 6 Maak fouten en stel vragen!

NIEUWS JUNI 2015 BEHEERSOFTWARE. In deze uitgave:

Informatiekunde 1. Informatiekunde. Een greep uit het werk van mijn studenten. Maarten Marx. 10 Jaar Informatie Wetenschappen

Netje is een meid! Vrolijke meid, uit een vissersdorp!

1. Ga naar de bibliotheek. 2. Kies twee of drie boeken uit over jouw onderwerp. 3. Denk je ook aan de junior-informatieboekjes?

Stappenplan voor je spreekbeurt in groep 3/4

VinniePlace helpdesk.vinnieplace.nl

Geneeskunde studiejaar Matchingsvragenlijst MATCHING

Veelgestelde vragen over de nieuwe fototool

explore the big questions of life Een introductie

Zelfreflectie meetinstrument Ondernemende houding studenten Z&W

WELKOM. Walter Groenen. Anneke van der Vaart. Directeur CJP. Account manager CJP

Praktische toepassing van functies

Ik ben Sim-kaart. Mobiel bellen groep 5-6. De Simkaart is een meisje, tikkeltje ondeugend en een echte kletsgraag. Aangeboden door

Mijn 7 grootste inzichten in ICT in de zorg uit de afgelopen 15 jaar

Formeel en informeel. Formeel: Je gebruikt u om iemand aan te spreken. Je noemt iemand bij zijn achternaam.

TMLO: PRAKTISCHE TOEPASSING

Voorbereiding assessment

Website bouwen Blok2 Wat kan wel en wat kan

Zondag 13 december 2009 Tekst: Lucas 1: 39-55

De theorie voor leesvaardigheid in de vorm van een stappenplan

op een gebrek aan kennis berustende mening of afkeer

Ik ben Sim-kaart. Mobiel bellen groep 7-8. De Simkaart is een meisje, tikkeltje ondeugend en een echte kletsgraag. Aangeboden door

Les 2: Voorspellen Tekst: Veilig in het verkeer. Introductiefase: 2. Vraag: "Kan iemand zich nog herinneren wat de bedoeling was bij het voorspellen?

Waarom anderen Ik krijg altijd gelijk lezen

Mediatechnologie Human Centred Creative Technology

De Drakendokter: Gideon

EFT kinderinstructiekaart voor pesten

Wat kan linked data betekenen voor de Basisregistratie Grootschalige Topografie?

THE BIG CHALLENGE. Gerechtsdeurwaarder Groenewegen (NL)

User Centred Development! UCD Werkcollege blok 1 week 6!

schoolwise Bibliotheek Haarlemmermeer

Thema 4 Communicatie. Taalhulp Telefoneren. Informele situaties - opbellen en opnemen. Hoi, Diana. Hallo, Diana van Someren. Hi, met. Hé, met John.

Wat is een digitale foto

Wrts.nl. Woordenschat leer je zo!

WETENSCHAPPELIJK ONDERZOEK. Wat is dat? Eva van de Sande. Radboud Universiteit Nijmegen

Social Media, de andere opvoeder

Zo maak je een Facebook pagina in 15 stappen

V Vergadering van de Eerste Kamer op dinsdag 5 maart Toespraak van de Voorzitter van de Eerste Kamer, Mr. G.J. de Graaf

De examenperiode is een moeilijke tijd. Je moet hard studeren en je hebt veel stress. Wat is een goede studiemethode en wat doe je beter niet?

OCAI. veelgestelde vragen

3 Hoogbegaafdheid op school

MANIEREN OM MET OUDERPARTICIPATIE OM TE GAAN

[zelf op te maken en in te vullen > denk hierbij aan het tonen van een foto en/of logo van de bank, je naam etc.

Archiveren digitale bestemmingsplannen. Workshop

Verantwoord omgaan met onderzoekgegevens. Hoe je data- en syntaxbestanden transparant opslaat en je analyses repliceerbaar maakt

Voorwoord. 15 miljoen mensen Op dat hele kleine stukje aarde Die moeten niet t keurslijf in Die laat je in hun waarde

Usability-evaluatie website op 10 juni bij SIGCHI.NL

Individueel procesverslag

Geleerde lessen van zes pilotprojecten Eindrapport Regie in de Cloud -project werkpakket 3

Interview Rob van Brakel

Welke kansen bieden internet en sociale media (niet)?

Interview Han van der Maas

Studiedag Beleid en Financiën een broos evenwicht

III. Het (mosterd)zaadje. Vrijdag

Beknopte instructies Onedrive


Ik weet dat mijn gegevens anoniem zullen worden toegevoegd aan een databestand dat voor wetenschappelijke doeleinden gebruikt wordt.

DE NIEUWE WEBSITE VAN DE GEMEENTERAAD VAN PURMEREND RAAD.PURMEREND.NL

Handleiding sectoronderzoek V

Op 21 maart is er een dansvoorstelling voor onze groep: Wiewawit

Thema Op het werk. Lesbrief 15. Vrij vragen


Introducties telefonisch interview

Omgaan met klachten volgens de BOOS-formule

Is snel starten wel effectief?

Opdracht bevolkingsgroei

INFORMATIE VOOR PARTNERS EN SPONSOREN

Open & Online. De (mogelijke) rollen van bibliotheken. Onderwijs

Toetsen in Blackboard

Een academische omgeving voor het basisonderwijs NRO-Congres 4 november 2015

Open Data. Themamiddag Actieve Openbaarheid

Mediawijs? Hoe word ik het?

CBS: Meer gemak en nut voor de MKB-er. Praktijkdag RGS en SBR, 20 april 2016

Je bent ziek. Je kan niet naar de les gaan. Je kan een mail sturen naar een collega of naar je docent. Je kan ook naar het secretariaat bellen.

Transcriptie:

Tekstuele databestanden 1 Tekstuele databestanden Maarten Marx Universiteit van Amsterdam 2 December 2009

Tekstuele databestanden 2 Wie ben ik? Politicoloog en informaticus. Specialismes: Kennisrepresentatie, XML, zoektechnologie. Samenwerking met Stemwijzer, KiesKompas, Koninklijke Bibliotheek, DANS.

Tekstuele databestanden 3 Wat doe ik? Intelligente Informatie Ontsluiting

Tekstuele databestanden 4 Onderwerp van vandaag Digitale ontsluiting van enorme tekstuele databestanden, zodat ze beschikbaar zijn voor grootschalige machinale kwantitatieve data en inhouds analyse, gedaan door alpha en gamma wetenschappers.

Tekstuele databestanden 5 Inhoud Voorbeeld van zo n databestand Aantal toepassingen daarop Knelpunten Boodschap

Tekstuele databestanden 6 Longitudinale data wekelijkse meting sinds meer dan 150 jaar vrijwel onveranderde meetprocedure en datamodel

Tekstuele databestanden 7 Data over menselijk gedrag

Tekstuele databestanden 8 Vaak wat saai

Tekstuele databestanden 9 Maar vaak ook vol drama, spanning en sensatie

Tekstuele databestanden 10 Heel veel meetpunten 24.000 dagen, 450.000 onderwerpen, 7.5 miljoen spreekbeurten

Tekstuele databestanden 11 Digitaal beschikbaar

Tekstuele databestanden 12 De Handelingen der Staten Generaal

Tekstuele databestanden 13 Gegevens over de collectie zeer beperkte metadata maar uitgebreide metadata zit verborgen in de data zelf Rijk datamodel Vergadering (1 Dag) Onderwerp Blok Spreekbeurt

Tekstuele databestanden 14 Wat kan je hier nou mee?

Tekstuele databestanden 15 Toepassing 1: Interruptiegraaf Lid A interrumpeert B A spreekt tijdens het blok van B.

Tekstuele databestanden 16 Toepassing 2: Trends van Frames Proefschrift Rens Vliegenthart (2007)

Tekstuele databestanden 17 Fijnmaziger beeld We weten van elk woord wanneer het gezegd is, door wie, en in welke hoedanigheid. Scala aan toepassingsmogelijkheden.

Tekstuele databestanden 18 Toepassing 3: Populistisch taalgebruik in de Kamer Proefschrift Jan Jagers (2006).

Tekstuele databestanden 19 Toepassing 4: Zoeken naar politici We kunnen van elke politicus automatisch een profiel opstellen, op basis van uitspraken in de kamer, ingediende moties en kamervragen. Dan kunnen we politici koppelen aan onderwerpen.

Tekstuele databestanden 20 Toepassing 5: Glazen Plafond in de Kamer? Er zit nu een recordaantal van meer dan 40% vrouwen in de Tweede Kamer. Zijn zij ook evenredig veel aan het woord? Vervolgvragen: Verschilt dit per onderwerp? Verschilt de vrouw(on)vriendelijkheid per partij? Hoe zat het vroeger? Mooi onderwerp voor een bachelorscriptie.

Tekstuele databestanden 21 Makkelijk toch? Conceptueel helder. Duidelijke operationalisatie. Heel eenvoudig te programmeren (niet veel meer dan woordjes tellen) Maar...

Tekstuele databestanden 22 Tussen woord en daad staan... data niet bewerkbaar (want in PDF), niet in één formaat, niet op één plek, niet verbonden met andere bronnen, niet...

Tekstuele databestanden 22 Tussen woord en daad staan... data niet bewerkbaar (want in PDF), niet in één formaat, niet op één plek, niet verbonden met andere bronnen, niet... dat is allemaal op te lossen, maar...

Tekstuele databestanden 22 Tussen woord en daad staan... data niet bewerkbaar (want in PDF), niet in één formaat, niet op één plek, niet verbonden met andere bronnen, niet... dat is allemaal op te lossen, maar... de probleemhouders hebben de kennis vaak niet om met tekst-data om te gaan. Geef studenten een vak Tekstanalyse door computers.

Tekstuele databestanden 23 Boodschap 1. Tekst wordt dé data van de toekomst. 2. Een goed ontsloten tekst-bestand bevat ruwe én bewerkte data inéén. 3. Tekst databestanden zijn nóóit af, inherent dynamisch en longitudinaal. 4. Academische wereld moet oppassen om de boot niet te missen [Computational Social Science, Science, 2009].

Tekstuele databestanden 24 Bedankt maartenmarx@uva.nl