Text Mining/Linked Data



Vergelijkbare documenten
Tekstuele databestanden

Entry Point Retrieval

Political Mashup Kickoff Meeting

Informatiekunde 1. Informatiekunde. Een greep uit het werk van mijn studenten. Maarten Marx. 10 Jaar Informatie Wetenschappen

De theorie voor leesvaardigheid in de vorm van een stappenplan

De voorzitter van de Tweede Kamer der Staten-Generaal Postbus EA DEN HAAG

Dit boek heeft het keurmerk Makkelijk Lezen gekregen. Wilt u meer weten over dit keurmerk kijk dan op de website:

Polderen voor beginners

Cloud Computing. Cloud Computing. Welkom allemaal hier op het science park.

TMLO: PRAKTISCHE TOEPASSING

Cultuur & Media Werkgroep 1 Introductie

De presentatie: basisprincipes

CHATTEN. verborgen verdriet MARIAN HOEFNAGEL

Bijlage interview meisje

Geneeskunde studiejaar Matchingsvragenlijst MATCHING

Gebruikersdag 2007

Bijlage 6 Achtergrondkenmerken van Tweede en Eerste Kamerleden en het gebruik van parlementaire instrumenten

Debat: regionaal en nationaal

STAPPENPLAN PERMISSIES INSTELLEN OP PROJECTEN

Lekker in je vel in 7 stappen. Life Balance

Handleiding PicMonkey

Evaluatie groepsinteracties door ervaringsdeskundigen stichting Waarheid bij JCC den Haag De kracht zit in de mensen én de methode!

Examen HAVO. Nederlands Nederlands. tijdvak 1 maandag 18 mei uur. Bij dit examen hoort een bijlage

Geoportaal Overijssel

User Centred Development! UCD Werkcollege blok 1 week 6!

(VIDEO) Review ZEEF Wat is ZEEF en wat kan je hiermee?

Vragenlijst: Wat vind jij van je

Inhoud. Mentale Training & Begeleiding. Mythes & misvattingen. Mentale training. Doel. Elke training is mentale training

Handleiding &

3 Hoogbegaafdheid op school

Roy Fijma Project 13 Friesland College Leeuwarden

Veelgestelde vragen over de nieuwe fototool

DE NIEUWE WEBSITE VAN DE GEMEENTERAAD VAN PURMEREND RAAD.PURMEREND.NL

Zelfreflectie meetinstrument Ondernemende houding studenten Z&W

WELKOM. Walter Groenen. Anneke van der Vaart. Directeur CJP. Account manager CJP

Exact Online BUSINESS CASE MET EXACT ONLINE MEER FOCUS OP ACCOUNTMANAGEMENT EN ADVISERING. De 5 tips van Marc Vosse.

De onderwerpen die voor deze avond zijn aangedragen! Maskers maken. Workflow Lightroom en Photoshop. Verschil tussen werken in RGB en srgb

maatschappijwetenschappen havo 2015-II

CMS Made Simple voor gevorderden

De ijnmanager. Cartoons februari Luc Timmers

Hoe activiteitenfiches en BC s (lesvoorbereidingen) meenemen van de ene school naar de andere?

VinniePlace helpdesk.vinnieplace.nl

Studiedag VREG 26 november

Wat een mediakit is. Waarom je een mediakit nodig hebt. Hoe je een mediakit gebruikt. Hoe je een mediakit ontwerpt

Examen HAVO. Nederlands. tijdvak 1 maandag 19 mei uur. Bij dit examen hoort een bijlage.

HANDLEIDING. Handleiding Parlementaire Informatie

Via het tabblad, kun je afdrukinstellingen aangeven:

v.1.11 Verenigingenweb handleiding Genkgo koppeling: Exact Online

SUBSITE BEHEREN. 1. Verticale navigatie maken

Uitleg boekverslag en boekreclame

Stappenplan. Ontwikkelingsgericht Praktijkbeoordelen.nl Praktijkopleider/BPV-beoordelaar. DOSSIERCREBO : Alle KWALIFICATIE : Alle CREBONUMMER :

Les 2: Voorspellen Tekst: Veilig in het verkeer. Introductiefase: 2. Vraag: "Kan iemand zich nog herinneren wat de bedoeling was bij het voorspellen?

BSc Kunstmatige Intelligentie. : Bachelor Kunstmatige Intelligentie Studiejaar, Semester, Periode : semester 1, periode 2

Daarom geef ik vanaf vandaag geen huiswerk meer mee om extra tijd vrij te maken om te oefenen. Wat kan in deze voorbereidingsperiode geoefend worden?

Speech Voorzitter bij het afscheid van Jan de Wit op 1 april 2014

Nieuwe klanten werven in 2014

CV en motivatiebrief. 1. Kop Curriculum Vitae, eventueel je naam

V Vergadering van de Eerste Kamer op dinsdag 5 maart Toespraak van de Voorzitter van de Eerste Kamer, Mr. G.J. de Graaf

Examen VWO. Nederlands. tijdvak 1 maandag 19 mei uur. Bij dit examen hoort een bijlage.

Deel 2: Endnote bibliografische software gebruiken als databasemanager en editor

Leerpaden maken. 1. Account en wachtwoord. 2. Maak een nieuw leerpad aan. 3. Inhoud aan een leerpad toe voegen. 4. Structuur aanbrengen op een pagina.

RIE Vragenlijst Editor

Afstudeerrichting Scheppende Muziek specialisatie Muziekproductie. Voornaam en Naam : Leeftijd:. Woonachtig te (gemeente of stad):.

Opgave Taalkunde-Olympiade 2009: TIGRINYA

Effect van Planetree op kwaliteit en tevredenheid, wetenschappelijk aangetoond?

Voorzitter, Er is al heel veel gezegd. Dat gaat de VVD niet doen.

Handleiding W-schijf Medewerkers

Webinar: Wat is Social Media Monitoring?

In groep 8 gaan we een aantal dingen door het jaar heen doen, namelijk het maken van een:

1. Ga naar de bibliotheek. 2. Kies twee of drie boeken uit over jouw onderwerp. 3. Denk je ook aan de junior-informatieboekjes?

Handleiding Dashboard. Pensioenfonds Vervoer

Matchingsvragenlijst. Geneeskunde. studiejaar MATCHING

Hand-out Methodiek Lookalike

Stadsarchief Zo vroeg mogelijk in het proces

De examenperiode is een moeilijke tijd. Je moet hard studeren en je hebt veel stress. Wat is een goede studiemethode en wat doe je beter niet?

Advies aan de stuurgroep CJG & Gemeente Assen

Oefenvragen Management Assistent A - Communicatie

Handboek Politiek. Derde Kamer der Staten-Generaal

Geleerde lessen van zes pilotprojecten Eindrapport Regie in de Cloud -project werkpakket 3

Durf jij Afrika te ontdekken?

Welke kansen bieden internet en sociale media (niet)?

Om met Symbaloo te werken, moet u zich aanmelden bij de website van Symbaloo.

Dossieropdracht 3. Analyse 1 - Didactiek

2. Syntaxis en semantiek

10 onderdelen die niet mogen ontbreken in een online briefing

Transcriptie:

Text Mining/Linked Data 1 Text Mining/Linked Data Maarten Marx Universiteit van Amsterdam Den Haag 2010-02-09

Text Mining/Linked Data 2 Doel van project 1. impliciete verbanden in Kamerstukken expliciet maken 2. laten zien wat je daar dan mee kan. Relatie met Topic Maps: niet meer document gericht werken, maar vanuit personen, dossiers, en onderwerpen.

Text Mining/Linked Data 3 De handelingen... wekelijkse meting sinds meer dan 150 jaar vrijwel onveranderde meetprocedure en datamodel

Text Mining/Linked Data 4 Data over menselijk gedrag

Text Mining/Linked Data 5 Vaak wat saai

Text Mining/Linked Data 6 Maar vaak ook vol drama, spanning en sensatie

Text Mining/Linked Data 7 Heel veel meetpunten 24.000 dagen, 450.000 onderwerpen, 7.5 miljoen spreekbeurten

Text Mining/Linked Data 8 Digitaal beschikbaar

Text Mining/Linked Data 9 De Handelingen der Staten Generaal

Text Mining/Linked Data 10 Gegevens over de collectie zeer beperkte metadata maar uitgebreide metadata zit verborgen in de data zelf Rijk datamodel Vergadering (1 Dag) Onderwerp Blok Spreekbeurt

Text Mining/Linked Data 11 Wat kan je hier nou mee?

Text Mining/Linked Data 12 Koppeling Handelingen aan personen Wie is er aan het woord? Wat wordt precies door wie gezegd?

Text Mining/Linked Data 13 Toepassingen Samenvatting van een betoog van één spreker Verbind sprekers met hun biografie Een ouder voorbeeld (Voorzitter, link naar dossiers) Biopagina met parlementaire activiteiten Dynamisch en altijd up to date.

Text Mining/Linked Data 14 Een echt goed beeld van de kamerleden Als we van elk kamerlid weten wat zij zegt, vraagt, indient,..., dan kunnen we een heel nauwkeurig profiel van haar maken.

Text Mining/Linked Data 14 Een echt goed beeld van de kamerleden Als we van elk kamerlid weten wat zij zegt, vraagt, indient,..., dan kunnen we een heel nauwkeurig profiel van haar maken. en op basis daarvan heel gericht en nauwkeurig zoeken.

Text Mining/Linked Data 15 Op 2 manieren zoeken naar het juiste kamerlid Vergelijk zoeken naar kamerleden over islam op basis van een geschreven en statische biografie, en een dynamische bio inclusief alle parlementaire activiteiten

Text Mining/Linked Data 16 Toepassing 1: Interruptiegraaf Lid A interrumpeert B A spreekt tijdens het blok van B.

Text Mining/Linked Data 17 Toepassing 2: Trends van Frames Proefschrift Rens Vliegenthart (2007)

Text Mining/Linked Data 18 Fijnmaziger beeld We weten van elk woord wanneer het gezegd is, door wie, en in welke hoedanigheid. Scala aan toepassingsmogelijkheden.

Text Mining/Linked Data 19 Toepassing 3: Populistisch taalgebruik in de Kamer Proefschrift Jan Jagers (2006).

Text Mining/Linked Data 20 Toepassing 4: Zoeken naar politici We kunnen van elke politicus automatisch een profiel opstellen, op basis van uitspraken in de kamer, ingediende moties en kamervragen. Dan kunnen we politici koppelen aan onderwerpen.

Text Mining/Linked Data 21 Toepassing 5: Glazen Plafond in de Kamer? Er zit nu een recordaantal van meer dan 40% vrouwen in de Tweede Kamer. Zijn zij ook evenredig veel aan het woord? Vervolgvragen: Verschilt dit per onderwerp? Verschilt de vrouw(on)vriendelijkheid per partij? Hoe zat het vroeger? Mooi onderwerp voor een bachelorscriptie.

Text Mining/Linked Data 22 Makkelijk toch? Conceptueel helder. Duidelijke operationalisatie. Heel eenvoudig te programmeren (niet veel meer dan woordjes tellen) Maar...

Text Mining/Linked Data 23 Tussen woord en daad staan... data niet bewerkbaar (want in PDF), niet in één formaat, niet op één plek, niet verbonden met andere bronnen, niet...

Text Mining/Linked Data 23 Tussen woord en daad staan... data niet bewerkbaar (want in PDF), niet in één formaat, niet op één plek, niet verbonden met andere bronnen, niet... dat is allemaal op te lossen, maar...

Text Mining/Linked Data 23 Tussen woord en daad staan... data niet bewerkbaar (want in PDF), niet in één formaat, niet op één plek, niet verbonden met andere bronnen, niet... dat is allemaal op te lossen, maar... de probleemhouders hebben de kennis vaak niet om met tekst-data om te gaan. Geef studenten een vak Tekstanalyse door computers.

Text Mining/Linked Data 24 Boodschap 1. Tekst wordt dé data van de toekomst. 2. Een goed ontsloten tekst-bestand bevat ruwe én bewerkte data inéén. 3. Tekst databestanden zijn nóóit af, inherent dynamisch en longitudinaal. 4. Academische wereld moet oppassen om de boot niet te missen [Computational Social Science, Science, 2009].

Text Mining/Linked Data 25 Bedankt maartenmarx@uva.nl