SHICO: SHIFTING CONCEPTS OVER TIME

Vergelijkbare documenten
KPMG PROVADA University 5 juni 2018

SAMPLE 11 = + 11 = + + Exploring Combinations of Ten + + = = + + = + = = + = = 11. Step Up. Step Ahead

Firewall van de Speedtouch 789wl volledig uitschakelen?

Wilco te Winkel, Liesbeth Mantel Erasmus University Rotterdam,NL

LDA Topic Modeling. Informa5ekunde als hulpwetenschap. 9 maart 2015

Interaction Design for the Semantic Web

Online Resource 1. Title: Implementing the flipped classroom: An exploration of study behaviour and student performance

3HUIRUPDQFH0HDVXUHPHQW RI'\QDPLFDOO\&RPSLOHG -DYD([HFXWLRQV

GernEdiT The GermaNet Editing Tool

From Padua to Groningen

Data Handling Ron van Lammeren - Wageningen UR

Introductie in flowcharts

01/ M-Way. cables

LONDEN MET 21 GEVARIEERDE STADSWANDELINGEN 480 PAGINAS WAARDEVOLE INFORMATIE RUIM 300 FOTOS KAARTEN EN PLATTEGRONDEN

Over dit boek. Richtlijnen voor gebruik

Usage guidelines. About Google Book Search

UNECE/UNESCAP Workshop on. Electronic Trade Documents. Ulaanbaatar, Mongolia, October 2009

Competencies atlas. Self service instrument to support jobsearch. Naam auteur

Global TV Canada s Pulse 2011

Fidelity of a Strengths-based method for Homeless Youth

Het beheren van mijn Tungsten Network Portal account NL 1 Manage my Tungsten Network Portal account EN 14

NMOZTMKUDLVDKECVLKBVESBKHWIDKPDF-WWUS Page File Size 9,952 KB 29 May, 2016

Add the standing fingers to get the tens and multiply the closed fingers to get the units.

Het Effect van Verschil in Sociale Invloed van Ouders en Vrienden op het Alcoholgebruik van Adolescenten.

Interaction Design for the Semantic Web

CORPORATE BRANDING AND SOCIAL MEDIA: KEY FINDINGS FOR DUTCH CONSUMERS Theo Araujo

Esther Lee-Varisco Matt Zhang

PLANNING FOR ES WITH NATURE VALUE EXPLORER

COGNITIEVE DISSONANTIE EN ROKERS COGNITIVE DISSONANCE AND SMOKERS

Summary 124

Innovative SUMP-Process in Northeast-Brabant

Chapter 4 Understanding Families. In this chapter, you will learn

My Inspiration I got my inspiration from a lamp that I already had made 2 years ago. The lamp is the you can see on the right.

RECEPTEERKUNDE: PRODUCTZORG EN BEREIDING VAN GENEESMIDDELEN (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

De Relatie tussen Voorschoolse Vorming en de Ontwikkeling van. Kinderen

Engels op Niveau A2 Workshops Woordkennis 1

0515 DUTCH (FOREIGN LANGUAGE)

What issues should the Province of Limburg address when developing its climate-proof policy?

ALGORITMIEK: answers exercise class 7

Introduction Henk Schwietert

Travel Survey Questionnaires

0515 FOREIGN LANGUAGE DUTCH

Vergaderen in het Engels

Eye Feature Detection Towards Automatic Strabismus Screening

Innovatieve interactieve communicatiemiddelen in internationaal watermanagement

Topic 10-5 Meeting Children s Intellectual Needs

Find Neighbor Polygons in a Layer

CREATING VALUE THROUGH AN INNOVATIVE HRM DESIGN CONFERENCE 20 NOVEMBER 2012 DE ORGANISATIE VAN DE HRM AFDELING IN WOELIGE TIJDEN

Programmaoverzicht Bachelor Open dag

ANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK EN BEHANDELING (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

Laatst bijgewerkt op 2 februari 2009 Nederlandse samenvatting door TIER op 25 mei 2011

De ondernemende psychotherapeut (Dutch Edition)

Wij beloven je te motiveren en verbinden met andere studenten op de fiets, om zo leuk en veilig te fietsen. Benoit Dubois

WORKSHOP : COMPTENCES FOR THE SUSTAINABLE DEVELOPMENT GOALS ( SDGs )

Designing climate proof urban districts

Publishing WWII aerial photographs within geographical & library information systems

Ik kom er soms tijdens de les achter dat ik mijn schoolspullen niet bij mij heb of niet compleet

Value based healthcare door een quality improvement bril

NETWORK CHARTER. #ResourceEfficiency

Concept of Feedback. P.S. Gandhi Mechanical Engineering IIT Bombay

FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 25/2/2016. Biocide CLOSED CIRCUIT

SLACHTOFFER CYBERPESTEN, COPING, GEZONDHEIDSKLACHTEN, DEPRESSIE. Cyberpesten: de implicaties voor gezondheid en welbevinden van slachtoffers en het

(1) De hoofdfunctie van ons gezelschap is het aanbieden van onderwijs. (2) Ons gezelschap is er om kunsteducatie te verbeteren

Understanding and being understood begins with speaking Dutch

Luister alsjeblieft naar een opname als je de vragen beantwoordt of speel de stukken zelf!

Ontwerpen van een variabele belasting om te meten aan zonnepanelen

Profile visitors NRC Q

Ons vak in beweging. Dr. Hans Hobbelen, Lector healthy Lifestyle, Ageing and Health Care

Basic operations Implementation options

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

Zo werkt het in de apotheek (Basiswerk AG) (Dutch Edition)

What to include in an array report?

Europa: Uitdagingen? Prof. Hylke Vandenbussche Departement Economie- International Trade 26 April 2018 Leuven

The first line of the input contains an integer $t \in \mathbb{n}$. This is followed by $t$ lines of text. This text consists of:

Academisch schrijven Inleiding

The role of local municipalities and labor market regions in adult education: monitoring quality

een kopie van je paspoort, een kopie van je diploma voortgezet onderwijs (hoogst genoten opleiding), twee pasfoto s, naam op de achterkant

More speed. Less stress.

Question-Driven Sentence Fusion is a Well-Defined Task. But the Real Issue is: Does it matter?

Scott J. Peters, Ph.D. University of Wisconsin Whitewater IAGC Handouts:

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

CBSOData Documentation

General info on using shopping carts with Ingenico epayments

Ius Commune Training Programme Amsterdam Masterclass 16 June 2016

Graphic Design. Keuzevak GD1. Raul Martinez-Orozco / raul@thecombine.nl)

B1 Woordkennis: Spelling

Handleiding Zuludesk Parent

Besluitenlijst CCvD HACCP/ List of decisions National Board of Experts HACCP

Invloed van het aantal kinderen op de seksdrive en relatievoorkeur

Chess board distance $\max( x_0-x_1, y_0-y_1 )$

Ius Commune Training Programme Amsterdam Masterclass 15 June 2018

Feedback WG System Operations 21 November 2012

Y.S. Lubbers en W. Witvoet

Heropnamen? Aan de slag!

Tilburg University. Technieken van kwalitatief onderzoek 1 Verhallen, T.M.M.; Vogel, H. Published in: Tijdschrift voor Marketing

MyDHL+ Van Non-Corporate naar Corporate

Programma Open dag Tilburg University Zaterdag 8 oktober 2016 Toelichting en overzicht

Intercultural Mediation through the Internet Hans Verrept Intercultural mediation and policy support unit

Opgave 2 Geef een korte uitleg van elk van de volgende concepten: De Yield-to-Maturity of a coupon bond.

Transcriptie:

SHICO: SHIFTING CONCEPTS OVER TIME Tracing Concepts in Dutch Newspaper Discourse using Sequential Word Vector Spaces Melvin Wevers Translantis Project Digital Humanities Approaches to Reference Cultures: The Emergence of the United States in Dutch Public Discourse 1890-1990

SHICO: SHIFTING CONCEPTS OVER TIME The emergence and transformation of concepts, ideas, and thoughts How can we study concepts in large digitized corpora? What words are used to discuss particular concepts? How do these words relate to each other? Can we trace the historical development of concepts? How to map the genealogy of a concept within a digitized corpus?

EXISTING METHODS Use of predefined list of words (N-gram viewers / Full-text search) Top-down approaches (NER, word classification lists/sentiment analysis) make use pre-established models that are often a-historic Topic modeling is useful but quite static and abstract

OUR APPROACH Data: >600.000 digitized newspaper issues from the Dutch National Library Multi-dimensional wordvector space using Google s word2vec (neural language model) Semantic and syntactic information representation by geometry (Baroni & Kruszweksi, 2014; Wijaya & Yeniterzi, 2011) 1950 1960 1970 1 model = 10 years 40 models for period between 1950-1990

TRACING CONCEPTS One or more words as entry-points into concept vocabulary at time t Concept is a network of words Find closely related words to seed word based on distance Weighting based on frequency + sum distance Tracing concepts: which words remain and disappear from network See: Kenter, Wevers, Huijnen, de Rijke (2015) Ad Hoc Monitoring of Vocabulary Shifts over Time prune t = t + 1 expand to semantic graph with semantic space for time t+1

Non-adaptive Model Adaptive Model

RAW OUTPUT >>> tc.trackword(dmodels, 'buitenlanders') 1950_1959: vreemdelingen (0.76), nederlanders (0.69), indonesiërs (0.65), toeristen (0.62), europeanen (0.61), vacantiegangers (0.58), mensen (0.57), vakantiegangers (0.56), duitsers (0.54), dagjesmensen (0.54) 1951_1960: vreemdelingen (0.76), nederlanders (0.74), toeristen (0.64), indonesiërs (0.64), europeanen (0.64), bezoekers (0.59), immigranten (0.58), duitsers (0.57), mensen (0.57), kampeerders (0.57) 1952_1961: vreemdelingen (0.74), toeristen (0.69), nederlanders (0.68), indonesiërs (0.61), dagjesmensen (0.61), bezoekers (0.61), kampeerders (0.60), europeanen (0.59), vakantiegangers (0.59), duitsers (0.57) 1953_1962: vreemdelingen (0.74), toeristen (0.70), bezoekers (0.64), nederlanders (0.63), vacantiegangers (0.62), kampeerders (0.59), vakantiegangers (0.59), dagjesmensen (0.57), mensen (0.57), automobilisten (0.55) 1954_1963: toeristen (0.69), vreemdelingen (0.68), nederlanders (0.66), bezoekers (0.62), vakantiegangers (0.60), kampeerders (0.59), vacantiegangers (0.58), immigranten (0.56), jongelui (0.55), jongeren (0.55) 1955_1964: toeristen (0.70), vreemdelingen (0.70), nederlanders (0.64), vakantiegangers (0.64), bezoekers (0.63), kampeerders (0.63), vacantiegangers (0.59), mensen (0.59), dagjesmensen (0.56), jongelui (0.55) 1956_1965: vreemdelingen (0.71), toeristen (0.70), vakantiegangers (0.64), kampeerders (0.63), nederlanders (0.62), bezoekers (0.62), mensen (0.61), duitsers (0.57), vacantiegangers (0.56), gezinnen (0.56) 1957_1966: vreemdelingen (0.68), toeristen (0.68), nederlanders (0.63), kampeerders (0.62), vakantiegangers (0.60), mensen (0.59), bezoekers (0.58), duitsers (0.57), sportvissers (0.56), vacantiegangers (0.55) 1958_1967: toeristen (0.71), vreemdelingen (0.71), nederlanders (0.68), vakantiegangers (0.64), kampeerders (0.63), bezoekers (0.60), marokkanen (0.59), duitsers (0.58), dagjesmensen (0.58), mensen (0.57) 1959_1968: toeristen (0.69), nederlanders (0.68), vreemdelingen (0.66), kampeerders (0.62), bezoekers (0.61), vacantiegangers (0.61), vakantiegangers (0.58), sportvissers (0.58), hotelgasten (0.57), mensen (0.57) 1960_1969: toeristen (0.72), vreemdelingen (0.70), nederlanders (0.68), kampeerders (0.61), vakantiegangers (0.61), zakenmensen (0.59), marokkanen (0.59), mensen (0.59), zakenlieden (0.58), bezoekers (0.58) 1961_1970: vreemdelingen (0.71), toeristen (0.68), nederlanders (0.65), kampeerders (0.63), vakantiegangers (0.62), reizigers (0.61), marokkanen (0.59), bezoekers (0.59), vacantiegangers (0.59), mensen (0.58) 1962_1971: vreemdelingen (0.71), nederlanders (0.68), toeristen (0.67), kampeerders (0.63), indonesiërs (0.59), vakantiegangers (0.59), dagjesmensen (0.59), marokkanen (0.58), sportvissers (0.57), vakantiegasten (0.57) 1963_1972: vreemdelingen (0.72), nederlanders (0.71), toeristen (0.68), indonesiërs (0.62), kampeerders (0.61), mensen (0.58), gezinnen (0.58), scandinaviërs (0.58), turken (0.57), duitsers (0.57) 1964_1973: nederlanders (0.69), vreemdelingen (0.67), toeristen (0.66), surinamers (0.62), indonesiërs (0.62), marokkanen (0.61), sportvissers (0.60), turken (0.59), mensen (0.58), antillianen (0.57) 1965_1974: nederlanders (0.73), vreemdelingen (0.71), toeristen (0.64), marokkanen (0.62), turken (0.60), kampeerders (0.59), indonesiërs (0.59), surinamers (0.59), spanjaarden (0.57), duitsers (0.56) 1966_1975: nederlanders (0.70), vreemdelingen (0.69), toeristen (0.68), indonesiërs (0.64), prostituées (0.61), marokkanen (0.60), gezinnen (0.59), mensen (0.59), surinamers (0.58), kampeerders (0.58) 1967_1976: nederlanders (0.71), toeristen (0.65), indonesiërs (0.63), vreemdelingen (0.63), chilenen (0.57), surinamers (0.57), kampeerders (0.57), gezinnen (0.57), duitsers (0.56), jongelui (0.55) 1968_1977: nederlanders (0.72), vreemdelingen (0.68), toeristen (0.64), vakantiegangers (0.62), kampeerders (0.62), indonesiërs (0.59), duitsers (0.59), loeristen (0.58), mensen (0.58), tunesiërs (0.58) 1969_1978: nederlanders (0.73), vreemdelingen (0.72), toeristen (0.66), surinamers (0.63), indonesiërs (0.61), tunesiërs (0.59), guyanezen (0.58), gezinnen (0.58), chilenen (0.58),

INTEGRATION

Mentally disturbed > adaptive model Discourse moves to more euphemistic terms

IDEAS Find better ways to conceptualize networks of words as concepts Ways to detect change in concepts? Backbone extraction?? How to improve visualization of conceptual change???

Thanks to: Carlos Martinez-Ortiz (escience Research Engineer) Pim Huijnen (Cultural History, University of Utrecht) Tom Kenter (Information and Language Processing Systems, University of Amsterdam) https://github.com/c-martinez/shico/ blob/explanations/docs/howitworks.md