Een multi dimensioneel perspectief op writing fluency

Vergelijkbare documenten
Hypertekst schrijven en observerend leren als aanvullende didactiek 1

Het schrijvershoofd ontbloot. Schrijfprocessen.

Slechtnieuwsbrieven als genre: leren via observaties van experts

3.1 Itemanalyse De resultaten worden eerst op itemniveau bekeken. De volgende drie aspecten dienen bekeken te worden:

Onderzoek naar schrijfproceskenmerken bij MCI- en Alzheimerpatiënten

Schrijfsucces van vmbo-leerlingen: verschillen in aanpak en tekstkwaliteit

Hoe schrijven masterstudenten syntheseteksten? Het brongebruik van gevorderde schrijvers in kaart gebracht.

Schrijfprocessen in de eerste en twee taal. Een onderzoek middels Inputlog naar het schrijfproces in twee talen aan de hand van pauze en actie tijden

9. Lineaire Regressie en Correlatie

Hoofdstuk 2: Kritisch reflecteren 2.1. Kritisch reflecteren: definitie Definitie: Kritisch reflecteren verwijst naar een geheel van activiteiten die

Autobiografisch geheugen in longitudinaal perspectief

Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

1. Reductie van error variantie en dus verhogen van power op F-test

Samenvatting. A. van Leeuwenhoeklaan MA Bilthoven Postbus BA Bilthoven KvK Utrecht T

Monte Carlo-analyses waarschijnlijkheids- en nauwkeurigheidsberekeningen van

Formulier voor het beoordelen van de kwaliteit van een systematische review. Behorend bij: Evidence-based logopedie, hoofdstuk 2

Wetenschappelijk Instituut Volksgezondheid. Verwerking van gecensureerde waarden

Rapport voor deelnemers M²P burgerpanel

Onderzoek Verplaatsingsgedrag Vlaanderen 4.3 ( )

EMPO voor Ouders en Jongeren versie 2.0

Hoe goed of slecht beleeft men de EOT-regeling? Hoe evolueert deze beleving in de eerste 30 maanden?

beoordelingskader zorgvraagzwaarte

Salarissen en competenties van MBO-BOL gediplomeerden: Feiten en cijfers

Onderzoek naar de impact van participatie, rollen en doelen in asynchrone discussiegroepen

13.6. Onderzoeksresultaten: Betekenis voor verander- en

Het belangrijkste doel van de studie in hoofdstuk 3 was om onafhankelijke effecten van visuele preview en spellinguitspraak op het leren spellen van

Samenvatting Zoeken naar en leren begrijpen van speciale woorden Herkenning en de interpretatie van metaforen door schoolkinderen

nederlandse samenvatting Dutch summary

1.1 Achtergrond. 1.2 Doelstelling van het onderzoek

Plannen en schrijven met een elektronische outline-tool

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

PDF hosted at the Radboud Repository of the Radboud University Nijmegen

Werkbelevingsonderzoek 2013

Een onderzoek naar visuele en verbale denkvoorkeuren en vaardigheden bij leerlingen van groep 6 en 7

De vrouwen hebben dan ook een grotere kans op werkloosheid (0,39) dan de mannen uit de onderzoekspopulatie (0,29).

Statistiek ( ) eindtentamen

How Do Children Read Words? A Focus on Reading Processes M. van den Boer

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

9 Gebruik van wetenschappelijke kennis

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

HOOFDSTUK VII REGRESSIE ANALYSE

ANALYSE PATIËNTERVARINGEN ELZ HAAKSBERGEN

Gezondheidsverwachting volgens socio-economische gradiënt in België Samenvatting. Samenvatting

Tabel 69: Verdeling van het gavpppd volgens geslacht en hoofdvervoerswijze. meerdere verplaatsingen heeft gemaakt.

Wat maakt WizeNote uniek?

Gegevensverwerving en verwerking

FOCUS : TOEKENNINGSDUUR

SCHOOLFEEDBACKRAPPORT ONDERZOEK WELBEVINDEN Bevraging van de leerlingen van het lager onderwijs

DATA-ANALYSEPLAN (20/6/2005)

Professionaliseringstraject onderzoeksvaardigheden voor docenten. prof. dr. Saskia Brand-Gruwel

In het voorgaande artikel werd aangegeven hoe de vaste verdeling van cijfers in getallen, zoals deze voortvloeit

Nederlandse Samenvatting

OVERZICHT VAN TOETSVORMEN

Mondgezondheidsrapport

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

4orange Connect. 4orange, Hogehilweg CD Amsterdam Zuidoost

PROCES OBSERVATIE-INSTRUMENT / BETROUWBAARHEID VAN HET INSTRUMENT

but no statistically significant differences

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur

Cover Page. The handle holds various files of this Leiden University dissertation.

Rapportage cliëntervaringsonderzoek WMO Gemeente Aalburg

Dossier Opdracht 2. Statistiek - Didactiek

Invloed van IT uitbesteding op bedrijfsvoering & IT aansluiting

Samenwerking en innovatie in het MKB in Europa en Nederland Een exploratie op basis van het European Company Survey

Operationaliseren van variabelen (abstracte begrippen)

Beoordelingsformulier eindproduct of verslag

Kwaliteitssysteem datamanagement. Meetbaar Beter

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

FACTS & FIGURES Bibliotheekbezoek Franne Mullens

INHOUDSTAFEL INHOUDSTAFEL... 1 LIJST VAN TABELLEN EN FIGUREN... 2

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Factsheet: De beleving van een vroege eerste geslachtsgemeenschap

Berekeningen in Kwaliteitscholen

Kwaliteitssysteem datamanagement. Meetbaar Beter

Seksuele inhibitie en excitatie: een verkennende studie van factoren die samenhangen met variatie in excitatie en inhibitie

Met factoranalyse worden heel veel variabelen ingekort tot een aantal variabelen.

Examenprogramma wiskunde D vwo

hoofdstuk 3 Hoofdstuk 4 Hoofdstuk 5

Educatief Startbekwaam (STRT) - B2

Hoofdstuk 17: Grafieken en diagrammen: waarom

Gezondheidsenquête, België Inleiding. Wetenschap ten dienste van Volksgezondheid, Voedselveiligheid en Leefmilieu.

Kun je met statistiek werkelijk alles bewijzen?

TOETSTIP 9 SEPTEMBER 2005

Organisatieprestatiescan. Deze techniek wordt gebruikt in de focus- en analysefase bij het analyseren van de huidige situatie.

1. Introductie tot SPSS

Voorbeeld bij het Excel-werkboek Analyse klantkenmerken

5. Discussie. 5.1 Informatieve waarde van de basisgegevens

G0N11C Statistiek & data-analyse Project tweede zittijd

WISKUNDIGE TAALVAARDIGHEDEN

3 Werkwijze Voordat een CQI meetinstrument mag worden ingezet voor reguliere metingen moet het meetinstrument in twee fases getest worden.

De invloed van docentenprofessionalisering op het leren van studenten. Ann Stes Sven De Maeyer David Gijbels Peter Van Petegem

Fish Based Assessment Method for the Ecological Status of European Rivers (FAME)

WISKUNDE D VWO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

Samenvatting Dutch summary

Uitwisseling tussen teamleden in sociale teams cruciaal voor prestatie

Capita Selecta Recent Arbeidsmarktonderzoek in Vlaanderen

Programma. Schaalconstructie. IRT: moeilijkheidsparameter. Intro: Het model achter het LOVS Mogelijkheden die het model biedt voor interpretatie

A c. Dutch Summary 257

Beschrijvende statistiek

Transcriptie:

Vlot schrijven Een multi dimensioneel perspectief op writing fluency Luuk Van Waes en Mariëlle Leijten 1 Inleiding Samenvatting Iedereen kent het fenomeen: de ene De ene tekst komt maar moeilijk en met veel zwoegen tekst krijg je makkelijk op papier gezet, de andere tekst komt maar moei- gezet. Maar, wat betekent vlot schrijven (writing tot stand, de andere tekst krijg je makkelijk op papier lijk en met veel zwoegen tot stand. fluency) nu eigenlijk precies? In dit artikel benaderen Vlot schrijven is in een vreemde we writing fluency vanuit verschillende perspectieven taal ook meestal moeilijker dan in en proberen we om zo een samengestelde maat op te je moedertaal. Maar, wat betekent bouwen om dit concept genuanceerd te beschrijven. vlot schrijven (writing fluency) nu We geven eerst een kort overzicht van de verschillende eigenlijk precies. Betekent het dat je maten die in verwante studies gebruikt zijn om fluency erin slaagt een tekst van 500 woorden sneller te schrijven dan iemand onderzoek vullen we vervolgens de bestaande fluency- te beschrijven. Op basis van een quasi-experimenteel anders? Je meer lettertekens typt op maten verder aan. In dit onderzoek schreven 68 korte tijd? Je een hele tijd kan typen proefpersonen een korte beschrijvende tekst, zowel zonder al te lange pauzes? Je tekst in hun moedertaal als in een vreemde taal (EFRniveau B2). De proces- en productdata werden via produceert zonder dat je die achteraf nog ingrijpend moet aanpassen? toetsregistratie verzameld (Inputlog). Onderzoek naar schrijfvlotheid We definieerden een zo breed mogelijke set of fluency en de ontwikkeling van afhankelijke variabelen die allemaal als indicator voor taalvaardigheid staat al vele jaren op vlotheid kunnen worden gebruikt. Via respectievelijk de agenda van taalbeheersers. In het correlatie-analyses en een PCA konden we die spraak- en leesonderzoek is dit ondertussen een goed ingevuld con- vier onderliggende componenten: (1) productie, (2) set reduceren en onderscheiden we uiteindelijk cept (zie bijvoorbeeld Bosker et al., procesvariantie, (3) revisie, en (4) pauzegedrag. In een 2013; Skehan, 2003, 2009). In het aanvullende case-studie - waarbij de klemtoon op het schrijfonderzoek daarentegen zijn de gebruik van (digitale) bronnen lag - tonen we aan dat definities nog steeds vrij ééndimensioneel en oppervlakkig (voor een belangrijke indicator voor fluency kan zijn. Samen ook een vijfde component, nl. (5) bronfragmentatie, een recente review: Abdel Latif, 2012). In creëren die vijf componenten een multi-dimensioneel dit artikel willen we een aanzet geven om fluency vanuit een multidi- en genuanceerd perspectief op fluency. mensioneel perspectief te benaderen om zo tot een meer genuanceerde - en hopelijk ook meer bruikbare - invulling te komen. 160 Tijdschrift voor Taalbeheersing - 35 (2013), nr. 2, 160-182

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency Voor alle duidelijkheid, als we het in deze bijdrage over fluency hebben, verwijzen we niet naar de stilistische vlotheid van een tekst (leesbaarheid), maar wel naar de vlotheid die de tekstproductie kenmerkt. In tegenstelling tot bij gesproken taal heeft schriftelijke productievlotheid geen directe invloed op de tekstperceptie van de lezer. Als een spreker moeilijk uit zijn woorden komt en lange pauzes laat vallen, zal dit ongetwijfeld een effect hebben op de ontvanger van de boodschap. Bij een geschreven tekst ligt dit totaal anders. De uiteindelijke tekst verraadt immers (nauwelijks) het onderliggende pauzegedrag. Het verband tussen fluency en tekstkwaliteit is dan ook van een heel andere aard in schriftelijke communicatie (zie bijvoorbeeld Snellings, Van Gelderen, & De Glopper, 2002). In deze bijdrage schetsen we kort hoe fluency tot nu toe onderzocht is in schrijfonderzoek. Daarna gaan we in op een quasi-experimenteel onderzoek waarbij volwassen schrijvers een kort tekstje schreven in hun moedertaal (L1) en in een vreemde taal (L2). De nadruk in de resultaatsanalyse ligt niet op de verschillen in de tekstproductie tussen twee talen, maar wel op de verkenning van maten die relevant zijn om fluency te bepalen. Daarbij richten we ons om te beginnen op de traditionele maten. Daarna exploreren we ook een aantal nieuwe maten die bijvoorbeeld het procesverloop en de persoonlijke kenmerken van de schrijver representeren. In een eerste fase bouwen we dus zo veel mogelijk invalshoeken op; in een tweede fase reduceren we het aantal variabelen via correlatie-analyse en gaan we in een Principal Component Analyse (PCA) op zoek naar de onderliggende componenten. Op die manier proberen we tot een beheersbaar aantal fluency-maten en componenten te komen die samen een genuanceerd beeld ophangen van fluency. In de schrijftaak in het eerste onderzoek konden de schrijvers geen gebruik maken van externe bronnen. De praktijk toont echter aan dat hedendaagse schrijfprocessen meer en meer gekenmerkt worden door een constante interactie met (digitale) bronnen omdat ze meestal slechts een muisklik verwijderd zijn. Daarom sluiten we de bijdrage af met een tweede onderzoekje waarbij schrijvers die een tweet c.q. e-mail schrijven wel bronnen konden raadplegen. Hoe die interactie de fluency beïnvloedt, staat centraal in de bespreking van dit tweede onderzoek. 2 Fluency in schrijfonderzoek In schrijfonderzoek is fluency onderzocht vanuit verschillende domeinen: o.m. de ontwikkeling van schriftelijke vaardigheden (Berninger et al., 1994; McCutchen et al., 1994); schrijfmodi, o.a. handschrift vs. computer (Connelly et al., 2012; Olive et al., 2009; Shanahan, 2006); moedertaal vs. vreemde taal (Chenoweth & Hayes, 2001b; Kormos, 2012; Latif, 2009; Lindgren, Sullivan, & Spelman Miller, 2008; Ong & Zhang, 2010). In deze studies vergelijken de onderzoekers twee groepen (bijvoorbeeld 10-jarigen vs. 14-jarigen), schrijftaken (bijvoorbeeld narratief vs. argumentatief) of schrijfmodi (handschrift vs. computer). De meest gebruikte maat bij die vergelijking is: aantal woorden per minuut (in de eindtekst). De ontwikkeling van toetsregistratie als observatie-instrument in het schrijfonderzoek heeft er echter voor gezorgd dat er gaandeweg nieuwe maten ontwikkeld werden. Bij de ontwikkeling van nieuwe maten is er in de eerste plaats ook voortgebouwd op inzichten uit het spraakonderzoek. Skehan (2003) onderscheidt bijvoorbeeld de volgende vier componenten in fluency van gesproken taaluitingen: 161

Luuk Van Waes en Mariëlle Leijten (1) stiltes; (2) herstellingen: herformuleringen, valse starts, herhalingen etc.; (3) spreektempo: woorden of lettergrepen per minuut; (4) bursts: lengte van ononderbroken tekstproductie tussen twee (significante) pauzes. Vertaald naar schrijfonderzoek wordt nu algemeen aangenomen dat vlotte schrijfprocessen gekenmerkt worden door kortere pauzetijden, minder revisies op een laag niveau en een hoge tekstproductie, m.a.w. de tekst komt vlot en met weinig aarzelingen tot stand (MacArthur, Graham, & Fitzgerald, 2008). Vooral die laatste factor komt vaak voor als indicator voor fluency in schrijfonderzoek. De invloed van planning en/of taakcomplexiteit stonden daarbij meestal centraal. Een van de eerste voorbeelden daarvan is het onderzoek van Kellogg (1996, 2004). Hij toonde aan dat initiële planning ertoe kan leiden dat de cognitieve belasting tijdens de tekstproductie daalt, en dat dit de fluency ten goede kan komen. In dit onderzoek hanteerde hij twee maten van fluency: Fluency I refereert aan het gemiddeld aantal woorden in de transcriptiefase (d.w.z. totale taaktijd min initiële planningstijd); Fluency II werd berekend op basis van de totale taaktijd. Het thema inspireerde heel wat vervolgonderzoek en ook de fluency-maten werden overgenomen (o.a. De La Paz & Graham, 2002; Edmonds, 2003; Graham & Perin, 2007; Snellings et al., 2002). Uit hun onderzoek blijkt dat de tweede maat meestal resulteerde in scherpere en beter interpreteerbare verschillen. Ook het burst -concept van Skehan werd overgezet van het spraak- naar het schrijfonderzoek. Chenoweth en Hayes (2001b, 2003; 2006) introduceerden bursts in een vergelijkende studie van L1-L2. Ze toonden onder meer aan dat burstlengte fundamenteel gekoppeld is aan fluency en dat de lengte een indicator vormt voor de cognitieve capaciteit om complexe taalstructuren te verwerken: de lengte van pauze- en revisiebursts daalt significant als (jonge) schrijvers niet in hun moedertaal, maar in een vreemde taal (L2) schrijven. Chenoweth en Hayes hanteerden in hun onderzoek de veelgebruikte pauzedrempel van 2 seconden (Sullivan & Lindgren, 2006). Recent onderzoek toont echter aan dat hoewel de meeste motorische activiteiten slechts minder dan 200 ms vergen, dat er tussen 200 en 2000 ms ook wel degelijk belangrijke cognitieve tekstbeslissingen genomen worden (Grabowski, 2008; Wengelin, 2006). Bovendien bleek ook dat het wenselijk is om rekening te houden met inter- en intrapersoonlijke variatie in pauzetijden om tot een meer genuanceerde benadering van fluency te komen (Kormos, 2012; Van Waes & Leijten, 2011; Van Waes et al., 2012; Wengelin, 2006). In dit onderzoek zullen we daarom verschillende pauzedrempels opnemen en ook persoonsgebonden maten verwerken in onze analyse. In dit artikel willen we fluency in schrijfprocessen technisch benaderen. We beschrijven in de eerste plaats een zo ruim mogelijk aantal variabelen die kenmerkend kunnen zijn voor fluency. Daarbij maken we gebruik van traditionele en nieuwe inzichten in schrijfprocesonderzoek, gekoppeld aan de nieuwe mogelijkheden die toetsregistratieprogramma s ons bieden. Vervolgens gebruiken we correlatie-analyses en PCA om tot een veelzijdige - maar ook eenvoudig toepasbare - benadering van fluency te komen in schriftelijke tekstproductie. 162

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency 3 Fluency revisited Om een brede waaier van indicatoren te kunnen definiëren voor fluency, hebben we een quasi-experimenteel onderzoek opgezet waarin twee korte descriptieve teksten geproduceerd werden in L1 en L2. De verzamelde data werden zowel product- als procesgeoriënteerd geanalyseerd. 3.1 Deelnemers Aan de studie namen 84 personen deel: studenten van de masteropleiding Meertalige Professionele Communicatie. Het experiment vond plaats in de context van de cursus Communicatie-onderzoek. De deelnemers die we selecteerden, hadden Nederlands als hun moedertaal (L1) en een L2-beheersing op B2/C1-niveau (CEFR, common European Framework of Reference for languages). De groep bestond uit 67 vrouwen en 17 mannen; met een gemiddelde leeftijd van 22.5 jaar (SD=1.52). Na een technische selectie (zie Data-analyse), hielden we 68 deelnemers over. 3.2 Schrijftaak Elke deelnemer schreef twee teksten. We kozen voor een heel eenvoudige descriptieve taak (knowledge telling) om zo een situatie te creëren waarin de schrijvers - zonder al te veel cognitieve belasting - vlot een tekst zouden kunnen schrijven (Bereiter & Scardamalia, 1987). Door de beperkte complexiteit van de taak zijn verschillen in taakuitvoering immers directer toe te wijzen aan de taalfactor (Ong & Zhang, 2010). De deelnemers kregen de opdracht om een korte beschrijving van twee recente gebeurtenissen te geven: beschrijf je laatste vakantie en beschrijf het voorbije weekend. Deze algemene opdracht werd aangevuld met een aantal hulpvragen: waar ben je naartoe geweest? ; met wie? ; wat heb je gedaan?. 3.3 Design en procedure De data werden in drie sessies verzameld in een computerklas met telkens ongeveer 30 studenten. De studenten kregen een korte mondelinge toelichting bij de opdracht en een schriftelijke instructie voor de twee schrijftaken (op aparte bladen). De taakvolgorde en de taal van de taken werden zorgvuldig gevarieerd over de deelnemers in een latin-squaredesign. De deelnemers kregen eerst even de tijd om de taakomschrijving door te nemen en de opdracht mentaal voor te bereiden (2 minuten). De schrijftaak zelf diende afgerond te worden in 8 minuten (met een tijdsindicatie 2 minuten voor het einde). De tijdsanalyse toonde aan dat er tussen de taaktijd in beide talen geen verschillen waren (L1: 7m46s (29s) vs. L2: 7m50s (28s); F(1,67)=0.91, p=.343). Er was dus geen verschil in de tijd die de deelnemers nodig hadden om de twee taken uit te voeren. Tussen de twee schrijftaken voerden ze een afleidingstaak uit (i.c. een visuele schattingstaak: www.wiskundemeisjes.nl/20081006/test-je-gevoel-voor-aantallen/). Bij de afsluiting van het onderzoek vulden de studenten een korte survey in die peilde naar hun typevaardigheid en hun bevindingen bij de twee taken. Die werd onder meer gebruikt om bepaalde deelnemers uit de dataset te verwijderen: op basis van gerapporteerde leerstoornissen, gebrekkige vertrouwdheid met het Belgische azerty-toetsenbord, of een andere taal dan het Nederlands als moedertaal. 163

Luuk Van Waes en Mariëlle Leijten 3.4 Data-analyse De procesdata voor dit onderzoek werden verzameld met Inputlog (versie 5.0 - www.inputlog.net gratis downloadbaar voor onderzoekers; Leijten & Van Waes, 2006, 2013). Inputlog is een toetsregistratieprogramma dat tijdens de tekstproductie elke toetsaanslag en muisactiviteit registreert, en ook de tijd (in ms) opslaat van elk van die acties. De resulterende logfiles kunnen dan met het programma geanalyseerd worden om zo een gedetailleerd beeld te krijgen van het verloop van het schrijfproces (Leijten, 2007; Leijten & Van Waes, 2006). Inputlog biedt standaard een aantal analyses aan. In het kader van dit onderzoek hebben we vooral gebruikgemaakt van de algemene, de samenvattende en de pauzeanalyse (cf. General, Summary, and Pause logging file). Deze analyses werden uitgevoerd met verschillende pauzedrempels en intervallengtes. In een eerste stap werd de technische kwaliteit en de bruikbaarheid van de data gecontroleerd (in combinatie met de surveycriteria, cf. supra). Op basis van volledigheid en eventueel gediagnosticeerde problemen werd de totale dataset herleid tot 136 logfiles (68 per taak). Daarna werden de data gefilterd (via pre-processing) om zo de begin- en eindpauzes te verwijderen en de procesanalyse te beperken tot de effectieve tekstproductie van het eerste tot het laatste letterteken (c.q. revisie). Die data dienden als input voor de volgende analyses (zie www.inputlog.net voor een meer gedetailleerde beschrijving): General analysis: meta-informatie over het experiment, alle toetsaanslagen, muisacties, tijden (ms), pauze- en actietijden, x/y-coördinaten van muiskliks etc. (zie voorbeeld in Tabel 1: elke regel representeert een toetsaanslag of muisactie. In dit voorbeeld: Zaterdagavond van ben ik ). Summary analysis: Samenvattend overzicht van o.a. totale procestijd, actieve schrijftijd vs. pauzetijd, product-procesratio, aantal en lengte van de pauze-bursts. Voor dit onderzoek hanteerden we de volgende pauzedrempels: 0, 200, 500, 1000, 2000 en 5000 milliseconden. D.w.z. dat enkel pauzes boven die respectieve drempels als effectieve pauzes geïnterpreteerd worden. Linear analysis: lineaire representatie van alle acties in het schrijfproces. Pause analysis: samenvattende analyse van het pauzegedrag op basis van de pauzelocatie (vb. binnen of tussen woorden) en het verloop van het schrijfproces (vb. intervallen). Ook deze werd op de verschillende pauzedrempels toegepast. Vervolgens werden de data uit de samenvattende en de pauze-analyses samengevoegd (via postprocessing in Inputlog, optie horizontal merging ). Ook de algemene (general) logbestanden (zie Tabel 1) werden samengebracht om aanvullende data-analyses semi-automatisch via formules in Excel te genereren (bijvoorbeeld: gegenereerde lettertekens per interval; inserties en deleties). 164

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency Tabel 1. Voorbeeld output general logging file (fragment van 5 sec) #Id Event Output Position Doclength Start- Time Start- Clock End- Time End- Clock Ac- tion- Time Pause- Time 238 keyboard Z 212 212 60435 0:01:00 60498 0:01:00 63 125 7 239 keyboard a 213 213 60810 0:01:00 60888 0:01:00 78 375 1 240 keyboard t 214 214 60950 0:01:00 61012 0:01:01 62 140 1 241 keyboard e 215 215 61122 0:01:01 61184 0:01:01 62 172 1 242 keyboard r 216 216 61231 0:01:01 61278 0:01:01 47 109 1 243 keyboard d 217 217 61371 0:01:01 61449 0:01:01 78 140 1 244 keyboard a 218 218 61496 0:01:01 61574 0:01:01 78 125 1 245 keyboard g 219 219 61636 0:01:01 61699 0:01:01 63 140 1 246 keyboard a 220 220 62042 0:01:02 62089 0:01:02 47 406 1 247 keyboard v 221 221 62229 0:01:02 62292 0:01:02 63 187 1 248 keyboard o 222 222 62479 0:01:02 62526 0:01:02 47 250 1 249 keyboard n 223 223 62713 0:01:02 62775 0:01:02 62 234 1 250 keyboard d 224 224 62962 0:01:02 63072 0:01:03 110 249 1 251 keyboard SPACE 225 225 63087 0:01:03 63150 0:01:03 63 125 2 252 keyboard v 226 226 63243 0:01:03 63321 0:01:03 78 156 3 253 keyboard a 227 227 63430 0:01:03 63493 0:01:03 63 187 1 254 keyboard n 228 228 63571 0:01:03 63618 0:01:03 47 141 1 255 keyboard BACK 229 229 63867 0:01:03 63945 0:01:03 78 296 1 256 keyboard BACK 228 228 64023 0:01:04 64101 0:01:04 78 156 7 257 keyboard BACK 227 227 64444 0:01:04 64538 0:01:04 94 421 7 258 keyboard b 226 226 64866 0:01:04 64912 0:01:04 46 422 7 259 keyboard e 227 227 64990 0:01:04 65053 0:01:05 63 124 1 260 keyboard n 228 228 65115 0:01:05 65224 0:01:05 109 125 1 261 keyboard SPACE 229 229 65193 0:01:05 65271 0:01:05 78 78 2 262 keyboard i 230 230 65677 0:01:05 65739 0:01:05 62 484 3 263 keyboard k 231 231 65864 0:01:05 65958 0:01:05 94 187 1 Pause- Location Ten slotte werden al deze analyses op persoonsniveau in SPSS ingelezen. Verschillen tussen L1 en L2 werden berekend met een General Linear Models variantietoetsing (repeated measures; binnen-proefpersoondesign). Daarnaast maakten we gebruik van correlatie-analyses (Pearson) en Principal Component Analysis (PCA). Omdat die laatste analyse centraal staat in dit onderzoek, lichten we die even verder toe. 3.5 Principal Component Analyse (PCA) Het hoofddoel van deze studie was te achterhalen welke onderliggende structuur er terug te vinden is in een set van variabelen die als indicator kunnen gelden voor fluency. Een Principal Component Analyse (PCA) is daar een geschikt hulpmiddel voor (Field, 2009). We maakten daarbij gebruik van de algemeen 165

Luuk Van Waes en Mariëlle Leijten geldende criteria (Field, 2009). Bij de start van de analyse werden alle variabelen naar logwaarden geconverteerd. In een eerste stap was het belangrijk om de grote verzameling variabelen tot een bruikbare en hanteerbare set te herleiden. Dit is om twee redenen belangrijk. Ten eerste willen we een benadering voorstellen die enerzijds zo omvattend mogelijk is, maar tegelijkertijd ook relatief eenvoudig toepasbaar is voor onderzoekers. Daarnaast zijn er ook technische beperkingen waarmee we rekening moeten houden. Een veel gebruikte vuistregel bij PCA is dat de verhouding personen vs. items bij voorkeur de ratio 10:1 niet overstijgt; een ratio 5:1 wordt als een minimum beschouwd (Hatcher, 1994; Nunnally, 1978)0. Een eerste logische stap in de variabelenreductie was dat we enkel die variabelen selecteerden die generaliseerbaar zijn over verschillende schrijfprocessen (dus niet de absolute lengte van het schrijfproces bijvoorbeeld omdat een dergelijke variabele niet bruikbaar is om processen met een verschillende lengte met elkaar te vergelijken). Bijgevolg hielden we enkel variabelen over die verwijzen naar proporties, ratio s of gemiddelden. Op basis van dit criterium konden we een 50-tal variabelen selecteren voor de verdere procedure. Vervolgens hebben we in een tweede stap de correlatie tussen die variabelen onderzocht. Daarvoor verdeelden we de variabelenset in acht subcategorieën (zie Tabel 4), enerzijds gebaseerd op maten uit meer productgerelateerde fluency-onderzoek en anderzijds op maten uit meer procesgeoriënteerd onderzoek (Chenoweth & Hayes, 2001a). Bij subgroepjes van variabelen die hoger dan.9 met elkaar correleerden, hebben we telkens één representatieve variabele geselecteerd. Representativiteit hebben we bepaald op basis van de volgende kenmerken: meest uitgesproken correlatie met de andere variabelen in het subgroepje, aanwezigheid in vroegere studies en zo eenvoudig mogelijk te genereren in de data analyse. Dit resulteerde in een basisset van 13 variabelen die we als input gebruikten voor de PCA-analyse. Tot slot werden ook variabelen uit de PCA verwijderd die een communaliteit hadden van minder dan.5 en die niet of minimaal bijdragen aan een van de componenten. Daarbij hanteerden we als criterium van minimale componentenlading.6 of hoger en een cross-lading van.4 of lager met andere componenten (Tabachnick & Fidell, 2013). 4 Resultaten In dit deel bespreken we eerst enkele product- en procesresultaten vanuit een contrastief L1-L2-perspectief. De resultaten zelf staan daarbij echter niet centraal. Wel willen we op die manier exploratief en systematisch relevante fluency-indicatoren opbouwen. Daarna illustreren we een aantal kenmerken van een gefaseerd procesverloop en gaan we in op het belang van persoonskenmerken. In het laatste deel behandelen we de analyse die leidt tot een multidimensionele karakterisering van fluency. 4.1 Traditionele fluency-maten Verscheidene studies hebben aangetoond dat een schrijver in zijn moedertaal L1 vlotter tekst produceert dan in L2 (Lindgren et al., 2008; Ong & Zhang, 2010; Segalowitz, 2010). Dat is zeker niet verbazingwekkend. De vraag is echter welke variabelen het beste helpen om die verschillen in vlotheid te beschrijven. Daarover is veel minder eensgezindheid. In deze paragraaf illustreren we de traditionele fluency-benadering aan de hand van enkele voorbeelden uit het onderzoek. Tabel 2 geeft een overzicht van de basisvariabelen vanuit 166

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency een klassieke productbenadering aangevuld met een procesbenadering op letterteken- en woordniveau. De resultaten van de variantie-analyse tonen aan dat de L1 en L2 schrijfprocessen vanuit het product- en procesperspectief zowel apart als in combinatie significant verschillend zijn (o.a. ratio waarbij we het aantal lettertekens dat geproduceerd wordt tijdens het proces delen door het aantal lettertekens in het uiteindelijke product). De waarden voor de effectgrootte tonen bovendien aan dat de verschillen het meest uitgesproken zijn op lettertekenniveau (excl. spaties). Op woordniveau zien we een verschil van ongeveer 14%; op lettertekenniveau blijkt men in L1 meer dan 20-25% productiever te zijn dan in L2. De vergelijking van de ratio s tonen ook aan dat er relatief iets meer gereviseerd wordt in L2 dan in L1. Tabel 2. Vergelijking voor basis product- en procesmaten tussen L1 en L2 L1 L2 gem. SD gem. SD F p 2 η p Product woorden per minuut 31.5 10.1 27.5 9.6 22.90.000.255 lettertekens per minuut (excl. spaties) 148.6 44.8 118.2 39.6 73.94.000.525 lettertekens per minuut (incl. spaties) 180.0 54.7 145.7 49.0 63.03.000.485 Proces woorden per minuut 34.5 10.0 30.2 9.7 27.14.000.288 lettertekens per minuut (excl. spaties) 190.4 49.4 156.7 44.4 68.25.000.505 lettertekens per minuut (incl. spaties) 225.5 59.1 187.7 53.6 61.16.000.477 Ratio product/proces woorden (%) 79.56 9.80 77.39 10.95 5.09.027.071 lettertekens (excl. spaties; %) 77.88 10.31 75.32 11.55 6.51.013.089 lettertekens (incl. spaties; %) 79.56 9.79 77.38 10.95 5.09.027.071 De pauze-analyse vormt een aanvullende benadering om het schrijfproces te karakteriseren. De pauzes werden gedefinieerd op een aantal niveaus: o.a. aantal, gemiddelde lengte, pauzelocatie, pauzedrempels (tussen 200 ms en 5000 ms), en P-bursts (tekstproductie tussen twee significante pauzes). Tabel 3 illustreert die benadering voor de gekozen drempelwaarden. 167

Tabel 3. Vergelijking voor pauzegedrag tussen L1 en L2 Luuk Van Waes en Mariëlle Leijten Aantal pauzes per minuut L1 L2 gem. SD gem. SD F p η p 2 > 200 ms 60.4 15.6 68.1 14.8 31.06 0.000 0.327 > 500 ms 17.9 3.9 20.8 4.5 58.43 0.000 0.477 > 1000 ms 6.8 1.8 7.9 2.1 24.29 0.000 0.275 > 2000 ms 2.8 1.0 3.3 1.3 18.62 0.000 0.225 Gemiddelde lengte pauzes binnen woorden (s) > 200 ms 0.375 0.060 0.396 0.068 12.79 0.001 0.167 > 500 ms 0.894 0.188 0.926 0.172 2.33 0.132 0.035 > 1000 ms 1.709 0.708 1.752 0.545 0.42 0.518 0.007 > 2000 ms 2.079 1.830 2.428 1.610 2.52 0.117 0.038 Gemiddelde lengte pauzes tussen woorden (s) > 200 ms 0.643 0.170 0.681 0.198 4.53 0.041 0.064 > 500 ms 1.299 0.311 1.372 0.357 3.06 0.085 0.046 > 1000 ms 2.105 0.490 2.316 0.636 6.25 0.015 0.089 > 2000 ms 3.320 0.755 3.595 1.162 3.40 0.070 0.050 Gemiddelde lengte pauzes tussen zinnen (s) > 200 ms 1.292 0.801 1.421 1.046 1.01 0.318 0.016 > 500 ms 2.284 1.459 2.489 1.716 0.91 0.343 0.014 > 1000 ms 3.112 2.429 3.446 2.281 0.81 0.372 0.012 > 2000 ms 4.223 4.294 4.342 3.084 0.05 0.828 0.001 Gemiddelde lengte P-Bursts (s) > 2000 ms 80.0 60.8 55.1 39.1 24.74 0.000 0.270 > 5000 ms 284.0 236.1 231.9 220.7 4.54 0.037 0.063 In Tabel 3 zien we onder meer dat het aantal pauzes per minuut significant afneemt als de proefpersonen een tekst in hun moedertaal schrijven. Het betreft een daling van ruim 10% die zichtbaar is op de verschillende pauzedrempels. Vooral het aantal korte pauzes neemt af. De analyse van de pauzelengte op de verschillende pauzelocaties toont een gevarieerder beeld. Zo blijkt dat vooral de pauzes binnen en tussen woorden significant afwijken, en meer bepaald als we een kleine pauzedrempel (< 200 ms) hanteren. Op zinsniveau zien we geen verschillen meer. Dat wijst erop dat in een tweede taal vooral de lagere cognitieve processen - bijvoorbeeld gericht op lexicaliteit en spelling - meer aandacht opeisen. Voor de complexe- 168

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency re cognitieve activiteiten zoals planning en (structurele) revisie - die meestal samenhangen met pauzes langer dan 1 of 2 seconden - zijn er veel minder significante verschillen waar te nemen tussen L1 en L2. Een vergelijkbaar beeld vinden we terug in de P-Burst-analyse. Bij een lagere pauzedrempel daalt de hoeveelheid tekst tussen pauzes met ruim 40 % als we L1 en L2 vergelijken (L1: gem. 80.0 (60.8) vs. L2: 55.1 (39.1); F(1,67)=24.74; p<.01). Dit wijst op een sterker gefragmenteerde tekstproductie in L2; tekst wordt in kleinere vloeiende eenheden geproduceerd. Tot slot tonen we in Figuur 1 het aandeel van de pauzetijd (t.o.v. de actieve schrijftijd) op basis van verschillende pauzedrempels. Als we de pauzedrempel verhogen, daalt uiteraard het aandeel van de pauzetijd. Op elk niveau zijn de verschillen tussen L1 en L2 significant. Figuur 1. Aandeel van de pauzetijd t.o.v. de actieve schrijftijd berekend met verschillende pauzedrempels. 4.2 Variabiliteit van het procesverloop Tot nu toe is fluency in hoge mate gedefinieerd als een algemene maat die betrekking heeft op een schrijfproces of -product in zijn geheel. Via dit onderzoek willen we echter ook het belang aantonen van de aard en de variabiliteit van het schrijfproces. De fluency-maten die we hierboven toelichtten, worden immers niet gekenmerkt door een constant verloop. Op verschillende momenten in het proces kan de fluency immers variëren (Leijten, Van Waes, & Janssen, 2010; Van den Bergh & Rijlaarsdam, 1996; Van Weijen et al., 2009). Naast de variantie in het schrijfproces is het volgens ons ook belangrijk om de persoonlijke typevaardigheid in ogenschouw te nemen. De eerste nieuwe benadering van fluency illustreren we in Figuur 2. Het schrijfproces is opgedeeld in tien gelijke procesintervallen en per interval berekenen we de productie (aantal lettertekens inclusief spaties) in L1 en L2. 169

Luuk Van Waes en Mariëlle Leijten Het aantal lettertekens hebben we vervolgens proportioneel afgezet t.o.v. een zogenaamd theoretisch optimum dat we voor dit onderzoek hebben vastgelegd op 400 lettertekens per minuut 1. We gaan er dus vanuit dat die score in theorie de maximale lettertekenproductie is die iemand in een tekstproces - gedurende één minuut - kan bereiken. Of, in een formule: Op die manier krijgen we per interval een percentage t.o.v. dat optimum en kunnen we op een vergelijkbare schaal de variabiliteit gedurende het schrijfproces weergeven. Figuur 2. Proportionele distributie per interval van het aantal lettertekens t.o.v. het theoretisch optimum in L1 en L2. (Opmerking: De stippellijn toont de polynomiale trendlijn voor beide groepen.) In Figuur 2 zien we dat het proportioneel aantal lettertekens per interval in L1 gemiddeld hoger is dan in L2. Er is een hoofdeffect van taal (L1: 40.4 (1.2) vs. L2: 38.8 (1.2); F(1,67)= 7.54; p<.01; η p 2 =.101). Daarnaast is er ook hoofdeffect van interval of tijdsverloop (F(9,59)= 47.86; p<.01; η p 2 =.880). Als we de verschillen per interval toetsen, stellen we echter vast dat in het middendeel van het schrijfproces (interval 4, 5 en 7) er geen significant verschil is in vlotheid tussen L1 en L2 (resp. p =.086,.319, en.431). Dit wijst erop dat er in die fases in beide talen een vergelijkbare taalproductie plaatsvindt en de fluency dus niet afwijkt tijdens die (midden)intervallen. 170

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency In deze fluencybenadering - waarbij we de vlotheid relateren aan een theoretisch optimum - ontbreekt echter nog een belangrijke factor. We houden namelijk geen rekening met specifieke persoonskenmerken die de schrijf- en typevaardigheid kenmerken. Recent onderzoek bijvoorbeeld laat zien dat motorische pauzedrempels sterke individuele verschillen vertonen (Leijten, De Maeyer, & Van Waes, 2011; Sullivan & Lindgren, 2006; Van Weijen et al., 2009; Wengelin, 2006). Om gedeeltelijk hieraan tegemoet te komen, hebben we gezocht naar een manier om een persoonlijk optimum van tekstproductie te bepalen, geënt op een specifieke schrijfopdracht (i.c. Nederlandse descriptieve schrijftaak). Voor deze tweede benadering verdelen we het schrijfproces weer in tien gelijke intervallen. Voor elk interval bepalen we het aantal geproduceerde lettertekens (incl. spaties) en herleiden dit tot het aantal lettertekens per minuut. We zetten dit nu echter niet af tegen een theoretisch optimum, maar wel tegen een persoonlijk optimum, individueel bepaald voor elke schrijver. Dit optimum is berekend op basis van een drievoudig voortschrijdend gemiddelde toegepast op de schrijfproductie van periodes van 10 seconden. Op deze manier kunnen we bepalen wat de maximale tekstproductie is in een specifiek schrijfproces voor een bepaalde persoon gedurende een halve minuut. Het resultaat van die berekening, herleid tot een minuut, zetten we ten slotte af tegen de tekstproductie per interval. Die score laat de proportie zien tussen de effectieve tekstproductie in een bepaald interval t.o.v. de persoonlijke maximale tekstproductie voor die specifieke tekst. Figuur 3 toont de tekstproductie in relatie tot het persoonlijke optimum 2. Figuur 3. Proportionele distributie per interval van het aantal lettertekens t.o.v. het persoonlijk optimum in L1 en L2. 171

Luuk Van Waes en Mariëlle Leijten Figuur 3 laat zien dat in begin van de schrijftaak in L1, de schrijvers gemiddeld een tekstproductie realiseren die bijna 80 tot 90% bedraagt van hun persoonlijk optimum 3. In L2 bedraagt de gemiddelde tekstproductie slechts 60 tot 70% in de eerste intervallen. Daarna neemt de tekstproductie geleidelijk af. Hoewel we ook hier een hoofdeffect van de taal vinden (L1: 64.3 (1.3) vs. L2: 52.7 (1.2); F(1,67)= 69.7; p<.01; η p 2 =.510) en van interval (L1: 64.3 (1.3) vs. L2: 52.7 (1.2); F(1,67)= 69.7; p<.01; η p 2 =.510), stellen we hier ook weer vast dat in de middenfase van het schrijfproces dit effect soms verdwijnt. In interval 5 en 7 blijkt de fluency in L1 en L2 niet significant te verschillen (resp. p =.319 en p =.431). Om de derde benadering van fluency-variantie te visualiseren, zetten we in Figuur 4 het gemiddelde percentage van de intervallen per persoon (x-as) af tegen de individuele standaardafwijking (y-as). Figuur 4. Vergelijking van gemiddeld persoonlijk optimum en standaardafwijking in L1 en L2. In Figuur 4 zien we dat de gemiddelde tekstproductie daalt van 62% van het persoonlijke optimum (L1) tot 54% (L2). De standaardafwijking daalt van 23.9 naar 19.6. De spreiding is dus groter bij L1 wat wijst op een grotere individuele variantie in het verloop van het schrijfproces in de moedertaal. 4.3 Opbouw van de fluency-maten De exploratie, zoals we die in de vorige twee paragrafen hebben beschreven, leverde een aantal invalshoeken op, die we systematisch op verschillende 172

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency niveaus met elkaar gecombineerd hebben. Die combinatie (Tabel 4) leverde een vrij volledige en gebalanceerde set van variabelen op. Deze variabelen hebben we gebruikt als input voor de verdere analyse. We zetten de invalshoeken systematisch op een rijtje en lichten ze bondig toe. Tabel 4. Invalshoeken voor het bepalen van de fluency-variabelen Invalshoek Toelichting 1. Product Lengte van de eindtekst in woorden en lettertekens (incl. en excl. spaties). 2. Proces Lengte van het proces in milliseconden, geproduceerde woorden en lettertekens (incl. en excl. spaties). 3. Ratio product/proces Procentuele verhouding tussen product- en proceskenmerken. 4. Pauzelengte De gemiddelde lengte van een pauze (d.w.z. de tijd in ms tussen de start van een actie en de start van een daaropvolgende actie). 5. Aantal pauzes Het aantal pauzes (totaal en herberekend per minuut). P-burst Een P-burst wordt afgebakend door pauzes die langer zijn dan de gehanteerde pauzedrempel. De lengte van een P-burst is gebaseerd op het aantal geproduceerde lettertekens tussen twee pauzes. Pauzelocatie Plaats van de pauze: binnen woorden, tussen woorden en tussen zinnen. Pauzedrempel Minimumdrempel die als filter gebruikt wordt om een pauze te bepalen: i.c. 200, 500, 1000, 2000 en 5000 milliseconden. De kleinere pauzedrempels richten zich meer expliciet op lagere cognitieve processen; de hogere op meer complexe cognitieve activiteiten. Motorische transities (<200 ms) worden hier altijd buiten beschouwing gelaten. Aanvullend hebben we ook een pauze-interval gedefinieerd van resp. 200 tot 500 ms en 200 tot 1000 ms. 6. Revisies Aantal inserties en deleties in het schrijfproces (per minuut). R-burst Een R-burst wordt afgebakend door twee revisies. We tellen het aantal R- bursts per minuut en de gemiddelde lengte ervan (op basis van het aantal geproduceerde lettertekens). 7. Intervalspreiding Verdeling van elk schrijfproces in 10 gelijke intervallen om proportionele vergelijking van schrijfprocessen met een verschillende lengte mogelijk te maken. Hierbij staat het procesverloop centraal. Daarom nemen we ook expliciet de standaardafwijking mee als variabele om zo de variantie tijdens het proces in kaart te brengen. Hoe lager de standaardafwijking hoe gelijkmatiger het procesverloop. 8. Theoretisch optimum Procesverloop per interval proportioneel afgezet tegenover een theoretisch optimum, vastgelegd op 400 lettertekens per minuut (zie sectie 4.2). Persoonlijk optimum Procesverloop per interval proportioneel afgezet tegenover een persoonlijk optimum, bepaald op basis van de fase in het schrijfproces waarin een bepaalde persoon het meeste lettertekens geproduceerd heeft (zie sectie 4.2). 4.4 Analyse Voor de reductie en classificatie van de variabelen volgden we de procedure zoals we die beschreven in de methodologische sectie. De analyse werd toegepast op de L1- data om van daaruit het referentiepunt op te bouwen. De stapsgewijze procedure zorgde ervoor dat we uiteindelijk 10 basisvariabelen konden selecteren als input voor de PCA. De Kaiser-Meyer-Oklin (KMO) waarde die de toereikendheid van de steekproef bepaalt, bedroeg voor de basisvariabelen.627, wat hoger is dan de aanbevolen ondergrens van.600. De Bartlett s Test of sphericity toonde een significante waarde (Χ 2 (45)= 709.39, p<.001), wat 173

Luuk Van Waes en Mariëlle Leijten erop wijst dat er voldoende communaliteit is in de geselecteerde variabelen om een PCA uit te voeren. Wel dient opgemerkt te worden dat door de beperkte omvang van de steekproef (68 proefpersonen) de resultaten met enige voorzichtigheid benaderd dienen te worden. In het domein van schrijfprocesonderzoek zijn grotere aantallen hoogst ongebruikelijk, maar voor een PCA is een analyse pas optimaal interpreteerbaar met een sample size vanaf 200 à 300 (Hatcher, 1994). De PCA toonde de aanwezigheid van vier componenten. Die vier componenten samen verklaren 92.1% van de totale variantie (voor rotatie). De visuele interpretatie van de screeplot bevestigt deze vier componenten en toont een duidelijk breekpunt na de vierde stap. Op basis van deze gegevens kozen we voor een oplossing met vier componenten die respectievelijk 45.3%, 20.1%, 16.2, en 10.5% van de totale cumulatieve variantie verklaarden. Om de vier componenten te interpreteren, pasten we een oblieke rotatie toe (Oblimin with Kaiser Nominalization) op de finale variabelenset. De aard van de variabelen zorgden ervoor dat we er namelijk rekening mee moesten houden dat de componenten tot op zekere hoogte met elkaar konden correleren. Tabel 5 toont het resultaat van die analyse met de componentladingen na rotatie (7 iteraties); in Tabel 6 zien we de correlaties tussen de vier componenten. In de tabellen kunnen we duidelijk vaststellen dat de 4 componenten verschillende perspectieven representeren. Tabel 5. Patroonmatrix van de componentladingen op basis van een principal component analyse met Oblimin rotatie voor de tien geselecteerde fluency-variabelen (N=68) 1 2 3 4 1. Productie: gemiddeld aantal lettertekens (incl. spaties) in het schrijfproces (per minuut) 1.02 -.01 -.15.04 in het eindproduct (per minuut).94 -.04.12.05 per.10 interval (proportioneel t.o.v. een theoretisch optimum van 400 lpm).86 -.04.29 -.06 per P-burst (per minuut; pauzedrempel 2000 ms).72.07 -.07 -.48 2. Procesvariantie: standaardafwijking van aantal lettertekens (incl. spaties) per.10 interval (per minuut).19.99.07.03 per.10 interval (proportioneel t.o.v. het persoonlijk optimum) -.28.88 -.09 -.07 3. Revisie: gemiddeld aantal lettertekens (incl. spaties) product- vs. procesratio -.05 -.08.94 -.22 lengte van de R-burst.10.07.89.21 4. Pauzegedrag gemiddelde pauzelengte tussen woorden (pauzedrempel > 200 ms).09 -.03 -.07.96 proportioneel aandeel totale pauzetijd (pauzedrempel > 2000 ms) -.41.06.13.67 Opmerking: componentladingen >.48 staan in vet (Rietveld & Van Hout, 1993). 174

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency Tabel 6. Correlatiematrix met de vier PCA-componenten Component 1 2 3 4 1 1,000,191 -,138 -,329 2 1,000 -,096,046 3 1,000,015 4 1,000 Met een Cronbach Alpha analyse beoordeelden we vervolgens de interne consistentie van elk van de vier componenten. Een alpha-waarde van.7 wordt algemeen beschouwd als voldoende betrouwbaar (Field, 2009, p. 675). De resultaten toonden aan dat alle componenten een goede tot excellente betrouwbaarheid hebben: α =.95 voor Productie, α =.88 voor Procesvariantie, α =.83 voor Revisie en α =.69 voor Pauzegedrag. Figuur 5 biedt een schematische representatie van de vier componenten die - met de onderliggende variabelen - aan de basis liggen van het nieuwe fluency-model. Figuur 5: Model met de vier onderliggende fluency-componenten. In een laatste stap hebben we met een GLM repeated measure test de fluency vergeleken tussen de beschrijvende teksten in L1 en L2 (Tabel 7). Op het niveau van de componenten zijn de productie-, procesvariantie- en revisiecomponent significant verschillend; de pauzecomponent toont geen verschil. Op het niveau van de onderliggende variabelen toont de analyse een significant verschil tussen L1- en L2-schrijfprocessen voor alle variabelen. Conform de verwachtingen produceren schrijvers die een tekst in L1 schrijven meer tekst (proces en product), zijn hun P-bursts langer, vertoont het procesverloop meer pieken en dalen (variantie) en voeren ze meer revisies door. Ten slotte blijken schrijvers in L1 gemiddeld minder te pauzeren dan in L2 (relatieve pauzetijd), vooral tussen woorden is de pauzetijd korter. 175

Luuk Van Waes en Mariëlle Leijten Tabel 7. Vergelijking van de L1- en L2-schrijfprocessen voor de vier componenten en de onderliggende variabelen L1 Gem SD L2 Gem SD F p 2 η p Productie: gemiddeld aantal lettertekens (incl. spaties) 58.7 25.3 39.9 27.3 40.9.001.379 in het schrijfproces (per minuut) 225.2 59.1 186.9 53.7 57.6.001.474 in het eindproduct (per minuut) 178.6 54.1 144.3 48.3 57.9.001.475 per.10 interval (proportioneel t.o.v. een theoretisch optimum) 43.5 11.3 35.6 10.4 59.3.001.481 per P-burst (per minuut; pauzedrempel 2000 ms) 80.4 62.0 53.8 38.6 27.3.001.299 Procesvariantie: standaardafwijking aantal lettertekens (incl. spaties) 60.5 28.1 41.1 272 31.4.001.319 per.10 interval (per minuut) 50.3 15.7 41.1 12.2 27.4.001.300 per.10 interval (proportioneel t.o.v. het persoonlijk optimum) 24.2 7.2 19.7 5.8 28.5.001.308 Revisie: gemiddeld aantal lettertekens (incl. spaties) 54.8 26.8 46.0 30.3 13.8.001.171 product- vs. procesratio 0.79 0.10 0.77 0.11 4.2.045.061 lengte van de R-burst 30.4 12.8 24.5 11.3 37.6.001.370 Pauzegedrag 49.7 29.4 52.9 29.8 1.04.313.016 gemiddelde pauzelengte tussen woorden (pauzedrempel > 200 ms) 0.643 0.170 0.688 0.198 4.4.041.064 proportioneel aandeel totale pauzetijd (pauzedrempel > 2000 ms) 18.5 9.6 22.4 11.4 12.1.001.159 Opmerking: De waarde van de vier factoren representeren de percentages berekend voor elke component. Ze werden verkregen via een normsdistconversie op persoonsniveau van de componentscores voor L1 en L2 (gecombineerd). 5 Case-studie: Schrijven met bronnen De bovenstaande analyses gebeurden op basis van een geïsoleerde taak. Tegenwoordig maken schrijvers echter steeds vaker gebruik van allerlei (digitale) bronnen als ze teksten schrijven: ze vertrekken van een bestaand document en passen dat aan, kopiëren een stukje uit een mailconversatie, zoeken extra informatie op internet, bewerken een illustratie in Photoshop, stellen een planning op in Project Planner etc. Ook het beantwoorden van een mailtje dat net binnenkomt, een retweet of een snelle blik op een nieuw Facebookbericht, zijn activiteiten die deel uitmaken van een hedendaags schrijfproces. Als aanvulling op bovenstaand onderzoek willen we de invloed van bronnen op fluency beschrijven via een korte case-studie waarin de rol van digitale bronnen centraal staat. De case-beschrijving komt uit een onderzoek waarbij we het brongebruik bestudeerden van masterstudenten communicatie en communicatieprofessionals bij het opstellen van een tweet en een e-mailbericht. De taak bestond eruit resp. een breed en een beperkt publiek via deze media te informeren over een communicatiecongres. De nadruk in de analyse lag op de interactie met digitale bronnen, en meer in het bijzonder de website van het congres. 176

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency Figuur 6. Evolutie van de tekstontwikkeling bij het schrijven van een e-mail en de interactie met digitale bronnen. Figuur 6 is een grafische representatie van het verloop van het schrijfproces van één van de studenten. We zien hoe de e-mail geleidelijk vorm krijgt. Helen produceert 1320 lettertekens (rechter y-as) in 17 minuten. Bepaalde episodes leiden tot snelle tekstproductie (bijvoorbeeld na 1.30 min of tussen 11 en 14 min), terwijl er in andere tijdsperiodes (bijvoorbeeld tussen 2 en 4 minuten) nauwelijks tekst gegenereerd wordt. De verklaringen voor zowel die versnellingen als vertragingen, vinden we in hoge mate bij de interactie met de bronnen, in dit geval de website van het congres. De balk onderaan in Figuur 6 toont de interactie met de website. De schrijfster spendeert ongeveer 40 % van haar schrijftijd aan het raadplegen van de beschikbare bronnen en het schrijfproces wordt gemiddeld één keer per minuut onderbroken. We zien dat de interactie met de website vooral in het begin en midden van het proces plaatsvindt. In de laatste fase concentreert de schrijfster zich voornamelijk op de revisie van haar eigen tekst. Ze doet dit in twee rondes. De cursor gaat twee keer helemaal terug naar het begin van de e-mail: cursorpositie 0. Als we de fragmentatie in het schrijfproces van studente Helen vergelijken met het schrijfproces van communicatiedeskundige Gilles, dan zien we dat hij dezelfde taak heel anders aanpakt (hetzelfde geldt voor de tweet trouwens). Hij rondt de taak af in een tiental minuten en blijkt vooral minder maar gerichter met de bronnen in interactie te gaan. Fi- Figuur 7. Fragmentatie door bronnen van het schrijfproces van Helen (masterstudent) en Gilles (communicatieprofessional) 177

Luuk Van Waes en Mariëlle Leijten guur 7 visualiseert van beide schrijvers de interactie tussen de e-mail en de andere bronnen. De donkergrijze vakken verwijzen naar de schrijfactiviteiten in Word; de andere vlakken naar de geraadpleegde pagina s op de congreswebsite. Het beschreven verschil in fragmentatie is duidelijk, alsook de beperktere (lees)tijd in de bronnen. Om ook dit aspect mee te nemen in de nieuwe karakterisering van fluency, stellen we voor om een fragmentatiecomponent toe te voegen aan de beschreven dimensies. Die component stelt ons in staat verschillen in de bronneninteractie mee te nemen in onze multidimensionele benadering. De interactie met bronnen is immers een wezenlijk onderdeel van de meeste schrijfprocessen, en we zijn ervan overtuigd dat het gebruik van bronnen een belangrijke impact heeft op de fluency (Leijten & Van Waes, 2012; Leijten et al., submitted; O Hara et al., 2002). Dit resulteert uiteindelijk in een basismodel met 5 componenten (Figuur 8). Figuur 8. basismodel uitgebreid met bronfragmentatie. 6 Conclusie, discussie en verder onderzoek Het doel van dit artikel was om een nieuw perspectief te creëren om fluency van schrijfprocessen genuanceerder te beschrijven. Daarom zijn we vertrokken vanuit de bestaande inzichten en hebben die aangevuld met meer recente invalshoeken uit het schrijfonderzoek. Doordat we gekozen hebben voor een datagestuurde verkenning, konden we ook gebruik maken van pca-analyse om de onderliggende concepten van onze verkenning beter bloot te leggen. Ten slotte hebben we ook geprobeerd om rekening te houden met de specifieke kenmerken van hedendaagse schrijfprocessen, waarbij secundaire bronnen meer dan ooit het tekstproces sturen. De directe beschikbaarheid via enkele muisklikken speelt daarbij een belangrijke rol en de interactie met de bronnen vormt een belangrijke versneller en vertrager van het proces. De analyses in dit onderzoek vormen ons inziens een goede basis als eerste aanzet voor een multidimensioneel model waarbij we vijf componenten kunnen onderscheiden: (1) productie, (2) procesvariantie, (3) revisie, (4) pauzegedrag, en (5) bronfragmentatie. Door de samenhang tussen die componenten kunnen we het concept fluency volgens ons nu genuanceerder beschrijven. We hopen dat dit voor verschillende soorten onderzoeken naar schrijfvaardigheid een bruikbaar instrument oplevert om groeps- en individuele fluencyverschillen te meten. We denken hierbij bijvoorbeeld aan onderzoek in onderwijssettings waarbij schrijfontwikkeling centraal staat, onderzoek naar het effect van verschillende vormen van initiële planning(sinstructie) op het verloop van schrijfproces, of de koppeling van schrijfkwaliteit aan fluency. 178

Vlot schrijven. Een multi dimensioneel perspectief op writing fluency Uiteraard moeten we er in dit stadium van het onderzoek rekening mee houden dat de voorliggende studie gebaseerd is op een enkele specifieke en korte descriptieve schrijftaak, uitgevoerd door communicatiestudenten. Dat is ongetwijfeld een beperking. Het is daarom onze bedoeling om in vervolgonderzoek deze benadering toe te passen op een groter aantal schrijfprocessen (cf. beperkingen van steekproefgrootte; Hatcher 1994) en na te gaan of deze karakterisering van fluency toepasbaar is op andere tekstgenres en schrijfsituaties. De case study leverde immers al argumenten dat het waarschijnlijk zinvol is om bronfragmentatie toe te voegen aan de analyse. Dit vervolgperspectief is zowel methodologisch belangrijk (selectie en vervangbaarheid van de geselecteerde variabelen; confirmatorische factoranalyse), als inhoudelijk. We denken daarbij aan de vergelijking van argumentatieve, instructieve en descriptieve teksten (L1 en L2), lange en korte teksten, analyse van de ontwikkeling van schrijfvaardigheid (kinderen, jongvolwassenen, ouderen), expertisevorming (bijvoorbeeld bij journalisten), vertaalprocessen, leerstoornissen etc. Op die manier willen we het opgebouwde model toetsen op andere datasets en gaandeweg valideren. Een directe koppeling aan de kwaliteitsvraag en onderzoek naar de overeenstemming met de gepercipieerde fluency (Bosker et al., 2013; Segalowitz, 2010), kunnen de onderzoeksagenda vervolledigen. Ook zullen we verder aandacht besteden aan het berekenen van een persoonlijk optimum. In dit onderzoek is dit gebaseerd op de huidige schrijftaak. We willen in vervolgonderzoek nagaan of een aparte (kopieer)taak niet beter geschikt is om een taakonafhankelijk en stabieler persoonlijk optimum te berekenen. Om dit vervolgonderzoek te faciliteren en om ook andere onderzoekers deze instrumentatie eenvoudig aan te reiken, zullen we de fluency-analyse verder integreren in Inputlog. Op dit moment kunnen de maten die we in dit artikel hebben voorgesteld, allemaal gegenereerd worden uit de analyses van Inputlog of kunnen ze via aanvullende geautomatiseerde analyses in Excel berekend worden. Manuele codering is dus in principe niet meer nodig (vgl. Baaijen, Galbraith, & de Glopper, 2012). We zien echter zeker nog mogelijkheden voor een meer verregaande automatisering door de voorgestelde componenten en bijhorende variabelen in een aparte Inputloganalyse automatisch en gegroepeerd te genereren. Het toevoegen van die invalshoek in een volgende versie van Inputlog heeft bovendien als voordeel dat we geleidelijk een benchmark voor fluency kunnen opbouwen op basis van een grote hoeveelheid, gevarieerde data. Dank Graag willen we Jasmine Robbé, Nikki Van de Keere en Michel Smits danken. In het kader van hun masterscriptie voor de opleiding Meertalige Professionele Communicatie aan de Universiteit Antwerpen hebben ze de procesdata voorbereid die we voor deze paper hebben gebruikt. Ook willen we Eric Van Horenbeeck en Tom Pauwaert danken voor al het programmeerwerk waardoor we gebruik hebben kunnen maken van nieuwe logging- en analysemogelijkheden in Inputlog. Bij Sven De Maeyer konden we terecht voor een aantal statistische vragen. Tot slot willen we ook onze waardering uitspreken voor de kritische feedback die we van de anonieme reviewers mochten ontvangen. Luuk Van Waes* & Mariëlle Leijten* *Universiteit Antwerpen Fonds Wetenschappelijk Onderzoek - Vlaanderen (FWO) 179