Handleiding SPSS voor OpenClinica Exports Inhoudsopgave

Handleiding SPSS voor OpenClinica Exports Inhoudsopgave 1. Inleiding... 2 2. Tips bij het ontwerp van de studie... 2 3. Vóór het exporteren van de SPSS bestanden... 3 4. Exporteren van de SPSS bestanden... 4 5. Inlezen van de SPSS bestanden... 4 6. Bestand klaarmaken voor analyse in SPSS... 5 6.a. Repeating Events in de studie... 5 6.b. Lengte tekstvelden vast zetten... 6 6.c. Samenvoegen data van hetzelfde CRF uit verschillende visites... 6 7. Error meldingen en wat te doen... 6 8. Andere problemen en wat te doen... 8 8.a. Decimale getallen missen in de gegevens.... 8 8.b. SPSS toont veel meer kolommen dan verwacht.... 8 8.c. Items in een RepeatedItemGroup... 9 8.d. SPSS toont bij items meerdere waarden gescheiden door comma s...10 8.e. Er missen gegevens in export naar STATA....11 Appendix 1. Data van eerdere versies van OpenClinica...12

1. Inleiding Deze handleiding geeft hulp bij het inlezen in SPSS van data die verzameld is met OpenClinica. Het beschrijft ook hoe exports voor SPSS gemaakt moeten worden. Het gaat uit van versie 3.1.4.1 van OpenClinica. In de OpenClinica Reference guide op https://docs.openclinica.com/3.1/openclinica-userguide staat beschreven hoe je data uit OpenClinica kunt exporteren. Er is ook een beknopte TraIT export manual geschreven die te downloaden is vanuit TOPdesk. 2. Tips bij het ontwerp van de studie Als een studie met SPSS zal worden geanalyseerd is het handig met een aantal aspecten rekening te houden bij het maken van de studie 1. Bij de SPSS export wordt de itemnaam gebruikt om variabelen aan te duiden. Bij het maken van een CRF in OpenClinica moeten de itemnamen per CRF uniek zijn. Hierbij is OpenClinica kritischer dan SPSS, want OpenClinica maakt onderscheid tussen hoofd en kleine letters bij item namen, maar SPSS doet dit niet. Een itemnaam mag alleen letters en cijfers en _ (= underscore) bevatten en geen spaties (gebruik hiervoor underscores) en vreemde tekens bevatten (zoals % etc.). Is het mogelijk om een volledige lijst te geven (of naar te refereren) van tekens die niet zijn toegestaan? Let er dus op dat in de CRF al de itemnamen uniek zijn onafhankelijk van hoofd en kleine letter gebruik. 2. De maximale lengte van een itemnaam in OpenClinica is 255 karakters, maar SPSS staat maximaal 64 karakters toe. Bovendien plaatst OpenClinica in de SPSS export achter de itemnamen nog codes om te wijzen naar Event, CRF en eventuele itemgroep. Let er dus op dat in de CRF de itemnamen maximaal 50 karakters zijn. 3. Een item van het type radio of single-select zal als RESPONSE_VALUES_OR_CALCULATIONSvaak getallen zoals 1,2,3 bevatten. Het is sterk aan te raden het DATA_TYPE van het item INT te maken. Dit is vooral belangrijk als de export eerst naar SPSS gedaan wordt en later door STATA verwerkt zal worden. Let er in het algemeen op om numerieke velden data type INT of REAL te maken. Let er dus op dat in de CRF de itemnamen van type radio en single-select van het data-type INT zijn als er alleen getallen in de waarden staan die opgeslagen worden. 4. Een item van het type checkbox of multi-select kan meerdere keuzen opslaan. Het systeem combineert alle antwoorden in een veld, elke optie gescheiden door een komma (SPSS heeft hier geen type voor). Bij de verwerking in SPSS zal dit omgezet moeten worden zodat elke waarde in een apart veld (SPSS kolom) terecht komt. - Er kan via de TraIT servicedesk s een standaard script verkregen worden om Pagina 2 van 12

de multi-select export aan te passen voor analyse in SPSS. - Als alternatief is het te overwegen aparte vragen te formuleren, bijvoorbeeld met een keuze tussen ja en nee. Bedenk goed of de checkbox of multi-select de beste manier is om je data te verzamelen. 5. In een OpenClinica-CRF kan gebruik worden gemaakt van een RepeatingItemGroup. Hierbij worden meerdere regels met dezelfde items ingevuld. In de SPSS-export zullen deze waarden horizontaal worden weergegeven. Wanneer het voor de analyse gewenst is dat deze gegevens in SPSS verticaal worden weergegeven, dus per Subject meerdere regels, dan zul je hiervoor zelf een SPSS-syntax-script moeten schrijven. Bedenk van tevoren hoe je de gegevens in SPSS wilt gaan analyseren en test of de wijze van data verzamelen in OpenClinica hierop aansluit. 6. OpenClinica exporteert data gegroepeerd per CRF versie. Daardoor kan een wijziging in een of meerdere CRFs in de looptijd van een studie potentieel veel bewerkingen geven in SPSS. Voorkom zoveel mogelijk dergelijke aanpassingen door onder andere: - eventuele anderen die moeten invoeren eerst feedback te vragen voor de overgang naar productie. - alle scenario s van de betrokken CRFs te controleren en een keer in te voeren, - een export te maken voor de analyse van alle hiervoor gemaakte invoer en te kijken of dit goed te analyseren is. Probeer dus te voorkomen dat de CRFsgewijzigd moeten worden terwijl ze in productie zijn. NB: OpenClinica biedt de mogelijkheid om gegevens die in een oudere CRF versie zijn ingevoerd te migreren naar een nieuwe CRF versie (zie paragraaf 3). Hiermee kan bovengenoemd probleem voorkomen worden. 7. Wanneer de nullvalues optie van OpenClinica wordt gebruikt, zullen nullvalues in de export terecht komen als text(bijv UNK voor unknown). In het geval van numerieke en datumvelden wordt dit bij export naar SPSS omgezet naar system missing. Wanneer het relevant is om het type nullvalue in SPSS terug te zien, is het beter om de nullvalues op te nemen bij de antwoordopties van de vraag. Zie hiervoor ook de TraIT OpenClinicaNull Value guidance volgt binnenkort. 3. Vóór het exporteren van de SPSS bestanden OpenClinica exporteert alleen variabelen waar gegevens voor zijn ingevoerd in het CRF. Maak daarom tijdens de ontwikkel fase in de TraIT OpenClinica sandbox omgeving een test site met een test subject aan en vul gegevens in voor alle items. Eventueel zijn er meer subjecten nodig om alle mogelijke scenario s af te lopen. Controleer of alle variabelen (items) in de export voorkomen. Neem de export (evt. met een analist) goed door en test of analyse in SPSS mogelijk is. Dit is vooral van belang bij RepeatingItemGroup vragen die later voor de analyse georganiseerd moeten worden (bijvoorbeeld medicatie en AEs). Zelfs als dit gedaan is kan het zijn dat voor de analyse extra aanpassingen nodig zijn omdat er meer herhaalde regels Pagina 3 van 12

zijn dan verwacht. (bijvoorbeeld doordat een patiënt 6 AEs heeft, maar de test patiënt maar 5). Mochten er onverhoopt meerdere versies van CRF s zijn met gegevens van subjects, dan is het verstandig te kijken of subjecten met data op een oude versie van een CRF handmatig gemigreerd kunnen worden naar een nieuwe versie (reden hiervan is eerder uitgelegd bij 2.6). Per subject kies je voor View this Subject s Record, Een lijst met events en CRF wordt getoond. Per CRF kan de versie gemigreerd worden door te klikken op het laatste icoon (Reassign CRF to a New Version). Selecteer de nieuwe versie. LET OP: het systeem zal laten zien hoe het data van de ene versie naar de andere verplaatst. Als itemnamen veranderd moesten worden tussen 2 versies dan moeten er handmatige correcties gedaan worden. Het wordt aangeraden om aanmaken van nieuwe CRF versie en migratie van gegevens van oude naar nieuwe versie eerst te testen in de sandbox omgeving. Zijn het erg veel subjects dan is de overzetting anders te doen, zie http://www.trialdatasolutions.com/tds/howto/transferdatanewversion.jsp of benader hiervoor de TraIT servicedesk. Het kan eventueel ook verwerkt worden na de SPSS export. 4. Exporteren van de SPSS bestanden De eerste stap is het creëren van een dataset. Dit gaat als volgt: 1. Ga naar Tasks 2. Onder Extract Data kies Create Dataset. Kies de elementen van de dataset bij events CRF en items. 3. Kies de scope van de dataset door een periode voor de events te kiezen waarvan de data geëxporteerd moeten worden. Als niets ingevuld wordt, worden alle data gekozen. 4. Kies wat in het extract moet zitten: alle CRF, alleen de marked complete CRF, ofalleen notmarked complete. 5. Geef een naam aan de dataset Als de dataset gecreëerd is kan de datageëxporteerd worden. Dit gaat als volgt: 1. Ga naar Tasks 2. Onder Extract Data kies View Dataset. 3. Op de regel van de dataset die geëxporteerd moet worden kies onder actions het laatste icoon (pagina met een pijl naar rechts): Export Dataset. 4. Kies op de volgende pagina Run Now achter SPSS data and syntax 5. Wacht eventueel op een email met het bericht dat het extract klaarstaat en klik op de link in de mail om naar de pagina te gaan waar het bestand klaar staat of kies View Dataset om te controleren of de dataset al klaar staat. 6. Kies Download (icoon met pijl naar beneden) van het bestand dat klaargezet is. Bewaar het bestand. 5. Inlezen van de SPSS bestanden Open het zip bestand dat OpenClinica gecreëerd heeft. Er zijn 2 bestanden: 1. SPSS_SPS.spsheeft de definitie en structuur voor SPSS 2. SPSS_DAT.datheeft de data Pagina 4 van 12

Extraheerbeide bestanden in een directory, bijvoorbeeld c:\spss\mijnstudie. Verander de naam vandebestandennaar een toepasselijke naambijvoorbeeld: mijnstudie.sps en mijnstudie.dat. In SPSS kies File, Open, Syntax, kies het.spsbestand. Op de eerste regel moet een aanpassing gemaakt worden: De plaats en naam moeten gecorrigeerd voor de plaats waar het.dat bestand staat. Bijvoorbeeld: FILE = 'SPSS_DAT.dat wordt vervangen door FILE = 'c:\spss\mijnstudie\mijnstudie.dat. Kies nu alle regels in het.sps bestand (Ctrl-A). Kies run Alle data zullen in SPSS gelezen worden. Er zijn 3 SPSS windows: 1. SPSS Viewer met een log van derun (toont bestanden met extensie.spo). 2. Syntax editorwindow (extensie.sps) en 3. Statistics Data Editor (extensie.sav). Dit windows heeft 2 views: Data View and Variable View. In het Data View window staat de data. Boven de kolommen staan de itemnamen. Deze zijn uitgebreid met letters. Deze letters zijn een vertaling van Event en CRF namen. E is altijd een Event, de events worden genummerd C is altijd een CRF, ook de CRF worden genummerd. De export zal in de itemnamen een indicatie voor het event opnemen. E1 is voor het eerste event. Eventueel kan in het.sps bestand de naam aangepast worden zodat een betekenisvollere naam gegeven wordt. Om te voorkomen dat E1 op andere plekken vervangen worden, kun je het beste alle _E1 vervangen. Doe dit zowel voor de sectie GET DATA als voor VARIABLE LABELS en VALUE LABELS. Pas echter op dat de maximale lengte van de itemnaam niet overschreden wordt. 6. Bestand klaarmaken voor analyse in SPSS Een eerste versie van het SPSS bestand is vaak nog niet geschikt om analyses mee te doen. Vooraf is belangrijk te weten dat: - Per SPSS bestand is er 1 rij per patiënt ongeacht van de CRF opbouw zoals RepeatingItemGroupvragen, meerdere visites met dezelfde CRF pagina. Open Clinicaonderscheid herhalende elementen door aan de gekozen itemnaam extra letters en cijfers toe te voegen voor het event nummer, het occurence nummer van de Event, het CRFversie nummer, en eventuele rij nummer. Bijvoorbeeld de AE_start_date wordt dan AE_start_date_E5_C1_1. E5 staat voor het Event nummer, C geeft een versie nummer van een CRF aan, het losse nummer is de regelnummer van het item - Bij tekstvelden wordt de lengte in SPSS bepaald door de ingevoerde waarde met de grootste lengte (zie sectie6.b). 6.a. Repeating Events in de studie Events kunnen repeatingzijn. VALUE LABELS van items in een repeating event worden niet opgenomen in het syntax bestand. Pagina 5 van 12

Bijvoorbeeld. Stel dat event E1 twee keer is voorgekomen. Dan zullen er 2 SPSS variabelen zijn voor bijvoorbeeld het CRF item: RADIO_ITEM namelijk: RADIO_ITEM_E4_1_C1 en RADIO_ITEM_E4_2_C1. RADIO_ITEM_E4_1_C1 is het item RADIO_ITEM in het eerste Event. RADIO_ITEM_E4_2_C1 is het item RADIO_ITEM in het tweede Event. Om SPSS dit te laten verwerken moet bij VALUE LABELS de syntax handmatig worden aangepast in het.sps bestand. Bijvoorbeeld RADIO_ITEM_E4_1_C1 '1' "Yes" '0' "No" / Moet aangepast worden naar: RADIO_ITEM_E4_1_C1,RADIO_ITEM_E4_2_C1 '1' "Yes" '0' "No" / Als dit niet gebeurd zal het geen foutmelding tot gevolg hebben, maar de labels zullen niet getoond worden. 6.b. Lengte tekstvelden vast zetten De grootte van tekstvelden wordt in SPSS gesteld op de lengte van het langst ingevoerde antwoord. Dit kan problemen geven, bijvoorbeeld in het geval dat de data anders georganiseerd moet worden voor de analyse. Ook bij het hergebruiken van een aangepaste syntax bij nieuwe data exports (bijvoorbeeld doordat in een specify veld nu voor een patiënt een tekst met lengte 145 tekens is ingevoerd, terwijl voorheen het maximaal ingevoerde tekens 123 was). Zet daarom het format eenmalig op het maximaal te verwachten waarde voor deze velden: A255. Dit is de maximale toegestane waarde in normale velden. Controleer eventueel of in de CRF s geen langere antwoorden zijn gegeven; soms wordt bijvoorbeeld een discrepancynote aanmaakt om meer informatie te geven dan in het veld is toegestaan. 6.c. Samenvoegen data van hetzelfde CRF uit verschillende visites Als een (zelfde) CRF in meerdere visites voorkomt, dan zal een export vanuit Open Clinica alle metingen achter elkaar i.p.v. onder elkaar tonen. Soms is het beter voor de analyse de data uit de verschillende visites onder elkaar te hebben. Ga dan als volgt te werk: Exporteer de CRF data vanuit Open Clinica per visite als aparte datasets. Voeg in SPSS syntax een variabele visit toe met de visite aanduiding (waarde hetzelfde voor alle rijen in dat bestand): COMPUTE VISIT=1. EXECUTE. Verander de namen van de variabelen in algemene namen (bijv. Blood_pres_E1_C6 wordt Blood_pres). Doe dit consequent hetzelfde voor alle visites en voeg vervolgens de verschillende SPSS bestanden samen. De visites staan nu onder elkaar. 7. Error meldingen en wat te doen Error # 105. Command name: EXECUTE>This command is not valid before a working file has been defined. >Execution of thiscommandstops. Pagina 6 van 12

Controleer in het.sps bestand of het pad achter FILE = correct is en pas deze aan Als dit niet helpt dan: Kies in SPSS: Edit, Options, kies de tab File Locations, zorg dat alle locaties op de pagina ook daadwerkelijk bestaan. Als dit niet helpt kies in de syntax editor de regel GET DATA en kies Run Er zullen een of meer regels met fouten komen. (2265) Unrecognized or invalid variable format. The format is invalid. For numeric formats, the width or decimals value may be invalid. OpenClinica geeft een foute Fn.d voor items met enkele specifieke WIDTH_DECIMAL Het gaat om 1. items met een WIDTH_DECIMAL van het type real waarbij het aantal cijfers achter de komma als 0 is gedefinieerd is, bijvoorbeeld 5(0) 2. items van het type REAL meteen WIDTH_DECIMALwaarbijeen maximale breedte als (d) is opgegeven bijvoorbeeld 4(d) 3. WIDTH_DECIMAL aangegeven als een simpel getal bijvoorbeeld 4. Dit is tegen de OpenClinica gedefinieerde syntax, maar wordt geaccepteerd en ook bij het invullen van vragen wordt er gecontroleerd dat de invoer niet groter is dan het gegeven getal. (een real zonder WIDTH_DECIMAL gaat wel goed) Zoek itemnamen in je CRF die deze WIDTH_DECIMAL instellingen hebben en vervang in de SPSS syntax editor bij sectie GET DATA voor deze itemnamen de waarde achter F door x.0, waarbij x de waarde is die OpenClinica al neergezet heeft. Bijvoorbeeld als de WIDTH_DECIMAL 5(0) is zet OpenClinica F5.6, vervang dit door F4.0 (2272) Duplicate variable name (only first 64 characters are counted): Pas in het.sps en in het.dat bestand de dubbele variabele namen aan en maak unieke namen. OpenClinica maakt onderscheid tussen hoofd en kleine letters, maar SPSS niet. Open het.dat bestand in Excel om het aan te passen. Bij het bewaren van het bestand moet de indeling behouden blijven. 2278) A variable name does not conform to the rules for variable names. ad- Execution of this command stops. Controleer het.sps bestand op itemnamen met een -. Deze zijn na versie 3.04 in OpenClinica niet meer toegestaan, maar CRF gemaakt in eerdere versie klaagden hier niet over. SPSS kan niet met dergelijke namen omgaan. Pas in het.sps en in het.dat bestand de variabele namen aan (zorg dat de namen uniek blijven). Open het.dat bestand in Excel om het aan te passen. Bij het bewaren van het bestand moet de indeling behouden blijven. Pagina 7 van 12

8. Andere problemen en wat te doen 8.a. Decimale getallen missen in de gegevens. SPSS toont geen getallen in de Data View voor var die in OpenClinica van het type REAL zijn en getallen achter de komma bevatten. De data van OpenClinica wordt geëxporteerd in een US formaat. Als SPSS een Nederlandse versie is, dan kan moet SPSS geïnstrueerd worden in welk formaat de data die geïmporteerd wordt staat. Nadat in SPSS het sps bestand geopend is, moet voor de eerste regel die begint met GET DATA een regel toegevoegd worden: SET LOCALE = 'en_us.windows-1252'. (let op dat er een punt achter staat). Na het inlezen kan SPSS voor de analyse weer terug gezet worden in de Nederlandse representatie van de Data door SET LOCALE = 'nl_nl'. aan het eind toe te voegen Daarna kunnen de alle regels uitgevoerd worden. Controleer eventueel wat de setting is: SHOW LOCALE. 8.b. SPSS toont veel meer kolommen dan verwacht. Bij diepere analyse lijken er extra kolommen te zijn voor meerdere versies van sommige CRF s. Zoals beschreven in paragraaf 3 kan het zijn dat het CRF tussentijds is gewijzigd en er zijn sommige subjecten met gegevens in de ene versie en andere subjecten met gegevens in de andere versie van de CRF, de itemnamen verschillen niet. Dit is te zien als er in het SPSS.sps bestand bij het onderdeel Get DATA in te namenlijst namen staan waarin ook Ex_Cx voorkomt, waarbij x een getal is. Bijvoorbeeld: E1_C1, E1_C2, E1_C3. In paragraaf 3 is uitgelegd hoe je binnen OpenClinica gegevens naar de laatste CRF versie kan migreren. Mocht je dat niet in OpenClinica willen of kunnen doen, dan kan het ook binnen SPSS worden gedaan. Hoe dit te doen binnen SPSS: Hiervoor is een programmaatje geschreven dat TraIT beschikbaar stelt in de Knowledge base van TOPdesk. Het betreft een MS Access bestand: CRFversies_SPSS.mdb. De volgende handelingen zijn nodig: 1. Open CRFversies_SPSS.mdb. 2. Het formulier met de titel repairan SPSS-syntax file is geopend. Is dit niet het geval ga dan in de linker kolom naar het onderdeel formulieren (in een Engelse MS Access heet dit forms). Dubbelklik op frmgetsyntaxfile. 3. Klik op de knop browse, open van de SPSS export het.sps bestand. 4. Klik op de knop repair-script. Dit genereert een SPSS script om het probleem te repareren voor items met dezelfde naam in de verschillende versies in het CRF. Pagina 8 van 12

Er verschijnt een boodschap: a new file was created, named: (dit bevat zowel de locatie als de bestandsnaam van het gemaakte bestand) 5. Als SPSS niet meer open staat met het bestand met alle verwerkte data zoals beschreven in Inlezen van de SPSS bestanden, start dan opnieuw SPSS en voer het inlezen en genereren van de data uit. 6. Open in SPSS het gegenereerde repair script door File, Open, Syntax, 7. Selecteer alle regels (Ctrl-A) 8. Kies Run (groene pijl) 9. Alle data staat nu in het eerste voorkomen van elk item in de eerste versie van het CRF. 10. Bewaar het SPSS bestand met de data onder een andere naam door: File, Save as Kies type SPSS Statistics (*.sav). 11. Ga terug naar het MS Access bestand 12. Klik op de knop clean-script. Dit genereert een script om de kolommen zonder data weg te gooien. Er verschijnt een boodschap: a new file was created, named: (dit bevat zowel de locatie als de bestandsnaam van het gemaakte bestand) 13. Ga terug naar SPSS 14. Kies File, New 15. Sluit het bewaarde.sav bestand. 16. Open het gegenereerde clean script door File, Open, Syntax, 17. In de eerste regel wijzig GET FILE = 'c:\oc\trait\topdesk\robin\robin_edit_20131213.sav' en vervang dit door het bestand met de locatie en naam die in stap 10 gemaakt is 18. Selecteer alle regels (Ctrl-A) 19. Kies Run (groene pijl). Nu worden alle extra kolommen verwijderd. 20. Bewaar het bestand als de basis voor verdere analyse. Opmerkingen: Als een CRF versie verwijderd is zal de data die voor subjecten is ingevoerd niet geëxporteerd worden! Zorg dat deze data handmatig gemigreerd wordt, of reactiveer de CRF versie 8.c. Items in eenrepeateditemgroup In SPSS is het voor sommige analysis juist handig als er niet één rij per patiënt is, bijvoorbeeld bij AEs en medicatie. Als deze pagina s zijn opgezet als RepeatingItemGroupvragen, dan kunnen er problemen ontstaan bij het variables to cases proces. Het definitief voorbereiden van de analyse scripts is lastig, omdat het aantal rijen dat in de data zal komen niet vaststaat. Een ander probleem is dat kolommen waarin nog geen data zijn ingevoerd niet voorkomen in de export. Voor het proces variables to cases moet van ieder uiteindelijke variabele evenveel beginvariabelen aanwezig zijn. Dus als er items in een RepeatingItemGroupstaan dan moet voor elk item in elk geval in één van regels ergens data ingevuld zijn. Maak - ter voorkoming van problemen - in een test site voor alle CRF met RepeatingItemGroups een of meer subjecten aan waarbij elk item in elk geval op een van de regels een keer ingevuld is. Dan zullen onafhankelijk van het aantal regels die bij Pagina 9 van 12

andere subjecten worden ingevuld, genoeg items gegenereerd worden om het variables to cases proces uit te voeren. 8.d. SPSS toont bij items meerdere waarden gescheiden door komma s Voor items van het type checkbox of multi-select worden meerdere waarden in een item getoond. In SPSS staan alle gegevens van één item in een kolom met komma s gescheiden. Er zijn twee mogelijkheden. TraIT heeft een tooltje (Checkbox_utility_ SPSS) om dit automatisch te verwerken. Als dit tooltje wordt gerund, zal voor elke respons optie een aparte kolom worden aangemaakt en de geselecteerde respons zal in de betreffende kolom worden geplaatst. Je kunt dit hulpmiddel downloaden uit de Knowledge base van TOPdesk. Ook kun je ervoor kiezen om zelf extra variabele namen te maken en deze met behulp van SPSS om te zetten. Voor elke variabele met dergelijke inhoud zouden zoveel nieuwe variabelen gemaakt moeten worden als er opties zijn. Elke optie die gekozen wordt krijgt dan een waarde bij de betreffende variabele. In het onderstaande voorbeeld worden bij een checkbox item met de naam OPEN_CLIN_VRAAG 5 nieuwe variabelen aangemaakt, evenveel als er antwoord opties zijn bij het checkbox item. Dit gebeurt met behulp van de volgende SPSS syntax. COMPUTE ANTWOORDOPTIE1=0. COMPUTE ANTWOORDOPTIE2=0. COMPUTE ANTWOORDOPTIE3=0. COMPUTE ANTWOORDOPTIE4=0. COMPUTE ANTWOORDOPTIE5=0. EXECUTE. Er zijn nu 5 nieuwe variabelen die de waarde 0 hebben. Vervolgens moet geëvalueerd worden welke antwoordopties gekozen zijn per subject. Dit gebeurt met onderstaande syntax. IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'1')>0) ANTWOORDOPTIE1=1. IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'2')>0) ANTWOORDOPTIE2=1. IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'3')>0) ANTWOORDOPTIE3=1. IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'4')>0) ANTWOORDOPTIE4=1. IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'5')>0) ANTWOORDOPTIE5=1. EXECUTE. De functie CHAR.INDEX geeft de positie binnen OPEN_CLIN_VRAAG waarop de opgegeven code tekst zich begint. Wanneer de positie groter is dan 0 is deze antwoord optie gekozen en zal de variabele op 1 gezet worden. Stel dat voor een subject de waarde van OPEN_CLIN_VRAAG is 1,2,4, dit betekent dat de opties 1, 2 en 4 aangekruist zijn. Wanneer SPSS de regel IF (CHAR.INDEX(OPEN_CLIN_VRAAG,'4')>0) ANTWOORDOPTIE4=1. uitvoert, zal CHAR.INDEX(OPEN_CLIN_VRAAG,'4' de waarde 5 hebben. Omdat dit groter is dan 0 zal ANTWOORDOPTIE4 de waarde 1 krijgen Pagina 10 van 12

Geef de variabelen nieuw valuelabels via: VALUE LABELS ANTWOORDOPTIE1 ANTWOORDOPTIE2 ANTWOORDOPTIE3 ANTWOORDOPTIE4 ANTWOORDOPTIE5 0 "No" 1 "Yes" 8.e. Er missen gegevens in export naar STATA. Bij het bewaren van SPSS gegevens naar STATA-bestand wordt een deel van de data niet meegeleverd. De valuelabels komen alleen mee als de variabelen in SPSS zijn getypeerd als een number i.p.v. een string. Tijdens de bouw van het CRF is een item van het type radio of single-select gemaakt en met een data_type ST. Echter de waarden die opgeslagen worden zijn alleen getallen. SPSS zelf kan hier wel analyses mee uitvoeren, dit probleem is alleen relevant voor STATA exports. Het is te zien aan het.sps bestand dat bij elke variabele waarbij zich dit voordoet achter de naam in het onderdeel GET DATA een A1 staat. Een mogelijkheid is het handmatig aanpassen van de data. Een alternatief is het gebruik van een hulpmiddel die TraIT beschikbaar stelt. Het betreft een MS Access bestand: ST_naar_INT_SPSS_20131108.mdb. De volgende handelingen zijn nodig 1. Voordat dit hulpmiddel gebruikt kan worden moet eerst een extra export van OpenClinica gedraaid worden in een ander formaat dan SPSS. 2. Kies in OpenClinica Tasks, View Datasets, Export DataSet op de regel van de dataset die gebruikt wordt voor de analyse. 3. Kiesbij CDISC ODM XML 1.3 Clinical Data : Run Now 4. Kies Back to Dataset. 5. Er moet een bestand gemaakt zijn dat begint met de naam odm1.3 (is die er nog niet dan duurt het even voor het bestand klaar is) 6. Download het bestand en extract de gegevens uit het.zip bestand. 7. OpenST_naar_INT_SPSS_20131108.mdb. 8. Het formulier met de titel Get studymetadataandclinicaldatafroman ODM file is geopend.is dit niet het geval ga dan in de linker kolom naar het onderdeel formulieren (in een Engelse MS Access heet ditforms). Dubbelklik op frmgetclinicaldata. 9. Klik op de knop browse, open het odm bestand met de extensie.xml. 10. Klik op de knop getmetadata. 11. Als het programma klaar is klik dan op de knop remove HTML-tags. 12. Zoek in de linker kolom bij het onderdeel formulieren (in een Engelse MS Access heet ditforms). Dubbelklik op frmgetsyntaxfile. 13. Het formulier repair an SPSS-syntax file is geopend. 14. Klik op de knop browse, open van de SPSS export het.sps bestand. 15. Klik op de knoprepair-script. Dit genereert een SPSS script om het probleem te repareren voor items met dezelfde naam in de verschillende versies in het CRF. Er verschijnt een boodschap: a new file was created, named: (dit bevat zowel de locatie als de bestandsnaam van het gemaakte bestand) 16. Start SPSS met hetrepair script in plaats van het door OpenClinica gemaakte script. Pas de regel achter FILE = aan met de locatie en de bestandsnaam van het spss dat bestand. En genereer de data. 17. Deze is nu wel te bewaren als STATA Pagina 11 van 12

Appendix1. Data van eerdere versies van OpenClinica OpenClinica.nl draait versie 3.1.4.1. Als er nog data ingelezen moet worden die uit eerdere versies van OpenClinica geëxporteerd zijn of bij studies die in eerdere versies van OpenClinica gecreëerd zijn, dan kan het zijn dat er wat extra handelingen gedaan moeten worden.bij het.sps bestand moeten enkele extra zaken veranderd worden: 1. De date velden moeten veranderd worden, de SPSS export van OpenClinicastaat niet in de Amerikaanse notatie. Doe een zoek ADATE10 en vervang alle door SDATE10 (American date versus standarddate) 2. Om te corrigeren voor het gebruik van decimalen moet de volgende regel toegevoegd wordenaan het begin van de syntax (voor het binnen halen van de data): SET LOCALE = 'en_us.windows-1252'. SHOW LOCALE. Aan het eind kun je opnemen: SET LOCALE='nl_NL'. SHOW LOCALE. 3. Verwijder in het SPSS syntaxbestand alle woorden BLANKS. 4. Studies die gemaakt zijn in eerdere versies OpenClinica kunnen itemnamen hebben met een -. SPSS zal een error geven: illegalvariable name. Verwijder dan alle streepjes Pagina 12 van 12