Onderzoek naar de toepasbaarheid van de Bedrijfsoorcheck (BOC) Deel B: Evaluatie in de praktijk. Oktober 2016

Vergelijkbare documenten
Screening van gehoorschade door lawaai m.b.v. internettesten

Toepassing spraak-in-ruis screeningtest voor lawaaislechthorendheid in arbeidsgeneeskunde

RAPPORTAGE OORCHECK HOORTEST 2016

Telegraaf-project. Het OAE-gram, een gevoeliger test voor gehoorscreening?

Evaluatie Kinderhoortest. Augustus 2014

Spraak-in-ruis testen: een nieuwe techniek om vroegtijdig gehoorverlies op te sporen

Het effect van het perifeer gehoorverlies op spraakverstaan: éénzijdig slechthorenden

De pdin The pediatric digits-in-noise test. Cas Smits VU medisch centrum, Amsterdam

Evaluatie Kinderhoortest. April 2016

Audiometrische triage bij de audicien

Audiometrie bij USHER2A patiënten

1 JULI 2015 RAPPORT PRAKTIJKTOETS SPIN-TEST DEEL 2: KWANTITATIEVE BESPREKING

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument.

Het meten van luisterinspanning met cijfers in ruis

De Spraak-in-Ruis-test. Screening naar gehoorschade door lawaai in de centra voor leerlingenbegeleiding

Ontwikkeling van een breedbandige cijfer-in-ruis test voor klinisch gebruik

Spraakaudiometrie met het vrije veld als referentie; een implementatiemethode

factsheet Resultaten Kinderhoortest 2017

Hoe goed is een test?

VCV-test. validatie en de relatie met spectrale en temporele resolutie. Jeroen Sol Thamar van Esch Wouter Dreschler

Antwoordsleutel vraag 2 t/m 9 IOF al la carte Pediatric Balance Scale

De rol van spectrale en temporele resolutie binnen het Auditief Profiel

Onderzoek heeft aangetoond dat een hoge mate van herstelbehoefte een voorspellende factor is voor ziekteverzuim. Daarom is in de NL-SH ook de relatie

Hoe verhoudt de psychosociale gezondheid van volwassenen met een CI zich tot die van volwassenen met en zonder gehoorverlies? Resultaten van de NL-SH

Summery. Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers

DE TOEPASBAARHEID VAN OTOAKOESTISCHE EMISSIES ALS SCREENINGS- EN MONITORINGSINSTRUMENT VOOR LAWAAISCHADE IN DE BOUWNIJVERHEID

9. Lineaire Regressie en Correlatie

Hoofdstuk 1: introductie van het proefschrift

Vergelijkende studie gehoorscreeningsmethodes in de arbeidsgeneeskunde

Stemproblemen en gehoorschade bij kleuter- en sportleerkrachten

De pdin The pediatric digits-in-noise tes. I. Saadane, S.T. Goverts, J.M. Festen, C. Smits VU medisch centrum, Amsterdam

SAL-test. Inleiding. Het principe van de SAL-test:

Lawaaischade bij slechthorenden en hoortoestelgebruik

Samenvatting. J. Nachtegaal, S.E. Kramer, J.M. Festen (Amsterdam)

Klinische inspanningstesten in de (kinder)revalidatie

Neonatale gehoordiagnostiek

Vitamine B12 deficiëntie

Cisplatinum Ototoxiciteit

Draagbare Gehoortest voor de gehoordrempel van laagfrequent geluid Tussenstand lopend onderzoek. 9 nov 2016 (Varia) door: Chris van Dijk

Slechthorendheid. is dat nog een thema in de ARBO-praktijk? Prof.dr.ir. Wouter A. Dreschler, Academisch Medisch Centrum Amsterdam

Status gehoor van musici in symphonieorkesten

hoofdstuk 3 Hoofdstuk 4 Hoofdstuk 5

Meningitis: het belang van gedegen multidisciplinaire diagnostiek van gehoor en communicatie De rol van het AC

Vroegtijdige opsporing gehoorstoornissen in de leeftijd van 4-19 jaar

Relatie tussen gehoorverlies & psychosociale gezondheid

De Nederlandse doelgroep van mensen met een LVB Van Basisvragenlijst LVB naar LVB-screeningsinstrument (screener LVB)

Nederlandse samenvatting

signaleringsinstrumenten voor psychosociale problemen bij 0 4 jarigen in de JGZ

Kosten- batenanalyse POCT Influenza Spaarne Gasthuis

User Profile Repository Testrapportage kwaliteit

Vitamine B12 deficiëntie. Een rapport naar De Incidentie en Prevalentie van vitamine B12 deficiëntie in Nederland

Nederlandstalige samenvatting

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Frequentie specifieke ABR

Allart Knoop, Gertjan Dingemanse. Gehoor- en Spraak Centrum, afdeling KNO Erasmus MC, Rotterdam

Samenvatting. Samenvatting 8. * COgnitive Functions And Mobiles; in dit advies aangeduid als het TNO-onderzoek.

G. Dingemanse, J. Feenstra Gehoor- en Spraak Centrum, afdeling KNO Erasmus MC, Rotterdam, Nederland

SAMENVATTING. Samenvatting

Meten van spraakverstaan bij volwassenen met een cochleair implantaat in stilte en in lawaai

Treatment-induced Hearing Loss After (Chemo)Radiotherapy in Patients With Head and Neck E.A.R. Theunissen

Onderwijsmateriaal voor toetsgroepen

Press kit. Page 1 of 12

De invloed van ruisonderdrukking op luisterinspanning

Nederlandse Samenvatting

Overzicht. Help! Statistiek! Stelling van Bayes. Hoe goed is leverscan ( test T ) voor het diagnostiseren van leverpathologie ( ziekte Z )?

Schadelijk geluid. Informatie voor werknemers en werkgevers

Bijlage I Indicatoren en kwaliteitsnormen

Langdurig ziekteverzuim van werknemers met een chronische ziekte of beperking Geeke Waverijn, Mieke Rijken

Beroepsslechthorendheid bij vrachtwagenchauffeurs. geen aanwijzingen voor het chauffeursoor

Vitamine B12 deficiëntie

Beschrijvende statistieken

Samenvatting (Summary in Dutch)

Geluidsniveau s in/om klaslokalen

Dr.ir. J.A.P.M. de Laat, klinisch-fysicus audioloog hoofd Audiologisch Centrum, LUMC

Hoorzorg binnen een instelling

Audiogrammen. Een gezond gehoor. Geleidingsverlies. Ed de Geus februari Luchtgeleiding: Beengeleiding: UCL: MCL: Spraakaudiogram:

Dubbelzijdige cochleaire implantatie bij kinderen: de primaire voordelen

ASSR als onderdeel van de audiologische diagnostiek bij jonge kinderen

Oorverdovend Gehoorschade door muziek(lawaai)

DE SCREENING OP DOWN, EDWARDS EN PATAUSYNDROOM EN DE 20 WEKENECHO PUBLIEKSMONITOR 2017

beoordelingskader zorgvraagzwaarte

ASSR in de klinische praktijk: vergelijking van MASTER en AUDERA en toepassing bij jonge kinderen

Serologische testen en interpretatie van testresultaten

Audiologische diagnostiek en revalidatie. Cas Smits, klinisch fysicus-audioloog

VWVJ. Karen Van Doorslaer Referatendag - 07/12/2007 ONTWIKKELING VAN STANDAARD GEHOORONDERZOEK IN HET CLB

CQi Kortdurende ambulante geestelijke gezondheidszorg of verslavingszorg

Oorverdovend Gehoorschade door muziek(lawaai)

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Verloop pieklatentie vs intensiteit

Exact Periode 6.1. Juist & Precies Testen

FYSIOTHERAPIE en het behandelen van patiënten met SCHOUDERKLACHTEN. Januari 2015, blok 3, Gerard Koel.

FAQ Lawaai Prof. J. Malchaire

Meten van spraak-in-ruis bij jonge kinderen

but no statistically significant differences

Vroeginterventie via het internet voor depressie en angst

hoofdstuk 2 hoofdstuk 3

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

De status van het gehoor van musici. van vijf symphonieorkesten

Gebruik van de Oorcheck in de jeugdgezondheidszorg

Transcriptie:

Onderzoek naar de toepasbaarheid van de Bedrijfsoorcheck (BOC) Deel B: Evaluatie in de praktijk Oktober 2016 Uitgevoerd in opdracht van: Datum 19-10-2016 Versie eindversie Status beschikbaar via www.hearon.nl Auteurs M. Sheikh Rashid, MSc, AMC Dr.ir. J.A.P.M. de Laat, LUMC Prof.dr.ir. Wouter A. Dreschler, AMC Met dank aan: Trefwoorden Opmerkingen J. Blom, Audiometrist Comfoor Dr. I. Brons, AMC Drs. K. Coenen, Nationale Hoorstichting Drs. L. van Deelen, Nationale Hoorstichting Ing. L. Körössy, AMC Dr. M. Leensen, AMC Drs. L. de Regt, Nationale Hoorstichting L. Ting, BSc, student VUMC NIHL, lawaaislechthorendheid, speech-in-noise, Bedrijfsoorcheck, screeningstest, praktijk, werkvloer, evaluatie Een studie naar de toepasbaarheid van de Bedrijfsoorcheck (BOC). Deel B: Evaluatie in de praktijk. 0

1 Introductie... 3 2 Beschrijving van de Bedrijfsoorcheck... 4 3 Achtergrond Bedrijfsoorcheck... 5 4 Opbouw en Doelstellingen van het onderzoek... 5 5 Methodologie... 7 5.1 Studiepopulatie... 7 5.2 Sample size berekening... 7 5.3 Inclusiecriteria... 7 5.4 Testen... 8 5.4.1 Bedrijfsoorcheck... 8 5.4.2 Screeningsaudiometrie... 8 5.4.3 Geluidsmetingen testruimtes... 8 6 Evaluatieonderzoek #1... 10 6.1 Onderzoeksopzet... 10 6.2 Analyses... 10 6.3 Resultaten... 11 6.3.1 Toonaudiogram... 11 6.3.2 Screeningsaudiometrie... 11 6.3.3 Correlatie tussen het toonaudiogram en SRT score... 13 6.3.4 Test-retest betrouwbaarheid... 14 6.3.5 Discriminerend vermogen: sensitiviteit en specificiteit... 14 6.3.6 Invloed van aanloop en lengte van de test op testresultaten... 17 6.4 Discussie... 18 6.4.1 Test karakteristieken van de BOC in de praktijk... 18 6.4.2 Testpopulatie... 18 6.4.3 Vergelijking met lab onderzoek... 18 6.4.4 Aanloop en lengte van de test... 19 1

6.4.5 Flash vs. HTML... 19 6.4.6 Afweging afkappunt... 20 6.5 Definitie NIHL... 21 6.6 Implicaties voor de praktijk... 22 6.6.1 Van oor naar persoon... 22 6.6.2 Benaderingen in een model... 23 7 Evaluatieonderzoek #2... 24 7.1 Onderzoeksopzet... 24 7.2 Resultaten... 24 7.2.1 Beschrijvende statistiek... 24 7.2.2 De gevoeligheid van de BOC bij een automatische retest... 25 7.2.3 Het effect van de automatische retest... 27 7.2.4 Aanloop en lengte van de test... 27 7.3 Discussie... 28 8 Implicaties voor het gebruik van de BOC... 30 9 Conclusie... 30 Bijlage I: Karakterisering van de meetruimten... 31 Bijlage II. ROC-analyse... 32 Bijlage III. Uitslagen toonaudiometrie en BOC per testpartner en per leeftijdscategorie (nieuw afkappunt: -14,9 db SNR)... 33 Bijlage 4. Lijst van Afkortingen... 36 2

1 INTRODUCTIE Adequaat gehooronderzoek speelt een grote rol in de preventie van lawaaislechthorendheid. Tijdens periodiek arbeidsgezondheidskundig onderzoek (PAGO) wordt het gehoor van werknemers gescreend door middel van audiometrie. Deze reguliere screeningsmethode in de arbeidsgeneeskundige praktijk is een relatief tijdrovende, en dure methode om het gehoor te screenen. Toonaudiometrie dient afgenomen te worden door een getrainde audiometrist. Om een nauwkeurige meting te kunnen uitvoeren is tevens de aanwezigheid van een geluidsarme cabine noodzakelijk. Hoewel de richtlijn voorschrijft dat werknemers in lawaai eens in de twee jaar een gehoortest moeten krijgen, blijkt dat deze frequentie in de praktijk niet wordt gehaald. Om de gehoorstatus van de werknemer goed te kunnen monitoren is frequenter testen wenselijk. Op sommige plaatsen wordt hiertoe de meting van oto-akoestische emissies ingezet, maar naar onze mening is nog steeds niet aangetoond dat dit op individueel niveau een betrouwbare en valide methode is. De Bedrijfsoorcheck (BOC) is een aan de werksituatie aangepaste objectieve screeningstest via het internet en kan een belangrijke bijdrage leveren aan de opsporing van gehoorschade enerzijds 1 en aan een toename van de bewustwording anderzijds. De test is laagdrempelig, snel en eenvoudig en kan in een stille ruimte tijdens het PAGO zonder instructies worden uitgevoerd. Alleen de werknemers die slecht scoren op de Bedrijfsoorcheck hoeven toonaudiometrie (vervolgonderzoek) te ondergaan, wat de bedrijven kostenbesparing oplevert. Figuur 1. Responsplaatjes BOC 1 Wellicht ten overvloede zij vermeld dat de BOC uitsluitend gevoelig is voor perceptieve verliezen en niet voor geleidingsverliezen. Daardoor zal een verminderd gehoor ten gevolgen van een verkoudheid niet leiden tot een positieve (d.w.z. afwijkende) testuitslag. 3

2 BESCHRIJVING VAN DE BEDRIJFSOORCHECK De Bedrijfsoorcheck (BOC) is een online spraak-in-ruis test voor gehoorscreening. Deze versie is speciaal ontwikkeld voor werknemers die in lawaai werken 2. Deelnemers krijgen achtereenvolgens een lijst van woorden in een low-pass gefilterde breedbandige ruis te horen. De decibel-verhouding tussen het spraakniveau en het ruisniveau, oftewel de signalto-noise ratio (SNR), varieert hierbij. Het eerste woord wordt met een SNR van 0 decibel (db) aangeboden, een niveau dat zelfs voor matig slechthorenden nog verstaanbaar is. Per woord (stimulus) moet de deelnemer het bijbehorende plaatje aanklikken. Als het woord niet verstaan is, kan de deelnemer op het plaatje niet verstaan klikken. De meting begint zodra het eerste onjuiste antwoord is gegeven. De BOC werkt volgens de adaptieve methode. Het aanbiedingsniveau van de woorden wordt telkens met 2 db verlaagd als het woord juist verstaan wordt en met 2 db verhoogd na een fout antwoord of niet verstaan. Het geluidsniveau van de ruis blijft constant. De eerste 5 stimuli worden als aanloop naar de daadwerkelijke meting beschouwd. Van de 20 presentatieniveaus die vervolgens voor de eigenlijke meting gebruikt worden, wordt de gemiddelde SNR bepaald (M. Sheikh Rashid, rapport 2014). Het gemiddelde van de aanbiedingsniveaus wordt de verstaanvaardigheidsdrempel waarbij 50% van het woordmateriaal goed wordt verstaan genoemd, oftewel de Speech Reception Threshold (SRT). De SRT geeft aan hoe goed een persoon in staat is om spraak in omgevingsruis te verstaan en is daarmee een maat voor de selectiviteit van het gehoor. Binnen de adaptieve procedure wordt de intra-test standaarddeviatie bepaald, die gerelateerd is aan de spreiding van de schommelingen rondom de SRT. Een intra-test standaarddeviatie (sd) kleiner dan 3 db zal alleen gehaald kunnen worden als de test met aandacht wordt uitgevoerd. Daarom is deze maat bruikbaar als indicator voor de nauwkeurigheid van de test. De BOC meet in enkele minuten de gehoorfunctie van de deelnemer. De respondenten dienen met een hoofdtelefoon te luisteren om de oren onafhankelijk van elkaar te kunnen meten. Beide oren worden om de beurt afzonderlijk getest. Testuitslagen worden onmiddellijk na het aanklikken van het laatste woord weergegeven. Ten behoeve van de test wordt de respondenten gevraagd enkele gegevens in te vullen, namelijk hun geslacht, leeftijd en de eigen inschatting van het gehoor. Deze gegevens worden samen met de testuitslag en gegevens over het tijdstip waarop de test is uitgevoerd, opgeslagen in een databestand. De BOC bevat de volgende woorden: sok, zon, pan, tas, bed, mes, boek en poes (zie figuur 1). Deze woorden hebben per paar dezelfde vocalen (klinkers). Hierdoor dient de luisteraar meer aandacht te geven aan de consonanten (medeklinkers) om het woord te herkennen. Bovendien worden er meer hoogfrequente consonanten gebruikt wat de test naar verwachting gevoeliger maakt voor hoogfrequent verlies, zoals bij (beginnende) lawaaislechthorendheid (Noise-Induced Hearing Loss, afgekort NIHL). 2 Ellis, N., Kuijpers, M., Pijl, S. van der, Verbiest, E. 2006. Ontwikkeling van een gehoorscreening voor het bedrijfsleven. Rotterdam. 4

3 ACHTERGROND BEDRIJFSOORCHECK De online spraak-in-ruis test is uitgebreid geëvalueerd, waarbij deze werd vergeleken met reguliere toonaudiometrie en met de standaard spraak-in-ruis test van Plomp en Mimpen (1979a)(Leensen et al., 2011a). Er is onderzocht of en hoe de gevoeligheid van de spraak-inruis test verbeterd kan worden (Leensen et al., 2011b). Het is gebleken dat de homogenisatie van de spraakstimuli de betrouwbaarheid van de test positief beïnvloedt. Tevens is gebleken dat het discriminatievermogen van de test verbeterd kan worden door een maskeerruis te gebruiken die gefilterd is met een laagdoorlaatfilter (low-pass filtered noise). Dit type ruis stimuleert de testpersoon om zo veel mogelijk gebruik te maken van hoogfrequente spraakinformatie. Door een dergelijke ruis te gebruiken in plaats van een breedbandige ruis, is de sensitiviteit en de specificiteit van de test sterk verbeterd. 4 OPBOUW EN DOELSTELLINGEN VAN HET ONDERZOEK Het doel van dit project is het ontwikkelen van een online spraak-in ruis screeningstest die specifiek gevoelig is voor het detecteren van een lawaaidip in het frequentiegebied van 3000 6000 Hertz (Hz), de zogenaamde lawaaidip. De test kan gericht worden ingezet als er kans is op gehoorvermindering door lawaai op het werk. Het project bestaat uit twee delen. In deel A van het onderzoek stond de toepasbaarheid van de BOC, namelijk het gevoeliger maken van de BOC voor NIHL, centraal (M. Sheikh Rashid, rapport 2014). Dit deel bestond uit twee fasen: Fase 1: inventariserend onderzoek naar en aanpassing van de originele BOC Fase 2: validatie-onderzoek van de aangepaste BOC Het inventariserend onderzoek (deel A, fase 1) naar de originele BOC had het doel om testuitslagen uit het verleden te evalueren en punten van verbetering op te sporen, om zodoende de kwaliteit van de test te verhogen. Naar aanleiding van dit onderzoek is het spraakmateriaal gehomogeniseerd en de originele breedbandige continue ruis vervangen door een low-pass gefilterde continue ruis met een afsnijfrequentie van 1600 Hz en een ruisvloer van -12 db. De ruisvloer is bedoeld om het effect van achtergrondlawaai op de test te verminderen. Het doel van het validatie-onderzoek (deel A, fase 2) was om de verbeterde BOC, aan de hand van fase 1, te valideren met behulp van specifieke populaties met een normaal gehoor en met een verschillende mate van lawaaislechthorendheid. Diverse versies van de BOC werden met elkaar vergeleken en de beste variant werd gekozen. Uit de resultaten van fase 2 bleek dat de BOC in zijn huidige vorm een zeer gevoelige test is en heel specifiek (beginnend) lawaai-geïnduceerd gehoorverlies kan opsporen (M. Sheikh Rashid, rapport 2014). Dit cross-sectionele onderzoek is uitgevoerd in een nauwkeurig gecontroleerde klinische/lab setting onder normaalhorenden en slechthorenden met een lawaaigeïnduceerd gehoorverlies. In deze testpopulatie werd een sensitiviteit van 93% en een specificiteit van 94% behaald, bij een afkappunt van SRT=-16,9 db, gekozen op basis van een 5

receiver-operating characteristics (ROC) analyse. Dit houdt in dat de test in de meeste gevallen onder deelnemers met een gehoorverlies resulteerde in een terecht positieve testuitslag en onder normaalhorende deelnemers in een terecht negatieve uitslag. Tevens is uit deze studie gebleken dat de resultaten van de Bedrijfsoorcheck goed overeenkomen met gemiddelde gehoordrempels gemeten door middel van klinische toonaudiometrie, vooral voor de hoge frequenties die als eerste worden aangetast bij lawaaischade (r=0,83). Het huidige onderzoek, deel B van het project, omvat twee praktijkevaluaties van de BOC. Om te onderzoeken of de BOC als aanvulling op (of alternatief voor) screeningaudiometrie kan dienen in een populatie werknemers blootgesteld aan lawaai, is het van belang dat de test in de arbeidsgeneeskundige praktijksituatie wordt geëvalueerd. Op basis van het eerste evaluatieonderzoek bleken nog een aantal bijstellingen gewenst. Na het realiseren van deze bijstellingen is een tweede evaluatieonderzoek uitgevoerd. De volgende onderzoeksvragen worden beantwoord: 1. Wat is de validiteit van de BOC, wanneer toegepast in een populatie werknemers met vooraf onbekende prevalentie van NIHL? Om de validiteit van de online screeningstest te onderzoeken worden de resultaten van de BOC vergeleken met screeningstoonaudiometrie, de reguliere screeningsmethode. 2. Wat is de betrouwbaarheid van de BOC wanneer uitgevoerd in deze setting? Door de resultaten van test en retest met elkaar te vergelijken wordt de reproduceerbaarheid in kaart gebracht. 3. Wat is de gevoeligheid van de BOC wanneer uitgevoerd in deze setting, zowel per oor als per persoon? Om de gevoeligheid van de test te onderzoeken worden de sensitiviteit en de specificiteit bepaald. In de praktijk zouden deze beiden tot minimaal boven de 80% moeten stijgen. Deze gevoeligheid wordt allereerst geëvalueerd op het niveau van de individuele oren, zoals ook in voorgaand onderzoek is gebeurd. Maar met de BOC wordt uiteindelijk een beslissing genomen tot het al of niet doorverwijzen van individuele personen. Daarom zijn analyses toegevoegd op het niveau van personen. 6

5 METHODOLOGIE De opzet van beide studies en de informed consent zijn goedgekeurd door de Medisch Ethische Toetsingscommissie (METC) van het AMC: nummer 2013_231. De METC is van oordeel dat er voor deelnemers aan dit onderzoek geen risico s zijn verbonden. Daarom heeft de commissie voor dit onderzoek ontheffing verleend van de verplichting een proefpersonenverzekering af te sluiten. 5.1 STUDIEPOPULATIE De onderzoeksdeelnemers kwamen uit een populatie van aan lawaai blootgestelde werknemers. Deze werknemers zijn afkomstig uit beroepen waarin er sprake is van (enige) lawaaiblootstelling en hebben ofwel een normaal gehoor, ofwel een gehoorverlies veroorzaakt door blootstelling aan lawaai. De werving van de werknemers heeft plaatsgevonden in samenwerking met verschillende bedrijven waarbij sprake is van lawaaiexpositie op de werkvloer. De werknemers werden benaderd door hun werkgever en ontvingen allemaal een informatiebrief. Men kon zich geheel vrijwillig aanmelden voor deelname. Voor een goede leeftijdsspreiding van de studiepopulatie, streven we ernaar dat de helft van de geïncludeerde deelnemers jonger is dan 40 jaar en de andere helft ouder. 5.2 SAMPLE SIZE BEREKENING Om een voldoende aantal proefpersonen te selecteren voor het validatieonderzoek is er een steekproefberekening uitgevoerd. Hierbij is gebruik gemaakt van het programma nquery Advisor 7.0. Bij deze berekening werd een significantieniveau (α) van 0.05 en een power (β) van 80% aangehouden. In een eerder uitgevoerde veldstudie waarin een vergelijkbare spraak-in-ruis test met screeningsaudiometrie werd vergeleken, werd een correlatie tussen uitkomsten van beide meetmethoden gevonden van 0.58 3. Om onderscheid te maken tussen deze gevonden correlatie en een middelmatige waarde van 0.30 zijn er 79 personen nodig. Echter, hoe groter de studiepopulatie des te groter de power. Bovendien anticipeert een groter aantal deelnemers ook op eventuele uitval (loss to follow-up). Daarom streefden we in beide studies naar 100 deelnemers. 5.3 INCLUSIECRITERIA De onderzoeksdeelnemers waren 18 jaar of ouder en hun moedertaal was Nederlands. In studie #1 zijn personen met taalproblemen, asymmetrisch gehoorverlies, of een andere vorm van gehoorverlies dan lawaaislechthorendheid, uitgesloten. De exclusie van ongeschikte onderzoeksdeelnemers vond achteraf plaats. In studie #2 is dit niet gebeurd om het gebruik van de BOC in de praktijk zo realistisch mogelijk te testen. 3 Leensen, M.C.; Dreschler, W.A. The applicability of a speech-in-noise screening test in occupational hearing consevation. Int. J. Audiol. 2013. 72(7):455-65. 7

5.4 TESTEN 5.4.1 BEDRIJFSOORCHECK In Evaluatie-onderzoek #1 werd de BOC zelfstandig afgenomen op een laptop i.c.m. een Sennheiser HDA200 hoofdtelefoon. Een flash-versie en een HTML-versie van de BOC stonden klaar op een internetpagina. De helft van de onderzoeksdeelnemers onderging de test in flash en de andere helft onderging de test in html. Alle screeningstesten werden afgenomen op hetzelfde geluidsniveau, vooraf ingesteld naar voorkeur van de proefpersoon d.m.v. de volumebalk die getoond werd op de BOC website (met een bereik van 64-84 dba). In Evaluatie-onderzoek #2 werd de BOC afgenomen via een ipad met relatief eenvoudige hoofdtelefoons. Uit een onderzoek van dr. M. Leensen is gebleken dat het afkappunt gebaseerd op metingen in het lab een correctie van -1.2 db behoeft wanneer de hoortesten thuis via internet worden afgenomen (Leensen & Dreschler, 2013) 4. Over het algemeen haalt men in de thuissituatie een slechtere SRT dan in een gecontroleerde lab situatie. Een praktijksituatie, zoals bij deze studie het geval is, ligt naar verwachting dichter bij de thuissituatie dan bij metingen op het lab. Vooralsnog is gewerkt met een afkappunt van -15,7 db (kleiner dan of gelijk aan -15,7 is goed en groter dan -15,7 is niet goed ). In Evaluatie-onderzoek #1 wordt nagegaan of deze afkapwaarde de beste scheiding geeft tussen normaalhorend en slechthorend. 5.4.2 SCREENINGSAUDIOMETRIE Voor de afname van het toonaudiogram werden verschillende klinische audiometers gebruikt: AC40, Madsen Micromate 304 (Otometrics) en Voyager 522, i.c.m. een TDH 39 hoofdtelefoon met dempende kappen (Amplivox audiocups). Alle audiometers voldoen aan de norm EN 60645-1 (ANSI S3.6, Type 2), waren gekalibreerd en het toonaudiogram werd afgenomen door geschoolde medewerkers. Beide oren werden gemeten op 500, 1000, 2000, 3000, 4000, 6000 en 8000 Hz voor luchtgeleiding. De uitslagen werden kort met de deelnemer besproken. 5.4.3 GELUIDSMETINGEN TESTRUIMTES De BOC werd uitgevoerd in een stille (vergader)ruimte op de bedrijfslocatie, representatief voor de praktijksituatie. Omdat het niet mogelijk was toonaudiometrie in een geluidsdichte cabine uit te voeren, vond dit deel ook plaats in een stille (vergader)ruimte op locatie. De testruimtes waren stil, maar niet geheel geluidsdicht. 4 Leensen MCJ, Dreschler WA. The applicability of a speech-in-noise screening test in occupational hearing conservation. Int J Audiol 2013; 52(7):455-65. 8

Om te beoordelen of het achtergrondgeluid niet hinderlijk was voor de uitvoering van de metingen, is het geluidsniveau in de testruimtes gemeten. Het geluidsniveau is gemeten in 1/3 octaafbanden(middenfrequentie) van 125 Hz t/m 4000 Hz (LZ max : Z-weighted, fast, maximum, in db SPL). Per meetruimte zijn er telkens drie metingen verricht ter hoogte van de proefpersoon. De niveaus zijn energetisch gemiddeld. De geluidsniveaus zijn vergeleken met het maximaal toelaatbare niveau van achtergrond geluid (L max in db SPL) volgens ISO 8253 (deel I), een norm opgesteld voor het meten van gehoordrempels in het kader van gehoorscreening (ongemaskeerde luchtgeleiding vanaf 500 Hz). Er is gecorrigeerd voor de gemiddelde demping van de Amplivox kappen over de TDH 39 hoofdtelefoon (zie Bijlage I). De maximaal toelaatbare geluidsniveaus werden in de meeste testruimtes niet overschreden, met uitzondering van de kantoorruimten in de bedrijven 5 en 6. De toonaudiometrie werd uitgevoerd in cabines binnen deze ruimten, waar de gemeten niveaus wel ruim onder de toegestane niveaus lagen. 9

6 EVALUATIEONDERZOEK #1 6.1 ONDERZOEKSOPZET Evaluatieonderzoek #1 vond plaats op vijf verschillende bedrijfslocaties. De metingen werden uitgevoerd in twee stille (dicht bij elkaar gelegen) ruimtes, waarvan tenminste één zeer stille ruimte en tenminste één ruimte voorzien van een internetverbinding. Tijdens een meting werden achtereenvolgens een vragenlijst 5, een BOC-test en een toonaudiogram afgenomen. De BOC-test werd om reden van beschikbare tijd slechts bij een subgroep nog een tweede keer afgenomen (retest). Zie figuur 2 voor een schematisch overzicht van de testonderdelen. Een meting duurde ongeveer 30-35 minuten per onderzoeksdeelnemer. Figuur 2. Schematisch overzicht testonderdelen 6.2 ANALYSES Analyses werden uitgevoerd met behulp van het programma SPSS 20 en Microsoft Excel 2010. Beschrijvende statistiek is uitgevoerd op gehoordrempels en demografische kenmerken. SRT resultaten van de BOC zijn met behulp van ongepaarde t-toetsen vergeleken tussen normaalhorenden en slechthorenden. Correlatie analyses zijn uitgevoerd om de resultaten van de BOC te vergelijken met het toonaudiogram om zo de validiteit te bepalen. Om de test-retest betrouwbaarheid in kaart te brengen is het leereffect bepaald door middel van t-testen en zijn er overige testkarakteristieken berekend, zoals de standard error of measurement (SEM) en de intra-class correlation coefficient (ICC). Met behulp van ROC analyses is voor elke testvariant de sensitiviteit en de specificiteit berekend. Voor de sensitiviteit en specificiteit berekeningen is uitgegaan van de verschillende definities voor NIHL. Verder is de invloed van aanloop en lengte van de test op de gemiddelde intra-test standaarddeviaties (standaard deviatie van de adaptieve procedure) onderzocht. 5 De vragenlijst zal na enkele maanden nogmaals worden toegestuurd. Hierover zal apart worden gerapporteerd door de Nationale HoorStichting. 10

6.3 RESULTATEN Er waren in totaal 102 aanmeldingen voor het onderzoek. Daarvan waren er zes no-shows/ afmeldingen. Binnen deze studie hebben wij onderscheid gemaakt tussen normaalhorende proefpersonen (groep NH) en proefpersonen met een perceptief hoge tonen verlies t.b.v. lawaai (groep NIHL). NH deelnemers hadden een normaal gehoor, gedefinieerd als volgt: Gehoordrempels op elke octaaffrequentie (500 t/m 8000 Hz) van 20 db HL of beter. NIHL deelnemers hadden een perceptief hoge tonenverlies, gedefinieerd als volgt: Een gehoordrempel van 20 db HL of beter voor de lagere octaaffrequenties (500 t/m 2000 Hz) en een PTA 34 (Pure-Tone Average, gemiddelde gehoordrempel voor de frequenties 3 en 4 khz) van 25 db of slechter. Negen deelnemers werden uitgesloten van de analyses o.b.v. hun toonaudiogram (ze voldeden niet aan de inclusiecriteria die waren bepaald voor de twee groepen: NH en NIHL). Van de resterende 87 deelnemers was de meerderheid man (94,3%). 44% Van alle deelnemers was 40 jaar of jonger. De gemiddelde leeftijd was 41 jaar (sd=12, range: 20-62 jaar). 6.3.1 TOONAUDIOGRAM De gehoordrempels zijn, per oor, in percentielen weergegeven in figuur 3. Van de 174 oren waren 142 oren normaalhorend (74 rechteroren en 68 linkeroren) en 32 oren lawaaislechthorend (13 rechteroren en 19 linkeroren bij 21 personen). Lawaaislechthorenden waren 43 jaar of ouder (bij de ouderen valt ouderdomsslechthorendheid niet helemaal uit te sluiten). 6.3.2 SCREENINGSAUDIOMETRIE De gemiddelde SRT s van de normaalhorende oren zijn vergeleken met die van de slechthorende oren. De gemiddelde SRT voor de BOC voor normaalhorende oren was -17,0 db (sd=2,1) en slechthorende oren worden was -11,6 db (sd=3,2). Het verschil van 5,4 db was significant (p<0.000). De gemiddelde verschillen, met bijbehorend 95%- betrouwbaarheidsinterval en significantieniveau, per leeftijdsgroep, staan beschreven in tabel 1. Onder de deelnemers van 40 jaar of jonger was er maar één slechthorend oor. Het was daarom niet mogelijk om een verschil aan te tonen tussen de NH-oren en de NIHL-oren voor deze leeftijdsgroep. Voor de oudere leeftijdsgroep scoorde de NH-oren significant beter dan de NIHL-oren. 11

Hearing loss (db) Hearing loss (db) Hearing loss (db) NH: Right ear NH: Left ear -20-20 0 0 20 20 40 60 10th 25th 40 60 10th 25th 80 50th 80 50th 100 75th 90th 120 125 250 500 1000 2000 4000 8000 Frequency (Hz) 75th 100 90th 120 125 250 500 1000 2000 4000 8000 Frequency (Hz) -20 NIHL: Right ear 0 20 40 60 80 10th 25th 50th 100 75th 90th 120 125 250 500 1000 2000 4000 8000 Frequency (Hz) Figuur 3. Gehoordrempels van de onderzoeksdeelnemers voor normaalhorende en slechthorende oren (rechts en links), in percentielen (10 e,25 e, 50 e (mediaan), 75 e en 90 e ) Tabel 1. SRT scores voor normaalhorende en slechthorende oren, per leeftijdsgroep Leeftijd Gehoor N SRT (db) Δ NH-NIHL (db) ondergrens 95%-BI bovengrens P 40 jaar >40 jaar NH 75-17,4 (1,8) NIHL 1-17,6 NH 67-16,5 (2,2) NIHL 31-11,4 (3,1) 0,2-3,5 3,9 1.000-5,1-6,2-4,0 <0.001 12

6.3.3 CORRELATIE TUSSEN HET TOONAUDIOGRAM EN SRT SCORE De resultaten van de BOC (de eerste meting en per oor, over de gehele groep van NH en NIHL) zijn vergeleken met het toonaudiogram. Uit figuur 4 blijkt dat de resultaten van de testvarianten sterk correleren met de gemiddelde gehoordrempels op de hoge frequenties (PTA 34 en PTA 346 ), met een correlatiecoëfficiënt groter dan 0,7. Figuur 4. Scatterplots en correlatiecoëfficiënten voor de SRT met PTA 3,4 en PTA 3,4,6 Tevens zijn de resultaten van de BOC met het toonaudiogram vergeleken voor de normaalhorende en de slechthorende deelnemers afzonderlijk (definitie PTA 3,4, eerste meting en per oor) (figuur 5). De correlatie PTA en SRT is per groep kleiner (r=0,41 voor de normaalhorende oren en r=0,27 voor de lawaaislechthorende oren). Figuur 5. Scatterplots en correlatiecoëfficiënten voor SRT en PTA 3,4 voor NH en NIHL oren 13

6.3.4 TEST-RETEST BETROUWBAARHEID Achttien deelnemers hebben de test tweemaal uitgevoerd. De SRT-waarden voor test en retest (per oor) zijn met elkaar vergeleken. Het retest resultaat was over het algemeen beter (lagere SRT score) dan het resultaat van de eerste test (67%). Dit wijst op een bescheiden leereffect. De gemiddelde SRT-waarden voor test en retest en overige test-retest karakteristieken zijn weergegeven in tabel 2. Het gemiddelde leereffect van 0,62 db is niet significant. De gemiddelde standaardafwijking binnen één test (voor het eerste oor dat gemeten is), is 2,2 db. Acht van de 36 oren (22%) hadden een groter test-retest verschil dan de gemiddelde standaardafwijking binnen één test (2,2 db) (minimaal -4 db en maximaal 4,8 db). De test-retest betrouwbaarheid is weergegeven door de standard error of measurement (SEM, ofwel de intra-individuele standaarddeviatie van het verschil). Tenslotte is de mate van correlatie tussen de SRT-waarden van de test en retest berekend (intra-class correlation coefficient, ICC). De mate van correlatie tussen de SRT scores van de test en retest meting is gemiddeld hoog, namelijk 0,62. Tabel 3. Test retest karakteristieken (uitslag per oor, n=36) SRT test SRT retest Δ test-retest p SEM ICC* (db SNR) (db SNR) (db SNR) -16,63 (sd=2,47) -17,25 (sd=2,20) 0,62 (95%-BI: -0,06; 1,3) 0,07 1,04 0,62 * Two-way random model, type: absolute agreement, single measures 6.3.5 DISCRIMINEREND VERMOGEN: SENSITIVITEIT EN SPECIFICITEIT Met behulp van kruistabellen is de prevalentie lawaaischade, de sensitiviteit (percentage terecht positief, ofwel terecht een afwijkende score en dus NIHL) en de specificiteit (percentage terecht negatief, ofwel terecht een goede score en dus normaalhorend) van de BOC berekend voor de volgende definities van NIHL: - Definitie 1: PTA 3,4 (Een gehoordrempel van 20 db HL of beter voor de octaaffrequenties 500 t/m 2000 Hz en een gemiddelde gehoordrempel voor de frequenties 3 en 4 khz van 25 db HL of slechter (zie tabel 3). - Definitie 2: Een gehoordrempel van 20 db HL of beter voor de octaaffrequenties 500 t/m 1000 Hz en tenminste 1 frequentie in het frequentiegebied 2-6 khz van 25 db HL of slechter (zie tabel 4). - Definitie 3: PTA 3,4,6 (Een gehoordrempel van 20 db HL of beter voor de octaaffrequenties 500 t/m 2000 Hz en een gemiddelde gehoordrempel voor de frequenties 3, 4, 6 khz van 25 db of slechter (zie tabel 5). In de kruistabellen is de kans op de aan- of afwezigheid van lawaaischade uitgezet tegen de kans op aan- of afwezigheid van een slechte BOC score. Hierbij is uitgegaan van het afkappunt zoals bepaald op basis van het laboratorium experiment: -15,7 db. Definitie 2, de minst strenge definitie, resulteerde in een NIHL prevalentie van maar liefst 35%. Wanneer de wat strengere definities 1 en 3 werden gehanteerd, werd er een prevalentie van respectievelijk 18% en 21% gevonden. 14

Tabel 3. Kruistabel definitie 1 (uitslag per oor, n=174) Toonaudiometrie (definitie 1: PTA 3,4 ) BOC Afkappunt -15,7 db NH NIHL Totaal Negatief 104 4 108 Positief 38 28 66 Totaal 142 32 174 Prevalentie NIHL: 32/174=0,18; Sensitiviteit: 28/32=0,88; Specificiteit: 104/142=0,73 Tabel 4. Kruistabel definitie 2 (uitslag per oor, n=174) Toonaudiometrie (definitie 2: 1 frequentie) BOC Afkappunt -15,7 db NH NIHL Totaal Negatief 92 16 108 Positief 21 45 66 Totaal 113 61 174 Prevalentie NIHL: 61/174=0,35; Sensitiviteit: 45/61=0,74; Specificiteit: 92/113=0,81 Tabel 5. Kruistabel definitie 3 (uitslag per oor, n=174) Toonaudiometrie (definitie 3: PTA 3,4,6 ) BOC Afkappunt -15,7 db NH NIHL Totaal Negatief 101 7 108 Positief 36 30 66 Totaal 137 37 174 Prevalentie NIHL: 37/174=0,21; Sensitiviteit: 30/37=0,81; Specificiteit: 101/137=0,74 15

De keuze van de definitie beïnvloedt de sensitiviteit en de specificiteit. Van alle gehanteerde definities behaalde definitie 2 de laagste sensitiviteit, namelijk 74%. Daarentegen behaalde deze definitie de hoogste specificiteit. Definitie 1 en 3 resulteerden beiden in een hogere sensitiviteit, respectievelijk 88% en 81%, maar een lagere specificiteit, respectievelijk 73% en 74%. Vervolgens is een ROC-analyse uitgevoerd om te onderzoeken of het aanpassen van het gekozen afkappunt de sensitiviteit en de specificiteit kan verbeteren (bijlage II). Op basis van deze gegevens is de beste waarde voor het afkappunt om onderscheid te maken tussen normaalhorenden en lawaaislechthorenden (met zowel een hoge sensitiviteit als een hoge specificiteit) gekozen. Tabel 6 geeft de beste afweging van de sensitiviteit en de specificiteit en de bijbehorende nieuwe afkappunten weer. Tabel 6. Resultaten van ROC-analyse, voor de verschillende definities Nieuw afkappunt (db SNR) Sensitiviteit Specificiteit AUC Definitie 1 (PTA 3,4 ) Definitie 2 (1 frequentie) Definitie 3 (PTA 3,4,6 ) -14,9 84% 82% 0,92-16,1 79% 77% 0,87-15,3 81% 80% 0,91 Tevens is de area under the curve (AUC) vermeld, een maat voor de accuratesse van de test. Hoe hoger de waarde (maximaal 1), hoe beter het discriminatievermogen van de test. Voor de eerste definitie stegen de waarden voor sensitiviteit en specificiteit beiden tot hoger dan 80%. 16

6.3.6 INVLOED VAN AANLOOP EN LENGTE VAN DE TEST OP TESTRESULTATEN Zoals eerder beschreven krijgt men bij de aangepaste BOC 25 woorden te horen. Er wordt pas met de daadwerkelijke meting begonnen nadat het eerste onjuiste antwoord gegeven is. Op deze manier wordt voor elke persoon afzonderlijk een startwaarde bepaald. Vervolgens worden de eerste 5 stimuli als aanloop naar de meting beschouwd. Van de 20 presentatieniveaus die voor de meting gebruikt worden, wordt de SRT bepaald. Leereffecten en concentratie kunnen een rol spelen bij de bepaling van een testuitslag. Om deze reden is bestudeerd wat de invloed van de aanloop naar de daadwerkelijke meting is op de resultaten. Tevens is gekeken naar de invloed van de lengte van de test. Voor een totale duur van 20 stimuli zijn de resultaten berekend voor een aanloop van 5 en 10 stimuli, waarbij de meting dus gebaseerd was op respectievelijk 15 en 10 stimuli. Voor Gemiddelde SRT s en intra-test standaarddeviaties voor verschillende combinaties van aanloop en lengte zijn weergegeven in kolom 2 van tabel 7. Voor een totale duur van 25 stimuli zijn de resultaten berekend voor een aanloop van 5, 10 en 15 stimuli, waarbij de meting dus gebaseerd was op respectievelijk 20, 15 en 10 stimuli. De groene cellen geven de huidige situatie aan. De kleinste gemiddelde intra-test standaarddeviatie wordt over het algemeen behaald bij een meting van 25 stimuli met een aanloop van 15 woorden. De verschillen zijn echter klein. Tabel 7. Invloed van aanloop en lengte van de test op testresultaten Aanloop (# stimuli) Totale lengte (# stimuli) 20 25 SRT (db) intra-test sd (db) SRT (db) intra-test sd (db) 5-15,88 2,11-16,00 2,15 10-16,02 2,01-16,13 2,07 15 x x -16,20 1,91 17

6.4 DISCUSSIE Om te onderzoeken of de BOC als aanvulling (of alternatief) voor screeningaudiometrie kan dienen in een populatie werknemers blootgesteld aan lawaai, is deze in de arbeidsgeneeskundige praktijksituatie geëvalueerd. In de uitgevoerde analyses is primair naar de uitkomsten per oor gekeken. In paragraaf 7.8 wordt besproken als wij de resultaten niet per oor maar per persoon analyseren. 6.4.1 TEST KARAKTERISTIEKEN VAN DE BOC IN DE PRAKTIJK De resultaten van 87 werknemers in lawaai zijn onderzocht en hieruit is gebleken dat de test goed discrimineert tussen normaalhorenden en lawaaislechthorenden, met een gemiddeld verschil in SRT score van zo n 5 db. Verder is aangetoond dat de test valide is, met een correlatie tussen SRT scores en het toonaudiogram van r=0,71. Onder de groep werknemers (n=18) die de test tweemaal hebben uitgevoerd is gebleken dat de test-retest betrouwbaarheid toereikend is (met een SEM van 1,04) en dat er sprake is van een klein leereffect, dat niet klinisch relevant is en niet significant was. Tenslotte heeft dit onderzoek aangetoond dat de test (bij toepassing per oor) accuraat is, met een acceptabele sensitiviteit en specificiteit van 84% en 82% als het afkappunt ingesteld is op -14,9 db. Zie bijlage III voor de resultaten (per organisatie en leeftijdsgroep na aanpassing van het afkappunt naar -14,9 db. 6.4.2 TESTPOPULATIE De gevonden waarden zijn gebaseerd op een representatieve testpopulatie van 87 werknemers uit diverse beroepen in lawaai. De verwachting is dat de BOC in vergelijkbare populaties en in vergelijkbare situaties toegepast zal kunnen worden. Echter kunnen verschillen in NIHL prevalentie, leeftijd, geslacht, e.d. leiden tot afwijkingen in de testgevoeligheid. De sensitiviteit en specificiteit zijn geen vaste testkarakteristieken en kunnen per populatie werknemers in lawaai verschillen. Verder zijn voor dit onderzoek de mensen met afwijkende gehoorverliezen (gehoorverliezen in het lagere frequentiegebied) geëxcludeerd (het excluderen van ingewikkelde gevallen noemt men artefactual verification). Ook dit aspect kan invloed hebben op de werkelijke testgevoeligheid. Bij een bredere toepassing van de BOC in andere testpopulaties dient aan dit aspect nader aandacht te worden geschonken. 6.4.3 VERGELIJKING MET LAB ONDERZOEK De waarden die gevonden zijn, zijn echter lager dan de waarden verkregen uit het crosssectionele onderzoek, uitgevoerd in een nauwkeurig gecontroleerde lab setting (deel A, fase 2, M. Sheikh Rashid). In de testpopulatie met normaalhorenden en slechthorenden met een lawaaischade werd (bij toepassing per oor) een sensitiviteit van 93% en een specificiteit van 94% behaald. Tevens bleek dat de resultaten van de Bedrijfsoorcheck hoger correleerden met de gemiddelde gehoordrempels (r=0,83). Een verklaring voor de gevonden verschillen is dat er in het labonderzoek een andere testpopulatie is onderzocht dan in praktijkevaluatie. 18

Het labonderzoek had een zogeheten two-gate design, waarbij gezonde controles (groep van normaalhorenden) en known cases (proefpersonen waarvan zeer aannemelijk was dat zij NIHL hebben) zijn geworven. Normaalhorenden zijn makkelijker te onderscheiden van duidelijke gevallen van lawaaischade (er is geen grijs gebied), waardoor een hoge sensitiviteit en specificiteit kan worden behaald. In de praktijkevaluatie is een grote representatieve groep aan lawaai blootgestelde werknemers onderzocht, waarvan de prevalentie NIHL vooraf onbekend was. Door de grote variatie in gehoorstatus waren normaalhorenden moeilijker te onderscheiden van slechthorenden (variërend van normaal gehoor tot significante gehoorverliezen), wat de meest waarschijnlijk oorzaak is voor de lagere sensitiviteit en specificiteit. Een andere verklaring is dat een verschillende referentiestandaard is gebruikt. In het labonderzoek is de BOC vergeleken met klinische toonaudiometrie, uitgevoerd in een geluidsarme cabine. In de praktijkevaluatie is screeningsaudiometrie toegepast, wat kan leiden tot minder nauwkeurige resultaten. Tenslotte kan de aanwezigheid van omgevingslawaai in de praktijkevaluatie een rol hebben gespeeld. Op de meetdagen week het omgevingslawaai soms af van het voorafgaand gemeten geluidsniveau (zoals beschreven in hoofdstuk 5.5) door onverwachte werkzaamheden, vliegtuigverkeer en weersomstandigheden. 6.4.4 AANLOOP EN LENGTE VAN DE TEST Het is gebleken dat de aanloop en de lengte van de test geen grote invloed hebben op de gemiddelde SRT en intra-individuele standaarddeviatie. Ook verwachten wij niet dat de aanloop en lengte van de test veel invloed hebben op de test-retest betrouwbaarheid en de sensitiviteit en de specificiteit van de test, maar dat is niet verder onderzocht in studie #1. 6.4.5 FLASH VS. HTML In dit onderzoek is de BOC gedeeltelijk afgenomen in flash en gedeeltelijk in HTML. Het is verschil is dat flash zelf de ruis- en woord signalen mixt, terwijl bij de HTML versie de signaalruis files van te voren zijn gemixt. Het voordeel van de HTML versie is dat deze ook op een telefoon of tablet uitgevoerd kan worden. Bij de start was nog niet helemaal duidelijk of beide versies geheel vergelijkbaar zijn. Om dit te controleren in de praktijk onderging de helft van de onderzoeksdeelnemers de test in flash en de andere helft test in HTML. SRT waarden voor beide groepen zijn met elkaar vergeleken (figuur 6). De gemiddelde SRT voor normaalhorende oren was -16,9 db (sd=2,1) in flash en -17,1 db (sd=2,0) in HTML. De gemiddelde SRT voor slechthorende oren was -11,7 db (sd=2,4) in flash en -11,6 db (sd=4,0) in HTML. Ondanks dat er twee verschillende samples met elkaar vergeleken zijn, zijn de verschillen tussen flash en HTML niet significant (p=0.56 voor NH en p=0.95 voor NIHL) en klinisch niet relevant. 19

Figuur 6. Boxplots van de resultaten (per oor) in HTML (donkere boxplots) en in flash (lichte boxplots) 6.4.6 AFWEGING AFKAPPUNT Het is gebleken dat het toegepaste afkappunt (-15,7 db) niet optimaal is. Met een afkappunt van - 14,9 kan de testgevoeligheid tot boven de 80% stijgen. Dit is het meest optimale punt waarop de sensitiviteit en specificiteit elkaar kruisen (zie bijlage II). Bedrijven kunnen echter ook kiezen voor een hogere sensitiviteit als men het belangrijker acht dat alle slechthorenden worden opgespoord of juist kiezen voor een hogere specificiteit als men niet onnodig testpersonen ongerust wil maken. In de tabel 8 staan een paar mogelijke keuzen uitgewerkt, waaruit blijkt in welke mate een hogere sensitiviteit ten koste gaat van de specificiteit en andersom (tabel 8). Deze afweging heeft gevolgen voor het aantal fout-positieve en fout-negatieve uitslagen (tabel 8 en 9) en uiteindelijk voor de medische behandeling en de kosten. Tabel 8. Afweging sensitiviteit en specificiteit en percentage fout-positief en fout-negatief Afkappunt (db SNR) * Sensitiviteit Specificiteit % fout-positief % fout-negatief -17,6 97% 44% 56% 3% -15,7 88% 73% 27% 12% -14,9 84% 82% 18% 16% -14,3 78% 88% 12% 22% -12,1 53% 99% 1% 47% * Men krijgt een slechte uitslag wanneer de SRT score gelijk aan of slechter dan het afkappunt is 20

Tabel 9. Voor- en nadelen hoge/lage sensitiviteit/specificiteit Hoge sensitiviteit, lage specificiteit Hoge specificiteit, lage sensitiviteit Voordelen - Opsporen NIHL: slechthorenden krijgen terecht afwijkende uitslag Gevolgen: - Slechthorenden ondergaan vervolgonderzoek/behandeling - Uitsluiten NIHL: normaalhorenden krijgen terecht niet-afwijkende uitslag Gevolgen: - Geen onnodig vervolgonderzoek Nadelen - NH krijgen onterecht een afwijkende uitslag Gevolgen: - Onnodig vervolgonderzoek - Onnodige ongerustheid - Missen NIHL: slechthorenden krijgen onterecht een negatieve uitslag Gevolgen: - Slechthorenden krijgen geen vervolgonderzoek/behandeling 6.5 DEFINITIE NIHL Zoals verwacht is de keuze voor de definitie NIHL van invloed is op de prevalentie van NIHL en ook op de sensitiviteit en de specificiteit van de BOC. In dit onderzoek is de eerste definitie (PTA 3,4 van 25 db of groter) aangehouden, omdat deze de meest gangbare is en omdat 3000 en 4000 Hz de belangrijkste frequenties zijn waarop lawaaischade te verwachten is (de zogeheten lawaaidip begint in dit frequentiegebied). Definitie 3 (PTA 3,4,6 van 25 db of groter) is ook gangbaar, maar bevat de frequentie 6000 Hz. Toonaudiometrie metingen op deze octaaffrequentie blijken niet altijd even nauwkeurig te zijn (vanwege een kalibratie probleem). De waarden voor deze definities kwamen wel goed met elkaar overeen. Definitie 2 (tenminste op 1 frequentie een gehoorverlies van 25 db of groter) toonde de meest afwijkende resultaten. Met een gevonden prevalentie van 35% is deze dan ook de minst strenge definitie van de drie. Daarom is bij deze definitie de sensitiviteit lager en de specificiteit juist hoger dan bij de overige twee definities. Deze definitie resulteerde in een groter aantal fout-negatieven. Van deze werknemers bleek uit het toonaudiogram dat het gehoor was aangedaan, maar niet ernstig genoeg, waardoor het voor hen alsnog mogelijk was om een goede BOC score te halen. Bij het inzetten van de BOC in de praktijk moet er rekening mee gehouden worden dat verschillende ARBO diensten mogelijk een andere definitie voor NIHL hanteren en daardoor de sensitiviteit en de specificiteit kunnen afwijken. 21

6.6 IMPLICATIES VOOR DE PRAKTIJK 6.6.1 VAN OOR NAAR PERSOON Om de ruwe correlatie tussen SRT meting en toonaudiogram te kunnen bepalen, zijn de analyses verricht op oor-niveau (monauraal). Echter, om uitspraken te kunnen doen over de praktijksituatie, is het van belang dat er een slag wordt gemaakt van oor naar individu (binauraal). Het maakt voor de testgevoeligheid op individueel niveau niet uit of het linker of het rechter oor normaalhorend of slechthorend is, maar juist de totale uitslag die gebaseerd is op beide oren, is van belang. Om de gevoeligheid van de test te bepalen op het individuele niveau wordt er daarom een onderscheid gemaakt tussen normaal gehoor (beide oren normaalhorend, gebaseerd op het toonaudiogram: gemiddelde van 3000 en 4000 Hertz) en NIHL (tenminste één oor lawaaislechthorend). Voor de BOC uitslag geldt: als een individu voor beide oren een goede uitslag krijgt, is de totale uitslag negatief. Als de uitslag voor tenminste één oor onvoldoende is, krijgt het individu de totale uitslag positief. Bij gebruik van het nieuwe afkappunt vinden wij de kruistabel van tabel 10: Tabel 10. Kruistabel Bedrijfsoorcheck (BOC) uitslag en toonaudiometrie (TA) uitslag TA (PTA 3,4 ) NH (beide oren) NIHL (tenminste 1 oor) Totaal BOC (afkappunt -14,9 db) Negatief (beide oren NH) Positief (tenminste 1 oor NIHL) 48 2 50 18 19 37 Totaal 66 21 87 Sensitiviteit (TPR): 90,5%; specificiteit (TNR): 72,7%; FPR: 27,3%; FNR:9,5% Aan de hand van de volgende formules zijn de sensitiviteit, de specificiteit, de false positive rate (het percentage fout positieven) en de false negative rate (het percentage fout negatieven) bepaald: Sensitiviteit (true positive rate (TPR)) = TP/TP+FN Specificiteit (true negative rate (TNR)) = TN/TN+FP False positive rate (FPR) = 1-specificiteit (of FP/FP+ TN) False negative rate (FNR) = 1- sensitiviteit (of FN/FN+TP) Negentien van de 21 deelnemers met NIHL (90,5%) kregen terecht een rode uitslag. Twee van de 21 deelnemers met NIHL (9,5%) werden onterecht niet gedetecteerd als zijnde 22

lawaaislechthorend. Achtenveertig van de 66 normaalhorende deelnemers (72,7%) kregen terecht een groene uitslag. Achttien van de 66 normaalhorende deelnemers (27,3%) kregen onterecht een onvoldoende resultaat. Uit de uitkomsten blijkt dat bij de analyses per persoon de sensitiviteit iets hoger komt te liggen dan bij de uitkomsten per oor, maar de specificiteit neemt sterk af. Dit is het gevolg van verschillende effecten, waarvan de belangrijkste is dat iemand met twee goedhorende oren een ongeveer dubbel zo grote kans krijgt op een fout-positieve uitslag, omdat voor de twee metingen per oor telkens de FPR (false-positive rate) geldig is. In plaats van alle 87 deelnemers (100%) direct door te verwijzen voor een toonaudiogram, hoefden er volgens de BOC maar 37 (43%) doorverwezen te worden. Dit zou een besparing van bijna 60% aan toonaudiometrie kosten kunnen betekenen. 6.6.2 BENADERINGEN IN EEN MODEL In een verklarend model is onderzocht in hoeverre de sensitiviteit en specificiteit veranderen als de resultaten niet per oor, maar per persoon worden toegepast. In dit model zijn alle mogelijk opties gecombineerd: Als eerste parameter is gewerkt met het % oren met een NIHL binnen de populatie Als tweede parameter is gewerkt met het percentage asymmetrische verliezen binnen de populatie, d.w.z. een oor normaalhorend en een oor met NIHL. Als derde parameter is gewerkt met verschillende afkappunten (zie ook tabel 8) Voor elk van de betreffende combinaties (beiderzijds normaalhorend, asymmetrisch of beiderzijds slechthorend) zijn de te verwachten testuitslagen gesimuleerd, uitgaande van de berekende waarden voor TPR, TNR, FPR en FNR (zie boven). Voor de BOC met als afkappunt de waarde van -14,9 db voorspelde dit model een FPR per persoon van 33% en een FNR van 4%. Deze resultaten komen niet exact overeen met de uitkomsten van tabel 10, maar zijn wel in dezelfde orde van grootte. Op basis van studie #1 besluiten wij tot een afkappunt op - 14.9 db. Voor de testlengte kiezen wij - na een individuele start voor een totale testlengte van 20 stimuli: 10 stimuli voor de aanloop en 10 voor de drempelbepaling door middeling over de aangeboden niveaus. Het model is vervolgens gebruikt om te onderzoeken hoe de test robuuster kan worden gemaakt. Omdat de analyse per persoon vooral ongunstig was voor de FPR (een hoge kans op een ten onrechte afwijkende score), is overwogen om de BOC zo aan te passen dat er bij een positieve uitslag voor een gegeven oor automatisch een her-test wordt gestart. Het model is voor dit doel aangepast en voorspelt dat de FPR in dat geval zal dalen, maar ten koste van een stijging van de FNR (de kans op een ten onrechte normale uitkomst). In studie #2 hebben wij onderzocht of het toepassen van een herhaalde meting zal leiden tot een acceptabele combinatie van sensitiviteit en specificiteit. 23

7 EVALUATIEONDERZOEK #2 7.1 ONDERZOEKSOPZET Evaluatieonderzoek #2 richt zich op dezelfde onderzoeksvragen zoals geformuleerd in hoofdstuk 4, maar richt zich op de gevoeligheid van de BOC bij een automatische retest aan het slechte oor/oren: de BOC test was zodanig aangepast dat er bij een positieve/slechte uitslag automatisch een retest werd uitgevoerd. De retest bij een positieve uitslag wordt per oor bepaald. Tijdens een meting werden achtereenvolgens een BOC-test en een toonaudiogram afgenomen. Iedereen werd met een vaste testlengte getest (10 aanloop en 10 test presentaties). Standaard toonaudiometrie werd vanuit de bedrijven georganiseerd. Als de drempels op 3000 of 6000 Hz niet waren bepaald, werden deze waarden geïnterpoleerd vanuit de drempels op de naastliggende octaaffrequenties. De audiogrammen werden gekoppeld aan de BOC uitslagen aan de hand van een BOC-code. De metingen vonden plaats op twee verschillende bedrijfslocaties. De metingen werden uitgevoerd in twee stille (dicht bij elkaar gelegen) ruimtes, waarvan tenminste één zeer stille ruimte en tenminste één ruimte voorzien van een internetverbinding, zie Bijlage I, tabel I.2. Vanwege de bevindingen in evaluatieonderzoek #1 zal er extra aandacht worden besteed aan het effect dat de definitie slechthorendheid heeft op het discriminatievermogen van de test. Ook zal nogmaals worden onderzocht wat de invloed van de aanloop is voor de betrouwbaarheid van de meting en voor de duur/testlengte. 7.2 RESULTATEN 7.2.1 BESCHRIJVENDE STATISTIEK Er waren in totaal 80 deelnemers. De meerderheid was man (n=77; 96,3%). De gemiddelde leeftijd was 43,3 jaar (sd=11,5). Ongeveer de helft van de deelnemers heeft een retest ondergaan voor tenminste 1 oor (n=42; 52,5%). Het gemiddelde toonaudiometrisch verlies (PTA 124 ) bedroeg 11,8 db voor het rechter oor en 12,7 db voor het linker oor. De gemiddelde SRT uitslag (gebaseerd op de laatste metingen), was -16,0 db (sd=3,2) voor het rechteroor en -16,1 db SNR (sd=3,1) voor het linkeroor. De gemiddelde intra-individuele standaarddeviatie voor het rechteroor was 1,95 db (sd=0,60; min=0,84; max=3,16) en voor het linkeroor 1,89 db (sd=0,6; min=0,84; max=3,53). 24

7.2.2 DE GEVOELIGHEID VAN DE BOC BIJ EEN AUTOMATISCHE RETEST Met behulp van kruistabellen is de prevalentie lawaaischade, de sensitiviteit (percentage terecht positief, ofwel terecht een afwijkende score en dus slechthorend) en de specificiteit (percentage terecht negatief, ofwel terecht een goede score en dus normaalhorend) van de BOC berekend, op oor- en patiëntniveau. Hierbij is uitgegaan van het huidig ingestelde afkappunt ( 14,9 db). Aan de hand van de volgende formules zijn de sensitiviteit, de specificiteit, de false positive rate (het percentage fout positieven) en de false negative rate (het percentage fout negatieven) bepaald: Sensitiviteit (true positive rate (TPR)) = TP/TP+FN Specificiteit (true negative rate (TNR)) = TN/TN+FP False positive rate (FPR) = 1-specificiteit (of FP/FP+ TN) False negative rate (FNR) = 1- sensitiviteit (of FN/FN+TP) Er zijn 4 modellen met elkaar vergeleken, waarbij de definities voor normaalhorendheid en slechthorendheid zijn aangepast: Model 1 Model 2 Model 3 Model 4 Definitie normaalhorend (NH) Alle frequenties (500 t/m 8000 Hz) 20 db HL PTA 512 20 db HL en PTA 346 20 db HL PTA 512 20 db HL en PTA 346 30 db HL PTA 512 20 db HL en PTA 346 35 db HL Definitie slechthorend (HI) Ten minste 1 frequentie (500 t/m 8000 Hz) > 20 db HL PTA 512 > 20 db HL en/of PTA 346 >20 db HL PTA 512 > 20 db HL en/of PTA 346 > 30 db HL PTA 512 > 20 db HL en/of PTA 346 > 35 db HL Allereerst is onderzocht wat het effect van de keuze van de definitie slechthorendheid op het discriminatievermogen van de test is. De berekende waarden van de testkarakteristieken in deze populatie zijn voor elk van de vier modellen weergegeven in de tabel 11 (per oor) en tabel 12 (per deelnemer). In de tabel staan telkens twee waarden vermeld, waarbij de eerste waarde betrekking heeft op bovenstaande definitie en de tweede waarde wordt verkregen als het meetpunt op 6 khz buiten beschouwing wordt gelaten in de berekening van de hogere PTA (dus PTA 34 i.p.v. PTA 346 ), zoals ook in evaluatieonderzoek #1 is toegepast. Bij de beoogde toepassing van de BOC zijn vooral de testkarakteristieken per persoon van belang. Hierbij worden voor model 4 de beste resultaten behaald, zeker als 6 khz wordt meegenomen in de beoordeling van het gehoorverlies in de hoge frequenties. In dat geval zijn sensitiviteit en specificiteit beiden 0,89 en derhalve zijn de False positive rate (FPR) en de False negative rate (FNR) beiden 11%. De details voor model 4 zijn vermeld in de kruistabel van Tabel 13. 25

Tabel 11. Overzicht van de testkarakteristeken per oor voor elk van de 4 modellen om slechthorendheid te definiëren. Per cel heeft de eerste waarde betrekking op de definitie van het hoogfrequent verlies op basis van PTA 346 en de tweede waarde op de definitie van het hoogfrequent verlies op basis van PTA 34. Per oor Model 1 Model 2 Model 3 Model 4 Sens/TPR 0,33 / 0,33 0,50 / 0,56 0,63 / 0,56 0,73 / 0,63 Spec/TNR 0,94 / 0,94 0,94 / 0,92 0,93 / 0,90 0,91 / 0,87 FPR 0,06 / 0,06 0,06 / 0,08 0,07 / 0,10 0,09 / 0,13 FNR 0,67 / 0,67 0,50 / 0,44 0,37 / 0,44 0,27 / 0,37 Tabel 12. Overzicht van de testkarakteristeken per persoon voor elk van de 4 modellen om slechthorendheid te definiëren. Per cel heeft de eerste waarde betrekking op de definitie van het hoogfrequent verlies op basis van PTA 346 en de tweede waarde op de definitie van het hoogfrequent verlies op basis van PTA 34. Per persoon Model 1 Model 2 Model 3 Model 4 Sens/TPR 0,42 / 0,42 0,59 / 0,67 0,76 / 0,69 0,89 / 0,78 Spec/TNR 0,93 / 0,93 0,91 / 0,92 0,91 / 0,89 0,89 / 0,84 FPR 0,07 / 0,07 0,09 / 0,08 0,09 / 0,11 0,11 / 0,16 FNR 0,58 / 0,58 0,41 / 0,33 0,24 / 0,31 0,11 / 0,22 Tabel 13. Kruistabel Bedrijfsoorcheck (BOC) uitslag en toonaudiometrie (TA) uitslag voor de beoordeling per persoon bij gebruik van model 4 en de beoordeling van het hoogfrequent gehoorverlies op basis van PTA 346. Per persoon Toonaudiometrie NH NIHL Totaal BOC Negatief 54 (67%) 2 (2,5%) 56 (70%) Positief 7 (9%) 17 (21%) 24 (30%) Totaal 61 19 80 26

Het is belangrijk vast te stellen dat de testkarakteristieken in deze populatie minder gunstig zijn voor de modellen 1 t/m 3. Het verschil met model 4 is dat in deze modellen relatief lichte drempelafwijkingen al worden bestempeld als een gehoorverlies. In de discussie zal nader worden ingegaan op de relevantie van de verschillende modellen. 7.2.3 HET EFFECT VAN DE AUTOMATISCHE RETEST Retrospectief is een analyse uitgevoerd naar het effect van de automatische retest op de testkarakteristieken in deze populatie. In tabel 14a worden de waarden weergegeven die zouden zijn verkregen als de automatische retest niet zou zijn gebruikt. In tabel 14b staan de waarden weergegeven zoals eerder berekend voor de situatie met automatische retest. Het voorspelde effect is duidelijk zichtbaar: de invoering van een automatische retest leidt tot een hogere waarde van de specificiteit ten koste van de waarde van de sensitiviteit. Tabel 14: De testkarakteristieken in de populatie van studie#2 voor de situatie zonder en met een automatische retest. a) Resultaten zonder retest b) Resultaten met retest Model 4 (n=80) Per oor Per patiënt Model 4 (n=80) Per oor Per patiënt Sens/TPR 0,77 0,95 Spec/TNR 0,77 0,67 FPR 0,23 0,33 FNR 0,23 0,05 Sens/TPR 0,73 0,89 Spec/TNR 0,91 0,89 FPR 0,09 0,11 FNR 0,27 0,11 7.2.4 AANLOOP EN LENGTE VAN DE TEST Het is gebleken dat de aanloop en de lengte van de test invloed heeft op de gemiddelde SRT en intra-individuele standaarddeviatie. Binnen het gegeven dat in studie #2 met slechts 20 testwoorden (vanaf de eerste fout) wordt gewerkt, zijn er een beperkt aantal zinvolle keuzen. In dit onderzoek is geanalyseerd wat het effect is van een aanloop van 5 stimuli (met middeling over 15), een aanloop van 8 stimuli (met middeling over 12 stimuli) en een aanloop van 10 stimuli (met middeling over 10 stimuli). De resultaten staan weergegeven in tabel 15. Op basis van deze analyse concluderen wij dat een langere aanloop leidt tot een beter resultaat (lagere SRT-waarde) en een kleinere intra-test standaard deviatie (betrouwbaarder resultaat). De effecten op de sensitiviteit en specificiteit bij gebruik van model 4 (zie boven) staan vermeld in Tabel 16. Uit de analyses blijkt dat de test het meest betrouwbaar is bij gebruik van een aanloop van 10 stimuli (vanaf de eerste fout) en een middeling over eveneens 10 stimuli. 27

Tabel 15: De resultaten (SRT en intra-test standaard deviatie) bij verschillende keuzen van de lengte van de aanloop, zoals ook eerder onderzocht in deel A, fase 1. Aanloop Totale lengte = 20 (# stimuli) (# stimuli) Rechteroor Linkeroor SRT (db) intra-test sd (db) SRT (db) intra-test sd (db) 5-15,56 (3,26) 2,24 (0,76) -15,75 (3,08) 2,14 (0,64 8-15,81 (3,25) 2,05 (0,69) -16,03 (3,08) 1,93 (0,59) 10-16,03 (3,21) 1,95 (0,60) -16,10 (3,12) 1,89 (0,60) Tabel 16: De test-karakteristieken bij verschillende keuzen van de lengte van de aanloop. a) Aanloop=10 Aantal testpresentaties=10 b) Aanloop=5 Aantal testpresentaties=15 c) Aanloop=8 Aantal testpresentaties=12 Model 4 (n=80) Per oor Per patiënt Model 4 (n=80) Per oor Per patiënt Model 4 (n=80) Per oor Per patiënt Sens/TPR 0,73 0,89 Sens/TPR 0,80 0,89 Sens/TPR 0,77 0,89 Spec/TNR 0,91 0,89 Spec/TNR 0,85 0,79 Spec/TNR 0,88 0,84 FPR 0,09 0,11 FPR 0,15 0,21 FPR 0,12 0,16 FNR 0,27 0,11 FNR 0,20 0,11 FNR 0,23 0,11 7.3 DISCUSSIE In deelstudie 2 blijkt dat de test-karakteristieken sterk afhankelijk zijn van de gebruikte definitie voor slechthorendheid. De gunstigste waarden worden verkregen als lichte verliezen (vooral in de hoge frequenties) nog worden beschouwd als normaal conform model 4. Gezien de samenstelling van de studiepopulaties en de te verwachten samenstelling van de doelgroep is dit model verdedigbaar. Immers, bij de oudere werknemers zal relatief vaak sprake zijn van een eerste vorm van ouderdomsslechthorendheid en de test dient op dit punt niet te snel te leiden tot een positieve uitslag. Het criterium voor model 4 is in Figuur 7 grafisch weergegeven als doorgetrokken lijn. Boven deze lijn zijn ter referentie drie lijnen getekend, die betrekking hebben op de gemiddelde gehoorverliezen voor 40-jarigen, 50-jarigen en 60-jarigen, conform ISO-1999;1990. Het is duidelijk dat oudere werknemers bij een gemiddelde achteruitgang van het gehoor nog geen groot risico lopen op een positieve testuitslag. 28

Onder de doorgetrokken lijn van het model 4-criterium is een deels onderbroken lijn getekend, die overeenkomt met de grens waarop het recht op vergoeding voor een hoortoestel ontstaat (PTA 124 >35 db). Op basis van figuur 7 kan worden geconcludeerd dat wij van de BOC mogen verwachten dat de uitslag positief wordt, ruim voordat de betrokken werknemer voor een hoortoestel in aanmerking komt, terwijl de BOC negatief zal scoren bij een gemiddelde achteruitgang van het gehoor tot aan de pensioenleeftijd. De gekozen definitie van model 4 is dus goed werkbaar, zeker in een populatie waarin ook oudere werknemers zijn vertegenwoordigd. Maar met de nu gekozen afkappunten is de BOC minder gevoelig voor kleine drempelafwijkingen (PTA 512 20 db HL en/of PTA 346 35 db HL). Figuur 7. Het criterium voor slechthorend volgens model 4 van de BOC. Ter referentie zijn de gemiddelde leeftijdsafhankelijke gehoorverliezen getekend en de grens waarboven men in aanmerking komt voor de vergoeding van een hoortoestel. 29

8 IMPLICATIES VOOR HET GEBRUIK VAN DE BOC Met de Bedrijfsoorcheck wil de Nationale Hoorstichting werkgevers een laagdrempelig screeningsinstrument aanbieden om het gehoor van werknemers frequent (bijvoorbeeld jaarlijks) te testen. Op deze manier wil de Hoorstichting bewerkstelligen dat er meer aandacht komt voor de preventie van gehoorschade op de werkvloer, en dat zowel werknemers als werkgevers actie ondernemen om lawaaislechthorendheid te voorkomen. Uit het onderzoek is gebleken dat de Bedrijfsoorcheck voldoende accuraat is om ingezet te worden in de arbeidsgeneeskundige praktijk. De volgende stap is om na te gaan hoe de test geïmplementeerd kan worden in de praktijk: als vervanging van toonaudiometrie, als triage (voorafgaand het toonaudiogram), of als add-on (na het toonaudiogram). Een voorstel is om de BOC op jaarlijkse basis in een stille ruimte op de werkvloer te laten afnemen als voorselectie (triage). Bij de keuze van een afkappunt met een voldoende hoge sensitiviteit (-14,9 db) behoeft een traditioneel toonaudiogram in principe alleen afgenomen te worden als de Bedrijfsoorcheck een onvoldoende resultaat laat zien. Dit levert bedrijven een aanzienlijke besparing op: bij toepassing van de definitie voor slechthorendheid van model 4 is de verwachting dat na het uitvoeren van de BOC in een vergelijkbare populatie 70% van de werknemers niet hoeft te worden doorverwezen voor een toonaudiogram. Dit levert potentieel een belangrijke besparing, al dient ook te worden vastgesteld dat bij 2,5% van de populatie een gehoorverlies wordt gemist, dat mogelijk in een volgende screening pas zal worden ontdekt. Bij de 30% die alsnog voor een toonaudiogram wordt verwezen is dit in 2/3 van de gevallen terecht en in 1/3 van de gevallen onterecht (false positive). Het betreft hier ongeveer 9% van de totale populatie. Voor een dubbele voorselectie (dubbele screening) zou de BOC alvorens het testen op de werkvloer tevens een keer thuis uitgevoerd kunnen worden (bijvoorbeeld op tablet of telefoon). 9 CONCLUSIE Studie #1 heeft aangetoond dat de Bedrijfsoorcheck een accurate en betrouwbare test is voor de detectie van lawaaislechthorendheid in een populatie van werknemers blootgesteld aan lawaai met een risico op lawaaischade. De test is zeer gevoelig voor lawaaischade, met een sensitiviteit en een specificiteit hoger dan 80% wanneer het afkappunt op -14,9 db is ingesteld (monauraal). De SRT resultaten correleren goed met het toonaudiogram (r=0,71). Het leereffect is niet significant (0,6 db). Er is een goede test-retest betrouwbaarheid (SEM=1,04; ICC=0,62). Bij gebruik van de testresultaten per persoon stijgt de sensitiviteit naar 91%, maar er wordt ingeleverd op de specificiteit, deze is namelijk 73%. Dit kan ten dele worden gecompenseerd door een herhaalde meting bij een afwijkend resultaat (positieve uitslag). Studie #2 toont aan dat de BOC met een automatische herhaalde meting bij een positief resultaat een bruikbaar instrument is met een goede sensitiviteit en specificiteit (beiden 89%) als men zich richt op gehoorverliezen zoals gedefinieerd in Model 4. 30

BIJLAGE I: KARAKTERISERING VAN DE MEETRUIMTEN Tabel I.1. Maximale achtergrondniveaus en gemeten geluidsniveaus per testruimte, per octaafband voor de ruimten gebruikt in Evaluatie-onderzoek #1. Bedrijf Bedrijf Bedrijf 2 Bedrijf 3 Bedrijf 4 1 1 2 2 TA BOC TA/BOC TA BOC TA BOC TA BOC Frequentie (Hz) ISO 8253 L max (db SPL) Demping TDH-39 (db) L max (db SPL) LZF max (db SPL) LZF max (db SPL) LZF max (db SPL) LZF max (db SPL) LZF max (db SPL) LZF max (db SPL) LZF max (db SPL) LZF max (db SPL) 125 51 9 60 35,3 39,1 42,5 43,9 43,2 46,2 44,8 40,8 250 37 13 50 28,6 33,3 32,3 33,1 39 40,9 35,7 37,8 500 18 24 42 22,5 34,1 34 31,7 36,1 38,8 30,4 35,3 1000 23 30 53 20,7 25,8 33,9 28,9 37,8 33,1 27,5 37,8 2000 30 39 69 25 25,5 30,1 22,9 34 34,1 26,9 26,6 4000 36 44 80 17,1 29,2 41,3 16,9 31,8 25,6 19,1 26,0 8000 33 35 68 15 24,4 28,6 13,1 25,8 14 12,1 18,8 1 Alleen één van de twee (vergelijkbare en naast elkaar gelegen) testruimtes was beschikbaar voor geluidsmetingen 2 Audiometrie (TA) en BOC in dezelfde ruimte Tabel I.2. Maximale achtergrondniveaus en gemeten geluidsniveaus per testruimte, per octaafband voor de ruimten gebruikt in Evaluatie-onderzoek #2. Bedrijf 5 (zaaltje) Bedrijf 5 (kantoor BA) Bedrijf 5 (Cabine) Bedrijf 6 (kantoor) Bedrijf 6 (cabine) Freq 1 Max 2 Demping 3 Max 4 LZeq LZF max LZeq LZF max LZeq LZF max LZeq LZF max LZeq LZF max 125 51 9 60 35,9 46,6 34,9 45,8 22,0 32,9 45,4 64,4 27,3 40,0 250 37 13 50 29,6 47,7 33,6 48,8 16,6 34,1 39,3 58,0 23,8 38,8 500 18 24 42 27,8 38,9 30,2 45,7 11,5 32,4 39,0 63,7 13,1 34,2 1000 23 30 53 23,8 30,1 22,0 30,7 5,6 28,3 37,1 59,5 9,0 25,8 2000 30 39 69 16,7 34,9 16,6 35,1 5,8 24,8 37,7 59,1 9,2 24,6 4000 36 44 80 11,4 33,5 12,9 34,6 8,6 31,6 28,6 49,9 7,5 24,8 8000 33 35 68 9,1 25,9 10,1 22,0 8,1 20,4 23,1 45,6 18,2 27,3 1 Middenfrequentie tertsband (Hz) 2 Maximale niveaus achtergrond volgens ISO 8253 (deel I) Lmax (db SPL) 3 Gemiddelde demping TDH39 hoodtelefoon (Amplivox kap) (db SPL) 4 Maximale toegestane achtergrondniveaus bij gebruik Amplivox kap (db SPL) 31

BIJLAGE II. ROC-ANALYSE Figuur II.1: Sensitiviteit en specificiteit tegen elkaar uitgezet (links) en ROC-curves (rechts) voor de drie verschillende definities van NIHL, die in dit rapport zijn gebruikt. 32

BIJLAGE III. UITSLAGEN TOONAUDIOMETRIE EN BOC PER TESTPARTNER EN PER LEEFTIJDSCATEGORIE (NIEUW AFKAPPUNT: -14,9 DB SNR) Tabel III.1. Uitslag toonaudiometrie (TA)* en Bedrijfsoorcheck (BOC)** per testpartner Testpartner 1 Testpartner 2 Testpartner 3 Testpartner 4 TA BOC TA BOC TA BOC TA BOC <40 jaar Beide oren NH 9 7 10 10 10 7 9 7 1 oor NIHL 0 1 1 1 0 3 0 2 Beide oren NIHL 0 1 0 0 0 0 0 0 Totaal 9 9 11 11 10 10 9 9 40 jaar Beide oren NH 6 3 7 6 9 4 6 5 1 oor NIHL 2 3 1 3 3 6 3 3 Beide oren NIHL 1 3 5 4 3 5 2 3 Totaal 9 9 13 13 15 15 11 11 N 18 18 24 24 25 25 20 20 * PTA3,4 ** Afkappunt -14,9 db Tabel III.2. Leeftijdsverdeling Leeftijdsgroep Percentage 20-24 jaar 8 (9,2%) 25-30 jaar 13 (14,9%) 31-35 jaar 9 (10,3%) 36-40 jaar 9 (10,3%) 41-45 jaar 11 (12,6%) 46-50 jaar 9 (10,3%) 51-55 jaar 19 (21,8%) 56-60 jaar * 9 (10,3%) Totaal 87 (100% * 1 persoon van 62 jaar 33

Figuur III.1. Uitslag toonaudiometrie(links) en Bedrijfsoorcheck (rechts) per leeftijdscategorie Tabel III.3. Uitslag toonaudiometrie en BOC, per leeftijdscategorie (deel I) Leeftijdsgroep 20-24 jaar Beide oren NH 1 oor NIHL Beide oren NIHL Totaal 25-30 jaar Beide oren NH 1 oor NIHL Beide oren NIHL Totaal 31-35 jaar Beide oren NH 1 oor NIHL Beide oren NIHL Totaal 36-40 jaar Beide oren NH 1 oor NIHL Beide oren NIHL Totaal Toonaudiometrie BOC (PTA3,4) (afkappunt -14,9 db) 8 (100%) 7 (87,5%) 0 1 (12,5%) 0 0 8 (100%) 8 (100%) 13 (100%) 11 (84,6%) 0 1 (7,7%) 0 1 (7,7%) 13 (100%) 13 (100%) 9 (100%) 7 (77,8%) 0 2 (22,2%) 0 0 9 (100%) 9 (100%) 8 (88,9%) 6 (66,7%) 1 (11,1%) 3 (33,3%) 0 0 9 (100%) 9 (100%) 34