VERSLAG PRACTICUM SPREKEN EN VERSTAAN

Vergelijkbare documenten
Spreken en Verstaan: Inleiding in de Fonetiek

Analyse spraakspectrogram

David Weenink. Instituut voor Fonetische Wetenschappen ACLC Universiteit van Amsterdam. Spraakverwerking per computer.

huiswerkvragen Spreken en Verstaan ( )

Akoestiek. Geluid zichtbaar gemaakt. Golfvormen. Geluid zichtbaar gemaakt. Golfvormen. Golfvormen. Overzicht

Biofysisch Practicum Geluid Spraakanalyse Richtinghoren Gehoortest

Opgave 2 Amplitude = afstand tussen de evenwichtsstand en de uiterste stand.

INLEIDING IN DE FONETIEK

Handleiding opnemen laagfrequent geluid Van een lid van de vereniging Leefmilieu, september 2014

Viool RVDH Rob van der Haar Sneek Blz. 1

Tentamen Inleiding Meten Vakcode 8E april 2009, uur

Intrinsieke prosodie van klinkers. Constantijn Kaland Marie Postma

Hierin is λ de golflengte in m, v de golfsnelheid in m/s en T de trillingstijd in s.

Werkboek bij Practicum Spreken en Verstaan: Inleiding Fonetiek ( )

Woord vooraf...9. Inleiding

Acoustics. The perfect acoustics of a car. Jan Hoekstra

De spraakbanaan. De spraakbanaan zoals ReSound hem neerzet

Tussentoets spraakherkenning en -synthese (1)

1) Bekijk spectrogram 1. Denk niet aan wat er gezegd wordt, maar identificeer minimaal drie in het oog springende patronen in het spectrogram.

. Dat kun je het beste doen in een donkere ruimte. Dan gebruik je een stroboscooplamp die de hele korte licht fitsen maakt van 0,5 sec.

1) Bekijk spectrogram 1. Denk niet aan wat er gezegd wordt, maar identificeer minimaal drie in het oog springende patronen in het spectrogram.

INSTITUUT VOOR DEELTIJD HTO

De horizontale lijnen geven de normale luchtdruk weer. Boven de horizontale lijn verhoogt de luchtdruk, onder de lijn vermindert de luchtdruk.

Examentraining Natuurkunde havo Subdomein B1. Informatieoverdracht

NaSk overal en extra opgaven

Samenvatting Natuurkunde Samenvatting 4 Hoofdstuk 4 Trillingen en cirkelbewegingen

Schriftelijk tentamen Digitale Telecommunicatie Technieken (5LL20) en Telecommunicatie Techniek (5LL50) op dinsdag 14 juni 2005 van

College Spreken en Verstaan 9. De verwerving van spraakklanken Hoofdstuk 10 De waarneming van spraak

Audacity. Het bewerken van audio bestanden. Gratis te downloaden op :

Naam Klas: Repetitie trillingen en geluid HAVO ( 1 t/m 6)

Om te beginnen vormen de longen de motor van de spraak door de opbouw van luchtdruk.

HOOFDSTUK 5: Digitale audio

Tabellenboek. Gitaar

Hoofdstuk 9 Golven. Gemaakt als toevoeging op methode Natuurkunde Overal

Geluidsanalyse: de Hollandse en de Marokkaanse [z]

David Weenink. First semester 2005

Invloeden van schok en trillingen op product en verpakkingen

Tentamen Spraakherkenning en -synthese

De hele noot Deze noot duurt 4 tellen

TECHNISCHE UNIVERSITEIT EINDHOVEN FACULTEIT DER TECHNISCHE NATUURKUNDE

13 Golven. e Transversale lopende golven. Onderwerpen:

Meten van de Impuls response

Samenvatting NaSk H7 geluid

Het thermisch stemmen van een gitaar

Bijsluiter Presets 2014 t.b.v. NLT-module Sound Design

Geluidsmetingen ter bepaling van de herkomst en signatuur van de bromtoon in de omgeving van windpark Houten

NATUURKUNDE PROEFWERK

HANDLEIDING AUDACITY

Herkansing 1 e Deeltentamen Spraakherkenning en -synthese

Begeleiding bij Acoustic Voice Quality Index v.02.03

m C Trillingen Harmonische trilling Wiskundig intermezzo

Naam: Klas: Repetitie Golven VWO (versie A) Opgave 2 Leg uit wat het verschil is tussen een transversale golf en een longitudinale golf.

Hoofdstuk 5: Elektro-akoestische omzetters

M629 M650 M665 M686 M628

De opbouw van notenladders

Videoclub Bedum. Geluid in video

Hoe werkt het gehoor? Bert van Zanten Klinisch-Fysicus/Audioloog Hoofd KNO-Audiologisch Centrum

Golven. 4.1 Lopende golven

Examen ste tijdvak Vinvis zingt toontje lager

Eindronde Natuurkunde Olympiade 2018 theorietoets deel 1

Eindexamen natuurkunde havo I

Als de lijn een sinusvorm heeft spreek je van een harmonische trilling of een zuivere toon.

Impuls Response Meting

David Weenink. Instituut voor Fonetische Wetenschapen ACLC Universiteit van Amsterdam. Spraakverwerking per computer.

LES 3 Analoog naar digitaal conversie

Eindexamen natuurkunde 1 vwo 2001-I

Handleiding bij werkbladen uitspraak

Geluid en wind. Erik Salomons TNO TPD Delft. Door de wind klinkt geluid soms harder dan anders. Deze website legt uit hoe dit komt.

Eindexamen natuurkunde 1 vwo 2004-I

Maatwerk als succesfactor

Profielwerkstuk. Effecten en boventonen van Gitaren. Stefan Soede 6W 2004/2005 Coördinator:Rob Hazelzet

z 1 Dit tentamen bestaat uit zes opgaven (50 punten) Opgave 1 (8 punten) Gegeven het volgende systeem:

Digitale Image Processing

6,6. Werkstuk door een scholier 2147 woorden 10 oktober keer beoordeeld. Natuurkunde

M+P MBBM groep Mensen met oplossingen. Gemeente Houten T.a.v. Edwin Koolhof Postbus DA HOUTEN. Onderzoek herkomst bromtoon Houten

Analyse van de zangstem : geluiden in beeld

DFT, Windowing, STFT, spectrogrammen

Door Josse van Dobben de Bruyn & Jelle van Mourik

Schriftelijk tentamen Spraakherkenning en spraaksynthese (do. 23 december 2004, u; zaal C.206)

Oefeningenles beeldverwerking

Eindexamen natuurkunde / scheikunde 1 compex vmbo gl/tl I

Figuur 1. Rabo bank Lekkerkerk nr Handelsregister nr K.v.K. te Rotterdam

Hoofdstuk 9 Golven. Gemaakt als toevoeging op methode Natuurkunde Overal

Spreken Wat is een dysartrie?

Frequentie specifieke ABR

Een nieuw geluid voor het meten van hoortoestellen

Eindexamen natuurkunde 1-2 vwo 2001-I

Kernvraag: Hoe maken we geluid?

TECHNISCHE UNIVERSITEIT EINDHOVEN FACULTEIT DER TECHNISCHE NATUURKUNDE

De BalUn en aanpassingstrafo onder de loep

WiskuNde in-zicht. Wiskunde in muziek. Pieter Belmans Matthias Roels

Examentraining Leerlingmateriaal

Eindexamen wiskunde B 1 havo I

HiFi over 8,33 khz channel spacing? Ik dacht het niet.

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode.

WiskuNde in-zicht. Wiskunde in muziek. Pieter Belmans Matthias Roels

Schriftelijke zitting Systeem- en regeltechniek 2 (WB2207) 31 januari 2008 van 9:00 tot 12:00 uur

EXAMENONDERDEEL ELEKTRONISCHE INSTRUMENTATIE (5GG80) gehouden op woensdag 27 juni 2007, van tot uur.

Verder had ik toch nog graag een paar misverstanden de wereld uitgeholpen :

Stevin havo deel 2 Uitwerkingen hoofdstuk 3 Trillingen ( ) Pagina 1 van 11

Transcriptie:

VERSLAG PRACTICUM SPREKEN EN VERSTAAN Naam student : Maaike de Kleijn Studentnummer : 329849

Inleiding Dit practicumverslag is geschreven ten behoeve van de cursus Spreken aan verstaan aan de universiteit van Utrecht. De oefeningen zijn afkomstig van de tutorial Basics of phonetics and how to use Praat. De oefeningen staan in dit verslag genoteerd in de volgorde zoals ze zijn opgedragen in het draaiboek van de cursus. 2

Inhoud Inleiding... 2 Hoofdstuk A.... 4 Vragen behorende bij hoofdstuk A... 4 Oefening A.7.2... 5 Oefening A.7.3... 6 Oefening A.7.1... 7 Oefening A.7.4... 8 Oefening A.6.1... 1 Hoofdstuk B.... 11 Oefening B.6.1... 11 Oefening B.6.3... 11 Oefening B.6.4... 12 Oefening B.6.5... 13 Oefening B.6.6... 14 Oefening B.6.8... 15 Hoofdstuk C.... 16 Oefening C.1.17... 16 Oefening C.1.18... 17 Hoofdstuk E.... 19 Oefening E.1.2... 19 Oefening E.1.3... 19 Bronnen... 21 Literatuur... 21 WWW... 21 3

Hoofdstuk A. Vragen behorende bij hoofdstuk A A.1.1. Wat is een geluidsgolf? Geluid wordt veroorzaakt door een trillende bron, hierdoor worden luchtdrukwisselingen veroorzaakt. Deze wisselingen veroorzaken bewegingen in de luchtdeeltjes, zij worden afwisselend dichter op elkaar gedrukt en uit elkaar getrokken, dit is de geluidsgolf. A.1.2. Leg uit waarom een geluidsgolf energie verliest naarmate het zich verder verwijderd van de trillingsbron? De luchtdeeltjes zelf verplaatsen zich niet maar geven de drukwisselingen door aan de omliggende deeltjes. Daardoor verplaatsen de luchtdrukwisselingen zich. De energie die aan de bron vrijkomt wordt dus steeds verder doorgegeven en verspreidt zich over een groter oppervlak. De hoeveelheid energie blijft hetzelfde maar wordt verdeeld, hierdoor wordt de energie kleiner naarmate de geluidsgolf zich verder verwijderd van de trillingsbron A.1.3. Welke parameter is van invloed op de snelheid van een geluidsgolf? De snelheid van een geluidsgolf is afhankelijk van de samendrukbaarheid (en dus van de elasticiteit) en van de massa (en dus van de traagheid) van de omliggende materie. Hoe elastischer de materie, hoe sneller de geluidsgolven zich kunnen voortplanten; hoe groter de massa, hoe harder de materie zich tegen het samendrukken verzet, en hoe kleiner de snelheid. De snelheid van geluidsgolven wordt ook beïnvloed door de temperatuur. Een stijgende temperatuur doet de luchtdeeltjes sneller bewegen en daardoor beweegt het geluid zich sneller voort. A.2.1. Wat is een spiegelfrequentie (alias frequency)? Hoe doet deze zich voor is een gedigitaliseerd signaal. Een spiegelfrequentie is een frequentie die zich voordoet in een gedigitaliseerd signaal terwijl het nog niet aanwezig was is het originele signaal. Deze frequentie is te wijten aan een verkeerde bemonsteringsfrequentie bij het origineel signaal. Er is daar een gouden regel voor, namelijk f s >2f. Als deze regel geschonden wordt treedt er een spiegelfrequentie op. A.2.2. Wat is de nyquist frequentie? De nyquist frequentie ligt net iets onder de helft van de bemonsteringsfrequentie. A.2.3. Een signaal met een frequentie van 25 Hz moet gedigitaliseerd worden. Wat is de minimale bemonsteringsfrequentie die nodig is om spiegelfrequenties te vermijden? En welke amplitude? 4

De bemonsteringsfrequentie moet minimal 5 Hz zijn, namelijk minstens twee keer zo hoog als het originele signaal. Aan de amplitude worden geen specifieke eisen gesteld, deze is afhankelijk van het doel van de digitalisering. A.2.4. Wat is kwantiseringsruis? Hoe kan het vermeden worden? Kwantisatie leidt tot vervorming van het signaal. Het verschil tussen het origineel en het gekwantiseerde signaal is de kwantiseringsruis. Het kan vermeden worden door een hoger aantal bits te gebruiken bij het kwantiseren van het signaal. A.2.5. Waarom is het niet wenselijk om gedetailleerde fonetische analyses op spraak op te slaan als een mp3 bestand? Om het bestand zo klein mogelijk te houden, wordt het signaal samengeperst. Dit samenpersen heeft geen gevolgen voor de kwaliteit van het signaal maar doordat het signaal op die manier gedigitaliseerd wordt is het niet meer geschikt voor fonetische analyses. Oefening A.7.2 Bij deze oefeningen zijn een aantal verschillende sinusvormige signalen gecreëerd. Deze sinussen zijn gemaakt met behulp van Praat, door middel van create sound from formula. De formule die vervolgens in beeld komt is 1/2 * sin(2*pi*377*x). Het eerste getal is de amplitude (1/2), het getal na pi is de frequentie (377). Het eerste signaal heeft een frequentie van 44 Hz en een amplitude van,25 (formule: 1/4 * sin(2*pi*44*x). Het tweede signaal heeft een frequentie van 12 Hz en een amplitude van 1 (formule: 1 * sin(2*pi*12*x). Het derde signaal heeft een frequentie van 12 Hz en een amplitude van,5 (formule: 1/2 * sin(2*pi*12*x). Het vierde signaal heeft een frequentie van 176 Hz en een amplitude van,5 (formule: 1/2 * sin(2*pi*176*x). Bij het beluisteren van de vier signalen valt het volgende op: Luidheid: Sine_a is het zachtst van de vier signalen, sine_b is het meest luid. Sine_c en sine_d hebben een vergelijkbare luidheid. Toonhoogte: De signalen zijn oplopend in toonhoogte, sine_a is de laagste toon, sine_ b en sine_c zijn even hoog en zijn hoger dan sine_a. Sine_d is het hoogst van alle vier de signalen. Vervolgens zijn van alle geluiden segmenten geknipt van.5 s. Daarvan zijn oscillogrammen gemaakt die hieronder zijn weergegeven..25 -.25.5 5

Figuur 1: Oscillogram van sine_a.9999 -.9999.5 Figuur 2: Oscillogram van sine_b.5 -.5.5 Figuur 3: Oscillogram van sine_c.5 -.499.5 Figuur 4: Oscillogram van sine_d Oefening A.7.3 Bij deze oefening zijn er verschillende fragmenten uit sine_a van de vorige oefening geknipt. Bij het eerst oscillogram is een halve periode van maximaal tot minimaal geknipt. Bij de tweede is wederom een halve periode geknipt nu echter van de positieve -lijn tot de negatieve -lijn. De derde oscillogram is een figuur van een hele periode van een positieve o-lijn tot de volgende positieve - lijn..2499 -.2499.498281.499441 6

Figuur 5: Oscillogram van sine_a, halve periode van maximaal tot minimaal.2499.9613.497726.498879 Figuur 6: Oscillogram van sine_a, halve periode van positieve tot negatieve -lijn..2499 -.2499.497733.499996 Figuur 7: Oscillogram van sine_a, hele periode Bij het beluisteren van de verschillende signalen waar de bovenstaande segmenten uitgeknipt zijn valt het op dat het nauwelijks te horen is bij het derde bestand dat er een periode uit geknipt is. Wanneer dit heel exact gebeurd kan de periode voorafgaande aan de geknipte periode naadloos overgaan in de periode die daarop volgt. Bij de eerste twee signalen is het duidelijk hoorboor dat er een gedeelte van een periode tussen uit gehaald is. Dus hoewel het in de eerste twee signalen om een korter segment gaat is het duidelijker hoorbaar. Oefening A.7.1 In onderstaand figuur zijn het oscillogram en de textgrid van de zin het leven is mooi als de zon schijnt weergegeven. In het textgrid zijn de woorden weergegeven in de bovenste rij. Bij de onderste rij zijn de afzonderlijke fonemen aangegeven en is het fonetisch schrift gebruikt om de uitspraak weer te geven. 7

zinleven1.324341 1.79877 het leven is mooi als de zon schijnt h ε t l e v I s m oi oia l s d z n s εi n t 1.7999 Figuur 8: Oscillogram en textgrid van de zin het leven is mooi als de zon schijnt Oefening A.7.4 Bij deze oefening zijn om drie verschillende manieren het woord delicatesse gevormd. In de eerste samenvoeging zijn de onderstreepte syllaben geknipt uit de zin de degelijke linkse politicus had genoeg van het kabaal van zijn teckel. Deze zijn met behulp van PRAAT aan elkaar geplakt totdat het woord delicatesse gevormd werd. delicatesse1.243628 2.682 De li ca te sse.26339 2.743 Figuur 9: Samenvoeging 1 geknipte syllaben uit een ingesproken zin Bij de tweede samenvoeging is het woord opgebouwd uit ingesproken syllaben. Wederom zijn de losse syllaben met behulp van PRAAT zo goed mogelijk achter elkaar gevoegd om lopende spraak te imiteren. 8

delicatesse2.543493.662177 de li ca te sse.662177 Figuur 1: Samenvoeging 2 syllaben los ingesproken aan elkaar geplakt Bij de derde afbeelding is het woord delicatesse als een woord opgenomen. delicatesse3.24665 1.1356 de li ca te sse 1.13526 Figuur 11: Delicatesse in één keer uitgesproken. Bij het beluisteren van de drie bestanden vallen er een aantal zaken op. Bij de eerste samenvoeging klinkt het woord staccato. Omdat er geen coarticulatie is klinkt het woord onnatuurlijk. Bij de tweede samenvoeging klinkt het woord al veel meer als het doelwoord. De eerste syllabe is opvallend veel te lang, maar de overige syllaben klinken duidelijk samenhangend. Opvallend is het dat de afbeelding van de tweede samenvoeging en de derde afbeelding ook duidelijk meer op elkaar lijken, dan op de eerste afbeelding. 9

Oefening A.6.1 Bij deze oefening zijn twee oscillogrammen gemaakt. De eerste is van een stemhebbende klank, namelijk de [e] uit leven (figuur 12) en de [s] uit schijnt (figuur 13). De oscillogrammen zijn zo ver uitvergroot dat het mogelijk is de perioden van het signaal te zien. Bij de [e] is duidelijk een periode te herkennen, het is een periodiek signaal. Bij de [s] is de periode niet te herkennen. Dit komt omdat de [s] een ruissignaal en dus atonaal is..5497 zinleven1 -.8411.2767.244346 Figuur 12: Vier perioden van de [eː].2913 zinleven1 -.2247 1.37518 1.3846 Figuur 13: Stukje van de [s] 1

Hoofdstuk B. Oefening B.6.1 Het is mogelijk om een hoge tonen filter en een lage tonen filter te combineren om op die manier een bandpass filter te verkrijgen. De filters moeten parallel en in serie geschakeld zijn. Verder is het belangrijk dat de hoge tonen filters een lagere cut off hebben dan the lage tonen filters. Een notch filter is een filter dat een smalle band rond een zekere frequentie wegfiltert en de overige frequenties zo ongestoord mogelijk laat. Om dit filter te verkrijgen moeten de filters parallel geschakeld worden en dient de lage tonen filter een lagere cut off te hebben dan de hoge tonen filter. Oefening B.6.3 Van de geluiden zijn eerst de beginstukken afgeknipt, zodat het geluid begint met een stabiele toestand (steady-state segment). Vervolgens zijn de eerste 3 milliseconden handmatig geselecteerd. Van elke klinker is vervolgens een spectrum gemaakt. Op deze spectra is een formantanalyse uitgevoerd. De gegevens uit deze analyse met betrekking tot de eerste en tweede formant zijn in onderstaande grafiek weergegeven. Op de x-as staan de tweede formanten weergegeven en op de y-as staan de eerste formanten van de verschillende klinkers. Figuur 14: Grafiek met F1 en F2 van vijf klinkers Bij het vergelijken van bovenstaande grafiek met de klinkerdriehoek zoals hieronder opgenomen valt het op dat de F1 en F2 van de klinkers redelijk overeen komen. Er zitten uiteraard wat verschillen in die waarschijnlijk verklaard kunnen worden door op te merken dat in bovenstaande grafiek maar één spreker is geanalyseerd en in onderstaand schema zijn 5 sprekers geanalyseerd. Daarnaast speelt 11

het natuurlijk een rol dat er een segment van de klanken is genomen. De e: begint bij het uitspreken namelijk als een E en verglijdt dan naar een e:. Hierdoor komt de e: uit bovenstaande grafiek overeen met de E in onderstaande klinkerdriehoek. Figuur 15: Klinkerdriehoek (Pols, 1977) Oefening B.6.4 In figuur 16 is het spectrum van witte ruis weergegeven. Het gemiddelde (average, m) is en als standaard deviatie (s) is,25 gebruikt. Sound pressure level (db/hz) 8 6 4 225 Figuur 16: Spectrum van witte ruis. Het verschil tussen witte ruis en roze ruis is de energieverdeling. Bij witte ruis komen alle frequentiecomponenten evenredig voor. In roze ruis komen meer lage dan hoge frequenties voor. Het spectrum van roze ruis loopt af met 3 db per octaaf. Om witte ruis te veranderen in roze ruis moet de witte ruis gefilterd worden. Het filter moet bij elke octaaf 3 db verminderen. 12

Oefening B.6.5 Allereerst zijn er van twee signalen oscillogrammen gemaakt, van witte ruis en van de [a:]..893.825 -.9464 1 Figuur 17 & 18: Oscillogram van witte ruis (links) en oscillogram van [a:] (rechts). -.8533.76562 Daarna is van beide signalen een fragment van 2 ms geknipt en de oscillogrammen daarvan zijn te zien in figuur 19 en 2..6435.7629 -.7924.7629.1828.199751.127379.24711 Figuur 19 & 2: Oscillogram van fragmenten van 2 ms van witte ruis (links) en [a:] (rechts). Tot slot is er van het witte ruissignaal en het bestand norma een spectrum gemaakt, deze zijn weergegeven in figuur 21 en 22. Sound pressure level (db/hz) 4 2 8 Figuur 21 & 22: Spectrum van witte ruis (links) en norma (rechts). Sound pressure level (db/hz) 6 4 2 8 In het rechter spectrum, het spectrum van de klinker, zijn duidelijk bergen en dalen te zien. De maxima zijn het gevolg van versterking door de resonantie in de mond-keelholte. De sinussen zijn te verklaren door de stembandtrillingen. Deze worden door de mond-keelholte selectief versterkt en verzwakt. In het linkerfiguur zijn er geen bergen en dalen waar te nemen. Over de gehele frequentie is de bandbreedte nagenoeg even breed. Er is geen sprake van een resonantiekanaal bij de gecreëerde witte ruis. De witte ruis heeft een redelijk constante intensiteit. 13

Oefening B.6.6 Voor deze oefening is van het bestand [i'] gebruikt. Allereerst is de ruis aan het begin van het signaal afgeknipt. Daarna is er een fragment geselecteerd van 5 ms. Dit is een zogenaamd steady state segment. Van dit segment zijn twee spectra gemaakt, eerst een spectrum zonder windowing en het tweede spectrum met een zogenaamd Hanning -window. Sound pressure level (db/hz) 6 4 2 16 Figuur 23: Spectrum van [i'] zonder windowing Sound pressure level (db/hz) 6 4 2 16 Figuur 24: Spectrum van [i'] met Hanning -window Er wordt gebruik gemaakt van windowing omdat het waarschijnlijk is dat het geknipte segment niet exact samenvalt met een volledige periode. De frequentieanalyse binnen Praat gaat daar echter wel van uit binnen de berekeningen. Door gebruik te maken van windowing komt het begin en het einde van het segment op de -as te liggen. Het segment is daardoor kunstmatig periodiek gemaakt waardoor de frequentieanalyse beter gaat. Bij bovenstaande figuren valt het op dat niet alle pieken en dalen op exact dezelfde frequentie voorkomen, dit komt door de windowing. Ook is er duidelijk zichtbaar een verschil in intensiteit. 14

Oefening B.6.8 Sound pressure level (db/hz) 6 4 2 8 Figuur 25: Spectrum van oud-nederlands tekstfragment Bij deze oefening is een voorgelezen tekstfragment met behulp van een filter zodanig aangepast dat de illusie wordt gewekt dat het door een telefoon wordt gesproken. Een telefoon heeft een bandbreedte van 3 tot 34 Hz. Het filter is zo ingesteld dat het alles onder de 3Hz en boven de 34 Hz wegfiltert. De volgende formule werd daarvoor gebruikt: [if x<3 or x>34 then else self fi; rectangular band filter]. Sound pressure level (db/hz) 4 2 8 Figuur 26: Spectrum van gefilterd oud-nederlands tekstfragment 15

Hoofdstuk C. Oefening C.1.17 Bij deze oefeningen zijn de bestanden van oefening A.7.4 gebruikt. Van twee van de bestanden, delicatesse2 en delicatesse3 zijn onderstaande spectrogrammen gemaakt. Spectogram delicatesse2 5 2.386 Figuur 27: Spectrogram van het woord delicatesse opgebouwd uit vooraf los ingesproken syllaben delicatesse 3 5 1.24 Figuur 28: Spectrogram van het woord delicatesse. Er zijn in de twee bovenstaande figuren een aantal zaken die opvallen. Beide spectrogrammen zijn gemaakt met een brede band filter. Wat allereerst opvalt, is de het verschil in lengte van de beide uitingen. Figuur 27 duurt meer dan twee keer zo lang als figuur 28 In het algemeen is het duidelijk dat de intensiteit in figuur 27 over het gehele spectrogram groter is. Dit is te zien aan de mate van zwarting. 16

Oefening C.1.18 Hieronder staat het spectrogram van de zin die meid was al lang zat. 5 1.82463 Figuur 29: Spectrogram van de zin die meid was al lang zat. Om meer te kunnen zeggen over de formantkenmerken van de klinkers, fricatieven, nasalen en plofklanken is onderstaande Textgrid gemaakt. d ie m ei d w a s l a ng z a t 1.82463 Figuur 29: Oscillogram en textgrid van de zin die meid was al lang zat Klinkers zijn aan een aantal kenmerken te herkennen in een spectrogram. Ten eerste de vijf energieconcentraties die corresponderen met de eerste vijf formanten. Met name bij de[ei] zijn duidelijk vijf donkere balken te onderscheiden. Bij de [i.] liggen de eerste twee formanten dicht bij elkaar. Bij de [a] liggen de formanten allemaal dicht bij elkaar. De fricatieven zijn erg goed te onderscheiden in bovenstaand spectrogram. Bij de [s] en de [z] zit de meeste energie in de hogere frequenties. De [m] en de [n] vertonen duidelijk de kenmerken van de nasalen. Doordat de klanken voor een gedeelte door de neusholte geproduceerd worden is de algehele intensiteit gering. De grootste intensiteit is verdeeld in twee frequentiegebieden, een rond de 5 Hz en een rond de 27 Hz. De plofklanken zijn te onderscheiden in stemhebbende en stemloze plofklanken. Echter, bij het spectrogram is hier nauwelijks onderscheid in te maken. Bij de stemhebbende klanken, bijvoorbeeld de [d] is er op een hele lage frequentie intensiteit en de rest van het spectrum vrijwel geen intensiteit. 17

5 meid.496147 Formant frequency (Hz) 4 3 2 1.27277.72217 Figuur 3: Formantcontour van het woord meid Vervolgens is er gebruik gemaakt van de functie formant tracking. De formanten komen soms overeen met de contouren van het spectrogram. De eerste formant lijkt vrij aardig overeen te komen, de derde formant echter alleen in het midden van het segment. F1_Hz F2_Hz F3_Hz F4_Hz 378.723679 133.825439 328.211792 416.947998 Figuur 31: Formanten verkregen met behulp van formant tracking. 18

Hoofdstuk E. Oefening E.1.2 De bedoeling van deze oefening is het veranderen van het woord 1 (kanón) in woord 2 (kanon) en andersom. Dit is gedaan met behulp van het veranderen van de duur en toonhoogte van de verschillende klanken in het woord. Allereerst is met behulp van Praat de contour gestileerd en zijn de toonhoogtes aangepast. Daarna zijn sommige delen van het woord langer gemaakt en andere delen korter. Hieronder staan de spectrogrammen van het resultaat. 5 5.552687.657675 Figuur 32: Woord 1 origineel Figuur 33: Woord 1 verkregen door stylering woord 2. 5 5.597719 Figuur 34: Woord 2 origineel..632343 Figuur 35: Woord 2 verkregen door stilering woord 1. Oefening E.1.3 De zin Kees zei Koos kust met het buurmeisje van Toos is ambigu. Door de zin een andere prosodie te geven moet dit verduidelijkt worden. Hiervoor worden er twee bestanden gemaakt, namelijk keeskust en kooskust. Deze zinnen worden qua toonhoogte en lengte van de verschillende klanken zo aangepast dat de ambiguïteit verdwijnt. Hieronder staan het oscillogram en de pitch contour van de eerste zin: Kees zei Koos kust met het buurmeisje van Toos. 19

.5432 Oscillogram: koos kees kust het buurmeisje -.9129 3.42791 Figuur 36: Oscillogram kees kust. 5 Pitch contour: kees kust het buurmeisje 3.42791 Figuur 37: Pitch contour kees kust Hieronder staan het oscillogram en de pitch contour van de tweede zin: Kees zei Koos kust met het buurmeisje van Toos..5432 Oscillogram: koos kust het buurmeisje -.9129 3.12486 Figuur 38: Oscillogram koos kust. 5 Pitch contour: koos kust het buurmeisje 3.12486 Figuur 39: Pitch contour koos kust 2

Bronnen Bij dit practicum is gebruik gemaakt van een aantal bronnen. Deze staan hieronder vermeld Literatuur Rietveld, A.C.M. & Heuven, van V.J. (1997) Algemene fonetiek. Bussum: Coutinho WWW Praat: doing Phonetics by computer (www.fon.hum.uva.nl/praat/) Turorial about Phonetics and Speech Analyses (www.let.uu.nl/uilots/lab/courseware/ phonetics/index.html ) 21