-
Notifications
You must be signed in to change notification settings - Fork 1
/
node36.html
650 lines (581 loc) · 32.2 KB
/
node36.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//FI">
<!--Converted with jLaTeX2HTML 2002 (1.62) JA patch-1.4
patched version by: Kenshi Muto, Debian Project.
LaTeX2HTML 2002 (1.62),
original version by: Nikos Drakos, CBLU, University of Leeds
* revised and updated by: Marcus Hennecke, Ross Moore, Herb Swan
* with significant contributions from:
Jens Lippmann, Marek Rouchal, Martin Wilck and others -->
<HTML>
<HEAD>
<TITLE>7.5 Formanttianalyysi</TITLE>
<META NAME="description" CONTENT="7.5 Formanttianalyysi">
<META NAME="keywords" CONTENT="praat">
<META NAME="resource-type" CONTENT="document">
<META NAME="distribution" CONTENT="global">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
<META NAME="Generator" CONTENT="jLaTeX2HTML v2002 JA patch-1.4">
<META HTTP-EQUIV="Content-Style-Type" CONTENT="text/css">
<LINK REL="STYLESHEET" HREF="praat.css">
<LINK REL="previous" HREF="node35.html">
<LINK REL="up" HREF="node31.html">
<LINK REL="next" HREF="node37.html">
</HEAD>
<BODY >
<!--Navigation Panel-->
<A NAME="tex2html683"
HREF="node37.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html677"
HREF="node31.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html673"
HREF="node35.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html679"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html681"
HREF="node51.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<!--End of Navigation Panel-->
<!--Table of Child-Links-->
<A NAME="CHILD_LINKS"><STRONG>Aliluvut</STRONG></A>
<UL>
<LI><A NAME="tex2html685"
HREF="node36.html#SECTION00851000000000000000">7.5.1 Mikä on formantti?</A>
<LI><A NAME="tex2html686"
HREF="node36.html#SECTION00852000000000000000">7.5.2 Formanttianalyysin laskentaperiaatteet</A>
<UL>
<LI><A NAME="tex2html687"
HREF="node36.html#SECTION00852100000000000000">7.5.2.1 Formanttianalyysin toiminta</A>
</UL>
<BR>
<LI><A NAME="tex2html688"
HREF="node36.html#SECTION00853000000000000000">7.5.3 Burg-formanttianalyysin tekeminen</A>
<UL>
<LI><A NAME="tex2html689"
HREF="node36.html#SECTION00853010000000000000">7.5.3.0.1 Tapa 1: </A>
<LI><A NAME="tex2html690"
HREF="node36.html#SECTION00853020000000000000">7.5.3.0.2 Tapa 2</A>
</UL>
<BR>
<LI><A NAME="tex2html691"
HREF="node36.html#SECTION00854000000000000000">7.5.4 Tracking </A>
<LI><A NAME="tex2html692"
HREF="node36.html#SECTION00855000000000000000">7.5.5 Lisätietoa formanttianalyysista</A>
<LI><A NAME="tex2html693"
HREF="node36.html#SECTION00856000000000000000">7.5.6 Formanttikuvien piirtäminen</A>
<LI><A NAME="tex2html694"
HREF="node36.html#SECTION00857000000000000000">7.5.7 F1/F2-formanttikartan piirtäminen</A>
<LI><A NAME="tex2html695"
HREF="node36.html#SECTION00858000000000000000">7.5.8 Formanttianalyysin virhelähteet </A>
</UL>
<!--End of Table of Child-Links-->
<HR>
<H1><A NAME="SECTION00850000000000000000"></A><A NAME="sub:Formanttianalyysi-_esim.-vokaalien"></A>
<BR>
7.5 Formanttianalyysi
</H1>
<P>
Puheen formanttianalyysilla on pitkät perinteet etenkin vokaalitutkimuksessa<A NAME="476"></A>.
Koska formantit liittyvät ääntöväylän muotoon puheentuoton aikana,
voidaan niiden keskitaajuuden muutosten ja keskinäisten suhteiden
perusteella tietyin edellytyksin tehdä johtopäätöksiä puhesignaalin
tuottamiseen käytetyistä artikulaatioliikkeistä. Varovaisuus tulosten
tulkinnassa on kuitenkin tarpeen.
<P>
<H2><A NAME="SECTION00851000000000000000">
7.5.1 Mikä on formantti?</A>
</H2>
<P>
Puhe<A NAME="478"></A> on aina kompleksista ääntä, josta ns. Fourier-analyysin
avulla voidaan löytää paljon eritaajuisia komponentteja l. osataajuuksia.
Puheääni voi saada alkunsa kurkunpäässä ja/tai muissa kohdissa ääntöväylää
äänteestä riippuen. Tämän lähdeäänen<A NAME="479"></A> osataajuudet
vahvistuvat tai heikkenevät amplitudeiltaan sen mukaan, minkä muotoisessa
ääntöväylässä ääni liikkuu ja heijastuu. Osa näistä ääntöväylässä
suodattuneista ääniaalloista säteilee lopulta suun ja/tai nenän kautta
ulkomaailmaan.
<P>
Ääntöväylää<A NAME="480"></A> (kurkunpäästä huuliin asti)
voidaan yksinkertaistaen verrata jonoon eripituisia ja -paksuisia
putkia. Mikä tahansa putki taas vahvistaa kaikkia sellaisia ääniaaltoja,
joiden aallonpituus<A NAME="481"></A> (joka on kääntäen verrannollinen
aallon taajuuteen) on sopivassa suhteessa putken pituuteen. Ihminen
kykenee tietyissä rajoissa muuttelemaan ääntöväylänsä muotoa (esim.
liikuttamalla kieltään, huuliaan jne.), jolloin ääntöväylän "putkijonon"
osien lukumäärä, pituudet (ja paksuudet) muuttuvat. Jokainen putkenpää
(myös avonainen pää!) aiheuttaa äänien osittaisen heijastumisen putkessa
takaisinpäin. Niinpä ääntöväylässä liikkuu jatkuvasti ääniaaltoja
molempiin suuntiin, ja aallot tulevat toisiaan vastaan.
<P>
<BLOCKQUOTE>
Kuvittele, että istut keinussa ja kaverisi antaa sinulle vauhtia.
Kun kaverisi seisoo edessäsi tai takanasi ja tyrkkää keinua joka kerran
juuri oikeassa vaiheessa, saat parhaat "vauhdit"
eli keinusi heilahtelee vähitellen yhä korkeammalle. Olisikin turhaa
antaa vauhtia silloin, kun keinu ei ole kohdalla! Ja jos kaverisi
siirtyy keskelle keinun rataa seisomaan ja yrittää tyrkätä sinua takaisinpäin
kun keinu heilahtaa kovaa vauhtia häntä kohti, hän tuskin onnistuu,
vaan keinu todennäköisimmin pysähtyy (ja kaverisi ehkä kaatuu ja satuttaa
itsensä). Ajoitus on siis tärkeä.
</BLOCKQUOTE>
Jos kaksi ääniaaltoa tulee toisiaan vastaan ja kulkee toistensa läpi
sellaisessa kohdassa, jossa molemmat sattuvat olemaan samassa vaiheessa
(esim. molempien aaltojen ilmanpainehuiput osuvat toisiinsa samassa
pisteessä), kyseisellä kohdalla syntyy hetkellisesti amplitudiltaan
suurempi aalto. Toisiinsa törmäävät aallot siis summautuvat. Jos taas
aallot ovat kohdatessaan päinvastaisessa vaiheessa toisiinsa nähden,
on aaltojen yhteenlaskettu amplitudi kyseisellä kohdalla nolla, ts.
ne kumoavat toisensa. Tietyissä olosuhteissa aallot saattavat putken
sisällä jatkuvasti törmätä samanvaiheisina samassa kohdassa, jolloin
syntyy resonanssi<A NAME="488"></A>. Resonanssiin osallistuvilla
aalloilla on silloin joko sama taajuus (ja siten myös sama aallonpituus)
eli aalto törmää sopivan pituisessa putkessa aina itsensä heijastumiin,
tai sitten vähintään kahden eri osataajuuden aallonpituudet ovat tietyissä
suhteissa toisiinsa ja putken pituuteen. (Kuvittele, että kaverisi
tyrkkäisi keinulle vauhtia vain joka toisella tai kolmannella heilahduksella.)
Putken pituus siis määrää, minkätaajuiset aallot putkessa voivat resonoida.
(Ks. myös <A HREF="node16.html#sub:Akustiikkaa">3.5.1</A>)
<P>
<DL>
<DT><STRONG>Formantti</STRONG></DT>
<DD>vastaa yhtä tai useampaa ääntöväylän resonanssia<A NAME="491"></A>
eli sellaista taajuutta, jonka mukaiset ääniaallot vahvistuvat jossakin
ääntöväylän kohdassa. Formantit nähdään "harjanteina"
tai "huippuina" puhesignaalin pätkästä lasketussa
spektrissä. Formanttien sijainnin ja liikkeen on osoitettu vaikuttavan
merkittävällä tavalla myös puheäänteestä syntyvään havaintoon. Tämä
on aivan luonnollista: ovathan formantit tietyssä monimutkaisessa
suhteessa siihen, millä tavalla puhuja on liikutellut ääntöväyläputkistonsa
osia. Ääntöväylällä on periaatteessa aina monia (äärettömästi) resonansseja,
mutta niistä vain muutama vaikuttaa selvästi esim. vokaalien laadun
havaintoon. Yleensä puheäänteen spektristä ei edes yritetä tunnistaa
enempää kuin korkeintaan viisi alinta formanttia, koska ihmiskorvakaan
ei juuri erota formanttien muutoksia näitä korkeammilta taajuuksilta.
</DD>
</DL>
Tietyn puhesignaalipätkän spektrin muotoa voidaan approksimoida LPC-menetelmällä<A NAME="497"></A>
ja arvioida siten esimerkiksi formanttien keskitaajuuksia (eli mitä
taajuuksia ääntöväylä on kulloinkin parhaiten vahvistanut). Ääntöväylän
resonanssit vaikuttavat tietenkin mihin tahansa ääneen, joka ääntöväylän
läpi kulkee, mutta formantteja mitataan useimmiten vokaaleista, koska
näistä on olemassa paljon tutkimusta (ts. "referenssiarvoja"
joihin verrata) ja automaattiset formanttianalyysimenetelmätkin yleensä
toimivat vokaaleilla parhaiten.
<P>
Puhe on kuitenkin käytännössä ääntöväylän jatkuvaa liikettä ja LPC
nerokkuudessaankin vain matemaattinen malli, joten pelkällä formanttianalyysilla
ei luultavasti saada koskaan täydellistä kuvaa siitä, minkä muotoinen
ääntöväylä puhujalla on todellisuudessa ollut tietyllä ajanhetkellä.
Millä tahansa ohjelmalla tehty automaattinen formanttianalyysi on
pelkkä laskennallinen arvio spektrin hallitsevimmista huipuista, ja
formanttianalyysin virhelähteet onkin tunnettava tarkoin, ennen kuin
formanttianalyysin tuloksia voi tulkita ja käyttää.
<P>
<H2><A NAME="SECTION00852000000000000000">
7.5.2 Formanttianalyysin laskentaperiaatteet</A>
</H2>
<P>
Praat-ohjelmalla tehdyn formanttianalyysin lopputuloksena syntyy Formant-objekti<A NAME="501"></A>,
joka edustaa ääniobjektin spektrirakennetta ajan funktiona. Se on
siis jono tasaisin välimatkoin laskettuja näytteitä, joissa kussakin
on taajuus- ja kaistanleveysinformaatio useasta formantista sekä informaatiota
ikkunan maksimi-intensiteetistä. Formant-objekti on siis rakenteeltaan
ikään kuin kaavamainen tai karkeistettu versio spektrogrammista. Praat-ohjelman
oletusformanttianalyysi<A NAME="502"></A> on Burgin algoritmi,
jota käytetään komennolla <B>Sound: To Formant (burg)...</B> (ks.
<A HREF="node36.html#sub:Burg-analyysi">7.5.3</A> alla).
<P>
<H3><A NAME="SECTION00852100000000000000">
7.5.2.1 Formanttianalyysin toiminta</A>
</H3>
<P>
Aluksi äänisignaali <B>näytteistetään uudelleen</B> näytetaajuuteen,
joka on kaksi kertaa <I>Maximum formant</I><A NAME="508"></A>-kohdassa
annettu formanttien ylärajataajuus. Sitten signaali <B>esivahvistetaan<A NAME="509"></A></B>
(pre-emphasis<A NAME="510"></A>), jotta myös ylemmillä taajuuksilla
olevat, luonnostaan vaimeammat huiput saisivat saman painoarvon kuin
alemmat formantit. Näin saadusta signaalista lasketaan tietyin välimatkoin
<B>lyhytaikaisspektrejä<A NAME="511"></A></B> (spektrien
välimatka ja spektri-ikkunan leveys määritellään kohdissa <I>Time
step<A NAME="512"></A></I> ja <I>Window length</I><A NAME="514"></A>).
<P>
Sitten approksimoidaan kussakin analyysi-ikkunassa tai -kehyksessä
(frame) saatua spektriä <B>lineaariprediktio-<A NAME="515"></A></B>
eli LP- tai LPC-menetelmällä (Linear Predictive Coding<A NAME="516"></A>,
josta käytetään tässä Burgin algoritmia). Lineaariprediktiossa spektrin
muotoa pyritään kuvaamaan pienellä määrällä huippuja, joille arvioidaan
keskitaajuus ja kaistanleveys. Näiden huippujen voidaan katsoa edustavan
ääntöväylän resonansseja l. formantteja. LPC:n tulos on itse asiassa
joukko kertoimia, jotka eivät sinänsä ole ihmiselle lainkaan havainnollisia.
Siksi formanttianalyysissa vielä jatkojalostetaan kertoimien antamaa
informaatiota formanttien taajuus- ja kaistanleveysarvoiksi.
<P>
Koska algoritmi löytää aluksi formantteja myös hyvin matalilta ja
korkeilta taajuuksilta, <B>poistaa Burg-algoritmi lisäksi</B> formantit
50 Hz:n alapuolelta sekä formantit jotka ovat korkeammalla kuin Maximum
formant - 50 Hz. Jos välttämättä haluat pitää nämäkin taajuuskaistat
mukana (jolloin tuskin saat perinteisen näköisiä F1- ja F2-arvoja),
kokeile komentoa <B>Sound: To Formant (keep all)...</B> Jos
taas haluat välttämättä saada aina pyytämäsi tietyn määrän formantteja
tasaisesti jakautuneina koko antamallesi taajuusalueelle, voit kokeilla
muuten epäluotettavaa Split-Levinson-algoritmia<A NAME="519"></A>
komennolla <B>Sound: To Formant (sl)...</B>
<P>
Huom. Yllä kerrotulla tavalla tuotettu Formant-tyyppinen objekti sisältää
vain ne formantit, joita signaalista on kussakin ikkunassa löytynyt,
ja taajuusarvot saattavat heittelehtiä paljonkin peräkkäisten ikkunoiden
välillä. Peräkkäisten formanttiarvojen "jatkuvuutta"
tämä perusanalyysi ei yritä etsiä. Jos haluat tutkia esim. vokaalisegmentin
sisällä tapahtuvia formanttiliikkeitä, tee ensin tämä analyysi, mutta
katso sitten kohta Tracking (<A HREF="node36.html#sub:Tracking">7.5.4</A>).
<P>
<H2><A NAME="SECTION00853000000000000000"></A><A NAME="sub:Burg-analyysi"></A>
<BR>
7.5.3 Burg-formanttianalyysin tekeminen
</H2>
<P>
<H4><A NAME="SECTION00853010000000000000"></A><A NAME="par:formantit-editorissa"></A>
<BR>
7.5.3.0.1 Tapa 1:
</H4>
<P>
Jos haluat vain katsella Praatin laskemia formanttiarvoja esimerkiksi
yhdessä äänen aaltomuodon ja spektrogrammin kanssa, tee formanttianalyysi
äänieditori-ikkunan sisällä.
<P>
<OL>
<LI>Valitse objektilistasta ääniobjekti (tyyppiä <B>Sound</B>), jolle
haluat suorittaa formanttianalyysin.
</LI>
<LI>Paina hiirellä objektilistan oikeassa laidassa näkyvää painiketta
Edit,jolloin saat näkyviin äänieditori-ikkunan.
</LI>
<LI>Valitse äänieditori-ikkunan <B>View</B>-valikosta <B>Show formant</B>
(ja muut analyysit, jotka haluat näkyviin samanaikaisesti). Formanttianalyysi
tulee näkyviin ääniaallon alapuolelle punaisina pisteinä.
</LI>
<LI>Tarkista analyysin asetukset <B>View</B>-valikon kohdasta <B>Formant
analysis...</B> Äänieditorissa voi tehdä formanttianalyysin vain
burg-algoritmilla. Asetukset ovat muuten samat kuin analyysitavassa
2, mutta formanttien maksimimäärää ei tässä anneta, vaan sen sijaan
kohta <I>Number of poles<A NAME="532"></A></I> viittaa lineaariprediktiossa
käytettävien kertoimien määrään. Jos tämä arvo on 10, algoritmi etsii
viittä formanttia.
</LI>
<LI>Jos ikkunassa on kerrallaan näkyvissä pitkä pätkä äänisignaalia, formanttianalyysi
ei ehkä näy koko ikkunan osalta. Jos haluat analyysin laskettavaksi
pitemmältä aikaväliltä, muuta haluamasi sekuntimäärä <B>View</B>-valikon
komennolla <B>Analysis resolution</B>..., kohtaan <B>Formant
max. duration (s)</B>. Huomaa kuitenkin että formantit lasketaan uudelleen
aina kun vierität tai zoomaat editori-ikkunaa, joten pitkä formanttianalyysi
voi hidastaa työskentelyä. Formantit kannattaakin editorissa kytkeä
pois päältä aina kun niitä ei tarvita.
</LI>
<LI>Halutessasi voit tehdä äänieditorissa mittauksiakin seuraavasti:
</LI>
</OL>
<UL>
<LI>summittaisia mittauksia klikkaamalla hiirellä jonkin punaisen formanttipisteen
kohdalle (taajuus hiiren kohdalla näkyy ikkunan vasemmassa reunassa
punaisella) tai
</LI>
<LI>tarkempia mittauksia klikkaamalla hiirellä johonkin kohtaan äänisignaalia
tai spektrogrammia ja valitsemalla sitten <B>Query</B> -valikosta
esim. <B>Get first formant</B>, jolloin Info-ikkunassa näkyy ajallisesti
lähin 1. formantille mitattu arvo kursorin kohdalta. (Nämä <B>Query</B>-valikon
formanttikomennot toimivat vain jos formanttianalyysi on valittuna
<B>View</B>-valikossa.)
</LI>
</UL>
<P>
<H4><A NAME="SECTION00853020000000000000"></A><A NAME="par:formantit-objektilistasta"></A>
<BR>
7.5.3.0.2 Tapa 2
</H4>
<P>
Kun haluat analysoida tarkemmin, tehdä tarkkoja mittauksia, piirtää
kuvia, tai käyttää formanttianalyysia skriptin sisällä, luo formanttiobjekti<A NAME="545"></A>
erikseen objektilistassa.
<P>
<OL>
<LI>Valitse objektilistasta ääniobjekti (tyyppiä 'Sound'), jolle haluat
suorittaa formanttianalyysin.
</LI>
<LI>Paina hiirellä objektilistan oikeassa laidassa näkyvää painiketta
<B>Formants & LPC</B> ja valitse sen alasvetovalikosta <B>To
Formant (burg)...</B>
</LI>
<LI>Varmista, että formanttianalyysin asetukset ovat oikein:
<P>
<DL>
<DT><STRONG>Time step<A NAME="550"></A> (sekuntia):</STRONG></DT>
<DD>Aika-askel;
aika peräkkäisten analyysikehysten tai -ikkunoiden keskikohtien välillä.
Jos analysoitava ääniobjekti on 2 sekunnin pituinen ja aika-askel
on 0.01 sekuntia, analysoidaan yhteensä noin 200 kehystä. Todellinen
lukumäärä on kuitenkin hieman pienempi, koska mittaaminen on hankalampaa
ääninäytteen reunoilla.
</DD>
<DT><STRONG>Max. number of formants<A NAME="551"></A>:</STRONG></DT>
<DD>Etsittävien
formanttien maksimilukumäärä. Ihmispuheen analyyseissa kannattaa yleensä
käyttää arvoa 5. Jos <I>Maximum formant</I>-parametri on myös asetettu
oikein, tämä on ainoa tapa jolla saat järkeviä tuloksia.
</DD>
<DT><STRONG>Maximum formant<A NAME="553"></A> (Hz):</STRONG></DT>
<DD>Etsittävien formanttien
taajuuden yläraja. Tämä arvo on ehdottomasti asetettava analysoitavan
puhujan mukaan. Oletusarvo 5500 Hz<A NAME="554"></A>
sopii aikuiselle naispuhujalle. Miespuhujalle<A NAME="555"></A>
kannattaa käyttää arvoa 5000 Hz. Liian korkea yläraja<A NAME="556"></A>
voi nimittäin tuottaa liian vähän formantteja alemmilla taajuuksilla,
sillä algoritmi yrittää etsiä edellisessä kohdassa asetetut 5 formanttia
niin että ne erottuvat mahdollisimman hyvin toisistaan. Esim. miehen
ääntämälle [u]-vokaalille pitäisi periaatteessa löytyä kaksi lähekkäistä
formanttia 1000 Hz:n alapuolelta, mutta liian korkea yläraja-asetus
voi antaa F1:ksi näiden yhdistelmän ja sysätä loput formantit liian
ylös. Pienten lasten puheelle<A NAME="559"></A>
taas pitää käyttää paljon korkeampia arvoja, esim. 8000 Hz. Optimaalinen
ylärajataajuus löytyy kokeilemalla analyysia vaikkapa erikseen äännetyillä
vokaaleilla.
</DD>
<DT><STRONG>Window length<A NAME="560"></A>:</STRONG></DT>
<DD>Analyysi-ikkunan
tai -kehyksen efektiivinen kesto. (Todellinen laskentaikkuna on kaksi
kertaa näin pitkä, koska Praat käyttää Gauss-muotoista ikkunaa, jonka
reunat ovat lähellä nollaa.) Pre-emphasis from (Hz): Spektrin esivahvistuksen
alaraja (+3dB:n raja käänteiselle alipäästösuodattimelle, jonka kulma
on +6dB/oktaavi). Tavallisesti vokaalin spektri vaimenee ylätaajuuksiin
päin mentäessä noin 6 dB oktaavia kohti. Formanttianalyysilla halutaan
kuitenkin löytää paikallisia huippuja myös ylätaajuuksilta, vaikka
ne olisivat suhteessa heikompia kuin spektrin alaosan formantit. Tämän
vuoksi spektri suodatetaan ennen formanttianalyysia siten, että ylätaajuudet
voimistuvat ja spektrin kallistuskulma pienenee.
</DD>
</DL>
</LI>
<LI>Paina lopuksi <B>OK</B>. Objektilistaan ilmestyy uusi formanttiobjekti,
joka näkyy valittuna.
</LI>
</OL>
<DIV ALIGN="CENTER"><A NAME="566"></A>
<TABLE>
<CAPTION ALIGN="BOTTOM"><STRONG>Kuva 7.1:</STRONG>
Formanttianalyysin asetusten määritteleminen.</CAPTION>
<TR><TD><IMG
ALIGN="BOTTOM" BORDER="0" SRC="/home/lennes/praat-opas/kuvat/formantti_burg_asetukset.jpg"
ALT="Image /home/lennes/praat-opas/kuvat/formantti_burg_asetukset.jpg">
<P></TD></TR>
</TABLE>
</DIV>
<P>
<H2><A NAME="SECTION00854000000000000000"></A><A NAME="sub:Tracking"></A>
<BR>
7.5.4 Tracking
</H2>
<P>
Jos kaipaat yhtenäisiä ja johdonmukaisen näköisiä formanttikäyriä,
laske ensin edellämainitulla tavalla 2 Formant-objekti ja valitse
se objektilistasta. Paina sitten objektilistan oikeassa reunassa näkyvää
painiketta <B>Track...</B> Tämä komento pyrkii löytämään jokaisesta
analyysi-ikkunasta (<I>frame</I>) saman määrän formantteja ja esittämään
jokaiselle formantille suorimman mahdollisen "polun"
peräkkäisten ikkunoiden välillä. Jotta saisit esille esim. 3 formanttipolkua,
pitää Formant-objektin jokaisessa analyysi-ikkunassa olla ainakin
kolme formanttiehdokasta (ts. kannattaa laskea alkuperäinen formanttiobjekti
esim. 5 formantilla ja käyttää sitten <B>Track</B>-komentoa).
<P>
<H2><A NAME="SECTION00855000000000000000">
7.5.5 Lisätietoa formanttianalyysista</A>
</H2>
<P>
Kannattaa lukea Praatin sisäisestä manuaalista esim. tutoriaalisivu
<B>Source-filter synthesis<A NAME="575"></A></B>
(anna manuaalin hakusanaksi esim. "source-filter"),
jossa kuvataan melko helppotajuisesti puheen lähde-suodinteoria ja
neuvotaan käytännössä, miten Praatilla voi kokeilla puheen lähdeäänen
ja/tai ääntöväylän suodinfunktion laskemista puhenäytteestä. Sivu
on hyödyllinen varsinkin jos olet kiinnostunut Praatin puhesynteesiominaisuuksista.
<P>
<H2><A NAME="SECTION00856000000000000000">
7.5.6 Formanttikuvien piirtäminen</A>
</H2>
<P>
Tässä muutamia esimerkkejä Praatilla piirretyistä kuvista.
<P>
<DIV ALIGN="CENTER"><A NAME="836"></A>
<TABLE>
<CAPTION ALIGN="BOTTOM"><STRONG>Kuva 7.2:</STRONG>
Valitse Formant-objekti ja paina <B>Draw: Speckle...</B></CAPTION>
<TR><TD><IMG
ALIGN="BOTTOM" BORDER="0" SRC="/home/lennes/praat-opas/kuvat/formant_speckle.jpg"
ALT="Image /home/lennes/praat-opas/kuvat/formant_speckle.jpg">
<P></TD></TR>
</TABLE>
</DIV>
<P>
<DIV ALIGN="CENTER"><A NAME="837"></A>
<TABLE>
<CAPTION ALIGN="BOTTOM"><STRONG>Kuva 7.3:</STRONG>
Valitse Formant-objekti ja paina <B>Draw: Scatter plot...</B>
<BR>
Esim. skriptaamalla voi myös lisätä kyseisen vokaalin nimen kunkin
ympyrän sisälle.</CAPTION>
<TR><TD><IMG
ALIGN="BOTTOM" BORDER="0" SRC="/home/lennes/praat-opas/kuvat/formanttikarttaesim.jpg"
ALT="Image /home/lennes/praat-opas/kuvat/formanttikarttaesim.jpg">
<P></TD></TR>
</TABLE>
</DIV>
<P>
<H2><A NAME="SECTION00857000000000000000">
7.5.7 F1/F2-formanttikartan piirtäminen</A>
</H2>
<P>
Perinteisen, kirjallisuudessa usein esiintyvän F1/F2-vokaalikartan<A NAME="589"></A><A NAME="590"></A>
saa piirrettyä, kun ensin on laskenut tutkittavasta vokaalista tms.
yhtenäisestä äänteestä Formant-objektin objektilistaan esim. Burg-analyysilla
(<A HREF="node36.html#par:formantit-objektilistasta">7.5.3</A>).
<P>
<OL>
<LI>Valitse Formant-objekti ja käytä komentoa <B>Draw -- Scatter plot
(reversed axes)<A NAME="593"></A>...</B>
</LI>
<LI>Määritä esiin tulevassa lomakkeessa F1:n arvot sijoitettavaksi pystyakselille
(<B>Vertical formant number:</B> 1)<B><A NAME="595"></A></B>
sekä sopivat F1:n ala- ja ylärajat kohtaan <I>Vertical minimum<A NAME="596"></A></I>
ja <I>Vertical maximum</I><B><A NAME="598"></A>.</B> Määritä
F2 vastaavasti vaaka-akselille kirjoittamalla numero 2 kohtaan <I>Horizontal
formant number<A NAME="599"></A></I> sekä antamalla ylä-
ja alarajat. F1:n ja F2:n rajat kannattaa valita niin, että ne juuri
ja juuri kattavat kaikkien vokaalilaatujen alueen kyseisellä puhujalla,
jolloin eri vokaalien pitäisi asettua erilleen ja helposti tulkittaviin
kohtiin kartalla. Piirrettävän merkin muodon ja koon voi valita piirtolomakkeen
alaosasta (<I>Mark size<A NAME="600"></A></I> ja <I>Mark string</I><A NAME="602"></A>).
Piirtoväriä voit vaihtaa vielä ennen lomakkeen hyväksymistä Picture-ikkunan
<B>Pen</B>-valikosta. Muista myös valita Picture-ikkunasta sopivan
kokoinen ja muotoinen alue, johon formanttikartta skaalautuu haluamallasi
tavalla (ks. <A HREF="node37.html#sec:Kuvien-luominen">8</A>).
</LI>
<LI>Paina <B>OK</B>. Tuloksena pitäisi olla vokaalikartta, jossa kummankin
formantin minimi on oikeassa ylänurkassa ts. kuvan pitäisi suunnilleen
vastata kirjallisuudessa näkyviä karttoja. Jos Formant-objekti on
laskettu niin pitkästä ääninäytteestä, että siihen on mahtunut useita
laskentaikkunoita, jokaisesta näistä piirtyy kuvaan yksi formanttipiste
tai -pallero. Tästä on iloa, jos piirrät formanttikartan esim. diftongista,
jolloin formanttien liike vokaalin aikana näkyy.
</LI>
<LI>Voit piirtää samaan kuvaan päällekkäin muitakin Formant-objekteja.
Koska eri puhujien ''vokaaliavaruudet'' ovat hieman eri kokoisia
jo fysiologisista eroista johtuen, on yleensä järkevää piirtää vain
yhden puhujan formantteja samaan kuvaan.
</LI>
<LI>Formanttikartan voi tallentaa kuvatiedostoon (<A HREF="node39.html#sub:Kuvien-tallentaminen">8.2</A>).
</LI>
</OL>
<P>
<H2><A NAME="SECTION00858000000000000000">
7.5.8 Formanttianalyysin virhelähteet </A>
</H2>
<P>
Formanttianalyysi perustuu teoreettiseen <A NAME="l_E4hde-suodinteoria"></A>malliin,
jonka mukaan akustinen puhesignaali muodostuu lähdeäänestä<A NAME="610"></A>
(esimerkiksi kurkunpään tuottama "surina") ja ääntöväylän
suodinominaisuuksista (esimerkiksi formantit). Jos mitattavaan puheääneen
on päässyt vaikuttamaan jokin muu tekijä (esim. huonetila, muut puhujat
tai jokin äänitystekninen häiriö), saatat saada vääristyneitä mittaustuloksia.
<P>
<A NAME="Formanttianalyysin-tulkinta"></A>Formanttianalyysi vaatii aina
jonkin verran tulkintaa<A NAME="614"></A>: tutkija
olettaa formanttien löytyvän "sieltä mistä niiden pitäisi
löytyä". Tutkijoiden käyttämät referenssiarvot perustuvat
lukuisiin tutkimuksiin, joissa yleensä selkeästi äännettyjen vokaalien
formantteja on mitattu tietyillä parametreilla kontrolloiduista aineistoista,
tai kaavamaiseen malliin "keskimääräisen" ääntöväylän
rakenteesta. Formanttilaskennan tuloksia ei saa pitää yksinomaan objektiivisina
lukuina, vaan ne on suhteutettava kyseiseen puhujaan, äänneympäristöön,
analyysiparametreihin ja äänitteen laatuun. Monet kontekstuaaliset
tekijät saattavat muuttaa formanttien taajuuksia ja kaistanleveyksiä,
ja jotkut puheen piirteet (esim. nasaalisuus) saattavat vaikeuttaa
formanttien tulkintaa. Puhujat ovat myös aina yksilöitä, eikä formanttiarvojen
pidäkään osua kaikilla samoille taajuuksille.
<P>
Formantteja kannattaa luonnollisesti mitata vain kohdista, joissa
ei ole usean puhujan päällekkäispuhuntaa. Näin varmistat, ettei toisten
puhujien ääni sekoita analyysia, sillä formanttianalyysi ei pysty
erottamaan eri äänilähteitä toisistaan. Myös muu taustahäly tai äänitystilan
voimakas jälkikaiku voivat periaatteessa aiheuttaa virheellisiä tuloksia.
<P>
Tavanomaiset formanttianalyysin asetukset sopivat parhaiten soinnillisiin
äänteisiin, etenkin vokaaleihin. Formantteja sinänsä on tietenkin
kaikissa äänteissä, mutta automaattisen formanttianalyysin parametrien
antaminen ja tulosten tulkinta on soinnittomilla äänteillä vaikeampaa,
joskus järjetöntäkin. Ei myöskään kannata käyttää <B>Track...</B>-komentoa
kohdissa, joissa on esim. konsonantin ja vokaalin välinen siirtymä,
koska niissä löydettyjen formanttien lukumäärä saattaa äkisti muuttua,
jolloin järkevien "formanttipolkujen" löytäminen
on mahdotonta.
<P>
Kun formantit esiintyvät lähekkäin, kuten esim. F2 ja F3 [y]-vokaalissa
tai F1 ja F2 [u]:ssa tai [o]:ssa, on vaarana, että formanttianalyysi
tulkitsee vierekkäiset formantit samaksi yhtenäiseksi huipuksi. Näin
käy usein, jos tavanomaista viittä formanttia etsitään liian suurelta
taajuuskaistalta, esimerkiksi jos olet antanut matalaääniselle miespuhujalle
liian suuren yläraja-arvon kohdassa <I>Maximum formant</I>.
<P>
Laskennallisesti tavallinen syy <A NAME="formanttien-yhteensulautuminen"></A>formanttien<A NAME="630"></A>
"yhtymiselle" tai "heittelehtimiselle"
on, ettei LPC-analyysissa ole käytetty riittävää määrää spektrikertoimia
(tämä lukuhan on suhteessa etsittävien formanttihuippujen määrään).
Riittävä määrä on vähintään signaalin näytteenottotaajuus hertseinä
jaettuna tuhannella (esim. 16 kHz signaalille 16). Praatin Burg-formanttianalyysi
näytteistää signaalin automaattisesti ensin näytetaajuuteen, joka
on kaksi kertaa <I>Maximum formant</I>, ja jos (2 * Max. number
of formants) on tähän taajuuteen sopivassa suhteessa, kertoimia lasketaan
automaattisesti riittävä määrä ja analyysin pitäisi onnistua kohtalaisesti.
Sinun on kuitenkin otettava vielä tarkemmin huomioon oikea kerrointen
määrä, mikäli et käytä Praatin formanttianalyysia suoraan vaan teet
erikseen LPC-analyysin Sound-objektista. Silloin sinun on joko itse
näytteistettävä signaali uudestaan sopivaan näytetaajuuteen ennen
LPC-analyysia, tai annettava LPC:lle riittävä kertaluku (prediction
order), esim. 16 kHz ääninäytteelle 16.
<P>
<HR>
<!--Navigation Panel-->
<A NAME="tex2html683"
HREF="node37.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html677"
HREF="node31.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html673"
HREF="node35.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html679"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html681"
HREF="node51.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<B> :</B> <A NAME="tex2html684"
HREF="node37.html">8. Kuvien luominen</A>
<B> :</B> <A NAME="tex2html678"
HREF="node31.html">7. Akustinen analyysi</A>
<B> :</B> <A NAME="tex2html674"
HREF="node35.html">7.4 Intensiteetti (äänekkyys)</A>
  <B> <A NAME="tex2html680"
HREF="node1.html">Sisältö</A></B>
  <B> <A NAME="tex2html682"
HREF="node51.html">Hakemisto</A></B>
<!--End of Navigation Panel-->
<ADDRESS>
Mietta Lennes
2004-09-13
</ADDRESS>
</BODY>
</HTML>