All stimuli were produced from digital recordings (44.1 kHz, 16 bit)
of a female native speaker of Finnish. The initial syllables were uttered in
isolation and the final syllables in combination with a preceding vowel
to make them unstressed, in accordance with the Finnish phonology.
The syllables were selected from several utterances as matching for
their fundamental frequency (F0) and vowel duration. The original syllables
were normalised by the maximal peak amplitude and durations
matched to 145 ms with a 5 ms fade in and a 20 ms fade out envelopes.
The non-native syllables were morphed (taking into account 50% of
each original native syllable) using the TANDEM–STRAIGHT algorithm
(Kawahara et al., 2008). This technique decomposes sound information
into source and resonator components with representation of power
spectra of periodic signals, and computes an interference-free spectrum,
fundamental frequency and aperiodicity. The CV structure is fully
retained during the morphing procedure; yet, the phonemes do not
anymore correspond to any native prototypes. This procedure offers a
much more controlled way over the stimulus phonetic features than
e.g. simply using a random foreign language, as it enables one to precisely
dictate the make-up of the new sounds, while keeping their
acoustic features and general composition on average the same as the
other, native, sounds which they are based on. While some unnaturalness
may result from this procedure, this ensures that the subjects
have never encountered the phonemes before (which could occur
when using phonemes of a foreign language). The F0 and loudness
were equalised across syllables. Thereafter the F0 of the final syllables
was decreased by 44 Hz and loudness by 7 dB to conform to the natural
stress and prosody of Finnish speech (Suomi et al., 2003). The fundamental
frequency contours of the vowels of the initial syllables were adjusted
to match the contours of equivalent short Finnish vowels. The
final tokens were formed by cross-splicing the initial and final syllables
together with a 75 ms silent closure between the first and second
ทั้งหมด โดยถูกผลิตจากบันทึกดิจิตอล ( 44.1 kHz 16 บิต )
ของเจ้าของภาษาหญิงของฟินแลนด์ เสียงแรกพูดในการแยกพยางค์สุดท้าย
) รวมกับก่อนหน้านี้เพื่อให้เปลี่ยนแปลงทางเสียง ตามระบบเสียงภาษาไทย .
9 ได้รับเลือกจากคำพูดหลายเช่นการจับคู่สำหรับ
ความถี่และระยะเวลาของพวกเขา ( ละ ) สระ
พยางค์หลังจากยอดสูงสุดเดิมมีขนาดและระยะเวลา
จับคู่ 145 MS กับ 5 นางสาวจางในและจางหายออกจากซอง 20 ms .
9 ภาษา คือ morphed ( จดลงในบัญชี 50 %
ต้นฉบับแต่ละพยางค์พื้นเมือง ) โดยใช้ควบคู่–ตรงขั้นตอนวิธี
( คาวา et al . , 2008 )เทคนิคนี้สลายตัว
ข้อมูลเสียงลงในแหล่งที่มาและองค์ประกอบของชุดกับการสเปกตรัมของสัญญาณพลังงาน
เป็นระยะ , และการรบกวนฟรีคำนวณสเปกตรัมความถี่พื้นฐาน และ aperiodicity
. โครงสร้าง CV เต็มที่
เก็บไว้ในระหว่างขั้นตอนการ morphing ; ยัง , หน่วยเสียงไม่
แล้วสอดคล้องกับเจ้าของภาษาต้นแบบ ขั้นตอนนี้เสนอ
มากขึ้นกว่าการกระตุ้นทางควบคุมคุณลักษณะสัทกว่า
เช่น เพียงแค่ใช้สุ่มภาษาต่างประเทศตามที่มันช่วยให้หนึ่งที่จะแน่นอน
บอกการแต่งหน้าของเสียงใหม่ขณะที่การรักษาคุณสมบัติอะคูสติกของพวกเขา
และองค์ประกอบทั่วไปเฉลี่ยเช่นเดียวกับ
อื่นๆ , พื้นเมือง , เสียงที่พวกเขาอยู่ใน ในขณะที่บาง unnaturalness
อาจเป็นผลมาจากกระบวนการนี้นี้ยืนยันว่า วิชา
ไม่เคยพบทั้งหมดก่อน ( ซึ่งอาจเกิดขึ้น
เมื่อใช้หน่วยเสียงของภาษาต่างประเทศ ) ที่ละและความดัง
ถูกตีเสมอในพยางค์ หลังจากนั้นละพยางค์สุดท้ายของ
ลดลง 44 Hz และความดัง โดย 7 dB เพื่อให้สอดคล้องกับธรรมชาติ
ความเครียดและฉันทลักษณ์ของฟินแลนด์พูด ( ภาษาฟินแลนด์ et al . , 2003 )
พื้นฐานความถี่รูปทรงของเสียงสระของพยางค์แรกคือปรับ
เพื่อให้ตรงกับรูปทรงของฟินแลนด์เทียบเท่าสั้นสระ
สัญญาณสุดท้ายที่ถูกสร้างโดยข้าม splicing เริ่มต้นและสุดท้ายพยางค์
พร้อมกับ 75 นางสาวเงียบปิดระหว่างตัวแรกและตัวที่สอง
การแปล กรุณารอสักครู่..
