The channel bC whose measure is the highest is selected as
the least distorted one.
The degree of distortion (reverberation, noise) may vary
from one sub-band to another, so in principle a non-uniform
weighting of the sub-band measures may lead to a
higher ASR accuracy. A development data set may be used
to tune the weights, or, alternatively, they may be related to
the amount of sub-band distortion and estimated directly
from the signal.
2.2. Decoder-based measures
2.2.1. Likelihood
The first, straight forward, decoder-based measure
based on acoustic likelihood was proposed by Shimizu
et al. (2000). In that implementation, signals from all channels
were passed to the recognizer and the channel giving
the maximum acoustic likelihood was selected. In the following,
we will outline a problem related to this measure
and explain why it should not be used for CS. A solution
is provided in the next subsection.
In conventional ASR systems the Bayes’ rule is used to
compute the posterior probability P(w j O) of a word
sequence w = w1, . . . ,wN, given a sequence of acoustic
observation vectors O = o1, . . . ,oT. The speech recognition
problem is therefore regarded as that of computing
W ¼ arg max
w2X
Pðw j OÞ ¼ arg max
w2X
pðO j wÞPðwÞ
pðOÞ
; ð5Þ
where X denotes the set of all possible word sequences,
p(O j w) is the acoustic likelihood, and P(w) is the prior
probability of the word sequence. The probability of the
observation vector p(O) in the denominator is usually omitted
since it does not depend on the selected sequence of
words and works only as a scaling factor. Thus, the use
of (non-normalized) likelihood scores is not a problem in
the case of a single channel.
If there are several parallel channels, the probability of
the observation vector p(Om) is different for each stream.
The posterior probability for the multi-channel case is
defined as
Pðw j OmÞ ¼
pðOm j wÞPðwÞ
pðOmÞ
; ð6Þ
where m = 1, . . . ,M is the channel index. Obviously, the
probability of the observation vector can not be neglected
if we want to compare the scores from different channels
among themselves. This is the reason why likelihoods provided
by ASR systems can not be used as a reliable indicator
of channel quality.
2.2.2. Pairwise likelihood normalization
If the posterior probability of the hypothesized word
sequence was available for each channel (6), it could be
used as a CS measure. However, the estimation of the
observation vector probability p(Om) requires either some
assumptions or approximations (Hui, 2005). To avoid this
bc ช่องที่มีวัดที่สูงที่สุดจะถูกเลือกเป็น
อย่างน้อยหนึ่งบิดเบี้ยว.
ระดับของการบิดเบือน (ก้องเสียง) อาจแตกต่างจากที่หนึ่ง
ย่อยวงไปยังอีกดังนั้นในหลักการไม่เหมือนกัน
น้ำหนักย่อย วงมาตรการอาจนำไปสู่ความถูกต้อง
ASR ที่สูงขึ้น การพัฒนาชุดข้อมูลอาจจะใช้ในการปรับแต่ง
น้ำหนักหรืออีกทางเลือกหนึ่งที่พวกเขาอาจจะเกี่ยวข้องกับ
จำนวนของการบิดเบือนย่อยและวงดนตรีที่คาดโดยตรงจากสัญญาณ
.
2.2 มาตรการถอดรหัสตาม
2.2.1
โอกาสแรกตรงไปตรงมาถอดรหัสตามมาตรการ
อยู่บนพื้นฐานของความเป็นอคูสติกได้รับการเสนอโดย
Shimizu et al, (2000) ในการดำเนินการที่สัญญาณจากทุกช่อง
ถูกส่งผ่านไปยังจำแนกและให้ช่อง
โอกาสเสียงสูงสุดได้รับเลือกในต่อไปนี้
เราจะร่างปัญหาที่เกี่ยวข้องกับวัดนี้
และอธิบายว่าทำไมมันไม่ควรจะนำมาใช้สำหรับ cs โซลูชั่น
มีให้ในส่วนย่อยต่อไป.
ในระบบ ASR ทั่วไปกฎ Bayes 'จะใช้ในการคำนวณ
พีหลังน่าจะเป็น (wjo) ของคำ
ลำดับกว้าง = w1, . . , WN ให้ลำดับของอะคูสติก
สังเกตเวกเตอร์ o = o1, . . , ot รู้จำเสียงพูด
ปัญหาจึงได้รับการยกย่องว่าเป็นของคอมพิวเตอร์
กว้าง¼หาเรื่องสูงสุด
w2x PDW เจ OTH ¼หาเรื่องสูงสุด
w2x PDO เจwÞpðwÞ
pðoÞ
ð5Þที่ x หมายถึงชุดของลำดับคำเป็นไปได้ทั้งหมด
พี (ojw) เป็นความน่าจะเป็นอะคูสติกและพี (กว้าง) คือความน่าจะเป็นก่อน
ของลำดับคำ น่าจะเป็นของการสังเกต
เวกเตอร์พี (o) ในส่วนที่มักจะถูกละไว้
เพราะมันไม่ได้ขึ้นอยู่กับลำดับที่เลือกของ
คำพูดและการทำงานเป็นเพียงปัจจัยการปรับ จึงใช้
ของคะแนน (ไม่ปกติ) ความเป็นไปไม่ได้เป็นปัญหาในกรณีของ
ช่องทางเดียว.
ถ้ามีช่องทางที่หลายขนานน่าจะเป็นของ
พีสังเกตเวกเตอร์ (อ้อม) จะแตกต่างกันสำหรับแต่ละกระแส .
น่าจะเป็นหลังสำหรับกรณีที่หลายช่องทางที่กำหนดให้เป็น
PDW เจomÞ¼
pðomเจwÞpðwÞ
pðomÞ
ð6Þโดยที่ m = 1 . . , m คือดัชนีช่อง เห็นได้ชัดว่า
น่าจะเป็นของเวกเตอร์การสังเกตไม่สามารถละเลย
ถ้าเราต้องการที่จะเปรียบเทียบคะแนนจากช่องทางที่แตกต่างกันในตัวเอง
นี่คือเหตุผลที่ว่าทำไม likelihoods ให้
โดยระบบ ASR ไม่สามารถใช้เป็นตัวบ่งชี้ที่เชื่อถือได้ของที่มีคุณภาพ
ช่อง.
2.2.2 ความน่าจะเป็นบรรทัดฐานคู่
ถ้าความน่าจะเป็นหลังของคำสมมติฐาน
ลำดับที่สามารถใช้ได้สำหรับแต่ละช่อง (6), มันอาจจะ
ใช้เป็นตัวชี้วัด cs แต่การประเมินของ
สังเกตน่าจะเป็นเวกเตอร์พี (อ้อม) ต้องใช้ทั้งบาง
สมมติฐานหรือใกล้เคียง (ฮุย 2005) เพื่อหลีกเลี่ยงนี้
การแปล กรุณารอสักครู่..

ช่องเลือก bC วัดได้สูงสุดเป็น
ผิดเพี้ยนน้อยที่สุดหนึ่งได้
ระดับการบิดเบือน (reverberation เสียงรบกวน) อาจแตกต่างกัน
จากวงย่อยหนึ่งไปยังอีก ดังนั้นในหลักการไม่สม่ำเสมอ
น้ำหนักวัดวงย่อยอาจนำไปสู่การ
ASR ความแม่นยำที่สูงได้ อาจใช้ชุดข้อมูลพัฒนา
ฟังน้ำหนัก หรือ หรือ พวกเขาอาจจะเกี่ยวข้องกับ
จำนวนของความผิดเพี้ยนของวงย่อย และประเมินโดยตรง
จากสัญญาณ
2.2 มาตรการที่ใช้ถอดรหัส
2.2.1 โอกาส
วัดแรก ตรงไปข้างหน้า ใช้การถอดรหัส
อคูสติกโดยใช้ความน่าเป็นถูกเสนอ โดยชิมิซุ
et al. (2000) งาน สัญญาณจากช่องรายการทั้งหมดที่
ถูกส่งผ่านไปยังตัวจำแนกและช่องให้
เลือกโอกาสระดับสูงสุด ในต่อไปนี้,
เราจะเค้าปัญหาที่เกี่ยวข้องกับวัดนี้
และอธิบายว่า ทำไมจึงไม่ควรใช้สำหรับ CS โซลูชัน
ไว้ในหน้า subsection
ระบบ ASR ธรรมดา กฎ Bayes' คือใช้
คำนวณความเป็นไปหลัง P (w j O) คำ
w ลำดับ = w1,..., ดับเบิ้ลยูเอ็น กำหนดลำดับของอคูสติก
สังเกตเวกเตอร์ O = o1,..., oT การรู้จำเสียง
ปัญหาดังนั้นถือเป็นที่คอมพิวเตอร์
W ¼อาร์กิวเมนต์ของค่าสูงสุด
w2X
Pðw เจ OÞ ¼อาร์กิวเมนต์ของค่าสูงสุด
w2X
pðO เจ wÞPðwÞ
pðOÞ
; ð5Þ
X หมายถึงชุดของลำดับคำได้ทั้งหมด,
p (O j w) ความน่าเป็นอะคูสติก และ P(w) ก่อน
น่าลำดับคำ ความน่าเป็นของ
p(O) เวกเตอร์สังเกตในตัวหารมักจะไม่ใส่
เนื่องจากมันขึ้นอยู่กับลำดับการเลือกของ
คำ และทำงานเป็นตัวประกอบมาตราส่วนเท่านั้น ดังนั้น การใช้
ของโอกาส (ไม่ใช่ตามปกติ) คะแนนจะไม่มีปัญหาใน
กรณีของเดียวช่อง
ถ้ามีหลายช่องทางขนาน ความน่าเป็นของ
p(Om) เวกเตอร์สังเกตจะแตกต่างกันสำหรับกระแสข้อมูลแต่ละการ
น่าเป็นหลังสำหรับกรณีหลายช่องเป็น
กำหนดเป็น
Pðw เจ OmÞ ¼
pðOm เจ wÞPðwÞ
pðOmÞ
; ð6Þ
ที่ m = 1,..., M คือ ดัชนีช่อง อย่างชัดเจน การ
ไม่สามารถจะที่ไม่มีกิจกรรมน่าเป็นเวกเตอร์สังเกต
ถ้าเราต้องการเปรียบเทียบคะแนนจากสถานี
ระหว่างกันเองได้ นี่คือเหตุผลที่ทำไมให้ likelihoods
โดย ASR ระบบไม่สามารถใช้เป็นตัวบ่งชี้ที่เชื่อถือได้
ของช่องคุณภาพ
2.2.2 แพร์ไวส์โอกาสฟื้นฟู
ถ้าความน่าเป็นหลังของคำค่า
ลำดับสำหรับแต่ละช่อง (6) อาจ
ใช้เป็นวัด CS อย่างไรก็ตาม การประเมินของการ
สังเกตเวกเตอร์ความน่าเป็น p(Om) ต้องการบาง
สมมติฐานหรือเพียงการประมาณ (ฮุย 2005) เพื่อหลีกเลี่ยงนี้
การแปล กรุณารอสักครู่..
