Normally, in speech recognition, a 5-state HMM is usually used for pho การแปล - Normally, in speech recognition, a 5-state HMM is usually used for pho ไทย วิธีการพูด

Normally, in speech recognition, a

Normally, in speech recognition, a 5-state HMM is usually used for phoneme modeling in speech recognition task. The 5-state HMM might be not suitable for classifying emotions in the whole sentence, which contains several phonemes. Therefore, we conducted this experiment to find the optimal number of HMM states and also that of Gaussian mixtures. This experiment was set to vary the number of HMM states starting at 8 to 32 states and the number of Gaussian mixtures from 1 to 16 mixtures. In general, the number of Gaussian mixtures are represented the number of clustering. More clustering would be more accuracy, but it usually takes much time to process the system. In some case that training data is not much enough to provide all statistical probabilities of the distinguish features in clustering. For that reason, more number of clustering will decrease the accuracy. This problem is so called over-fitting [6].
The feature utilized in this research was MFCC since it showed the best accuracy in speech recognition. The results of this experiment are shown in Table 4. From the table, the accuracy reached the best at 50.75% when using 16 and 32 states of HMM with two mixtures. Then, we decided to use 16 states of HMM and two Gaussian mixtures for the rest experiments.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
ปกติ ในการรู้จำเสียง HMM 5 รัฐมักจะใช้สำหรับสร้างโมเดลในงานการรู้จำเสียงหน่วยเสียง HMM 5 รัฐอาจไม่เหมาะสำหรับการจัดประเภทอารมณ์ในทั้งประโยค ซึ่งประกอบด้วยหลาย phonemes ดังนั้น เราดำเนินการทดสอบนี้เพื่อค้นหาจำนวน HMM อเมริกา และของผสมนที่ การทดลองนี้ถูกตั้งค่าที่แตกต่างกันจำนวน HMM อเมริกาเริ่มต้นที่อเมริกา 8-32 และจำนวนนที่ผสม 1 ส่วนผสม 16 ทั่วไป จำนวนนที่ผสมจะแสดงหมายเลขของคลัสเตอร์ คลัสเตอร์มากขึ้นจะมีความแม่นยำมากขึ้น แต่มักจะใช้เวลาในการประมวลผลระบบ ในบางกรณีข้อมูลการฝึกอบรมไม่มากพอที่จะให้น่าจะสถิติทั้งหมดคุณลักษณะ distinguish ในคลัสเตอร์ สำหรับเหตุผลที่ จำนวนเพิ่มเติมของคลัสเตอร์จะลดความแม่นยำ ปัญหานี้จึงจะเรียกว่าเกินตัว [6] คุณลักษณะที่ใช้ในงานวิจัยนี้คือ MFCC เนื่องพบว่าความแม่นยำที่ดีที่สุดในการรู้จำเสียง ผลการทดลองนี้จะแสดงในตารางที่ 4 จากตาราง ความถูกต้องถึง 50.75% เมื่อใช้สถานะ 16 และ 32 ของ HMM ด้วยส่วนผสมที่สอง จากนั้น เราตัดสินใจจะใช้อเมริกา 16 HMM และผสมนที่สองสำหรับการทดลองที่เหลือ
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
โดยปกติในการรู้จำเสียงพูดเป็น HMM 5 รัฐมักจะใช้สำหรับการสร้างแบบจำลองในงานฟอนิมรู้จำเสียงพูด HMM 5 รัฐอาจจะไม่เหมาะสำหรับการแบ่งประเภทของอารมณ์ในประโยคทั้งหมดซึ่งมีหลายหน่วยเสียง ดังนั้นเราจึงดำเนินการทดลองครั้งนี้เพื่อหาจำนวนที่เหมาะสมของรัฐอืมและที่ผสมแบบเกาส์ การทดลองนี้ถูกกำหนดให้แตกต่างกันจำนวน HMM สหรัฐอเมริกาเริ่มต้นที่ 8-32 รัฐและจำนวนของสารผสมแบบเกาส์ 1-16 ผสม โดยทั่วไปจำนวนผสมเกาส์จะแสดงจำนวนการจัดกลุ่ม การจัดกลุ่มมากขึ้นจะมีความถูกต้องมากขึ้น แต่ก็มักจะต้องใช้เวลามากในการประมวลผลระบบ ในบางกรณีที่ข้อมูลการฝึกอบรมไม่มากพอที่จะให้ความน่าจะเป็นสถิติทั้งหมดของความแตกต่างในลักษณะการจัดกลุ่ม สำหรับเหตุผลที่จำนวนมากของการจัดกลุ่มจะลดลงความถูกต้อง ปัญหานี้จะเรียกว่ามากกว่ากระชับ [6].
คุณลักษณะที่ใช้ในการวิจัยครั้งนี้มี MFCC เพราะมันแสดงให้เห็นความถูกต้องที่ดีที่สุดในการรู้จำเสียง ผลที่ได้จากการทดลองนี้จะแสดงในตารางที่ 4 จากตารางความถูกต้องถึงที่ดีที่สุดที่ 50.75% เมื่อใช้ 16 และ 32 รัฐของ HMM กับสองผสม จากนั้นเราตัดสินใจที่จะใช้ 16 รัฐของอืมและสองผสมแบบเกาส์สำหรับการทดลองส่วนที่เหลือ
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
ปกติแล้วในการรู้จำเสียงพูด , 5-state หืม โดยปกติจะใช้หน่วยเสียงแบบในงานรู้จำเสียงพูด การ 5-state อืมอาจจะไม่เหมาะกับการจัดอารมณ์ในประโยคทั้งหมด ซึ่งมีหลายหน่วยเสียง . ดังนั้นเราจึงทำการทดลองนี้เพื่อหาจำนวนที่เหมาะสมของรัฐและยังว่าเกาส์ - ผสม การทดลองนี้ถูกตั้งค่าให้เปลี่ยนเลขอืมสหรัฐอเมริกาเริ่มต้นที่ 8 32 รัฐและจำนวนของส่วนผสมจาก 1 ถึง 16 ) ผสม โดยทั่วไปจำนวนของเกาส์ผสมจะแสดงหมายเลขของการจัดกลุ่ม . เพิ่มเติมข้อมูลจะมีความถูกต้องมากขึ้นแต่มันจะใช้เวลามากเวลาในการประมวลผลของระบบ ในบางกรณีที่ข้อมูลการฝึกอบรมไม่มากพอที่จะให้ความน่าจะเป็นทางสถิติทั้งหมดของแยกแยะคุณสมบัติในการจัดกลุ่ม . สำหรับเหตุผลที่มากกว่าจำนวนของคลัสเตอร์จะลดความแม่นยำ ปัญหานี้จึงเรียกว่าเกินกระชับ [ 6 ]คุณลักษณะที่ใช้ในการวิจัย คือ ค่ามันมีความถูกต้องในการรู้จำเสียงพูด . ผลการทดลองนี้จะแสดงในตารางที่ 4 จากตาราง ความถูกต้องถึงดีที่สุดที่ 50.75% เมื่อใช้ 16 และ 32 รัฐของหือกับสองผสม จากนั้นเราตัดสินใจที่จะใช้ 16 รัฐของ - และสองเสียนผสมตลอดการทดลอง
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: