Abstract—We propose to adapt deep n

Abstract—We propose to adapt deep neural network (DNN) acoustic models to a target speaker by supplying speaker identity vectors (i-vectors) as input features to the network in parallel with the regular acoustic features for ASR. For both training and test, the i-vector for a given speaker is concatenated to every frame belonging to that speaker and changes across different speakers. Experimental results on a Switchboard 300 hours corpus show that DNNs trained on speaker independent features and ivectors achieve a 10% relative improvement in word error rate (WER) over networks trained on speaker independent features only. These networks are comparable in performance to DNNs trained on speaker-adapted features (with VTLN and FMLLR) with the advantage that only one decoding pass is needed. Furthermore, networks trained on speaker-adapted features and i-vectors achieve a 5-6% relative improvement in WER after hessian-free sequence training over networks trained on speakeradapted features only.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

นามธรรมซึ่งเราเสนอปรับรุ่นอะคูสติก (DNN) โครงข่ายประสาทลึกลำโพงเป้าหมาย โดยจัดหาลำโพงตัวเวกเตอร์ (i-เวกเตอร์) เป็นลักษณะเข้าข่ายควบคู่กับคุณลักษณะระดับปกติสำหรับ ASR ฝึกอบรมและทดสอบ เวกเตอร์ i สำหรับลำโพงให้เชื่อมรวมอยู่กับทุกเฟรมของลำโพงนั้น และการเปลี่ยนแปลงระหว่างลำโพงแตกต่างกัน ผลการทดลองในคอร์พัสคริบอร์ด 300 ชั่วโมงแสดงว่า DNNs รับการฝึกอบรมในลักษณะอิสระลำโพง และ ivectors ให้ปรับปรุงสัมพัทธ์ 10% ในอัตราข้อผิดพลาดคำ (WER) ผ่านทางเครือข่ายที่ผ่านการฝึกอบรมบนลำโพงขึ้นอยู่กับคุณลักษณะเฉพาะ เครือข่ายเหล่านี้จะสามารถเปรียบเทียบประสิทธิภาพการทำงานเพื่ออบรมการคุณลักษณะปรับลำโพง (กับ VTLN และ FMLLR) มีประโยชน์ DNNs ต้องผ่านการถอดรหัสที่เดียว นอกจากนี้ เครือข่ายการฝึกอบรมในลักษณะดัดแปลงลำโพง และเวกเตอร์ i ให้ปรับปรุงสัมพันธ์ 5-6% ใน WER หลังจากอบรมฟรี hessian ลำดับการฝึกอบรมผ่านเครือข่ายการ speakeradapted คุณลักษณะเฉพาะ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

บทคัดย่อ-เราเสนอให้ปรับตัวเข้ากับเครือข่ายประสาทลึก (DNN) รุ่นอะคูสติกลำโพงเป้าหมายโดยการจัดหาเวกเตอร์ตัวตนลำโพง (i-เวกเตอร์) เป็น input มีกับเครือข่ายในแบบคู่ขนานที่มีคุณสมบัติอะคูสติกปกติสำหรับ ASR ทั้งการฝึกอบรมและการทดสอบ i-เวกเตอร์ลำโพงที่ได้รับการตัดแบ่งเป็นทุกเฟรมที่เป็นที่ลำโพงและการเปลี่ยนแปลงที่แตกต่างกันทั่วลำโพง ผลการทดลองบนสวิตช์ 300 ชั่วโมงแสดงว่าคอร์ปัส DNNs รับการฝึกอบรมเกี่ยวกับคุณสมบัติที่เป็นอิสระและลำโพง ivectors บรรลุการปรับปรุงญาติ 10% ในอัตราความผิดพลาดคำ (WER) ผ่านเครือข่ายการฝึกอบรมเกี่ยวกับคุณสมบัติอิสระลำโพงเท่านั้น เครือข่ายเหล่านี้จะเปรียบในการปฏิบัติงานที่จะได้รับการฝึกฝน DNNs กับคุณสมบัติของลำโพงที่ดัดแปลง (มี VTLN และ FMLLR) ด้วยความได้เปรียบที่มีเพียงหนึ่งผ่านการถอดรหัสเป็นสิ่งจำเป็น นอกจากนี้เครือข่ายการฝึกอบรมเกี่ยวกับคุณสมบัติลำโพงที่ดัดแปลงและฉันเวกเตอร์บรรลุ 5-6% เมื่อเทียบกับในการปรับปรุง WER หลังการฝึกอบรมลำดับกระสอบฟรีผ่านเครือข่ายการฝึกอบรมเกี่ยวกับคุณสมบัติ speakeradapted เท่านั้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

นามธรรม เราเสนอให้ปรับโครงข่ายประสาทลึก ( dnn ) อะคูสติกรุ่นเป้าหมายโดยการจัดหาตัวลำโพง ( ลำโพงเวกเตอร์ i-vectors ) เป็นคุณสมบัติของข้อมูลไปยังเครือข่ายในแบบคู่ขนานกับปกติคุณสมบัติอะคูสติกขั้นสูง . สำหรับการฝึกอบรมและทดสอบ i-vector ให้ลำโพงมาทุกเฟรมที่เป็นของที่ลำโพงและการเปลี่ยนแปลงผ่านลำโพงที่แตกต่างกันผลการทดลองบนแผง 300 ชั่วโมงข้อมูลแสดงให้เห็นว่า dnns ฝึกลำโพงอิสระคุณลักษณะและ ivectors บรรลุการปรับปรุงสัมพัทธ์ 10% ในอัตราความผิดพลาดคำ ( เวอร์ ) ผ่านเครือข่ายการฝึกอบรมวิทยากรประกอบด้วยอิสระเท่านั้นเครือข่ายเหล่านี้จะเปรียบในการปฏิบัติการฝึก dnns ลำโพงดัดแปลงคุณสมบัติ ( และ vtln fmllr ) กับ ประโยชน์ ที่ เพียงหนึ่งถอดรหัสผ่านที่จำเป็น นอกจากนี้ เครือข่ายการฝึกอบรมลำโพงปรับคุณสมบัติและ i-vectors บรรลุการปรับปรุงญาติ 5-6 % ในกระสอบมีหลังจากฟรีลำดับการฝึกอบรมผ่านเครือข่ายการฝึกอบรมใน speakeradapted คุณสมบัติเท่านั้น

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.