Our Active Appearance Model was bui

Our Active Appearance Model was built using 44,000 frames from
200 of the source sequences, with 110 facial landmarks identified
for each frame, 32 of them around the mouth. After shape normalisation
and PCA the 10 largest PCA parameters were retained as
they contained over 98% of the energy. The corresponding audio
data was sampled at 44100 Hz and parameterised using 13 mel frequency
cepstal coefficients (MFCCs). Finally the audio-video dual
HMM model was built in the joint audio-video space. This joint
model is used to produce photorealistic videos from audio only input
as described by D.Cosker [Cosker 2006].

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

รูปแบบลักษณะงานของเราถูกสร้างขึ้นโดยใช้เฟรม 44000 จาก200 ลำดับแหล่งที่มา มีสถานหน้า 110 ที่ระบุสำหรับแต่ละเฟรม 32 พวกเขารอบปาก หลังจากทรง normalisationและ PCA ได้สะสมเป็นพารามิเตอร์ PCA ที่ใหญ่ที่สุด 10พวกเขาประกอบด้วยกว่า 98% ของพลังงาน เสียงข้อมูลเป็นตัวอย่างที่ 44100 Hz และ parameterised โดยใช้ความถี่เมล 13สัมประสิทธิ์ cepstal (MFCCs) ในที่สุดสองเสียงวิดีโอHMM รุ่นถูกสร้างขึ้นในพื้นที่เสียงวิดีโอร่วมกัน ร่วมนี้ใช้รูปแบบการผลิตวิดีโอภาพจากอินพุตเท่านั้นตามที่อธิบายไว้ โดย D.Cosker [Cosker 2006]

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ลักษณะการใช้งานของเรารุ่นที่ถูกสร้างขึ้นโดยใช้ 44,000 ภาพจาก
200 ลำดับแหล่งที่มากับ 110
สถานที่สำคัญของใบหน้าระบุสำหรับแต่ละเฟรม32 ของพวกเขารอบปาก หลังจากที่การฟื้นฟูรูปร่างและ PCA 10 ที่ใหญ่ที่สุดพารามิเตอร์ PCA ถูกเก็บไว้เป็นพวกเขาที่มีอยู่มากกว่า98% ของพลังงานที่ เสียงที่สอดคล้องกันข้อมูลที่เป็นตัวอย่างที่ 44,100 เฮิร์ตซ์และ parameterised ใช้ความถี่ 13 เมลสัมประสิทธิ์cepstal (MFCCs) ในที่สุดคู่เสียงวิดีโอรูปแบบอืมถูกสร้างขึ้นในพื้นที่เสียงวิดีโอร่วมกัน นี้ร่วมกันรูปแบบที่จะใช้ในการผลิตวิดีโอเหมือนจริงจากเสียงเพียงป้อนข้อมูลตามที่อธิบายD.Cosker [Cosker 2006]

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

รูปแบบลักษณะงานของเราคือการสร้างขึ้นโดยใช้ 44000 เฟรม
200 แหล่งลำดับ กับ 110 หน้าสถานที่ระบุ
สำหรับแต่ละเฟรม 32 ของพวกเขารอบ ๆปาก หลังจากการฟื้นฟูและรูปร่าง
PCA 10 ที่ใหญ่ที่สุดถูกพารามิเตอร์ถูกเก็บไว้เป็น
พวกเขาที่มีอยู่กว่า 98% ของพลังงาน ข้อมูลเสียงที่ 44100
ตัวอย่างที่ parameterised Hz และใช้ความถี่
13 เมลcepstal ค่าสัมประสิทธิ์ ( mfccs ) ในที่สุดเสียงวิดีโอคู่
อืมรูปแบบถูกสร้างขึ้นในพื้นที่ผลิตร่วมกัน รุ่นนี้จะใช้ในการผลิตวิดีโอร่วมกัน

เหมือนจริงจากสัญญาณเสียงเดียวตามที่อธิบายไว้โดย cosker cosker [ 2006 ]

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.