Abstract:Recently, automatic indexi

Abstract:
Recently, automatic indexing of a spoken document
using a speech recognizer attracts attention. However,
index generation from an automatic transcription has
many problems because the automatic transcription has
many recognition errors and Out-Of-Vocabulary words. To
solve this problem, we propose a document expansion
method using Web documents. To obtain important
keywords which included in the spoken document but lost
by recognition errors, we acquire Web documents relevant
to the spoken document. Then, an index of the spoken
document is generated by combining an index that
generated from the automatic transcription and the Web
documents. We propose a method for retrieval of relevant
documents, and the experimental result shows that the
retrieved Web document contained many OOV words.
Next, we propose a method for combining the recognized
index and the Web index. The experimental result shows
that the index of the spoken document generated by the
document expansion was closer to an index from the
manual transcription than the index generated by the
conventional method. Finally, we conducted a spoken
document retrieval experiment, and the
document-expansion-based index gave better retrieval
precision than the conventional indexing method.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

บทคัดย่อ:ล่าสุด การทำดัชนีอัตโนมัติของเอกสารพูดใช้จำแนกเสียงดึงดูดความสนใจ อย่างไรก็ตามสร้างดัชนีการ transcription โดยอัตโนมัติได้ปัญหามากมายเนื่องจากมี transcription โดยอัตโนมัติข้อผิดพลาดการรู้จำและคำศัพท์ของออกจำนวนมาก ถึงแก้ปัญหานี้ เราเสนอขยายเอกสารวิธีใช้เว็บเอกสาร ได้รับความสำคัญคำสำคัญที่รวมอยู่ในนั้นพูด แต่หายไปโดยข้อผิดพลาดในการรับรู้ เราได้รับเอกสารเว็บที่เกี่ยวข้องเอกสารพูด แล้ว ดัชนีของการพูดเอกสารถูกสร้างขึ้น โดยรวมดัชนีที่สร้าง transcription โดยอัตโนมัติและเว็บเอกสาร เราเสนอวิธีการเรียกของที่เกี่ยวข้องเอกสาร และผลการทดลองแสดงให้เห็นว่าการดึงข้อมูลเอกสารเว็บมีอยู่หลายคำ OOVถัดไป เราเสนอวิธีการรวมการรับรู้ดัชนีและดัชนีเว็บ แสดงผลการทดลองที่สร้างดัชนีของเอกสารพูดโดยการขยายเอกสารได้ใกล้ชิดกับดัชนีจากการคู่มือ transcription กว่าดัชนีที่สร้างขึ้นโดยการวิธีทั่วไป สุดท้าย เราดำเนินการพูดเอกสารการทดลองเรียก และดัชนีเอกสารขยายตัวใช้ให้เรียกดีกว่าแม่นยำกว่าวิธีดัชนีทั่วไป

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

บทคัดย่อ:
เมื่อเร็ว ๆ นี้การจัดทำดัชนีโดยอัตโนมัติของเอกสารที่พูด
โดยใช้จำแนกคำพูดที่ดึงดูดความสนใจ อย่างไรก็ตาม
การสร้างดัชนีจากการถอดความอัตโนมัติมี
ปัญหามากเพราะมีการถอดความอัตโนมัติ
ยอมรับข้อผิดพลาดจำนวนมากและคำพูดออกของคำศัพท์ เพื่อ
แก้ปัญหานี้เราขอนำเสนอการขยายตัวเอกสาร
วิธีการใช้เอกสารเว็บ ที่จะได้รับที่สำคัญ
คำหลักซึ่งรวมถึงในเอกสารพูด แต่หายไป
จากข้อผิดพลาดการรับรู้ที่เราได้รับเอกสารเว็บที่เกี่ยวข้อง
กับเอกสารพูด จากนั้นดัชนีพูด
เอกสารถูกสร้างขึ้นโดยการรวมดัชนีที่
สร้างขึ้นจากการถอดความโดยอัตโนมัติและเว็บ
เอกสาร เราเสนอวิธีการสำหรับการดึงที่เกี่ยวข้อง
เอกสารและผลการทดลองแสดงให้เห็นว่า
เอกสารดึงเว็บที่มีหลายคำ OOV.
ต่อไปเราจะนำเสนอวิธีการในการได้รับการยอมรับการรวม
ดัชนีและดัชนีเว็บ ผลการทดลองแสดงให้เห็น
ว่าดัชนีที่สร้างเอกสารที่พูดโดย
การขยายตัวของเอกสารอยู่ใกล้กับดัชนีจาก
การถอดความคู่มือกว่าดัชนีที่สร้างขึ้นโดย
วิธีการทั่วไป สุดท้ายเราดำเนินการพูด
การทดลองดึงเอกสารและ
ดัชนีตามเอกสารการขยายตัวที่ดีกว่าการดึงให้
ความแม่นยำกว่าวิธีการจัดทำดัชนีธรรมดา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

บทคัดย่อ :
เมื่อเร็ว ๆนี้ , การทำดัชนีอัตโนมัติของเอกสาร การใช้คำพูด พูด
recognizer ดึงดูดความสนใจ อย่างไรก็ตาม ดัชนีที่สร้างจากบัณฑิตยสถานอัตโนมัติ

มีปัญหามาก เพราะมีการถอดความหลายอัตโนมัติ
ข้อผิดพลาดจากคําศัพท์

แก้ปัญหานี้ เราขอเอกสารเพิ่ม
โดยใช้เอกสารเว็บ ที่จะได้รับที่สำคัญ
คำหลักซึ่งรวมอยู่ในเอกสาร แต่แพ้
โดยพูดยอมรับข้อผิดพลาด เราได้รับเอกสารเว็บที่เกี่ยวข้องกับพูด
เอกสาร จากนั้น ดัชนีพูด
เอกสารถูกสร้างขึ้นโดยการรวมดัชนีที่สร้างขึ้นจากบัณฑิตยสถานอัตโนมัติ

เว็บและเอกสาร เราเสนอวิธีการค้นคืนเอกสารที่เกี่ยวข้อง
และผลการทดลองแสดงให้เห็นว่า
ในเว็บมีหลายเอกสารคำ OOV .
ต่อไป เราขอเสนอวิธีการรวมจำ
ดัชนีและดัชนีเว็บ ผลการทดลองแสดงให้เห็นว่า
ที่ดัชนีของเอกสารที่สร้างขึ้นโดยพูด
เอกสารการขยายตัวใกล้ดัชนีจาก
ถอดความคู่มือกว่าดัชนีที่สร้างขึ้นโดย
ตามปกติ สุดท้าย เราทำการพูด
เอกสารทดลอง สืบค้น และดัชนีตามเอกสารที่ต้องการขยายการสืบค้นให้

ดีกว่าวิธีการปกติ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.