To extract segment-level keywords,

To extract segment-level keywords, we first arrange each
ASR and OCR word to an appropriate video segment
according to the time stamp. Then we extract nouns from
the transcripts by using the stanford part-of-speech tagger
[25] and a stemming algorithm is subsequently utilized to
capture nouns with variant forms. To remove the spelling
mistakes resulted by the OCR engine, we perform a dictionary-
based filtering process.
We calculate the weighting factor for each remaining
keyword by extending the standard TFIDF score [26]. In
general, the TFIDF algorithm calculates keywords only
according to their statistical frequencies. It cannot represent
the location information of keywords, that might be important
for ranking keywords extracted from web pages or lecture
slides. Therefore, we defined a new formula for
calculating TFIDF score, as shown by Eq. (1):

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การแยกเซ็กเมนต์ระดับคำหลัก เราครั้งแรกจัดให้แต่ละASR และ OCR คำส่วนวิดีโอเหมาะสมตามการประทับเวลา จากนั้น เราแยกคำนามจากใบ โดยใช้ tagger เป็นส่วนหนึ่งของคำพูดที่สแตนฟอร์ด[25] และต่อมามีใช้อัลกอริทึม stemming เพื่อจับคำนาม มีรูปแบบตัวแปร การเอาออกการสะกดส่งผลให้เกิดความผิดพลาด โดยโปรแกรม OCR เราทำพจนานุกรม-ตามขั้นตอนการกรองเราคำนวณปัจจัยถ่วงสำหรับแต่ละที่เหลือคำขยายมาตรฐาน TFIDF คะแนน [26] ในทั่วไป อัลกอริทึม TFIDF คำนวณคำสำคัญเท่านั้นตามความถี่ทางสถิติของพวกเขา มันไม่สามารถแสดงข้อมูลสถานที่สำคัญ ที่อาจสำคัญคำสำคัญอันดับที่สกัดได้จากหน้าเว็บหรือบรรยายภาพนิ่ง ดังนั้น เรากำหนดสูตรใหม่สำหรับการคำนวณคะแนน TFIDF ดังที่ Eq. (1):

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เพื่อแยกคำหลักส่วนระดับแรกที่เราจัดให้แต่ละ
ASR และ Word OCR เพื่อส่วนวิดีโอที่เหมาะสม
ตามที่ประทับเวลา จากนั้นเราก็แยกจากคำนาม
ใบรับรองผลการเรียนโดยใช้สแตนฟอส่วนหนึ่งของคำพูด Tagger
[25] และอัลกอริทึมที่เกิดถูกนำมาใช้ต่อมา
จับคำนามที่มีรูปแบบที่แตกต่างกัน ในการลบการสะกดคำ
ผิดพลาดส่งผลให้เครื่องยนต์ OCR เราทำการพจนานุกรม
ตามขั้นตอนการกรอง.
เราคำนวณปัจจัยถ่วงสำหรับที่เหลือแต่ละ
คำหลักโดยการขยายคะแนน TFIDF มาตรฐาน [26] ใน
ทั่วไปขั้นตอนวิธีการ TFIDF คำนวณเฉพาะคำหลัก
ตามความถี่สถิติของพวกเขา มันไม่สามารถเป็นตัวแทน
ข้อมูลตำแหน่งของคำหลักที่อาจจะมีความสำคัญ
สำหรับการจัดอันดับคำหลักที่สกัดจากหน้าเว็บหรือการบรรยาย
สไลด์ ดังนั้นเราจึงกำหนดสูตรใหม่สำหรับ
การคำนวณคะแนน TFIDF ที่แสดงโดยสมการ (1):

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

สารสกัดจากข้อมูลระดับกลุ่มแรกที่เราจัดทุกASR และ OCR คำ เซ็กเมนต์ที่เหมาะสมวีดีโอตามการเวลา แล้วเราก็แยกจากคำนามรายงานโดยการใช้ส่วนของคำพูด Tagger สแตนฟอร์ด[ 25 ] และต่อมาได้ใช้วิธีกั้นจับคำนามกับรูปแบบตัวแปร เอาตัวสะกดความผิดพลาดที่เกิดจากเครื่องยนต์ OCR ที่เราดำเนินการพจนานุกรมกระบวนการกรองตามเราคำนวณปัจจัยถ่วงแต่ละที่เหลือคำหลักโดยขยาย tfidf คะแนนมาตรฐาน [ 26 ] ในทั่วไป tfidf ขั้นตอนวิธีคำนวณคำหลักเท่านั้นตามสถิติ การแจกแจงความถี่ มันไม่สามารถเป็นตัวแทนของสถานที่ข้อมูลคำหลักที่อาจจะสำคัญการจัดอันดับสำหรับคำหลักที่สกัดจากหน้าเว็บ หรือบรรยายสไลด์ ดังนั้นเราจึงกำหนดสูตรใหม่สำหรับคำนวณคะแนน tfidf , ที่แสดงโดย ( 1 ) : อีคิว

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.