Text mining refers to the activity of identifying useful information f การแปล - Text mining refers to the activity of identifying useful information f ไทย วิธีการพูด

Text mining refers to the activity

Text mining refers to the activity of identifying useful information from natural language text. This is one of the criteria practiced in automated text categorization. Machine learning (ML) based methods are the popular solution for this problem. However, the developed models typically provide low expressivity and lacking in human-understandable representation. In spite of being highly efficient, the ML based methods are established in train–test setting, and when the existing model is found insufficient, the whole processes need to be reinvented which implies train–test–retrain and is typically time consuming. Furthermore, retraining the model is not usually practical and feasible option whenever there is continuous change. This paper introduces the evolving fuzzy grammar (EFG) method for crime texts categorization. In this method, the learning model is built based on a set of selected text fragments which are then transformed into their underlying structure called fuzzy grammars. The fuzzy notion is used because the grammar matching, parsing and derivation involve uncertainty. Fuzzy union operator is also used to combine and transform individual text fragment grammars into more general representations of the learned text fragments. The set of learned fuzzy grammars is influenced by the evolution in the seen pattern; the learned model is slightly changed (incrementally) as adaptation, which does not require the conventional redevelopment. The performance of EFG in crime texts categorization is evaluated against expert-tagged real incidents summaries and compared against C4.5, support vector machines, naïve Bayes, boosting, and k-nearest neighbour methods. Results show that the EFG algorithm produces results that are close in performance with the other ML methods while being highly interpretable, easily integrated into a more comprehensive grammar system and with lower model retraining adaptability time.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
การทำเหมืองข้อความหมายถึงการระบุข้อมูลที่เป็นประโยชน์จากข้อความภาษาธรรมชาติ นี้เป็นเกณฑ์การปฏิบัติในการจัดประเภทข้อความอัตโนมัติอย่างใดอย่างหนึ่ง วิธีการเรียนรู้ (ML) ใช้เครื่องเป็นโซลูชันยอดนิยมสำหรับปัญหานี้ อย่างไรก็ตาม แบบจำลองพัฒนาปกติให้กังวานต่ำและขาดตัวแทนมนุษย์เข้าใจ ทั้ง ๆ มีประสิทธิภาพสูง สร้างวิธี ML ใช้ในรถไฟ – ทดสอบ และ เมื่อพบรูปแบบที่มีอยู่ไม่เพียงพอ กระบวนการทั้งหมดที่จำเป็นต้องมีดิษฐ์ซึ่งหมายถึงรถไฟ – ทดสอบ – retrain และโดยทั่วไปใช้เวลานาน นอกจากนี้ ฝีกแบบมักจะไม่เลือกปฏิบัติ และกระทำเมื่อใดก็ ตามที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง เอกสารนี้แนะนำวิธีการเลือนไวยากรณ์ (EFG) พัฒนาสำหรับอาชญากรรมประเภทข้อความ ในวิธีนี้ แบบเรียนอยู่ตามบนชุดของชิ้นส่วนข้อความที่เลือกที่แปลงแล้วลงในโครงสร้างพื้นฐานเรียกว่า grammars พร่าเลือน ใช้ความคิดเลือน เพราะไวยากรณ์ที่ตรงกัน ความไม่แน่นอนที่เกี่ยวข้องกับแยกและที่มา ยังมีใช้ตัวดำเนินการ union เลือนการรวม และแปลงข้อความแต่ละส่วนของ grammars แทนบางส่วนของข้อความรู้ทั่วไป ชุดของ grammars เลือนรู้ได้รับอิทธิพลจากวิวัฒนาการในรูปแบบที่เห็น แบบเรียนรู้จะเปลี่ยนแปลงเล็กน้อย (แบบเพิ่มหน่วย) เป็นการปรับตัว ซึ่งไม่จำเป็นต้องใหม่ทั่วไป ประสิทธิภาพของ EFG ในการจัดประเภทข้อความอาชญากรรมถูกประเมินกับผู้เชี่ยวชาญแท็กเหตุการณ์จริงสรุป และเมื่อเทียบกับ C4.5 สนับสนุนเครื่องเวกเตอร์ หน่อมแน้ม Bayes เพิ่ม และ k ใกล้วิธีคน แสดงผลว่า อัลกอริทึม EFG สร้างผลลัพธ์ที่มีประสิทธิภาพด้วยวิธี ML อื่น ๆ ขณะที่ interpretable สูง รวมเป็นระบบไวยากรณ์ที่ครอบคลุมมากขึ้น และรุ่นล่างราคาเวลาปรับตัว
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
การทำเหมืองข้อความหมายถึงกิจกรรมในการระบุข้อมูลที่เป็นประโยชน์จากข้อความภาษาธรรมชาติ นี้เป็นหนึ่งในเกณฑ์ปฏิบัติในการจัดหมวดหมู่ข้อความอัตโนมัติ การเรียนรู้เครื่อง (ML) วิธีการตามที่มีการแก้ปัญหาที่เป็นที่นิยมสำหรับปัญหานี้ อย่างไรก็ตามรูปแบบการพัฒนามักจะให้ expressivity ต่ำและขาดในการเป็นตัวแทนของมนุษย์ที่เข้าใจ แม้จะมีประสิทธิภาพสูงวิธี ML ตามที่จัดตั้งขึ้นในการตั้งค่ารถไฟทดสอบและเมื่อรูปแบบที่มีอยู่พบว่าไม่เพียงพอกระบวนการทั้งหมดจะต้องมีนวัตกรรมใหม่ซึ่งหมายถึงรถไฟทดสอบรีเทรนและโดยปกติจะใช้เวลานาน นอกจากนี้การฝึกอบรมแบบไม่ปกติในทางปฏิบัติและเลือกที่เป็นไปเมื่อใดก็ตามที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง บทความนี้นำเสนอการพัฒนาไวยากรณ์เลือน (EFG) วิธีการในการก่ออาชญากรรมตำราการจัดหมวดหมู่ ในวิธีการนี​​้รูปแบบการเรียนรู้ที่สร้างขึ้นบนพื้นฐานของชุดของชิ้นส่วนข้อความที่เลือกที่ถูกเปลี่ยนแล้วเป็นโครงสร้างพื้นฐานของพวกเขาเรียกว่าไวยากรณ์เลือน ความคิดเลือนถูกนำมาใช้เพราะการจับคู่ไวยากรณ์การแยกและการที่มาเกี่ยวข้องกับความไม่แน่นอน ผู้ประกอบการสหภาพเลือนนอกจากนี้ยังใช้ในการรวมและเปลี่ยนชิ้นส่วนแต่ละไวยากรณ์ข้อความลงในการแสดงทั่วไปมากขึ้นของเศษข้อความได้เรียนรู้ ชุดเรียนรู้ไวยากรณ์เลือนได้รับอิทธิพลจากทฤษฎีวิวัฒนาการในรูปแบบที่เห็นนั้น รูปแบบการเรียนรู้ที่มีการเปลี่ยนแปลงเล็กน้อย (เพิ่มขึ้น) ขณะที่การปรับตัวซึ่งไม่จำเป็นต้องป็นธรรมดา ประสิทธิภาพการทำงานของ EFG อาชญากรรมตำราการจัดหมวดหมู่ได้รับการประเมินกับผู้เชี่ยวชาญด้านการติดแท็กเหตุการณ์ที่เกิดขึ้นจริงและสรุปเมื่อเทียบกับ C4.5 สนับสนุนเครื่องเวกเตอร์ไร้เดียงสา Bayes, การส่งเสริมและ K-ที่ใกล้ที่สุดวิธีเพื่อนบ้าน ผลปรากฏว่าอัลกอริทึม EFG ก่อให้เกิดผลลัพธ์ที่มีความใกล้ชิดในการทำงานด้วยวิธีการอื่น ๆ ML ในขณะที่ถูก interpretable สูงแบบบูรณาการได้อย่างง่ายดายในระบบไวยากรณ์ที่ครอบคลุมมากขึ้นและมีรูปแบบการฝึกอบรมระยะเวลาในการปรับตัวลดลง
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
การทำเหมืองข้อมูลหมายถึงกิจกรรมในการระบุข้อมูลที่เป็นประโยชน์จากข้อความภาษาธรรมชาติ นี้เป็นหนึ่งในเกณฑ์การฝึกโดยอัตโนมัติข้อความ การเรียนรู้ของเครื่อง ( ml ) ใช้วิธีการแก้ปัญหาที่เป็นที่นิยมสำหรับปัญหานี้ อย่างไรก็ตาม การพัฒนาแบบจำลองโดยทั่วไปให้ expressivity ต่ำและขาดการเข้าใจมนุษย์ ทั้งๆ ที่ประสิทธิภาพสูง ใช้วิธี ML ก่อตั้งขึ้นในรถไฟและทดสอบการตั้งค่า และเมื่อพบว่าแบบจำลองที่มีอยู่ไม่เพียงพอ กระบวนการทั้งหมดต้องเรียนรู้ซึ่งหมายถึงรถไฟ–ทดสอบ–ภาพรวมและโดยทั่วไปจะใช้เวลานาน นอกจากนี้ การนำรูปแบบนี้มักจะไม่ได้ในทางปฏิบัติและเป็นไปได้ตัวเลือกเมื่อใดก็ตามที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง กระดาษนี้จะแนะนำการพัฒนาไวยากรณ์แบบฟัซซี่ ( EFG ) วิธีการข้อความอาชญากรรมจัดแยกหมวดหมู่ ในวิธีการนี้ รูปแบบการเรียนรู้ที่ถูกสร้างขึ้นจากชุดของข้อความที่เลือกชิ้นส่วนที่เปลี่ยนแล้วของโครงสร้างพื้นฐานที่เรียกว่าไวยากรณ์แบบฟัซซี่ ความคิดแบบใช้ เพราะไวยากรณ์และรากศัพท์ที่ตรงกัน การเกี่ยวข้องกับความไม่แน่นอน พนักงานสหภาพเลือน นอกจากนี้ยังใช้ในการรวมข้อความและแปลงแต่ละส่วนไวยากรณ์เป็นทั่วไปมากขึ้นเป็นตัวแทนของเรียนรู้ข้อความเศษ ชุดเรียนรู้ไวยากรณ์ฟัซซี่คือ อิทธิพลจากวิวัฒนาการในเห็นแบบแผน ; เรียนรู้รูปแบบค่อนข้างเปลี่ยนไป ( แบบเพิ่มหน่วย ) ปรับตัวซึ่งไม่ต้องพัฒนาขื้นใหม่ตามปกติ ประสิทธิภาพของ EFG ในข้อความอาชญากรรมวิภัตติคือการประเมินจากผู้เชี่ยวชาญแท็กจริงเหตุการณ์และสรุปเมื่อเทียบกับโปรแกรม C4.5 เครื่องเวกเตอร์สนับสนุนนาไตได้ Bayes , ส่งเสริม , และเพื่อนบ้านละวิธี ผลการทดลองแสดงให้เห็นว่าวิธีการที่ใกล้ EFG สร้างผลลัพธ์ในการปฏิบัติ ด้วยวิธีการอื่น ๆในขณะที่การขอ interpretable มล. สามารถบูรณาการเข้าไปในระบบไวยากรณ์และรูปแบบครอบคลุมมากขึ้นกว่าการนำเวลาพร้อม
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: