ontology as background knowledge can improve document clustering quali การแปล - ontology as background knowledge can improve document clustering quali ไทย วิธีการพูด

ontology as background knowledge ca

ontology as background knowledge can improve document clustering quality with its concept hierarchy knowledge. Previous studies take term semantic similarity as an important measure to incorporate domain knowledge into clustering process such as clustering initialization and term re-weighting. However, not many studies have been focused on how different types of term similarity measures affect the clustering performance for a certain domain. In this article, we conduct a comparative study on how different term semantic similarity measures including path-based, information-content-based and feature-based similarity measure affect document clustering. Term re-weighting of document vector is an important method to integrate domain ontology to clustering process. In detail, the weight of a term is augmented by the weights of its co-occurred concepts. Spherical k-means are used for evaluate document vector re-weighting on two real-world datasets: Disease10 and OHSUMED23. Experimental results on nine different semantic measures have shown that: (1) there is no certain type of similarity measures that significantly outperforms the others; (2) Several similarity measures have rather more stable performance than the others; (3) term re-weighting has positive effects on medical document clustering, but might not be significant when documents are short of terms.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
ภววิทยาเป็นความรู้ความสามารถปรับปรุงเอกสารคุณภาพความลำดับชั้นแนวคิดคลัสเตอร์ การศึกษาก่อนหน้านี้ใช้ระยะความคล้ายคลึงกันทางตรรกเป็นมาตรการสำคัญเพื่อรวมความรู้โดเมนลงในคลัสเตอร์กระบวนเช่นคลัสเตอร์เริ่มต้นและระยะน้ำหนักอีกครั้ง อย่างไรก็ตาม ศึกษาจำนวนมากไม่ได้ถูกเน้นวิธีประเภทของมาตรการคล้ายผล clustering สำหรับโดเมนบางระยะ ในบทความนี้ เราทำการศึกษาเปรียบเทียบระยะทางตรรกมาตรการความคล้ายคลึงกันรวมทั้งใช้เส้นทาง วัดความคล้ายคลึงกัน ตามคุณลักษณะ และข้อมูลเนื้อหาตามส่งผลกระทบต่อเอกสารคลัสเตอร์แตกต่าง ระยะอีกครั้งน้ำหนักของเวกเตอร์เอกสารเป็นวิธีการสำคัญการรวมโดเมนภววิทยา clustering กระบวนการ รายละเอียด น้ำหนักของคำที่ถูกขยาย โดยน้ำหนักของแนวคิดเกิดขึ้นร่วม ถึงทรงกลมใช้สำหรับกประเมินเอกสารเวกเตอร์ใหม่น้ำหนักบน datasets สองจริง: Disease10 และ OHSUMED23 ผลการทดลองเกี่ยวกับมาตรการทางตรรกเก้าแตกต่างกันได้แสดงที่: (1) นั่นคือ ไม่บางชนิดวัดความคล้ายคลึงกันที่อย่างมีประสิทธิภาพสูงกว่าผู้อื่น (2) มาตรการความคล้ายคลึงมากกว่ามีเสถียรภาพประสิทธิภาพมากกว่าคนอื่น ๆ (3) ระยะใหม่น้ำหนักมีผลในเชิงบวกในคลัสเตอร์การแพทย์เอกสาร แต่อาจไม่มีนัยสำคัญเมื่อมีเอกสารขาดเงื่อนไข
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
อภิปรัชญาเป็นความรู้พื้นฐานสามารถปรับปรุงคุณภาพการจัดกลุ่มเอกสารที่มีความรู้แนวคิดลำดับชั้นของ การศึกษาก่อนหน้าใช้คำความหมายคล้ายคลึงกันเป็นมาตรการสำคัญที่จะรวมความรู้ในกระบวนการจัดกลุ่มเช่นการเริ่มต้นการจัดกลุ่มและระยะเวลาอีกครั้งน้ำหนัก อย่างไรก็ตามการศึกษาไม่มากได้รับการมุ่งเน้นไปที่วิธีการที่แตกต่างกันประเภทของมาตรการระยะคล้ายคลึงกันมีผลต่อประสิทธิภาพการจัดกลุ่มสำหรับโดเมนบางอย่าง ในบทความนี้เราดำเนินการศึกษาเปรียบเทียบความคล้ายคลึงกันเกี่ยวกับมาตรการระยะวิธีที่แตกต่างกันความหมายรวมถึงเส้นทางตามข้อมูลตามเนื้อหาและคุณลักษณะตามมาตรการที่คล้ายคลึงกันส่งผลกระทบต่อการจัดกลุ่มเอกสาร ระยะอีกครั้งน้ำหนักของเวกเตอร์เอกสารเป็นวิธีการที่สำคัญที่จะบูรณาอภิปรัชญาโดเมนกับกระบวนการการจัดกลุ่ม ในรายละเอียดน้ำหนักของคำที่มีการเติมโดยน้ำหนักของแนวคิดร่วมที่เกิดขึ้นของมัน ทรงกลม K-วิธีการที่ใช้สำหรับการประเมินเอกสารเวกเตอร์ใหม่น้ำหนักสองชุดข้อมูลที่แท้จริงของโลก: Disease10 และ OHSUMED23 ผลการทดลองเก้ามาตรการความหมายที่แตกต่างกันได้แสดงให้เห็นว่า (1) ไม่มีการบางประเภทของมาตรการความคล้ายคลึงกันอย่างมีนัยสำคัญที่มีประสิทธิภาพดีกว่าคนอื่น ๆ ; (2) มาตรการความคล้ายคลึงกันหลายมีประสิทธิภาพการทำงานที่ค่อนข้างมีเสถียรภาพมากขึ้นกว่าคนอื่น ๆ ; (3) ระยะอีกถ่วงมีผลในเชิงบวกต่อการจัดกลุ่มเอกสารทางการแพทย์ แต่อาจจะไม่ได้อย่างมีนัยสำคัญเมื่อเอกสารที่มีระยะสั้นของข้อตกลง
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
อภิปรัชญาความรู้พื้นหลังสามารถปรับปรุงการจัดกลุ่มเอกสารคุณภาพด้วยแนวคิดลำดับชั้นของความรู้ การศึกษาก่อนหน้านี้ใช้คำความหมายความเหมือนเป็นมาตรการสำคัญที่จะรวมข้อมูลความรู้ในกระบวนการผลิต เช่น การจัดกลุ่ม และอยู่ในระยะเริ่มต้น น้ำหนัก . อย่างไรก็ตาม หลายการศึกษาได้มุ่งเน้นไปที่วิธีการที่แตกต่างกันประเภทของมาตรการระยะยาวมีผลต่อการจัดกลุ่มสมรรถนะความเหมือนโดเมนหนึ่ง ในบทความนี้ เราได้ทำการเปรียบเทียบวิธีการต่าง ๆ รวมทั้งใช้มาตรการระยะยาวความหมายความเหมือนทางข้อมูลและเนื้อหาจากความเหมือนในสารวัดมีผลต่อการจัดกลุ่มเอกสาร . ระยะ Re weighting ของเวกเตอร์เอกสารเป็นวิธีการสำคัญที่จะรวมโดเมนอภิปรัชญาเพื่อการจัดกลุ่มกระบวนการ รายละเอียด น้ำหนักของระยะเติมโดยน้ำหนักของ co เกิดแนวคิด k-means ทรงกลมใช้สำหรับประเมินเวกเตอร์เอกสารอีกครั้งดัชนีสองจริงและข้อมูล : disease10 ohsumed23 . ทดลองกับเก้าที่แตกต่างกันแต่ละมาตรการได้แสดงให้เห็นว่า ( 1 ) ไม่มีมาตรการบางประเภทของความคล้ายคลึงกันอย่างมีนัยสำคัญมีประสิทธิภาพดีกว่าคนอื่น ๆ ; ( 2 ) มาตรการความคล้ายคลึงหลายค่อนข้างมีเสถียรภาพมากขึ้นมีประสิทธิภาพกว่าคนอื่น ๆ ; ( 3 ) อยู่ในระยะน้ำหนักมีผลในเชิงบวกในการจัดกลุ่มเอกสารทางการแพทย์ แต่อาจจะไม่สําคัญ เมื่อเอกสาร สั้นของเงื่อนไข
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: