In many text mining applications, side-information is available along  การแปล - In many text mining applications, side-information is available along  ไทย วิธีการพูด

In many text mining applications, s

In many text mining applications, side-information is available along with the text documents. Such side-information may be of different kinds, such as document provenance information, the links in the document, user-access behavior from web logs, or other non-textual attributes which are embedded into the text document. Such attributes may contain a tremendous amount of information for clustering purposes. However, the relative importance of this side-information may be difficult to estimate, especially when some of the information is noisy. In such cases, it can be risky to incorporate side-information into the mining process, because it can either improve the quality of the representation for the mining process, or can add noise to the process. Therefore, we need a principled way to perform the mining process, so as to maximize the advantages from using this side information. In this paper, we design an algorithm which combines classical partitioning algorithms with probabilistic models in order to create an effective clustering approach. We then show how to extend the approach to the classification problem. We present experimental results on a number of real data sets in order to illustrate the advantages of using such an approach.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
ในงานหลาย ๆ ในการทำเหมืองข้อความ ข้อมูลด้านนั้นพร้อมกับเอกสารข้อความ ข้อมูลด้านดังกล่าวอาจแตกต่างกัน เช่นข้อมูลเอกสาร provenance การเชื่อมโยงในเอกสาร พฤติกรรมการเข้าถึงผู้ใช้จากเว็บล็อก หรือคุณลักษณะอื่น ๆ ไม่เป็นข้อความที่ฝังตัวลงในเอกสารข้อความ คุณลักษณะดังกล่าวอาจประกอบด้วยจำนวนมหาศาลของข้อมูลสำหรับคลัสเตอร์เพื่อวัตถุประสงค์ อย่างไรก็ตาม อาจจะยากที่จะประเมินความสำคัญของข้อมูลด้านนี้ โดยเฉพาะอย่างยิ่งเมื่อบาง ข้อมูลที่เป็นเสียงดัง ในกรณี มันสามารถจะมีความเสี่ยงรวมด้านข้อมูลเป็นกระบวนการทำเหมืองแร่ เนื่องจากจะสามารถปรับปรุงคุณภาพของการแสดงสำหรับกระบวนการทำเหมืองแร่ หรือสามารถเพิ่มเสียงในกระบวนการ ดังนั้น เราต้อง principled วิธีการกระบวนการทำเหมืองแร่ เพื่อขยายประโยชน์จากการใช้ข้อมูลด้านนี้ ในเอกสารนี้ เราออกแบบขั้นตอนวิธีการรวมอัลกอริทึมแบ่งพาร์ติชันคลาสสิกกับรุ่น probabilistic เพื่อสร้างวิธีการระบบคลัสเตอร์ที่มีประสิทธิภาพ เราจากนั้นแสดงวิธีการขยายวิธีการจัดประเภทปัญหา เรานำเสนอผลการทดลองจำนวนชุดข้อมูลจริงเพื่อแสดงให้เห็นถึงประโยชน์ของการใช้วิธีการดังกล่าว
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
ในการใช้งานการทำเหมืองข้อความหลายด้านข้อมูลที่สามารถใช้ได้พร้อมกับเอกสารข้อความ เช่นด้านข้อมูลอาจจะเป็นชนิดที่แตกต่างกันเช่นข้อมูลที่มาเอกสารการเชื่อมโยงในเอกสารพฤติกรรมของผู้ใช้จากการเข้าถึงบันทึกการใช้เว็บหรือคุณลักษณะที่ไม่เกี่ยวกับใจอื่น ๆ ที่ฝังลงในเอกสารข้อความ คุณลักษณะดังกล่าวอาจจะมีจำนวนมากของข้อมูลเพื่อการจัดกลุ่ม แต่ความสำคัญของด้านนี้ข้อมูลอาจจะเป็นเรื่องยากที่จะประเมินโดยเฉพาะอย่างยิ่งเมื่อบางส่วนของข้อมูลที่มีเสียงดัง ในกรณีดังกล่าวก็สามารถจะมีความเสี่ยงที่จะรวมด้านข้อมูลเข้าสู่กระบวนการทำเหมืองเพราะมันสามารถปรับปรุงคุณภาพของการเป็นตัวแทนสำหรับกระบวนการทำเหมืองหรือสามารถเพิ่มเสียงในการประมวลผล ดังนั้นเราจึงต้องเป็นวิธีที่มีหลักการในการดำเนินการขั้นตอนการทำเหมืองแร่เพื่อเพิ่มข้อได้เปรียบจากการใช้ข้อมูลด้านนี้ ในบทความนี้เราออกแบบอัลกอริทึมที่รวมขั้นตอนวิธีการแบ่งคลาสสิกที่มีรูปแบบความน่าจะเป็นในการสร้างวิธีการจัดกลุ่มที่มีประสิทธิภาพ จากนั้นเราจะแสดงวิธีการขยายวิธีการที่จะแก้ไขปัญหาการจัดหมวดหมู่ เรานำเสนอผลการทดลองกับจำนวนของชุดข้อมูลที่แท้จริงเพื่อที่จะแสดงให้เห็นถึงข้อดีของการใช้วิธีการดังกล่าว
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
ในหลายเหมืองแร่ข้อความการใช้งานข้อมูลด้านใช้ได้พร้อมกับข้อความเอกสาร ข้อมูลด้านดังกล่าวอาจมีหลายชนิด เช่น ข้อมูลรวบรวมเอกสาร การเชื่อมโยงในเอกสาร พฤติกรรมการเข้าถึงของผู้ใช้จากการบันทึกการใช้เว็บหรืออื่นๆที่ไม่ใช่ข้อความ คุณลักษณะที่ฝังอยู่ในเอกสารข้อความคุณลักษณะดังกล่าวอาจประกอบด้วยจำนวนมหาศาลของข้อมูลสำหรับวัตถุประสงค์ อย่างไรก็ตาม ความสําคัญของสารสนเทศด้านนี้อาจจะยากที่จะประมาณการ โดยเฉพาะอย่างยิ่งเมื่อบางส่วนของข้อมูลที่มีเสียงดัง ในบางกรณี อาจมีความเสี่ยงที่จะรวมข้อมูลด้านในกระบวนการทำเหมืองเพราะมันสามารถปรับปรุงคุณภาพของการเป็นตัวแทนสำหรับกระบวนการทำเหมือง หรือสามารถเพิ่มเสียงเพื่อกระบวนการ ดังนั้นเราจึงต้องการวิธีที่มีหลักการเพื่อแสดงกระบวนการทำเหมือง เพื่อเพิ่มประโยชน์จากการใช้ด้านสารสนเทศ ในกระดาษนี้เราออกแบบขั้นตอนวิธีการซึ่งรวมกับรุ่นคลาสสิกอัลกอริทึม Probabilistic เพื่อสร้างประสิทธิภาพในการจัดกลุ่ม ) จากนั้นเราจะแสดงวิธีการที่จะขยายแนวทางการปัญหา เรานำเสนอผลการทดลองบนจํานวนจริงชุดข้อมูลเพื่อที่จะแสดงให้เห็นถึงประโยชน์ของการใช้วิธีการดังกล่าว .
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2026 I Love Translation. All reserved.

E-mail: