Clustering algorithms
There are numerous algorithms available for doing clustering. Theymay be categorized in various ways such as: hierarchical
(e.g. [46,59]) or partitional (e.g. [14,43]), deterministic or probabilistic (e.g. [9]), hard or fuzzy (e.g. [8,21]). Typically, these clustering
algorithms while providing summary statistics on the generated set of clusters (e.g. mean of each variable, distance between
clusters), do not provide easily interpretable detailed descriptions of the set of clusters that are generated. Further, for a
given dataset, different algorithms may give different sets of clusters, so it is never clear which algorithm and which parameter
settings (e.g. number of clusters) is the most appropriate. For as noted by Jain et al. [37]: ‘‘There is no clustering technique that is
universally applicable in uncovering the variety of structures present in multidimensional data sets”. They thus raised the questions:
‘‘How is the output of a clustering algorithm evaluated? What characterizes a ‘good’ clustering result and a ‘poor’ one?”
Ankerst et al. [2] also commented that ‘‘Most of the recent research related to the task of clustering has been directed towards
efficiency. The more serious problem, however, is effectivity, i.e. the quality or usefulness of the result”.
อัลกอริทึมคลัสเตอร์
มีอัลกอริทึมต่าง ๆ สำหรับการทำคลัสเตอร์ Theymay ถูกจัดประเภทในรูปแบบต่าง ๆ เช่น: ลำดับ
(เช่น [46,59]) หรือ partitional (เช่น [14,43]), deterministic หรือ probabilistic (เช่น [9]), ฮาร์ดดิสก์ หรือเอิบ (เช่น [8,21]) ปกติ นี้คลัสเตอร์
อัลกอริทึมให้สรุปสถิติชุดสร้างขึ้น (เช่นเฉลี่ยของแต่ละตัวแปร กลุ่ม ห่างจากที่พักระหว่าง
คลัสเตอร์), ไม่มีคำอธิบายรายละเอียดได้ interpretable ชุดของคลัสเตอร์ที่สร้างขึ้น เพิ่มเติม สำหรับการ
รับชุดข้อมูล อัลกอริทึมต่าง ๆ อาจให้ค่าของคลัสเตอร์ ดังนั้นจึงไม่ชัดเจนซึ่งอัลกอริทึมและพารามิเตอร์ที่
การตั้งค่า (เช่นจำนวนของคลัสเตอร์) เหมาะสมสุดได้ สำหรับเสียงโดยเจน et al. [37]: มีเทคนิคไม่ระบบคลัสเตอร์ที่
หยุ่นในความหลากหลายของโครงสร้างอยู่ในชุดข้อมูลหลายมิติที่เปิดเจอทุ่นระเบิด " พวกเขาจึงยกคำถาม:
'' ว่าผลลัพธ์ของการประเมินขั้นตอนวิธีระบบคลัสเตอร์หรือไม่ ระบุว่าลักษณะผลลัพธ์ระบบคลัสเตอร์ 'ดี' และ 'ไม่ดี' หนึ่ง"
Ankerst et al [2] นอกจากนี้ยัง แสดงความคิดเห็นที่ '' ส่วนใหญ่เกี่ยวข้องกับงานของคลัสเตอร์การวิจัยล่าสุดได้รับคำแนะนำต่อ
ประสิทธิภาพ ปัญหารุนแรงมากขึ้น อย่างไรก็ตาม ได้ effectivity เช่นคุณภาพหรือประโยชน์ของผล"
การแปล กรุณารอสักครู่..
