We present a novel formulation for overlapping clustering. In a nutshell, to each data point is assigned a set of labels representing membership to different (overlapping) clusters. Defining a similarity function H(`(u),`(v)) between cluster labels,allowustodefineourobjectivefunctionoverthe“residual error” |H(`(u),`(v))−s(u,v)|, where s(u,v) is the input similarity function between pairs of data points. In this paper we consider summing the error terms|H(`(u),`(v))−s(u,v)| over all pairs of data points. An interesting future direction is to apply our idea to other clustering paradigms, different than correlation clustering. For example, one can consider only the errortermsamongdatapointsand k “prototypical”datapoints. With respect to the concrete optimization problems defined in this paper, it would be interesting to investigate different approaches, for example, using non local-search algorithms such as the idea based on relaxed graph-coloring, mentioned in Section III. Other interesting directions are to apply graph coloring solutions for the initialization step, as discussed in Section IV-D, and to design an approximation algorithm for the JACCARD-TRIANGULATION problem. Finally, it will be very interesting to apply the approach to different application domains.
เรานำเสนอการกำหนดนวนิยายสำหรับคลัสเตอร์ที่ทับซ้อน สั้น ข้อมูลแต่ละ จุดมีกำหนดชุดของป้ายชื่อที่เป็นตัวแทนสมาชิกกลุ่มต่าง ๆ (ซ้อนทับ) Defining ฟังก์ชันคล้าย H('(u),'(v)) ระหว่างป้ายชื่อคลัสเตอร์ allowustodefineourobjectivefunctionoverthe "ข้อผิดพลาดที่เหลือ" | H('(u),'(v))−s(u,v) กรุนด์ฟอส ฟังก์ชันสำหรับการป้อนค่าความคล้ายคลึงระหว่างคู่ของจุดข้อมูล s(u,v) ในกระดาษนี้ เราพิจารณาข้อสรุปเงื่อนไขข้อผิดพลาดกรุนด์ฟอส H('(u),'(v))−s(u,v) | กว่าคู่ทั้งหมดของจุดข้อมูล ทิศทางในอนาคตที่น่าสนใจคือการ ใช้ความคิดของเรากับกรอบอื่น ๆ การ clustering แตกต่างความสัมพันธ์คลัสเตอร์ ตัวอย่างเช่น หนึ่งสามารถพิจารณาเฉพาะการ errortermsamongdatapointsand k "สาขา" ซ้อน เกี่ยวกับตกลงปัญหาคอนกรีตปรับในเอกสารนี้ มันจะน่าสนใจเพื่อตรวจสอบแนวทาง เช่น โดยใช้อัลกอริทึมค้นหาท้องถิ่นไม่ใช่เป็นความคิดที่อิงผ่อนคลายระบายสีกราฟ กล่าวถึงในส่วน III เส้นทางที่น่าสนใจอื่น ๆ มี การใช้โซลูชั่นสำหรับขั้นตอนการเริ่มต้น การระบายสีกราฟตามที่กล่าวไว้ในส่วน IV-D และ การออกแบบขั้นตอนประมาณสำหรับปัญหา JACCARD ระบบสามสกุล ในที่สุด มันจะน่าสนใจมากจะใช้วิธีการโดเมนโปรแกรมประยุกต์อื่น
การแปล กรุณารอสักครู่..
