The similarity between two data objects X and Y is the sum of per attribute similarity for all the attributes. It is computed as
sim(X, Y ) = d ∑_j=1 s(xj, yj ),
where s(xj, yj) is the similarity for the j th attribute defined as
s(xj, yj ) = {1 if |xj − yj| ≤ δj ,0 otherwise},
where δj is the similarity threshold for the j th attribute. For categorical attributes δj = 0 and for numeric attributes δj ≥ 0.We use a subspace-based incremental clustering technique.
ความคล้ายกันระหว่างสองออบเจ็กต์ข้อมูล X และ Y เป็นผลรวมของต่อคล้ายแอตทริบิวต์สำหรับคุณลักษณะทั้งหมด มีคำนวณเป็นซิม (X, Y) = d ∑_j = 1 s (xj, yj),โดยที่ s (xj, yj) คือ ความคล้ายคลึงกันสำหรับแอตทริบิวต์ th เจกำหนดเป็นs (xj, yj) = {ถ้า 1 |xj δj ≤− yj| อื่น ๆ 0 },ที่ δj เป็นขีดจำกัดความคล้ายคลึงกันสำหรับแอตทริบิวต์ th เจ สำหรับการ δj แอตทริบิวต์แตก = 0 สำหรับแอตทริบิวต์เลข δj ≥ 0. เราใช้ subspace โดยเพิ่มระบบคลัสเตอร์เทคนิค
การแปล กรุณารอสักครู่..
