คือเลือก K clustering ข้อมูลตั้งค่าชุดข้อมูลแบบสุ่ม โดยคำนวณระยะทางแบบยุคลิดระหว่าง K เริ่มต้นศูนย์ระบบคลัสเตอร์คำนวณค่าเฉลี่ยของตัวอย่างของแต่ละ K คลัสเตอร์ จนกว่าจะมีการเปลี่ยนแปลงระบบคลัสเตอร์ศูนย์
คือการเลือกการจัดกลุ่ม K ของชุดข้อมูลชุดข้อมูลแบบสุ่ม โดยคำนวณหาระยะทางแบบยุคลิดระหว่างการจัดกลุ่ม K เริ่มต้นที่ศูนย์คำนวณค่าเฉลี่ยของกลุ่มตัวอย่างของแต่ละกลุ่ม K จน clustering ศูนย์ไม่ได้เปลี่ยน