บทคัดย่อ
งานวิจัยนี้เสนอการหากฎความสัมพันธ์ของลักษณะการเลือกซื้อหนังสือของแต่ละบุคคลด้วย Decision Tree โดยนำมาใช้กับชุดข้อมูลจากฐานข้อมูล UCI ที่มีความแตกต่างกันอย่างชัดเจน ข้อมูลเพศ ข้อมูลอายุ ข้อมูลประเภทของกีฬา โดยการวิจัยนี้ใช้การจำแนกข้อมูลด้วย Descision Treeในการหาข้อมูลจริง
ผลที่ได้จากการวิจัยพบว่า ข้อมูลชนิดไม่ต่อเนื่องสมบูรณ์ (Complete Discrete Data) ถูกแทนค่าสูญหายได้ดีด้วยต้นไม้ตัดสินใจ (Decision Tree) แต่เทคนิคนี้จะคลาดเคลื่อนน้อยก็ต่อเมื่อมีกฎจำนวนมากในการแทนค่าสูญหาย และข้อมูลชนิดตัวเลขต่อเนื่อง (Continuous Data) ถูกแทนค่าสูญหายได้ดีด้วย KNN และสำหรับข้อมูลชนิดไม่ต่อเนื่องและมีความเป็นลำดับแฝง (Ordinal Scale) ถูกแทนค่าสูญหายได้ดีด้วย Naïve Bayes
คำสำคัญ: การจำแนก การแทนค่าสูญหาย เหมืองข้อมูล ความคลาดเคลื่อน