As a result, we have witnessed an increased interest in developing schemes that use frequently occurring itemsets
to aid in the development of accurate and efficient classification algorithms. To this end, two general approaches
have been developed. The first approach uses the frequently occurring itemsets to generate a set of rules, that are
then used to build rule-based classifiers [LHM98, LHP01]. The second approach first expands the dataset’s feature
space by using the frequently occurring itemsets, and then uses traditional algorithms to build classification models in
that expanded feature space [LZO99, ZLM00]. Despite the differences of these approaches, the common theme that
underlies them is that they used the frequently occurring itemsets to generate a set of composite features. The idea of using composite features to expand the feature space is not new and has been extensively studied by the machine
learning community [S.78, Zij96]. Most of these schemes use a greedy approach to find the composite features;
hence, they do not search the entire space of all possible attribute value conjuncts. However, frequent itemset-based
approaches have the advantage of exhaustively generating all possible composite features, before selecting which ones
to use for classification. Experimental results presented in [LHM98, LHP01, ZLM00, LZO99] illustrate that the use
of frequently occurring itemsets can lead to measurable improvements in classification accuracy.
ดังนั้น เราได้เห็นความสนใจเพิ่มขึ้นในการพัฒนาโครงร่างที่ใช้บ่อยเกิดขึ้น itemsetsเพื่อช่วยในการพัฒนาอัลกอริทึมการจัดประเภทที่ถูกต้อง และมีประสิทธิภาพ เพื่อการนี้ สองวิธีทั่วไปได้รับการพัฒนา วิธีแรกใช้ itemsets เกิดขึ้นบ่อย ๆ เพื่อสร้างชุดของกฎ ที่แล้ว ใช้ในการสร้างกฎโดยใช้คำนามภาษา [LHM98, LHP01] วิธีที่สองก่อนขยายคุณลักษณะของชุดข้อมูลพื้นที่ โดยใช้ itemsets ที่เกิดขึ้นบ่อย ๆ แล้วใช้อัลกอริทึมแบบดั้งเดิมเพื่อสร้างรูปแบบการจัดประเภทที่ขยายพื้นที่คุณลักษณะ [LZO99, ZLM00] แม้ มีความแตกต่างของแนวทางเหล่านี้ ชุดรูปแบบทั่วไปที่underlies พวกเขาเป็นที่พวกเขาใช้ itemsets เกิดขึ้นบ่อย ๆ เพื่อสร้างชุดของคอมโพสิต ความคิดของการใช้คุณลักษณะของคอมโพสิตเพื่อขยายพื้นที่คุณลักษณะไม่ใหม่ และได้รับการศึกษาอย่างกว้างขวาง โดยเครื่องจักรเรียนรู้ชุมชน [S.78, Zij96] แผนงานเหล่านี้ส่วนใหญ่ใช้วิธีตะกละหาคุณลักษณะผสมดังนั้น พวกเขาไม่สามารถค้นหาพื้นที่ทั้งหมดของ conjuncts ค่าแอททริบิวต์ที่เป็นไปได้ทั้งหมด อย่างไรก็ตาม บ่อยตาม itemsetวิธีมีข้อดีของการสร้างคุณลักษณะได้โดยรวมทั้งหมด ลมก่อนที่จะเลือกคนใดการใช้การจัด แสดงผลการทดลองแสดงใน [LHM98, LHP01, ZLM00, LZO99] ที่ใช้ของบ่อย itemsets เกิดขึ้นสามารถนำไปปรับปรุงวัดในประเภทแม่นยำ
การแปล กรุณารอสักครู่..

เป็นผลให้เราได้เห็นการเพิ่มความสนใจในการพัฒนารูปแบบการใช้ที่เกิดขึ้นบ่อย itemsets
เพื่อช่วยในการพัฒนาอัลกอริทึมการจัดหมวดหมู่ที่ถูกต้องและมีประสิทธิภาพ
ด้วยเหตุนี้ทั้งสองวิธีทั่วไปได้รับการพัฒนา วิธีแรกใช้ itemsets
เกิดขึ้นบ่อยในการสร้างชุดของกฎที่จะนำมาใช้ในการสร้างจําแนกตามกฎ[LHM98, LHP01] แนวทางที่สองครั้งแรกที่ขยายคุณลักษณะชุดของพื้นที่โดยใช้ itemsets เกิดขึ้นบ่อยและจากนั้นใช้ขั้นตอนวิธีแบบดั้งเดิมในการสร้างรูปแบบการจัดหมวดหมู่ในพื้นที่คุณลักษณะขยาย[LZO99, ZLM00] อย่างไรก็ตามความแตกต่างของวิธีการเหล่านี้ในรูปแบบทั่วไปที่รองรับพวกเขาที่พวกเขาใช้ itemsets เกิดขึ้นบ่อยในการสร้างชุดของคุณลักษณะคอมโพสิต ความคิดของการใช้คุณสมบัติคอมโพสิตจะขยายพื้นที่คุณลักษณะที่ไม่ได้ใหม่และได้รับการศึกษาอย่างกว้างขวางโดยเครื่องชุมชนการเรียนรู้ [S.78, Zij96] ส่วนใหญ่ของรูปแบบเหล่านี้ใช้วิธีการโลภที่จะพบคุณสมบัติคอมโพสิต; ด้วยเหตุนี้พวกเขาไม่ได้ค้นหาพื้นที่ทั้งหมดของ conjuncts ค่าแอตทริบิวต์เป็นไปได้ทั้งหมด แต่บ่อย itemset ตามวิธีการที่ได้ประโยชน์จากการสร้างคุณสมบัติอย่างละเอียดถี่ถ้วนคอมโพสิตเป็นไปได้ทั้งหมดก่อนที่จะเลือกคนที่จะใช้สำหรับการจัดหมวดหมู่ ผลการทดลองที่นำเสนอใน [LHM98, LHP01, ZLM00, LZO99] แสดงให้เห็นว่าการใช้ของที่เกิดขึ้นบ่อยitemsets สามารถนำไปสู่การปรับปรุงที่วัดในความถูกต้องการจัดหมวดหมู่
การแปล กรุณารอสักครู่..

เป็นผลให้เราได้เห็นดอกเบี้ยที่เพิ่มขึ้นในการพัฒนารูปแบบที่ใช้บ่อยขึ้น itemsets
เพื่อช่วยเหลือในการพัฒนาที่ถูกต้องและมีประสิทธิภาพขั้นตอนวิธีการจำแนก จบเรื่องนี้ สองวิธีการทั่วไป
ได้รับการพัฒนา วิธีแรกใช้ที่เกิดขึ้นบ่อย itemsets เพื่อสร้างชุดของกฎที่ใช้ในการสร้างกฎ
แล้ว [ lhm98 คำ ,lhp01 ] วิธีที่สอง ก่อนขยายเป็นชุดข้อมูลคุณลักษณะ
พื้นที่โดยใช้เกิดขึ้นบ่อย itemsets แล้วดั้งเดิมที่ใช้ขั้นตอนวิธีการสร้างหมวดหมู่ในรูปแบบ
ที่ขยายคุณลักษณะพื้นที่ lzo99 zlm00 [ , ] แม้จะมีความแตกต่างของวิธีการเหล่านี้ ชุดรูปแบบทั่วไปที่
แผ่นอยู่นั้นคือการที่พวกเขาใช้ที่เกิดขึ้นบ่อย itemsets เพื่อสร้างชุดคุณลักษณะของคอมโพสิต ความคิดของการใช้คอมโพสิตมีการขยายคุณลักษณะพื้นที่จะไม่ใหม่และได้รับการศึกษาอย่างกว้างขวางโดยเครื่องการเรียนรู้ชุมชน [ s.78 zij96
, ] ส่วนใหญ่ของแผนเหล่านี้ใช้วิธีโลภที่จะหาคุณสมบัติประกอบ ;
ดังนั้นพวกเขาไม่ได้ค้นหาพื้นที่ทั้งหมดเป็นไปได้ค่าแอตทริบิวต์ conjuncts . อย่างไรก็ตาม itemset บ่อยขึ้น
วิธีมีข้อดีของการประกอบอย่างละเอียดคุณสมบัติทั้งหมดที่เป็นไปได้ ก่อนที่จะเลือกอันไหน
ใช้สำหรับการจำแนก ผลการทดลองแสดงใน [ lhm98 lhp01 zlm00 , , ,
lzo99 ] แสดงให้เห็นว่าใช้ของที่เกิดขึ้นบ่อย itemsets สามารถนำไปสู่การปรับปรุงสามารถในการจำแนกความ
การแปล กรุณารอสักครู่..
