17.6 MINING ASSOCIATION RULES
In order to get some experience with association rules, we work with Apriori, the
algorithm described in Section 4.5 (page 144). As you will discover, it can be
challenging to extract useful information using this algorithm.
Association-Rule Mining
To get a feel for how to apply Apriori, start by mining rules from the weather.
nominal.arff data that was used in Section 17.1. Note that this algorithm expects
data that is purely nominal: If present, numeric attributes must be discretized first.
After loading the data in the Preprocess panel, click the Start button in the Associate
panel to run Apriori with default options. It outputs 10 rules, ranked according to
the confidence measure given in parentheses after each one (they are listed in Figure
11.16). As we explained in Chapter 11 (page 430), the number following a rule’s
antecedent shows how many instances satisfy the antecedent; the number following
the conclusion shows how many instances satisfy the entire rule (this is the rule’s
“support”). Because both numbers are equal for all 10 rules, the confidence of every
rule is exactly 1.
In practice, it can be tedious to find minimum support and confidence values that
give satisfactory results. Consequently, as explained in Chapter 11, Weka’s Apriori
runs the basic algorithm several times. It uses the same user-specified minimum
confidence value throughout, given by the minMetric parameter. The support level
is expressed as a proportion of the total number of instances (14 in the case of the
weather data), as a ratio between 0 and 1. The minimum support level starts at a
certain value (upperBoundMinSupport, default 1.0). In each iteration the support is
decreased by a fixed amount (delta, default 0.05, 5% of the instances) until either a
certain number of rules has been generated (numRules, default 10 rules) or the
support reaches a certain “minimum minimum” level (lowerBoundMinSupport,
เครื่องหมายสมาคมเหมืองแร่กฎ
เพื่อที่จะได้รับบางประสบการณ์กับกฎของสมาคม เราทำงานกับ aPriori ,
ขั้นตอนวิธีที่อธิบายไว้ในมาตรา 5 ( หน้า 144 ) คุณจะค้นพบมันสามารถท้าทายที่จะดึงข้อมูลที่เป็นประโยชน์
กฎใช้อัลกอริทึมนี้ สมาคมเหมืองแร่
ที่จะได้รับความรู้สึกสำหรับวิธีการสมัครแบบ เริ่มจากเหมืองแร่ จากกฎของสภาพอากาศ
ปกติarff ข้อมูลที่ใช้ในส่วน 17.1 . โปรดทราบว่าขั้นตอนนี้คาดว่า
ข้อมูลที่หมดจดปกติ : ถ้าปัจจุบันคุณลักษณะตัวเลขต้องเป็นแบบจุดแรก
หลังจากโหลดข้อมูลใน preprocess แผง , คลิกที่ปุ่ม Start ในภาคี
แผงวิ่งแบบที่มีตัวเลือกเริ่มต้น มันแสดงผล 10 อันดับตามกฎ
,ความเชื่อมั่นในมาตรการให้วงเล็บหลังแต่ละคน ( พวกเขาจะแสดงในรูป
11.16 ) ตามที่เราได้อธิบายในบทที่ 11 ( หน้า 430 ) หมายเลขต่อไปนี้ของ
กฎมาก่อนแสดงให้เห็นว่ามีกรณีพึงพอใจมาก่อน ; หมายเลขต่อไปนี้
สรุปวิธีการหลายกรณีที่ตรงกับกฎทั้งหมด นี่เป็นกฎของ
" สนับสนุน " ) เพราะตัวเลขทั้งสองจะเท่ากันทั้งหมด 10 กฎความมั่นใจของทุก
กฎคือ 1 .
ในทางปฏิบัติสามารถที่น่าเบื่อที่จะหาการสนับสนุนและความเชื่อมั่นของค่าต่ำสุดที่
ให้ผลลัพธ์ที่น่าพอใจ ดังนั้น ตามที่อธิบายไว้ในบทที่ 11 Weka ของ aPriori
วิ่งขั้นตอนวิธีพื้นฐานหลายๆ ครั้ง มันใช้ User เดียวกันระบุขั้นต่ำ
ค่าความเชื่อมั่นตลอด , ที่กำหนดโดยพารามิเตอร์ minmetric . ระดับการสนับสนุน
จะแสดงเป็น สัดส่วนของจำนวนทั้งหมดของอินสแตนซ์ ( 14 ในกรณีที่ข้อมูล
สภาพอากาศ ) เป็นค่าระหว่าง 0 และ 1 ระดับการสนับสนุนขั้นต่ำเริ่มต้นที่ค่า (
upperboundminsupport เริ่มต้น 1.0 ) ในแต่ละซ้ำสนับสนุน
ลดลงคงที่ ( Delta , เริ่มต้น 2 , 5% ของอินสแตนซ์ ) จนทั้ง
หมายเลขหนึ่งของกฎที่ถูกสร้างขึ้น numrules ( ,เริ่มต้น 10 กฎ ) หรือ
สนับสนุนถึงบางขั้นต่ำ " ต่ำสุด " ( lowerboundminsupport ระดับ ,
การแปล กรุณารอสักครู่..