Logical rules for the mushroom data sets.
Logical rules given below seem to be the simplest possible for the
mushroom dataset and therefore should be treated as benchmark results.
Disjunctive rules for poisonous mushrooms, from most general
to most specific:
P_1) odor=NOT(almond.OR.anise.OR.none)
120 poisonous cases missed, 98.52% accuracy
P_2) spore-print-color=green
48 cases missed, 99.41% accuracy
P_3) odor=none.AND.stalk-surface-below-ring=scaly.AND.
(stalk-color-above-ring=NOT.brown)
8 cases missed, 99.90% accuracy
P_4) habitat=leaves.AND.cap-color=white
100% accuracy
Rule P_4) may also be
P_4') population=clustered.AND.cap_color=white
These rule involve 6 attributes (out of 22). Rules for edible
mushrooms are obtained as negation of the rules given above, for
example the rule:
odor=(almond.OR.anise.OR.none).AND.spore-print-color=NOT.green
gives 48 errors, or 99.41% accuracy on the whole dataset.
Several slightly more complex variations on these rules exist,
involving other attributes, such as gill_size, gill_spacing,
stalk_surface_above_ring, but the rules given above are the simplest
we have found.
4. Relevant Information:
This data set includes descriptions of hypothetical samples
corresponding to 23 species of gilled mushrooms in the Agaricus and
Lepiota Family (pp. 500-525). Each species is identified as
definitely edible, definitely poisonous, or of unknown edibility and
not recommended. This latter class was combined with the poisonous
one. The Guide clearly states that there is no simple rule for
determining the edibility of a mushroom; no rule like ``leaflets
three, let it be'' for Poisonous Oak and Ivy.
5. Number of Instances: 8124
6. Number of Attributes: 22 (all nominally valued)
7. Attribute Information: (classes: edible=e, poisonous=p)
1. cap-shape: bell=b,conical=c,convex=x,flat=f,
knobbed=k,sunken=s
2. cap-surface: fibrous=f,grooves=g,scaly=y,smooth=s
3. cap-color: brown=n,buff=b,cinnamon=c,gray=g,green=r,
pink=p,purple=u,red=e,white=w,yellow=y
4. bruises?: bruises=t,no=f
5. odor: almond=a,anise=l,creosote=c,fishy=y,foul=f,
musty=m,none=n,pungent=p,spicy=s
6. gill-attachment: attached=a,descending=d,free=f,notched=n
7. gill-spacing: close=c,crowded=w,distant=d
8. gill-size: broad=b,narrow=n
9. gill-color: black=k,brown=n,buff=b,chocolate=h,gray=g,
green=r,orange=o,pink=p,purple=u,red=e,
white=w,yellow=y
10. stalk-shape: enlarging=e,tapering=t
11. stalk-root: bulbous=b,club=c,cup=u,equal=e,
rhizomorphs=z,rooted=r,missing=?
12. stalk-surface-above-ring: fibrous=f,scaly=y,silky=k,smooth=s
13. stalk-surface-below-ring: fibrous=f,scaly=y,silky=k,smooth=s
14. stalk-color-above-ring: brown=n,buff=b,cinnamon=c,gray=g,orange=o,
pink=p,red=e,white=w,yellow=y
15. stalk-color-below-ring: brown=n,buff=b,cinnamon=c,gray=g,orange=o,
pink=p,red=e,white=w,yellow=y
16. veil-type: partial=p,universal=u
17. veil-color: brown=n,orange=o,white=w,yellow=y
18. ring-number: none=n,one=o,two=t
19. ring-type: cobwebby=c,evanescent=e,flaring=f,large=l,
none=n,pendant=p,sheathing=s,zone=z
20. spore-print-color: black=k,brown=n,buff=b,chocolate=h,green=r,
orange=o,purple=u,white=w,yellow=y
21. population: abundant=a,clustered=c,numerous=n,
scattered=s,several=v,solitary=y
22. habitat: grasses=g,leaves=l,meadows=m,paths=p,
urban=u,waste=w,woods=d
8. Missing Attribute Values: 2480 of them (denoted by "?"), all for
attribute #11.
9. Class Distribution:
-- edible: 4208 (51.8%)
-- poisonous: 3916 (48.2%)
-- total: 8124 instances
Logical rules for the mushroom data sets.
Logical rules given below seem to be the simplest possible for the
mushroom dataset and therefore should be treated as benchmark results.
Disjunctive rules for poisonous mushrooms, from most general
to most specific:
P_1) odor=NOT(almond.OR.anise.OR.none)
120 poisonous cases missed, 98.52% accuracy
P_2) spore-print-color=green
48 cases missed, 99.41% accuracy
P_3) odor=none.AND.stalk-surface-below-ring=scaly.AND.
(stalk-color-above-ring=NOT.brown)
8 cases missed, 99.90% accuracy
P_4) habitat=leaves.AND.cap-color=white
100% accuracy
Rule P_4) may also be
P_4') population=clustered.AND.cap_color=white
These rule involve 6 attributes (out of 22). Rules for edible
mushrooms are obtained as negation of the rules given above, for
example the rule:
odor=(almond.OR.anise.OR.none).AND.spore-print-color=NOT.green
gives 48 errors, or 99.41% accuracy on the whole dataset.
Several slightly more complex variations on these rules exist,
involving other attributes, such as gill_size, gill_spacing,
stalk_surface_above_ring, but the rules given above are the simplest
we have found.
4. Relevant Information:
This data set includes descriptions of hypothetical samples
corresponding to 23 species of gilled mushrooms in the Agaricus and
Lepiota Family (pp. 500-525). Each species is identified as
definitely edible, definitely poisonous, or of unknown edibility and
not recommended. This latter class was combined with the poisonous
one. The Guide clearly states that there is no simple rule for
determining the edibility of a mushroom; no rule like ``leaflets
three, let it be'' for Poisonous Oak and Ivy.
5. Number of Instances: 8124
6. Number of Attributes: 22 (all nominally valued)
7. Attribute Information: (classes: edible=e, poisonous=p)
1. cap-shape: bell=b,conical=c,convex=x,flat=f,
knobbed=k,sunken=s
2. cap-surface: fibrous=f,grooves=g,scaly=y,smooth=s
3. cap-color: brown=n,buff=b,cinnamon=c,gray=g,green=r,
pink=p,purple=u,red=e,white=w,yellow=y
4. bruises?: bruises=t,no=f
5. odor: almond=a,anise=l,creosote=c,fishy=y,foul=f,
musty=m,none=n,pungent=p,spicy=s
6. gill-attachment: attached=a,descending=d,free=f,notched=n
7. gill-spacing: close=c,crowded=w,distant=d
8. gill-size: broad=b,narrow=n
9. gill-color: black=k,brown=n,buff=b,chocolate=h,gray=g,
green=r,orange=o,pink=p,purple=u,red=e,
white=w,yellow=y
10. stalk-shape: enlarging=e,tapering=t
11. stalk-root: bulbous=b,club=c,cup=u,equal=e,
rhizomorphs=z,rooted=r,missing=?
12. stalk-surface-above-ring: fibrous=f,scaly=y,silky=k,smooth=s
13. stalk-surface-below-ring: fibrous=f,scaly=y,silky=k,smooth=s
14. stalk-color-above-ring: brown=n,buff=b,cinnamon=c,gray=g,orange=o,
pink=p,red=e,white=w,yellow=y
15. stalk-color-below-ring: brown=n,buff=b,cinnamon=c,gray=g,orange=o,
pink=p,red=e,white=w,yellow=y
16. veil-type: partial=p,universal=u
17. veil-color: brown=n,orange=o,white=w,yellow=y
18. ring-number: none=n,one=o,two=t
19. ring-type: cobwebby=c,evanescent=e,flaring=f,large=l,
none=n,pendant=p,sheathing=s,zone=z
20. spore-print-color: black=k,brown=n,buff=b,chocolate=h,green=r,
orange=o,purple=u,white=w,yellow=y
21. population: abundant=a,clustered=c,numerous=n,
scattered=s,several=v,solitary=y
22. habitat: grasses=g,leaves=l,meadows=m,paths=p,
urban=u,waste=w,woods=d
8. Missing Attribute Values: 2480 of them (denoted by "?"), all for
attribute #11.
9. Class Distribution:
-- edible: 4208 (51.8%)
-- poisonous: 3916 (48.2%)
-- total: 8124 instances
การแปล กรุณารอสักครู่..
กฎตรรกะสำหรับข้อมูลเห็ดชุด
ตรรกะกฎข้างล่างดูเหมือนจะง่ายที่สุด สำหรับข้อมูล
เห็ดและดังนั้นจึงควรจะถือว่าเป็นมาตรฐานผล
ดิซจังกฎสำหรับเห็ดพิษ จากทั่วไปมากที่สุดเพื่อที่เฉพาะเจาะจงมากที่สุด :
p_1 ) = ( กลิ่นอัลมอนด์ หรือ โป๊ยกั๊ก . หรือ ไม่มี )
120 ราย พิษ พลาด 98.52 % ความถูกต้อง
p_2 ) สปอร์พิมพ์สี = เขียว
48 กรณีพลาด 99.41 % ความถูกต้อง
p_3 ) = ไม่มีกลิ่นและพื้นผิวด้านล่าง ก้านแหวน = เป็นสะเก็ด และ .
( ก้านสีเหนือแหวน = ไม่ น้ำตาล )
8 รายที่พลาด 99.90 % ความถูกต้อง
p_4 ) = ใบถิ่นที่อยู่ และ หมวกสี = ขาว
100% ความถูกต้อง
กฎ p_4 ) อาจจะ
' ) p_4 ประชากร = กลุ่ม และ cap_color = ขาว
กฎเหล่านี้เกี่ยวข้องกับ 6 คุณลักษณะ ( 22 ) กฎสำหรับอาหาร
เห็ดจะได้เป็นนิเสธของกฎข้างต้น สำหรับตัวอย่างกฎ :
กลิ่น = ( อัลมอนด์ หรือ โป๊ยกั๊ก หรือ ไม่มี ) และ สปอร์พิมพ์สีไม่เขียว
ให้ 48 ข้อผิดพลาดหรือ 99.41 % ความถูกต้องในข้อมูลทั้งหมด
หลายรูปแบบซับซ้อนมากขึ้นเล็กน้อย กฎเหล่านี้อยู่
เกี่ยวข้องกับคุณลักษณะอื่น ๆเช่น gill_size gill_spacing stalk_surface_above_ring
, , ,แต่กฎข้างต้น เราได้พบง่าย
4 . ข้อมูลที่เกี่ยวข้อง :
ข้อมูลชุดนี้รวมถึงรายละเอียดของตัวอย่างสมมุติ
ที่ 23 ชนิด เห็ดอะการิคัส และใน gilled
เลอปิโอตาครอบครัว ( PP 500-525 ) แต่ละชนิดมีการระบุเป็น
แน่นอนพืชมีพิษแน่นอน หรืออาหารที่ไม่รู้จักและ
ไม่แนะนําห้องหลังนี้ถูกรวมกับพิษ
1 คู่มือก็ระบุไว้ชัดเจนว่า ไม่มีกฎง่ายๆสำหรับ
กำหนดอาหารของเห็ด ไม่มีกฎเหมือน ' ใบปลิว
3 , ให้มันเป็น ' ' โอ๊กพิษ และไอวี่
5 หมายเลขของอินสแตนซ์ : 8124
6 จำนวนของแอตทริบิวต์ : 22 ( ทั้งหมดนามมูลค่า )
7 ข้อมูลคุณสมบัติ : ( เรียน : กินได้ = E , พิษ = P )
1 หมวกทรงระฆัง = bรูปกรวยนูน = x = c แบน = F = k
ซมจม = s
2 ผิวหมวก : ปาก = = G F , ร่อง , ขุย = y เนียน = S
3 ฝาสี : น้ำตาล = n buff = B , อบเชย = C = G สีเทา สีเขียว = R ,
สีชมพู = p = u = สีม่วง , สีแดงและสีขาว , สีเหลือง = w = Y ,
4 รอยช้ำ : รอยฟกช้ำ = t = ไม่ F
5 กลิ่น : อัลมอนด์ = , โป๊ยกั๊ก = L creosote = C = Y = เหม็นคาว , F ,
เหม็นอับ = m = n = P ไม่ฉุน , เผ็ด = S
6 เหงือกแนบ : แนบลงมา = , = D , ฟรี = F หยัก = N
7 ระยะห่าง : เหงือกปิด = w = C , แออัด , ไกล = D
8 เหงือกขนาด : กว้าง = b แคบ = N
9 เหงือก สี : สีดำสีน้ำตาล = = K , N , Buff = B , ช็อกโกแลต = H , สีเทา = G = r
เขียว ส้ม = O = u = P สีชมพู , สีม่วง , สีแดง = e
ขาว = W = สีเหลือง Y
10 ก้าน รูปทรง : ขยาย = E , เรียว = t
11 ลำต้น ราก บวมเป่ง = B , คลับ = C , ถ้วย = U = เท่ากับ E ,
rhizomorphs = Z , ราก = R หายไป = ?
12 พื้นผิวด้านบน ก้านแหวน : เส้นใย = F , ขุย = y เนียนเรียบ = S = k
13 ก้านแหวนพื้นผิวด้านล่าง :เส้นใย = F , ขุย = y เนียนเรียบ = S = k
14 ก้านสีเหนือแหวนสีน้ำตาล = n buff = B , อบเชย = C = G สีเทา ส้ม = O = P
สีชมพู , สีแดง = E , สีขาว = W = สีเหลือง Y
15 ก้านแหวนสีด้านล่าง : น้ำตาล = n buff = B , อบเชย = C = G สีเทา ส้ม = O = P
สีชมพู , สีแดง = E , สีขาว = W = สีเหลือง Y
16 ชนิดผ้า : บางส่วน = P , สากล = u
17 ม่านสี : น้ำตาล = n , ส้ม = O = w = สีเหลือง , สีขาว , Y
18 แหวนเบอร์ : ไม่มี = O = N หนึ่ง สอง = t
19 ชนิดแหวน : cobwebby = Cหายไปอย่างรวดเร็ว = E , วูบวาบ = F ใหญ่ = l
ไม่มี = n , จี้ = P sheathing = S , โซน = z
20 สีพิมพ์สปอร์สีดำ = k , น้ำตาล = n buff = B , ช็อกโกแลต = H , สีเขียว = R ,
ส้ม = O = u = สีม่วง , ขาว W , สีเหลือง = y
21 ประชากร : มากมาย = , = กลุ่ม C มากมาย = N
= v = s กระจัดกระจายหลาย โดดเดี่ยว = y
22 ที่อยู่ : หญ้า = g , ใบ = L , ทุ่งหญ้า = M , เส้นทาง = P
เมือง = U = w = D เสีย ป่า
8 คิดถึงค่าแอตทริบิวต์ : 2978 ของพวกเขา ( แทน โดย " ? " ) ,ทั้งหมดคุณลักษณะ# 11
9 การแจกแจงชั้น :
-- กิน : 4208 ( ร้อยละ 51.8 % )
-- พิษ : 3916 ( 48.2% )
-- ทั้งหมด : กรณี 8124
การแปล กรุณารอสักครู่..