Interactive Decision Tree Construct

Interactive Decision Tree Construction
One of Weka’s classifiers is interactive: It lets the user—you!—construct your own
classifier. Here’s a competition: Who can build a classifier with the highest predictive
accuracy?
Follow the procedure described in Section 11.2 (page 424). Load the file segmentchallenge.
arff (in the data folder that comes with the Weka distribution). This dataset
has 20 attributes and 7 classes. It is an image segmentation problem, and the task is
to classify images into seven different groups based on properties of the pixels.
Set the classifier to UserClassifier, in the weka.classifiers.trees package. We use
a separate test set (performing cross-validation with UserClassifier is incredibly
tedious!), so in the Test options box choose the Supplied test set option and click
the Set button. A small window appears in which you choose the test set. Click Open
file and browse to the file segment-test.arff (also in the Weka distribution’s data
folder). On clicking Open, the small window updates to show the number of attributes
(20) in the data. The number of instances is not displayed because test instances
are read incrementally (so that the Explorer interface can process larger test files
than can be accommodated in main memory).
Click Start. UserClassifier differs from all other classifiers: It opens a special
window and waits for you to build your own classifier in it. The tabs at the top of
the window switch between two views of the classifier. The Tree visualizer shows
the current state of your tree, and the nodes give the number of class values there.
The aim is to come up with a tree of which the leaf nodes are as pure as possible.
To begin with, the tree has just one node—the root node—containing all the data.
More nodes will appear when you proceed to split the data in the Data visualizer.
Click the Data visualizer tab to see a two-dimensional plot in which the data
points are color-coded by class, with the same facilities as the Visualize panel
discussed in Section 17.1. Try different combinations of x- and y-axes to get the
clearest separation you can find between the colors. Having found a good separation,
you then need to select a region in the plot: This will create a branch in
the tree. Here’s a hint to get you started: Plot region-centroid-row on the x-axis
and intensity-mean on the y-axis (the display is shown in Figure 11.14(a)); you
can see that the red class (sky) is nicely separated from the rest of the classes
at the top of the plot.
There are four tools for selecting regions in the graph, chosen using the dropdown
menu below the y-axis selector. Select Instance identifies a particular instance. Rectangle
(shown in Figure 11.14(a)) allows you to drag out a rectangle on the graph.
With Polygon and Polyline you build a free-form polygon or draw a free-form
polyline (left-click to add a vertex and right-click to complete the operation).
When you have selected an area using any of these tools, it turns gray. (In Figure
11.14(a) the user has defined a rectangle.) Clicking the Clear button cancels the
selection without affecting the classifier. When you are happy with the selection,
click Submit. This creates two new nodes in the tree, one holding all the instances
covered by the selection and the other holding all remaining instances. These nodes
correspond to a binary split that performs the chosen geometric test.
Switch back to the Tree visualizer view to examine the change in the tree.
Clicking on different nodes alters the subset of data that is shown in the Data
visualizer section. Continue adding nodes until you obtain a good separation of
the classes—that is, the leaf nodes in the tree are mostly pure. Remember, however,
that you should not overfit the data because your tree will be evaluated

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ก่อสร้างต้นไม้ตัดสินใจโต้
คำนามภาษาของ Weka เป็นแบบโต้ตอบ: จะช่วยให้ผู้ใช้ — คุณ! — สร้างของคุณเอง
classifier นี่คือการแข่งขัน: ผู้สามารถสร้าง classifier กับสูงสุดงาน
ถูกต้อง?
ทำตามขั้นตอนที่อธิบายไว้ในส่วน 11.2 (หน้า 424) ได้ โหลด segmentchallenge แฟ้ม
arff (ในโฟลเดอร์ข้อมูลที่มาพร้อมกับการกระจาย Weka) ชุดข้อมูลนี้
มีแอตทริบิวต์ 20 และชั้น 7 ปัญหาการแบ่งภาพ และงาน
การจัดประเภทภาพใน 7 กลุ่มตามคุณสมบัติของพิกเซล
ตั้งที่ classifier เพื่อ UserClassifier ในแพคเกจ weka.classifiers.trees เราใช้
ชุดทดสอบแยกต่างหาก (ทำการตรวจสอบข้ามกับ UserClassifier ถูกอย่างไม่น่าเชื่อ
น่าเบื่อ!), ดังนั้นในกล่องตัวเลือกทดสอบเลือกทดสอบ Supplied ตั้งค่าตัวเลือก และคลิก
ปุ่มตั้งค่า หน้าต่างเล็ก ๆ ปรากฏขึ้น ซึ่งคุณเลือกชุดทดสอบ คลิกเปิด
แฟ้ม และเรียกดูแฟ้มเซ็กเมนต์-test.arff (ยังอยู่ในข้อมูลของการกระจาย Weka
โฟลเดอร์) บนคลิกเปิด หน้าต่างขนาดเล็กปรับปรุงเพื่อแสดงหมายเลขของ attributes
(20) ในข้อมูล แสดงหมายเลขของอินสแตนซ์ที่ไม่ได้เนื่องจากทดสอบกรณี
อ่านแบบเพิ่มหน่วย (เพื่อให้อินเทอร์เฟซ Explorer สามารถประมวลผลแฟ้มทดสอบใหญ่
กว่าสามารถอาศัยในหน่วยความจำหลัก)
คลิกเริ่มการทำงาน UserClassifier แตกต่างจากคำนามภาษาอื่น ๆ: เปิดเป็นพิเศษ
หน้าต่างและรอคุณสร้าง classifier ของคุณเองในการ แท็บที่ด้านบนของ
หน้าต่างสลับระหว่างสองมุมมองของ classifier ที่ แสดงจอภาพต้นไม้
สถานะปัจจุบันของแผนภูมิของคุณ และโหนให้ของมีค่าชั้น.
จุดมุ่งหมายจะเกิดขึ้นกับต้นไม้ที่โหนโหนดปลายสุดจะบริสุทธิ์เป็นที่เป็นไป
จะเริ่มต้นด้วย ทรีมีโหนเดียว — โหนดราก — ประกอบด้วยข้อมูลทั้งหมด
โหนเพิ่มเติมจะปรากฏขึ้นเมื่อคุณดำเนินแยกข้อมูลในข้อมูลจอภาพ
คลิกแท็บจอภาพข้อมูลเพื่อดูแผนแบบสองมิติซึ่งข้อมูล
จุดจะเข้ารหัสสี โดยคลาส สิ่งอำนวยความสะดวกเหมือนกันเป็นแผง Visualize
ในส่วน 17.1 ลองชุดของ x - และ y - axes ไป
แยกชัดเจนที่คุณสามารถค้นหาระหว่างสี มีพบแยกดี,
คุณต้องเลือกภูมิภาคในพล็อต: นี้จะสร้างใน
ต้น นี่คือคำแนะนำให้คุณเริ่มต้น: พล็อตภูมิภาคเซนทรอยด์แถวบนแกน x
และค่า เฉลี่ยความเข้มบนแกน y (จอแสดงผลจะแสดงในรูป 11.14(a)) คุณ
ดูว่า ชั้นสีแดง (ฟ้า) ดีได้แยกออกจากส่วนเหลือของคลา
ที่พล็อตได้
มีสี่เครื่องมือสำหรับเลือกพื้นที่กราฟ เลือกใช้รายการแบบหล่นลง
เมนูด้านล่างเลือกแกน y เลือกอินสแตนซ์ระบุอินสแตนซ์ที่เฉพาะ สี่เหลี่ยม
(แสดงในรูปที่ 11.14(a)) ช่วยให้คุณลากออกสี่เหลี่ยมบนกราฟ
Polyline คุณสร้างรูปหลายเหลี่ยมอิสระ หรือวาดเป็นอิสระและมีรูปหลายเหลี่ยม
polyline (คลิกซ้ายเพื่อเพิ่มจุดยอด และคลิกขวาเพื่อดำเนินการให้) .
เมื่อคุณเลือกพื้นที่โดยใช้เครื่องมือเหล่านี้ มันเป็นสีเทา (ใน Figure
11.14(a) ผู้มีกำหนดสี่เหลี่ยม) คลิกที่ปุ่ม Clear ยกเลิกการ
เลือกสภาพ classifier ที่ เมื่อคุณมีความสุขกับการเลือก,
คลิกส่งการ นี้สร้างโหนสองใหม่ในแผนภูมิ เก็บอินสแตนซ์เดียว
ครอบคลุมทางเลือกอื่น ๆ ที่เก็บอินสแตนซ์ทั้งหมดที่เหลือ โหนเหล่านี้
ตรงการแบ่งไบนารีที่ทำ test. เรขาคณิตท่าน
สลับไปยังมุมมองจอภาพแผนภูมิให้ตรวจสอบการเปลี่ยนแปลงในแผนภูมิ
Clicking บนโหนอื่นเปลี่ยนแปลงชุดย่อยของข้อมูลที่แสดงในข้อมูล
ส่วนจอภาพ เพิ่มโหนจนกว่าคุณได้รับการแยกที่ดีของ
คลา — นั่นคือ โหนโหนดปลายสุดในแผนภูมิเป็นส่วนใหญ่ล้วน จำ ไร,
ว่า คุณควรไม่ overfit ข้อมูลเนื่องจากแผนภูมิของคุณจะถูกประเมิน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การตัดสินใจแบบต้นไม้ก่อสร้าง
หนึ่งของคำจะโต้ตอบ Weka : จะช่วยให้ผู้ใช้ที่คุณ ! - สร้างของคุณเอง
ลักษณนาม นี่คือการแข่งขันที่สามารถสร้างส่วนขยายที่มีความถูกต้องทำนาย
สูงสุด ?
ตามขั้นตอนที่อธิบายไว้ในมาตราที่ 11.2 ( หน้า 136 ) โหลด segmentchallenge ไฟล์ .
arff ( ในข้อมูลโฟลเดอร์ที่มากับ Weka กระจาย ) นี้ข้อมูล
20 คุณลักษณะ 7 ชั้นเรียน มันเป็นภาพที่ตัดปัญหา และงานจะแบ่งออกเป็น 7
ภาพกลุ่มตามคุณสมบัติของพิกเซล .
ตั้งลักษณนามกับ userclassifier ใน weka.classifiers.trees แพคเกจ เราใช้
แยกชุดทดสอบ ( การตรวจสอบข้ามกับ userclassifier สุดๆ
น่าเบื่อ ! ) ,ดังนั้นในการทดสอบตัวเลือกในกล่องเลือกมาทดสอบตั้งค่าตัวเลือกและคลิก
ชุดปุ่ม หน้าต่างขนาดเล็กจะปรากฏในที่คุณเลือกแบบชุด คลิกเปิดไฟล์และเรียกดูไปยัง
segment-test.arff ไฟล์ ( ใน Weka กระจายข้อมูล
โฟลเดอร์ ) เมื่อคลิกเปิดหน้าต่างขนาดเล็กการปรับปรุงเพื่อแสดงจำนวนของแอตทริบิวต์
( 20 ) ในข้อมูลหมายเลขของอินสแตนซ์จะไม่แสดงเพราะอินสแตนซ์การทดสอบ
จะอ่านแบบเพิ่มหน่วย ( เพื่อให้อินเตอร์เฟซ Explorer สามารถประมวลผลไฟล์ทดสอบขนาดใหญ่
กว่าสามารถอาศัยในหน่วยความจำหลัก ) .
คลิกเริ่ม userclassifier แตกต่างจากคำอื่น ๆ : มันเปิดหน้าต่างพิเศษ
และรอให้คุณสร้างของคุณเอง 1 ในนั้น แท็บที่ด้านบนของ
หน้าต่างสลับระหว่างสองมุมมองของลักษณนาม ต้นไม้แสดง Visualizer
สถานะปัจจุบันของต้นไม้ และโหนดให้หมายเลขของระดับค่าตรงนั้น
มีจุดมุ่งหมายที่จะเกิดขึ้นกับต้นไม้ที่มีใบเป็นโหนดที่บริสุทธิ์ที่สุด
ต้น ต้นไม้มีเพียงหนึ่งโหนดรากโหนดที่มีข้อมูลทั้งหมด
โหนดเพิ่มเติมจะปรากฏขึ้นเมื่อคุณดำเนินการเพื่อแยกข้อมูลในข้อมูล Visualizer .
คลิกแท็บ Visualizer ข้อมูลเห็นสองมิติในที่แปลงข้อมูลเป็นรหัสสีโดย
คะแนนเรียนกับเครื่องเดียวกับภาพแผง
กล่าวถึงในส่วน 17.1 . ลองที่แตกต่างกันของ X - และ y-axes รับ
ชัดเจนแยกคุณสามารถค้นหาระหว่างสีมีการพบการแยกที่ดี
จากนั้นคุณจะต้องเลือกพื้นที่ในแปลงนี้จะสร้างสาขาใน
ต้นไม้ นี่เป็นเคล็ดลับที่จะได้รับคุณเริ่มต้น : แปลงเขตเซนทรอยด์แถวบนแกน x และแกน y
เข้มหมายถึงบน ( แสดงผลแสดงในรูปที่ 11.14 ( ) ) ; คุณสามารถดูที่ห้องแดง
( ท้องฟ้า ) เป็นอย่างดีแยกออกจากส่วนที่เหลือของชั้น
ที่ด้านบนของที่ดิน
มี 4 เครื่องมือสำหรับเลือกพื้นที่ในกราฟ เลือกใช้เมนูแบบเลื่อนลงด้านล่างแกน y
เลือก เลือกตัวอย่างระบุอินสแตนซ์โดยเฉพาะ สี่เหลี่ยมผืนผ้า
( แสดงในรูปที่ 11.14 ( ) ช่วยให้คุณสามารถลากออกสี่เหลี่ยมบนกราฟ
กับรูปหลายเหลี่ยม และเส้นคุณสร้างรูปทรงอิสระ หรือวาดอิสระ
รูปหลายเหลี่ยมเส้น ( คลิกซ้ายเพื่อเพิ่มยอดคลิกขวาเพื่อเสร็จสิ้นการดำเนินการ ) .
เมื่อคุณได้เลือกพื้นที่การใช้ใด ๆของเครื่องมือเหล่านี้ มันกลายเป็นสีเทา ( ในรูป
11.14 ( ) ที่ผู้ใช้ได้กำหนดสี่เหลี่ยมผืนผ้า ) คลิกปุ่มล้างยกเลิก
เลือกโดยไม่มีผลต่อลักษณนาม เมื่อคุณมีความสุขกับการเลือก
คลิกส่ง นี้จะสร้างสองโหนดในต้นไม้หนึ่งถือกรณีทั้งหมด
ครอบคลุมโดยการถือกรณีและอื่น ๆที่เหลือทั้งหมด โหนดเหล่านี้
สอดคล้องกับไบนารีที่ดำเนินการทดสอบแยกเลือกเรขาคณิต .
เปลี่ยนกลับไปดู Visualizer ต้นไม้เพื่อตรวจสอบการเปลี่ยนแปลงในต้นไม้
คลิกโหนดต่าง ๆ เปลี่ยนแปลงชุดย่อยของข้อมูลที่แสดงในข้อมูล
Visualizer ส่วนการเพิ่มโหนดต่อไปจนกว่าคุณจะได้รับการแยกที่ดี
เรียนนั่นคือ ใบโหนดในต้นไม้ส่วนใหญ่จะบริสุทธิ์ จำไว้ , อย่างไรก็ตาม ,
ที่คุณไม่ควร overfit ข้อมูลเพราะต้นไม้ของคุณจะถูกประเมิน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.