Attribute SelectionNow we investiga

Attribute Selection
Now we investigate which subset of attributes produces the best cross-validated
classification accuracy for the IBk algorithm on the glass dataset. Weka contains
automated attribute selection facilities, which are examined in a later section, but it
is instructive to do this manually.
Performing an exhaustive search over all possible subsets of the attributes is
infeasible (why?), so we apply the backward elimination procedure described in
Section 7.1 (page 311). To do this, first consider dropping each attribute individually
from the full dataset, and run a cross-validation for each reduced version. Once you
have determined the best eight-attribute dataset, repeat the procedure with this
reduced dataset to find the best seven-attribute dataset, and so on.
Exercise 17.2.4. Record in Table 17.1 the best attribute set and the greatest
accuracy obtained in each iteration. The best accuracy obtained in this process
is quite a bit higher than the accuracy obtained on the full dataset.
Exercise 17.2.5. Is this best accuracy an unbiased estimate of accuracy on
future data? Be sure to explain your answer. (Hint: To obtain an unbiased
estimate of accuracy on future data, we must not look at the test data at all

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เลือกแอททริบิวต์
ตอนนี้เราตรวจสอบว่าชุดย่อยของแอตทริบิวต์ผลิตผลดีที่สุดข้ามตรวจสอบ
จัดประเภทความแม่นยำสำหรับอัลกอริทึม IBk บนชุดข้อมูลแก้ว ประกอบด้วย weka
อัตโนมัติคุณลักษณะเลือกสิ่งอำนวยความสะดวก ซึ่งในส่วนหลัง แต่
จะให้คำแนะนำการทำด้วยตนเอง
ดำเนินการค้นหาที่ครบถ้วนสมบูรณ์กว่าย่อยได้ทั้งหมดของแอตทริบิวต์เป็น
ถอด (ทำไม), ดังนั้นเราใช้อธิบายไว้ในขั้นตอนตัดออกย้อนหลัง
ส่วน 7.1 (หน้า 311) การทำเช่นนี้ ก่อนพิจารณาปล่อยแต่ละแอททริบิวต์แต่ละ
จากชุดข้อมูลเต็ม และเรียกใช้ข้ามการตรวจสอบสำหรับแต่ละรุ่นลง เมื่อคุณ
ได้กำหนดชุดข้อมูลของแอททริบิวต์แปดสุด ทำซ้ำกระบวนการนี้
ลดชุดข้อมูลในการค้นหาชุดข้อมูลคุณลักษณะเจ็ดสุด และอื่น ๆ .
กาย 17.2.4 การ เรกคอร์ดในตาราง 17.1 ชุดแอตทริบิวต์สุดและยิ่งใหญ่
แม่นยำรับเนื่องด้วย ความถูกต้องที่สุดที่ได้รับในขั้นตอนนี้
ค่อนข้างเล็กสูงกว่าความถูกต้องได้รับบนเต็มรูปแบบชุดข้อมูล
กาย 17.2.5 อยู่นี้ถูกต้องที่สุดการประเมินคนของความถูกต้อง
ข้อมูลในอนาคตหรือไม่ ตรวจสอบให้แน่ใจว่าจะอธิบายคำตอบของคุณ (คำใบ้: เป็นคนรับ
ประเมินความถูกต้องข้อมูลในอนาคต เราต้องไม่ดูข้อมูลทดสอบเลย

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เลือกสินค้า
ตอนนี้เราตรวจสอบซึ่งส่วนหนึ่งของคุณลักษณะผลิตที่ดีที่สุดข้ามการตรวจสอบ
ความถูกต้องสำหรับการจัดหมวดหมู่ขั้นตอนวิธี IBK ในชุดแก้ว Weka มี
สิ่งอำนวยความสะดวกอัตโนมัติเลือกแอตทริบิวต์ซึ่งมีการตรวจสอบในส่วนต่อมา แต่มันก็
เป็นบทเรียนที่จะทำด้วยตัวเอง
แสดงการค้นหาหมดจดกว่าส่วนย่อยที่เป็นไปได้ทั้งหมดของคุณลักษณะที่เป็น
ไปไม่ได้ (ทำไม?) ดังนั้นเราจึงใช้วิธีการกำจัดย้อนกลับอธิบาย ใน
มาตรา 7.1 (หน้า 311) การทำเช่นนี้ก่อนพิจารณาวางแต่ละแอตทริบิวต์เป็นรายบุคคล
จากชุดเต็มรูปแบบและการทำงานข้ามการตรวจสอบสำหรับรุ่นที่ลดลงในแต่ละ เมื่อคุณ
ได้กำหนดชุดแปดคุณลักษณะที่ดีที่สุดทำซ้ำขั้นตอนนี้
ชุดลดลงที่จะหาชุดเจ็ดคุณลักษณะที่ดีที่สุดและอื่น ๆ
การออกกำลังกาย 17.2.4 บันทึกไว้ในตารางที่ 17.1 คุณลักษณะที่ดีที่สุดของการตั้งค่าและยิ่งใหญ่ที่สุด
ที่ได้รับความถูกต้องในแต่ละประโยค ความถูกต้องที่ดีที่สุดที่ได้รับในขั้นตอนนี้
ไม่น้อยที่สูงกว่าความถูกต้องที่ได้รับในชุดเต็ม
17.2.5 การออกกำลังกาย นี่คือความถูกต้องที่ดีที่สุดประมาณการที่เป็นกลางของความถูกต้องเกี่ยวกับ
ข้อมูลในอนาคตได้อย่างไร ให้แน่ใจว่าจะอธิบายคำตอบของคุณ (คำแนะนำ: หากต้องการได้รับที่เป็นกลาง
ประมาณการของความถูกต้องของข้อมูลในอนาคตเราจะต้องไม่มองไปที่ข้อมูลการทดสอบในทุก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เลือกแอตทริบิวต์ตอนนี้เราตรวจสอบบางส่วนของแอตทริบิวต์ที่ผลิตที่ดีที่สุดข้ามตรวจสอบความถูกต้องสำหรับ ibk
การจำแนกข้อมูลขั้นตอนวิธีการในแก้ว . เวก้าประกอบด้วย
เครื่องเลือกแอตทริบิวต์แบบอัตโนมัติ ซึ่งจะตรวจสอบในส่วนทีหลัง แต่มันก็ให้ความรู้ ทำแบบนี้

แสดงด้วยตนเอง การค้นหาที่ละเอียดถี่ถ้วนกว่าข้อมูลที่เป็นไปได้ทั้งหมดของแอตทริบิวต์เป็น
ทำ ( ทำไม ? ) ดังนั้นเราใช้ย้อนกลับขั้นตอนที่อธิบายไว้ในส่วนการ
7.1 ( หน้า 311 ) การทำเช่นนี้ก่อนพิจารณาปล่อยแต่ละแอตทริบิวต์แบบ
จากข้อมูลเต็ม และวิ่งข้ามการตรวจสอบสำหรับแต่ละลดรุ่น เมื่อคุณได้กำหนดคุณลักษณะที่ดีที่สุด
8 ข้อมูล ทำซ้ำขั้นตอนนี้
ลดข้อมูลเพื่อค้นหาที่ดีที่สุดของวันที่เจ็ด ,และ การออกกำลังกาย 17.2.4
. บันทึกตารางที่ 17.1 ที่ดีที่สุดชุดคุณลักษณะและยิ่งใหญ่ที่สุด
ความถูกต้องได้ในแต่ละซ้ำ . ความถูกต้องที่ดีที่สุดที่ได้รับในขั้นตอนนี้
เป็นค่อนข้างเป็นบิตมากกว่าความถูกต้องที่ได้รับข้อมูลครบถ้วน
ออกกำลังกาย 17.2.5 . คือความถูกต้องที่ดีที่สุดนี้ประมาณการไม่ฝักใฝ่ฝ่ายใดของความถูกต้องบน
ข้อมูลในอนาคต ? ให้แน่ใจว่าได้อธิบายคำตอบของคุณ ( คำใบ้ : ขอรับ
ไม่ฝักใฝ่ฝ่ายใดประเมินความถูกต้องในข้อมูลในอนาคต เราจะต้องดูข้อมูลทั้งหมด

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.