Model Evaluation and Selection Now

Model Evaluation and Selection Now that you may have built a classiﬁcation model, there may be many questions going through your mind. For example, suppose you used data from previous sales to build a classiﬁer to predict customer purchasing behavior. You would like an estimate of how accurately the classiﬁer can predict the purchasing behavior of future customers, that is, future customer data on which the classiﬁer has not been trained. You may even have tried different methods to build more than one classiﬁer and now wish to compare their accuracy. But what is accuracy? How can we estimate it? Are some measures of a classiﬁer’s accuracy more appropriate than others? How can we obtain a reliable accuracy estimate? These questions are addressed in this section.

Section 8.5.1 describes various evaluation metrics for the predictive accuracy of a classiﬁer. Holdout and random subsampling (Section 8.5.2), cross-validation (Section 8.5.3), and bootstrap methods (Section 8.5.4) are common techniques for assessing accuracy, based on randomly sampled partitions of the given data. What if we have more than one classiﬁer and want to choose the “best” one? This is referred to as model selection (i.e., choosing one classiﬁer over another). The last two sections address this issue. Section 8.5.5 discusses how to use tests of statistical signiﬁcance to assess whether the difference in accuracy between two classiﬁers is due to chance. Section 8.5.6 presents how to compare classiﬁers based on cost–beneﬁt and receiver operating characteristic (ROC) curves.

Section 8.5.1 describes various evaluation metrics for the predictive accuracy of a classiﬁer. Holdout and random subsampling (Section 8.5.2), cross-validation (Section 8.5.3), and bootstrap methods (Section 8.5.4) are common techniques for assessing accuracy, based on randomly sampled partitions of the given data. What if we have more than one classiﬁer and want to choose the “best” one? This is referred to as model selection (i.e., choosing one classiﬁer over another). The last two sections address this issue. Section 8.5.5 discusses how to use tests of statistical signiﬁcance to assess whether the difference in accuracy between two classiﬁers is due to chance. Section 8.5.6 presents how to compare classiﬁers based on cost–beneﬁt and receiver operating characteristic (ROC) curves.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

แบบประเมินและการเลือกตอนที่คุณอาจสร้างแบบ classiﬁcation อาจมีคำถามมากมายที่ผ่านใจของคุณ เช่น สมมติว่า คุณใช้ข้อมูลจากการก่อนหน้านี้เพื่อสร้าง classiﬁer การทำนายพฤติกรรมการซื้อของลูกค้า คุณต้องการประเมินวิธี classiﬁer สามารถทำนายพฤติกรรมของลูกค้าในอนาคต ซื้อที่ ข้อมูลลูกค้าในอนาคตซึ่ง classiﬁer มีไม่รับการฝึกอบรม แม้คุณอาจได้ลองวิธีอื่นในการสร้างมากกว่าหนึ่ง classiﬁer และตอนนี้ ต้องการเปรียบเทียบความถูกต้องของ แต่ความถูกต้องคืออะไร วิธีที่เราสามารถประมาณได้ มาตรการบางอย่างของ classiﬁer ถูกต้องเหมาะสมกว่าผู้อื่นบ้าง เราได้ประเมินความถูกต้องเชื่อถือได้หรือไม่ คำถามเหล่านี้จะได้รับการแก้ไขในส่วนนี้ ส่วน 8.5.1 อธิบายต่าง ๆ ประเมินวัดความแม่นยำทำนายของ classiﬁer Holdout สุ่ม subsampling (ส่วน 8.5.2), ตรวจ สอบข้าม (ส่วน 8.5.3), และวิธีการเริ่มต้นระบบ (ส่วน 8.5.4) เป็นเทคนิคทั่วไปสำหรับการประเมินความแม่นยำ ใช้บนพาร์ติชันโดยการสุ่มตัวอย่างของข้อมูลที่กำหนด ถ้าเรามี classiﬁer หนึ่ง และต้องเลือก "สุด" นี้จะเรียกว่าเป็นการเลือกรูปแบบ (เช่น เลือกหนึ่ง classiﬁer กว่าอีก) ส่วนสองแก้ปัญหานี้ ส่วน 8.5.5 กล่าวถึงวิธีการใช้การทดสอบของ signiﬁcance ทางสถิติเพื่อประเมินว่ามีความแตกต่างในความถูกต้องระหว่างสอง classiﬁers เนื่องจากโอกาส ส่วน 8.5.6 แสดงวิธีการเปรียบเทียบ classiﬁers อิงต้นทุน – ประโยชน์และตัวรับ (ROC) กราฟแสดงลักษณะการทำงาน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

รูปแบบการประเมินและการคัดเลือกตอนนี้คุณอาจได้สร้างรูปแบบการจัดประเภท Fi ไอออนบวกอาจจะมีคำถามมากมายที่จะผ่านความคิดของคุณ ตัวอย่างเช่นสมมติว่าคุณใช้ข้อมูลที่ได้จากการขายก่อนหน้านี้ที่จะสร้าง ER จัดประเภทในการทำนายพฤติกรรมการซื้อของลูกค้า คุณต้องการการประมาณการของวิธีการที่ถูกต้อง ER จัดประเภทสามารถทำนายพฤติกรรมการซื้อของลูกค้าในอนาคตที่เป็นข้อมูลของลูกค้าในอนาคตที่ ER จัดประเภท Fi ยังไม่ได้รับการฝึกอบรม คุณอาจจะยังมีความพยายามที่วิธีการต่าง ๆ ที่จะสร้างมากกว่าหนึ่งจัดประเภท Fi ER และตอนนี้ต้องการที่จะเปรียบเทียบความถูกต้องของพวกเขา แต่สิ่งที่เป็นความถูกต้อง? วิธีการที่เราสามารถที่จะประเมินได้หรือไม่ มาตรการของความถูกต้องจำแนก Fi ER บางคนที่เหมาะสมมากขึ้นกว่าคนอื่น ๆ ? วิธีการที่เราสามารถได้รับการประเมินความถูกต้องน่าเชื่อถือ? คำถามเหล่านี้ได้รับการแก้ไขในส่วนนี้. มาตรา 8.5.1 อธิบายตัวชี้วัดการประเมินผลที่หลากหลายสำหรับการทำนายความถูกต้องของ ER จัดประเภท ยอมอ่อนข้อและ subsampling สุ่ม (มาตรา 8.5.2) ข้ามการตรวจสอบ (มาตรา 8.5.3) และวิธีการบูต (มาตรา 8.5.4) เป็นเทคนิคที่พบบ่อยสำหรับการประเมินความถูกต้องอยู่บนพื้นฐานของพาร์ทิชันสุ่มของข้อมูลที่ได้รับ ถ้าเรามีมากกว่าหนึ่งจัดประเภท Fi ER และต้องการที่จะเลือก "ดีที่สุด" หรือไม่? นี้จะเรียกว่าการคัดเลือกตัวแบบ (เช่นเลือกหนึ่งจัดประเภท ER Fi มากกว่าอีก) สุดท้ายทั้งสองส่วนแก้ไขปัญหานี้ มาตรา 8.5.5 อธิบายถึงวิธีการใช้การทดสอบทางสถิตินัยนัยสำคัญ Fi เพื่อประเมินว่าความแตกต่างในความถูกต้องระหว่างสอง ERS จัดประเภทเป็นเพราะโอกาส มาตรา 8.5.6 นำเสนอวิธีการเปรียบเทียบ ERS จัดประเภทขึ้นอยู่กับค่าใช้จ่ายที่ Bene Fi T และรับปฏิบัติการลักษณะ (ROC) เส้นโค้ง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

รูปแบบการประเมินและการเลือกตอนนี้คุณอาจได้สร้างรูปแบบการ classi จึงอาจมีคำถามมากมายเข้ามาในหัวของคุณ ตัวอย่างเช่น สมมติว่าคุณใช้ข้อมูลจากการขายก่อนหน้านี้เพื่อสร้าง classi จึงเอ้อเพื่อทำนายพฤติกรรมการซื้อของลูกค้า . คุณต้องการประมาณการของวิธีการที่ถูกต้อง classi จึงเอ้อสามารถทำนายพฤติกรรมการซื้อของลูกค้าในอนาคต นั่นคือ อนาคตของข้อมูลลูกค้าที่ classi จึงเอ้อยังไม่ได้ฝึก คุณอาจจะลองวิธีที่แตกต่างเพื่อสร้างมากกว่าหนึ่ง classi จึงเอ่อและตอนนี้ต้องการที่จะเปรียบเทียบความถูกต้องของพวกเขา แต่อะไรคือความถูกต้อง วิธีที่เราสามารถประเมิน ? มีบางมาตรการของ classi จึงเอ้อ ความถูกต้องเหมาะสมมากขึ้นกว่าคนอื่น ๆ ? วิธีที่เราสามารถได้รับการประเมินความถูกต้องเชื่อถือได้ ? คำถามเหล่านี้จะอยู่ในส่วนนี้ส่วน 8.5.1 อธิบายวัดประเมินผลต่าง ๆเพื่อความถูกต้องในการทำนายของ classi จึงเอ้อ ไม่ยอมอ่อนข้อ และสุ่มค่า ( ส่วน 8.5.2 ) ข้ามการตรวจสอบ ( มาตรา 8.5.3 ) และวิธีบูตสแตรป ( มาตรา 8.5.4 ) เป็นเทคนิคทั่วไปสำหรับการประเมินความถูกต้องบนพื้นฐานของการสุ่มแบบพาร์ติชันของข้อมูลที่ได้รับ ถ้าเรามีมากกว่า 1 classi จึงเอ้อและต้องการเลือก " ดีที่สุด " ครับ นี้จะเรียกว่าการเลือกรูปแบบ ( เช่นการเลือกหนึ่ง classi จึงเป็นมากกว่าอีก ) สุดท้ายสองส่วนที่อยู่ปัญหานี้ ส่วน 8.5.5 กล่าวถึงวิธีการใช้การทดสอบทางสถิติ signi จึงแคนส์เพื่อประเมินว่า ความแตกต่างระหว่างสองคือ ความถูกต้องจึง classi ERS เนื่องจากโอกาส ส่วน 8.5.6 เสนอวิธีการเปรียบเทียบ classi ERS จึงขึ้นอยู่กับต้นทุน–ดีจึงไม่ได้รับการปฏิบัติและลักษณะ ( ROC ) เส้นโค้ง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.