Now the issue becomes selecting an

Now the issue becomes selecting an appropriate
value for k. A large k is seemingly desirable, since
with a larger k (i) there are more performance estimates,
and (ii) the training set size is closer to the full
data size, thus increasing the possibility that any conclusion
made about the learning algorithm(s) under
test will generalize to the case where all the data is used
to train the learning model. As k increases, however,
the overlap between training sets also increases. For
example, with 5-fold cross-validation, each training
set shares only 3∕4 of its instances with each of the
other four training sets whereas with 10-fold crossvalidation,
each training set shares 8 ∕ 9 of its instances
with each of the other nine training sets. Furthermore,
increasing k shrinks the size of the test set, leading
to less precise, less fine-grained measurements of the
performance metric. For example, with a test set size of
10 instances, one can only measure accuracy to the
nearest 10%, whereas with 20 instances the accuracy
can be measured to the nearest 5%. These competing
factors have all been considered and the general consensus
in the data mining community seems to be
that k = 10 is a good compromise. This value of k is
particularity attractive because it makes predictions
using 90% of the data, making it more likely to be
generalizable to the full data.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ตอนนี้กลายเป็นปัญหาการเลือกที่เหมาะสม
ค่าสำหรับ k k ขนาดใหญ่เป็นที่พึงปรารถนาดูเหมือนตั้งแต่
ด้วย k ขนาดใหญ่ (i) มีการประเมินผลการปฏิบัติงานมากขึ้น
และ (ii) ขนาดชุดการฝึกอบรมอยู่ใกล้กับเต็ม
ขนาดของข้อมูลซึ่งจะเป็นการเพิ่มความเป็นไปได้ว่าข้อสรุปใด ๆ
ทำเกี่ยวกับ ขั้นตอนวิธีการเรียนรู้ (s) ภายใต้การทดสอบ
จะพูดคุยถึงกรณีที่ข้อมูลทั้งหมดที่ถูกนำมาใช้
ในการฝึกอบรมรูปแบบการเรียนรู้ ตามการเพิ่ม k แต่
ทับซ้อนระหว่างการฝึกอบรมชุดนี้ยังเพิ่ม เพื่อ
เช่นกับ 5 เท่าการตรวจสอบข้ามการฝึกอบรมแต่ละ
หุ้นชุดเพียง 3/4 ของกรณีของตนกับแต่ละ
อีกสี่ชุดในขณะที่มีการฝึกอบรม crossvalidation 10 เท่า
ชุดการฝึกอบรมแต่ละหุ้น 8/9 ของ กรณี
กับแต่ละอื่น ๆ เก้าชุดการฝึกอบรม นอกจาก
เพิ่ม k shrinks ขนาดของชุดทดสอบที่นำ
จะแม่นยำน้อยกว่าการวัดน้อยละเอียดของผลการดำเนินงานตัวชี้วัด
ตัวอย่างเช่นที่มีขนาดของชุดทดสอบ
10 กรณีหนึ่งสามารถวัดความถูกต้องไปยังที่ใกล้ที่สุด
10% ในขณะที่มี 20 กรณีความถูกต้อง
สามารถวัดได้ถึง 5% ที่อยู่ใกล้ที่สุด เหล่านี้การแข่งขัน
ปัจจัยที่ทุกคนได้รับการพิจารณาและมติทั่วไป
ในชุมชนการทำเหมืองข้อมูลน่าจะเป็น
k = 10 ที่มีการประนีประนอมที่ดี ค่า k
นี้เป็นที่น่าสนใจเป็นพิเศษเพราะมันทำให้การคาดการณ์โดยใช้
90% ของข้อมูลที่ทำให้มันมีแนวโน้มที่จะ
ไปใช้ได้กับข้อมูลแบบเต็ม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ตอนนี้ปัญหาจะเลือกแบบที่เหมาะสมใน
ค่า k K ใหญ่เป็นสิ่งที่ต้องดูเหมือน ตั้งแต่
กับ k ใหญ่ (i) มีการประเมินประสิทธิภาพการทำงานเพิ่มเติม,
และ (ii) การฝึกอบรมกำหนดขนาดใกล้ชิดเต็มที่
ขนาดข้อมูล การเพิ่มโอกาสให้บทสรุป
ทำเกี่ยวกับ algorithm(s) เรียนรู้ภายใต้
ทดสอบจะทั่วไปกับกรณีที่มีใช้ข้อมูลทั้งหมดที่
การฝึกรูปแบบการเรียนรู้ เป็น k เพิ่ม แต่,
เหลื่อมกันระหว่างชุดฝึกยังเพิ่มขึ้น สำหรับ
ตัวอย่าง 5-fold ที่ข้ามสอบ ฝึกอบรมแต่ละ
ใช้ร่วมกับแต่ละชุด 3∕4 เฉพาะของอินสแตนซ์ของการ
สี่อื่น ๆ ฝึกอบรมชุดในขณะที่กับ 10-fold crossvalidation,
∕ 8 9 ของอินสแตนซ์ของหุ้นแต่ละชุดฝึกอบรม
กับแต่ละอื่น ๆ 9 ฝึกอบรมชุด นอกจากนี้,
k เพิ่มลดขนาดขนาดของชุดทดสอบ นำ
การวัดแม่นยำน้อยลง ทรายแป้งละเอียดน้อยการ
วัดประสิทธิภาพ ตัวอย่าง กับการทดสอบตั้งค่าขนาดของ
อินสแตนซ์ 10 หนึ่งสามารถเฉพาะวัดแม่นยำ
ใกล้ 10% ในขณะที่กับ 20 อินสแตนซ์ที่ถูกต้อง
สามารถวัด 5% ที่ใกล้ที่สุดได้ เหล่านี้แข่งขัน
ปัจจัยได้ทั้งหมดถูกพิจารณา และมติทั่วไป
ข้อมูล ชุมชนเหมืองน่าจะ
ที่ k = 10 เป็นการประนีประนอมที่ดี นี้ค่าของ k
particularity ที่น่าสนใจเนื่องจากทำให้คาดคะเน
ใช้ 90% ของข้อมูล ทำมัก
generalizable กับข้อมูลทั้งหมด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ในขณะนี้ปัญหาที่จะกลายเป็นการเลือกที่เหมาะสม
ซึ่งจะช่วยมอบความคุ้มค่าสำหรับ K K ที่มีขนาดใหญ่มีอาณาจักรที่พึงปรารถนาตั้งแต่
พร้อมด้วยที่มีขนาดใหญ่กว่า K ( i )มี ประสิทธิภาพ มากขึ้นประมาณ,
และ( ii )การฝึกอบรมตั้งค่าขนาดอยู่ใกล้กับที่
ขนาดข้อมูล,ดังนั้นจึงเป็นการเพิ่มความเป็นไปได้ที่ใดๆในบทสรุปเกี่ยวกับ
ซึ่งจะช่วยทำให้การเรียนรู้อัลกอริธึม( S ) ภายใต้
การทดสอบจะทำให้กรณีที่ทั้งหมดที่มีการใช้ข้อมูล
ในการฝึกอบรมรุ่นการเรียนรู้ เป็นกม.เพิ่มขึ้นอย่างไรก็ตาม
เหลื่อมซ้อนระหว่างชุดการฝึกอบรมยังจะเพิ่มขึ้น ตัวอย่างเช่น
ซึ่งจะช่วยให้การด้วย 5 - พับข้าม - การตรวจสอบ,การฝึกอบรมแต่ละ
ซึ่งจะช่วยตั้งค่าหุ้นเพียง 3 ∕ 4 ของแต่ละกรณีด้วย
อื่นๆของที่สี่การฝึกอบรมชุดในขณะที่พร้อมด้วย 10 - พับ crossvalidation ,
แต่ละการฝึกอบรมตั้งค่าหุ้น 8 ∕ 9 ของแต่ละกรณี
พร้อมด้วยของที่อื่นๆเก้าการฝึกอบรมชุด. ยิ่งไปกว่านั้น
K เพิ่มขึ้น ภูเขา ,ขนาดของตั้งค่าการทดสอบที่นำไปวัดน้อยเนื้อละเอียด
ซึ่งจะช่วยในการลดลงได้อย่างแม่นยำของ
ซึ่งจะช่วยเพิ่ม ประสิทธิภาพ ให้ระบบเมตริก ตัวอย่างเช่นด้วยขนาดตั้งค่าการทดสอบ
10 กรณีหนึ่งสามารถวัดความแม่นยำ
ที่อยู่ใกล้ที่สุด 10% ในขณะที่มี 20 กรณีความถูกต้อง
สามารถวัดได้ถึง 5% ที่อยู่ใกล้ที่สุดเท่านั้น แข่งขัน
ปัจจัยเหล่านี้ได้ทั้งหมดได้รับการพิจารณาให้เป็นและความสอดคล้องต้องกัน
ในชุมชนการทำเหมืองแร่ข้อมูลดูเหมือนจะเป็น
ที่ K = 10 เป็นการประนีประนอมที่ดี ค่านี้ของ K
ซึ่งจะช่วยเป็นรายการที่ดึงดูดใจเพราะมันทำให้การทำนาย
การใช้ 90% ของข้อมูลที่ทำให้มีแนวโน้มมากขึ้นที่จะได้
generalizable ข้อมูลอย่างเต็มที่

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.