Training iteration t determines the number of unlabeled design configurations that are used for improving prediction accuracy. The experiment conducted here follows the same parameter setting (except t) as the previous experiments.
Figure 4 shows the relationship between the MSE of COAL and t, where 8 bench- marks, applu, apsi, bzip2, crafty, eon, lucas, mgrid and vortex, are considered. In gen- eral, the MSE (red curves in Figure 4) roughly decreases as the number of iterations increases. For example, on benchmark applu, the MSE of the COAL trained with 100 iterations is 63.5% of that of the COAL trained with only 10 iterations. However, when the number of iterations has become large enough, on several benchmarks the MSE may decrease with a relatively slower speed. This is not difficult to understand. On one hand, according to theoretical studies [Wang and Zhou 2007], disagreement-based approaches require a large difference between the learners, while when a large num- ber of iterations has been executed, the learners will become too similar to enable a further performance improvement. On the other hand, after a large number of labeled examples are obtained, the gains from exploiting unlabeled data become smaller.
Figure 4 also illustrates the training cost of COAL given different training iterations. We can clearly see that the training cost of COAL grows almost linearly with respect to t (black curves in Figure 4). Hence, if the computational resources are limited, it would be beneficial if t is determined by trading off the gained prediction accuracy and training costs, which can be achieved by setting more sophisticated stopping criterion for COAL. The related investigation will be conducted in our future work.
ฝึกอบรมทีการเกิดซ้ำกำหนดจำนวนของค่าออกแบบเพียงที่ใช้สำหรับปรับปรุงความแม่นยำในการทำนาย ทดลองดำเนินการต่อตามการตั้งค่าพารามิเตอร์เดียวกัน (ยกเว้น t) เป็นการทดลองก่อนหน้านี้รูปที่ 4 แสดงความสัมพันธ์ระหว่าง MSE ของถ่านหินและ t, 8 เครื่อง หมายม้า applu, apsi, bzip2, crafty อินเตอร์ eon ลูคัส mgrid และ vortex ถือเป็นการ ใน gen eral, MSE (เส้นโค้งสีแดงในรูปที่ 4) ประมาณลดเป็นจำนวนซ้ำเพิ่มขึ้น ตัวอย่าง ในมาตรฐาน applu, MSE ของถ่านหินที่ผ่านการฝึกอบรมกับการวนซ้ำ 100 เป็น 63.5% ที่ถ่านหินที่ฝึกฝน ด้วยซ้ำเพียง 10 อย่างไรก็ตาม เมื่อจำนวนการเกิดซ้ำเป็นพอ บนเกณฑ์มาตรฐานหลาย MSE ที่อาจลดลง ด้วยความเร็วค่อนข้างช้า นี่ไม่ใช่เรื่องยากที่จะเข้าใจ บนมือหนึ่ง ตามทฤษฎีศึกษา [วังและโจว 2007], กันตามแนวทางต้องการความแตกต่างขนาดใหญ่ระหว่างเรียน ในขณะที่เมื่อ num-ber จำนวนมากที่เกิดซ้ำมีการปฏิบัติ ผู้เรียนจะกลายเป็นเหมือนการเปิดใช้งานการปรับปรุงประสิทธิภาพการทำงานเพิ่มเติม ในทางกลับกัน หลังจากจำนวนตัวอย่างป้ายจะได้รับ กำไรจาก exploiting ข้อมูลไม่เป็นขนาดเล็กรูปที่ 4 แสดงต้นทุนฝึกอบรมของถ่านหินที่ได้รับการฝึกอบรมแตกต่างกันซ้ำยัง นอกจากนี้เราชัดเจนจะเห็นได้ว่า ต้นทุนฝึกอบรมของถ่านหินขึ้นเกือบเชิงเส้นกับ t (สีดำเส้นโค้งในรูปที่ 4) ดังนั้น ถ้าทรัพยากรคอมพิวเตอร์จำกัด มันจะเป็นประโยชน์ถ้าไม่เป็นไปตามค้าทายได้ถูกต้องและต้นทุนการฝึกอบรม ซึ่งสามารถทำได้ โดยการตั้งค่าเพิ่มเติมซับซ้อนหยุดเงื่อนไขสำหรับถ่านหิน จะดำเนินการตรวจสอบที่เกี่ยวข้องในการทำงานของเราในอนาคต
การแปล กรุณารอสักครู่..
ย้ำการฝึกอบรมทีกำหนดจำนวนของการกำหนดค่าการออกแบบที่ไม่มีป้ายกำกับที่ใช้สำหรับการปรับปรุงความถูกต้องคาดการณ์ การทดลองดำเนินการที่นี่ต่อไปนี้การตั้งค่าพารามิเตอร์เดียวกัน (ยกเว้นตัน) ในขณะที่การทดลองที่ผ่าน
รูปที่ 4 แสดงให้เห็นถึงความสัมพันธ์ระหว่าง MSE ของถ่านหินและเสื้อที่ 8 บัลลังก์เครื่องหมาย applu, Apsi, bzip2, ฝีมือ, กัป, ลูคัส, mgrid และกระแสน้ำวนได้รับการพิจารณา ใน eral gen-, MSE (เส้นโค้งสีแดงในรูปที่ 4) ประมาณลดลงเป็นจำนวนที่เพิ่มขึ้นซ้ำ ยกตัวอย่างเช่นใน applu มาตรฐาน MSE ของถ่านหินได้รับการฝึกฝนกับ 100 ซ้ำเป็น 63.5% จากการที่ถ่านหินผ่านการฝึกอบรมมีเพียง 10 ซ้ำ แต่เมื่อจำนวนของการแสดงได้กลายเป็นขนาดใหญ่พอในหลายมาตรฐาน MSE อาจลดลงด้วยความเร็วที่ค่อนข้างช้า นี้ไม่ยากที่จะเข้าใจ หนึ่งในมือตามการศึกษาทฤษฎี [วังและโจว 2007] วิธีการไม่เห็นด้วยที่ใช้ต้องมีความแตกต่างกันมากระหว่างผู้เรียนในขณะที่เมื่อมีจานวนมากซ้ำได้รับการดำเนินการเรียนจะกลายเป็นที่คล้ายกันเกินไปเพื่อให้การเพิ่มเติม ปรับปรุงประสิทธิภาพการทำงาน ในทางตรงกันข้ามหลังจากที่จำนวนมากของตัวอย่างที่ระบุว่าจะได้รับกำไรจากการใช้ประโยชน์จากข้อมูลที่ไม่มีป้ายกำกับกลายเป็นขนาดเล็ก
รูปที่ 4 ยังแสดงให้เห็นถึงค่าใช้จ่ายในการฝึกอบรมของถ่านหินที่ได้รับการฝึกอบรมที่แตกต่างกันซ้ำ เราสามารถเห็นได้ชัดเจนว่าค่าใช้จ่ายการฝึกอบรมของถ่านหินเติบโตเกือบจะเป็นเส้นตรงด้วยความเคารพต่อตัน (เส้นโค้งสีดำในรูปที่ 4) ดังนั้นหากทรัพยากรการคำนวณจะถูก จำกัด ก็จะเป็นประโยชน์ถ้าเสื้อจะถูกกำหนดโดยปิดการซื้อขายได้รับการทำนายความถูกต้องและการฝึกอบรมค่าใช้จ่ายซึ่งสามารถทำได้โดยการตั้งค่าเกณฑ์การหยุดความซับซ้อนมากขึ้นสำหรับถ่านหิน การสอบสวนที่เกี่ยวข้องจะต้องดำเนินการในการทำงานในอนาคตของเรา
การแปล กรุณารอสักครู่..
ไม่ทำซ้ำการฝึกอบรมกําหนดจํานวนของการออกแบบแบบใกล้เคียงที่ใช้สำหรับการปรับปรุงความถูกต้องพยากรณ์ ทดลองใช้ที่นี่ตามเดียวกันการตั้งค่าพารามิเตอร์ ( ยกเว้น t ) เช่นการทดลองก่อนหน้านี้
รูปที่ 4 แสดงความสัมพันธ์ระหว่าง MSE ของถ่านหินและ t ที่ 8 ม้านั่ง - เครื่องหมาย applu apsi bzip2 , , , เจ้าเล่ห์ ออน และ ลูคัส mgrid vortex , พิจารณาใน Gen - ที่ , MSE ( เส้นสีแดงในรูปที่ 4 ) ประมาณลดลง เมื่อเพิ่มจำนวนรอบ . ตัวอย่างเช่น มาตรฐาน applu , MSE ของถ่านหินกับฝึก 100 รอบคือ 63.5% ของของถ่านหินที่ฝึกเพียง 10 รอบ . อย่างไรก็ตาม เมื่อจำนวนรอบได้กลายเป็นขนาดใหญ่เพียงพอในมาตรฐานหลาย MSE อาจลดลงด้วยความเร็วค่อนข้างช้านี้ไม่ยากที่จะเข้าใจ บนมือข้างหนึ่ง , ตามการศึกษา [ 2007 ] ทฤษฎีวังและโจว ความขัดแย้งตามแนวทางต้องมีความแตกต่างใหญ่ระหว่างผู้เรียน ในขณะที่เมื่อมีขนาดใหญ่น้ำ - เบอร์ของซ้ำถูกประหารชีวิต ผู้เรียนจะกลายเป็นมากเกินไปคล้ายกับงานการปรับปรุงประสิทธิภาพต่อไป บนมืออื่น ๆหลังจากที่จำนวนมากของข้อความตัวอย่างจะได้รับผลประโยชน์จากการใช้ประโยชน์จากข้อมูลใกล้เคียงกลายเป็นขนาดเล็ก .
รูปที่ 4 นอกจากนี้ยังแสดงให้เห็นถึงการได้รับต้นทุนถ่านหินรอบการฝึกอบรมที่แตกต่างกัน เราสามารถเห็นได้อย่างชัดเจนว่า ต้นทุนของถ่านหินการเติบโตเกือบเป็นเส้นตรงด้วยความเคารพ T ( เส้นสีดำในรูปที่ 4 ) ดังนั้น ถ้าคอมพิวเตอร์มีทรัพยากรจำกัดมันจะเป็นประโยชน์ถ้าไม่ได้ถูกกำหนดโดยการซื้อขายปิดได้รับความถูกต้องการคาดการณ์และค่าใช้จ่ายในการฝึกอบรม ซึ่งสามารถทำได้โดยการตั้งค่าที่ซับซ้อนมากขึ้นสำหรับเกณฑ์หยุดถ่านหิน การสืบสวนที่เกี่ยวข้องจะดำเนินการในการทำงานในอนาคตของเรา
การแปล กรุณารอสักครู่..