Abstract
This thesis consists of complementary studies concerned with the ensemble
learning scheme Stacking (Wolpert, 1992) We will explore various aspects of
its behaviour and also clarify its relation to related ensemble learning schemes
in two ways: by showing that it is usually the best choice among ensemble learning
schemes2 and also by demonstrating that most ensemble learning schemes
can be simulated by Stacking (Chapter 7), making it the most general ensemble
learning scheme.
In the first chapter, we give an overview of what Stacking is and how it works,
combined with a short roadmap to this thesis.
In Chapter 2, we present an overview of related research for Stacking, considering
both state of the art approaches and unique contributions to this field.
In Chapter 3, we explore the parameter state space of Stacking. We systematically
investigate Stacking with an exhaustive set of base classifiers, diverse
meta classifiers and two related types of meta data. We propose default settings
of all these parameters, grounded by empirical and theoretical arguments. This
chapter is an extended version of (Seewald, 2002c).
In Chapter 4, we investigate regression meta learning, trying to predict Stacking’s
accuracy from a variety of dataset-related and base-classifier-related features.
We also investigate classification meta learning, trying to predict signifi-
cant differences between related ensemble learning schemes directly on a datasetby-dataset
basis. This chapter is an extended version of (Seewald, 2002b).
In Chapter 5, we introduce a variant, StackingC, which improves Stacking’s
performance further, reduces computational cost and also resolves a significant
weakness found during the course of our experiments. This chapter is an extended
version of (Seewald, 2002a).
In Chapter 6, we present results from an alternative paradigm to compare
classifiers. We investigate the hypothesis that StackingC is more stable than other
ensemble learning schemes, i.e. that its learning curve is at the uppermost level
of all learning curves. Surprisingly, we find that there is no significant difference
between all considered schemes within this paradigm.
In Chapter 7, we show that all ensemble learning systems, including StackingC,
Grading (Seewald & Furnkranz, ¨ 2001) and even Bagging (Breiman, 1996)
can be simulated by Stacking. For this we give functionally equivalent definitions
of most schemes as meta classifiers for Stacking.
In Chapter 8, we shortly introduce the field of Information Visualization
and apply it to the problem of visualizing our twenty-six datasets and extensive
experimental results. We find that the majority of examples are misclassified
because none of the base classifiers predict correctly. Although Stacking would
potentially be able to learn from such a setting, this is not observed. On the
contrary, Stacking even predicts incorrectly when a majority of base classifiers
predicts correctly. Full page figures for all datasets can be found in Appendix
A.
Finally, in Chapter 9, we conclude this thesis with a summary of our main
findings, an overall conclusion and an outlook on future research.
บทคัดย่อวิทยานิพนธ์นี้ประกอบด้วยการศึกษาเพิ่มเติมเกี่ยวข้องกับวงการดนตรีเรียนรู้โครงร่าง Stacking (Wolpert, 1992) ที่เราจะศึกษาด้านต่าง ๆพฤติกรรมของมัน และยัง ชี้แจงความสัมพันธ์กับวงดนตรีที่เกี่ยวข้องกับแผนการเรียนรู้วิธีที่ 2: โดยแสดงว่า เป็นปกติดีนี่เรียนรู้วงดนตรีschemes2 และยังเห็นวงดนตรีส่วนใหญ่เรียนรู้แผนงานที่สามารถจำลอง โดย Stacking (หมวด 7), ทำให้วงดนตรีทั่วไปส่วนใหญ่แผนการเรียนรู้ในบทแรก เราให้ภาพรวมของ Stacking คืออะไรและวิธีการทำงานร่วมกับแผนงานระยะสั้นให้วิทยานิพนธ์นี้ในบทที่ 2 เรานำเสนอภาพรวมของงานวิจัยที่เกี่ยวข้องสำหรับซ้อน consideringแนวทันสมัยและจัดสรรเฉพาะฟิลด์นี้ในบทที่ 3 เราสำรวจพื้นที่สถานะพารามิเตอร์ของ Stacking เราเป็นระบบตรวจสอบ Stacking เป็นชุดครบถ้วนสมบูรณ์ของคำนามพื้นฐานภาษา หลากหลายคำนามภาษา meta และสองชนิดที่เกี่ยวข้องของข้อมูลเมตา เราเสนอการตั้งค่าเริ่มต้นของพารามิเตอร์ทั้งหมดเหล่านี้ สูตร โดยอาร์กิวเมนต์ประจักษ์ และทฤษฎีการ นี้บทจะเป็นรุ่นแบบขยาย (Seewald, 2002c)ในบทที่ 4 เราตรวจสอบ meta ถดถอยเรียน พยายามทำนายของ Stackingความถูกต้องจากความหลากหลายของชุดข้อมูลที่เกี่ยวข้อง และฐาน classifier ที่เกี่ยวข้องกับเรายังตรวจสอบการจัดประเภทเมตาเรียน พยายามที่จะทำนายความ-ความแตกต่างระหว่างวงดนตรีที่เกี่ยวข้องเรียนรู้โครงร่างในการชุดข้อมูล datasetby ต้อนพื้นฐาน บทนี้เป็นการขยายรุ่น (Seewald, 2002b)ในบทที่ 5 เรานำตัวแปร StackingC การปรับปรุงของ Stackingประสิทธิภาพลดต้นทุนการคำนวณ และแก้สำคัญเพิ่มเติมจุดอ่อนที่พบในระหว่างการทดลองของเรา บทนี้เป็นการขยายรุ่น (Seewald, 2002a)ในบทที่ 6 เรานำเสนอผลลัพธ์จากการกระบวนทัศน์ทางเลือกเพื่อเปรียบเทียบคำนามภาษา เราตรวจสอบสมมติฐานที่ว่า StackingC มีเสถียรภาพมากขึ้นกว่าที่อื่น ๆวงดนตรีแบบแผน การเรียนรู้เช่นที่เส้นโค้งการเรียนรู้อยู่ในระดับสูงสุดของเส้นโค้งการเรียนรู้ทั้งหมด จู่ ๆ เราพบว่า มีความไม่แตกต่างอย่างมีนัยสำคัญระหว่างพิจารณาโครงร่างภายในกระบวนทัศน์นี้ในบทที่ 7 เราแสดงว่าทั้งหมดเรียนรู้ระบบ รวมถึง StackingC วงดนตรีการจัดเกรด (Seewald & Furnkranz, 2001 เลขจด) และแม้แต่เย็บถุง (Breiman, 1996)สามารถจำลอง โดย Stacking ซึ่งเราให้คำนิยามที่มีฟังก์ชันเทียบเท่าโครงร่างส่วนใหญ่เป็นคำนามภาษา meta สำหรับ Stackingในบทที่ 8 เราเร็ว ๆ แนะนำด้านการแสดงภาพประกอบเพลงข้อมูลสามารถใช้กับปัญหาของ datasets ยี่สิบหกของเรา และครอบคลุมผลการทดลอง เราพบว่า ตัวอย่างส่วนใหญ่เป็นงานเนื่องจากไม่มีคำนามภาษาฐานทำนายอย่างถูกต้อง แม้ว่า Stacking จะอาจจะต้องเรียนรู้เช่นการตั้งค่า นี้จะสังเกตไม่ ในการตรงกันข้าม ซ้อนแม้จะทำนายไม่ถูกต้องเมื่อส่วนใหญ่ของคำนามภาษาพื้นฐานทำนายได้อย่างถูกต้อง ตัวเลขหน้าเต็มสำหรับทุก datasets สามารถพบได้ในภาคผนวกอ.สุดท้าย ในบทที่ 9 เราสรุปวิทยานิพนธ์นี้ มีสรุปหลักของเราค้นพบ การสรุปรวม และทัศนะเกี่ยวกับการวิจัยในอนาคต
การแปล กรุณารอสักครู่..
บทคัดย่อวิทยานิพนธ์ฉบับนี้ประกอบด้วยการศึกษาเสริมที่เกี่ยวข้องกับชุดรูปแบบการเรียนรู้ที่ซ้อน(Wolpert 1992) เราจะสำรวจด้านต่างๆของพฤติกรรมและชี้แจงความสัมพันธ์กับรูปแบบการเรียนรู้ที่เกี่ยวข้องกับวงดนตรีในสองวิธีโดยแสดงให้เห็นว่ามันมักจะเป็นตัวเลือกที่ดีที่สุดในหมู่ชุดการเรียนรู้schemes2 และยังแสดงให้เห็นว่าวงดนตรีมากที่สุดรูปแบบการเรียนรู้ที่สามารถจำลองโดยซ้อน(บทที่ 7) ทำให้มันเป็นชุดทั่วไปมากที่สุดรูปแบบการเรียนรู้. ในบทแรกที่เราจะให้ภาพรวมของสิ่งที่ซ้อนและวิธีการทำงานรวมกับแผนงานระยะสั้นไปวิทยานิพนธ์ฉบับนี้. ในบทที่ 2 เรานำเสนอภาพรวมของการวิจัยที่เกี่ยวข้องกับการซ้อนการพิจารณาของรัฐทั้งสองวิธีการและผลงานศิลปะที่ไม่ซ้ำกับข้อมูลนี้. ในบทที่ 3 เราจะสำรวจพื้นที่พารามิเตอร์ของรัฐซ้อน เรามีระบบการตรวจสอบซ้อนกับชุดที่ครบถ้วนสมบูรณ์ของลักษณนามฐานความหลากหลายลักษณนามเมตาและทั้งสองประเภทที่เกี่ยวข้องกับข้อมูลmeta เราเสนอตั้งค่าเริ่มต้นของตัวแปรเหล่านี้มีเหตุผลโดยการขัดแย้งเชิงประจักษ์และทฤษฎี นี้บทเป็นรุ่นที่ขยายของ (Seewald, 2002c). ในบทที่ 4 เราจะตรวจสอบการเรียนรู้การถดถอยเมตาพยายามที่จะคาดการณ์ซ้อนของความถูกต้องจากความหลากหลายของคุณสมบัติชุดข้อมูลที่เกี่ยวข้องและที่เกี่ยวข้องกับฐานจําแนก. นอกจากนี้เรายังตรวจสอบการจัดหมวดหมู่การเรียนรู้เมตา พยายามที่จะคาดการณ์ signifi- ความแตกต่างระหว่างลาดเทรูปแบบการเรียนรู้ที่เกี่ยวข้องกับวงดนตรีโดยตรงบน datasetby-ชุดข้อมูลพื้นฐาน บทนี้เป็นรุ่นที่ขยายของ (Seewald, 2002b). ในบทที่ 5 เราแนะนำตัวแปร, StackingC ที่ช่วยเพิ่มการซ้อนของผลการดำเนินงานต่อไปลดค่าใช้จ่ายในการคำนวณและยังช่วยแก้ปัญหาอย่างมีนัยสำคัญอ่อนแอพบในระหว่างการทดลองของเรา บทนี้เป็นขยายรุ่น (Seewald, 2002a). ในบทที่ 6 เรานำเสนอผลจากกระบวนทัศน์ทางเลือกเพื่อเปรียบเทียบแยกแยะ เราจะตรวจสอบสมมติฐานที่ว่า StackingC มีเสถียรภาพมากขึ้นกว่าที่อื่น ๆรูปแบบการเรียนรู้ทั้งมวลคือว่าการเรียนรู้ที่อยู่ในระดับบนสุดของเส้นโค้งการเรียนรู้ทั้งหมด น่าแปลกที่เราจะพบว่าไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างรูปแบบการพิจารณาทั้งหมดภายในกระบวนทัศน์นี้. ในบทที่ 7 เราแสดงให้เห็นว่าระบบการเรียนรู้ทั้งมวลรวมทั้ง StackingC, การวัดผลการศึกษา (Seewald และ Furnkranz, ¨ 2001) และแม้กระทั่งการบรรจุถุง (Breiman, 1996) สามารถจำลองโดยซ้อน สำหรับวันนี้เราให้คำจำกัดความเทียบเท่าหน้าที่ของรูปแบบที่สุดเท่าที่จําแนก meta สำหรับซ้อน. ในบทที่ 8 เราไม่นานแนะนำด้านการแสดงข้อมูลและนำไปใช้ในการแก้ไขปัญหาของการแสดงชุดข้อมูลยี่สิบหกและครอบคลุมของเราผลการทดลอง เราพบว่าส่วนใหญ่ของตัวอย่างที่มีการแบ่งเพราะไม่มีการแยกแยะฐานทำนายได้อย่างถูกต้อง แม้ว่าจะซ้อนที่อาจจะสามารถที่จะเรียนรู้จากการตั้งค่าดังกล่าวนี้จะไม่ได้สังเกต ในทางตรงกันข้ามซ้อนแม้คาดการณ์ไม่ถูกต้องเมื่อเสียงส่วนใหญ่ของลักษณนามฐานคาดการณ์ได้อย่างถูกต้อง ตัวเลขหน้าเต็มรูปแบบสำหรับชุดข้อมูลทั้งหมดสามารถพบได้ในภาคผนวกกสุดท้ายในบทที่9 เราสรุปงานวิจัยนี้มีบทสรุปของหลักของเราค้นพบข้อสรุปโดยรวมและแนวโน้มในการวิจัยในอนาคต
การแปล กรุณารอสักครู่..
บทคัดย่องานวิจัยนี้ประกอบด้วยการศึกษาเสริม
เรียนเกี่ยวข้องกับวงดนตรีแบบซ้อน ( โวลเพิร์ต , 1992 ) เราจะดูด้านต่างๆของตนและยังชี้แจง
พฤติกรรมความสัมพันธ์ของรูปแบบการเรียนรู้ที่เกี่ยวข้อง ensemble
ในสองวิธี : โดยการแสดงให้เห็นว่ามันมักจะเลือกที่ดีที่สุดระหว่างชุดการเรียนรู้
schemes2 และยังแสดงให้เห็นว่า ชุดการเรียนรู้มากที่สุดรูปแบบ
สามารถจำลองโดยซ้อน ( บทที่ 7 ) ทำให้ทั่วไป ensemble
เรียนแบบ ในบทแรก , เราให้ภาพรวมของสิ่งที่ซ้อนและวิธีการทํางาน ,
รวมกับแผนงานสั้นการศึกษา .
ในบทที่ 2 เราได้นำเสนอภาพรวมของการวิจัยที่เกี่ยวข้องกับการเรียงซ้อน พิจารณา
ทั้งของรัฐของศิลปะแนวทางและเอกลักษณ์ให้กับสาขานี้ .
ในบทที่ 3เราสำรวจสภาพพื้นที่ของพารามิเตอร์เรียงซ้อน เรามีระบบตรวจสอบซ้อนกับชุดสมบูรณ์
Meta คำลักษณนามฐาน หลากหลายคำสองประเภทที่เกี่ยวข้องและ meta ข้อมูล เรานำเสนอการตั้งค่าเริ่มต้น
ของพารามิเตอร์เหล่านี้ ถูกกักบริเวณโดยเชิงประจักษ์ทฤษฎีและเหตุผล บทนี้
เป็นรุ่นขยาย ( seewald 2002c , ) .
ในบทที่ 4เราตรวจสอบขั้นตอนการเรียนรู้เมตา , พยายามที่จะทำนายซ้อนของ
ความถูกต้องจากความหลากหลายของข้อมูลที่เกี่ยวข้องและฐานจนได้คุณสมบัติที่เกี่ยวข้อง .
เรายังตรวจสอบหมวดหมู่ Meta การเรียนรู้ พยายามที่จะทำนาย signifi -
ไม่ได้เกี่ยวข้องกับการเรียนรู้ความแตกต่างระหว่างชุดรูปแบบโดยตรงบน datasetby
ข้อมูลพื้นฐาน บทนี้เป็นรุ่นที่ขยายของ ( seewald 2002b ,
ในบทที่ 5 )เราแนะนำแตกต่าง stackingc ซึ่งช่วยเพิ่มประสิทธิภาพของการซ้อน
เพิ่มเติม ช่วยลดต้นทุน การคำนวณ และยังช่วยแก้ปัญหาทางด้าน
จุดอ่อนที่พบในระหว่างการทดลองของเรา บทนี้จะขยายรุ่นของ ( seewald
,
2002a ) . ในบทที่ 6 ที่เรานำเสนอผลลัพธ์จากกระบวนทัศน์ทางเลือกเปรียบเทียบ
ลักษณนามเราตรวจสอบสมมติฐานที่ว่า stackingc มีเสถียรภาพมากขึ้นกว่าที่อื่น ๆ รูปแบบการเรียนรู้
ทั้งมวล เช่นว่า เส้นโค้งการเรียนรู้ที่ระดับบนสุด
ของทุกการเรียนรู้โค้ง จู่ ๆ เราพบว่า ไม่มีความแตกต่างระหว่างการพิจารณาโครงร่างภายในกระบวนทัศน์
.
ในบทที่ 7 เราทั้งหมดทั้งมวลแสดงให้เห็นว่าระบบการเรียนรู้ รวมทั้ง stackingc
,ให้คะแนน ( seewald furnkranz ตั้ง& , 2001 ) และแม้กระทั่งถุง ( breiman , 1996 )
สามารถจำลองโดยเรียงซ้อน สำหรับเรื่องนี้เราให้ตามหน้าที่เท่ากับคำนิยามของโครงการส่วนใหญ่เป็นคำ meta
สำหรับเรียงซ้อน ในบทที่ 8 เราไม่นานแนะนำสาขา
การแสดงข้อมูลและใช้กับปัญหาของการแสดงผลข้อมูลและผลการทดลองอย่างละเอียดยี่สิบหกของเรา
เราพบว่าส่วนใหญ่ของตัวอย่าง misclassified
เพราะไม่มีฐานลักษณนามทำนายได้อย่างถูกต้อง แม้ว่าซ้อนจะ
อาจจะได้เรียนรู้จากการตั้งค่าดังกล่าวนี้จะไม่ได้สังเกต ในทางตรงกันข้ามแม้
ซ้อนคาดการณ์ไม่ถูกต้องเมื่อส่วนใหญ่ของคำฐาน
คาดการณ์ได้อย่างถูกต้อง รูปภาพเต็มหน้าทุกชุดข้อมูลที่สามารถพบได้ในภาคผนวก
A
ในที่สุดในบทที่ 9 สรุปได้วิทยานิพนธ์ฉบับนี้ มีสาระสำคัญสรุปหลัก
ของเรา สรุปโดยรวม และแนวโน้มการวิจัยในอนาคต
การแปล กรุณารอสักครู่..