17.4 PREPROCESSING AND PARAMETER TU

17.4 PREPROCESSING AND PARAMETER TUNING
Now we look at some useful preprocessing techniques, which are implemented as
filters, as well as a method for automatic parameter tuning.
Discretization
As we know, there are two types of discretization techniques: unsupervised ones,
which are “class blind,” and supervised ones, which take the class value of the
instances into account when creating intervals. Weka’s main unsupervised method
for discretizing numeric attributes is weka.filters.unsupervised.attribute.Discretize.
It implements these two methods: equal-width (the default) and equal-frequency
discretization.
Find the glass dataset glass.arff and load it into the Explorer interface. Apply the
unsupervised discretization filter in the two different modes explained previously.
Exercise 17.4.1. What do you observe when you compare the histograms
obtained? The one for equal-frequency discretization is quite skewed for some
attributes. Why?
The main supervised technique for discretizing numeric attributes is weka.filters.
supervised.attribute.Discretize. Locate the iris data, load it, apply the supervised
discretization scheme, and look at the histograms obtained. Supervised discretization
strives to create intervals within which the class distribution is consistent, although
the distributions vary from one interval to the next.
Exercise 17.4.2. Based on the histograms obtained, which of the discretized
attributes would you consider to be most predictive? Reload the glass data and
apply supervised discretization to it.
Exercise 17.4.3. For some attributes there is only a single bar in the histogram.
What does that mean?
Discretized attributes are normally coded as nominal attributes, with one value
per range. However, because the ranges are ordered, a discretized attribute is actually
on an ordinal scale. Both filters have the ability to create binary attributes rather than
multivalued ones, by setting the option makeBinary to true.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

17.4 ประมวลผลเบื้องต้นและพารามิเตอร์ TUNING
ตอนนี้เรามองประโยชน์เบื้องเทคนิคบาง ซึ่งใช้เป็น
กรอง ตลอดจนวิธีการปรับแต่งพารามิเตอร์อัตโนมัติ.
Discretization
เรารู้ มีสองประเภทของเทคนิคการ discretization: unsupervised คน,
ซึ่งเป็น "คลาสตาบอด" มีคน ซึ่งใช้ค่าระดับของการ
กรณีพิจารณาเมื่อสร้างช่วง วิธี unsupervised หลักของ weka
discretizing แอตทริบิวต์ที่เป็นตัวเลขเป็น weka.filters.unsupervised.attribute.Discretize.
It ใช้สองวิธี: ความกว้างเท่ากัน (เริ่มต้น) และความถี่เท่ากับ
discretization.
glass.arff ชุดข้อมูลแก้วค้นหา และโหลดเข้าไปในอินเทอร์เฟซ Explorer ใช้การ
กรอง unsupervised discretization ในสองโหมดที่แตกต่างกันอธิบายก่อนหน้านี้
กาย 17.4.1 อะไรทำคุณสังเกตเห็นเมื่อคุณเปรียบเทียบฮิสโตแกรม
รับ ค่อนข้างมีเบ้หนึ่งสำหรับความถี่เท่ากับ discretization บาง
แอตทริบิวต์ ทำไม?
หลักแบบมีผู้สอนเทคนิคสำหรับการ discretizing แอตทริบิวต์ที่เป็นตัวเลขเป็น weka.filters.
supervised.attribute.Discretize ค้นหาข้อมูลไอริส โหลด ใช้ที่มี
discretization โครงร่าง และดูฮิสโตแกรมที่ได้รับการ แบบมีผู้สอน discretization
เพื่อสร้างช่วงเวลาที่การกระจายชั้นเรียนมีความสอดคล้อง แม้ว่า
การกระจายที่แตกต่างไปจากช่วงหนึ่งไปถัดไป
กาย 17.4.2 การ จากฮิสโตแกรมที่ได้รับ ซึ่งของที่ discretized
คุณลักษณะคุณยิ่งต้องคาดการณ์มากที่สุด โหลดข้อมูลแก้ว และ
ใช้ discretization มีไป
กาย 17.4.3 สำหรับบางแอตทริบิวต์ มีเพียงแถบเดียวในฮิสโตแกรม
อะไรไม่ว่าหมายถึง?
Discretized แอตทริบิวต์จะมีโค้ดเป็นแอตทริบิวต์ระบุ ค่าหนึ่งปกติ
ต่อช่วงนั้น อย่างไรก็ตาม เนื่องจากมีสั่งช่วง แอตทริบิวต์ discretized เป็นจริง
ในระดับความหมายสัญลักษณ์ ตัวกรองทั้งสองมีความสามารถในการสร้างแอตทริบิวต์นารี rather กว่า
คนมีหลายค่า โดย makeBinary ตัวเลือกตั้งค่าเป็น true

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

และเน้นการเตรียมการปรับค่าพารามิเตอร์
ตอนนี้เรามาดูเทคนิคการเตรียมที่มีประโยชน์ซึ่งจะใช้เป็น
กรอง รวมทั้งวิธีการปรับค่าพารามิเตอร์อัตโนมัติ

เท่าที่เรารู้ มีอยู่สองชนิดของเทคนิคค่า : unsupervised ทั้งหลาย
ซึ่งเป็น " ชั้นตาบอด " และดูแลอยู่ ซึ่งใช้เวลาระดับค่าของ
กรณีเข้าบัญชีเมื่อการสร้างช่วงเวลา เวก้าเป็นหลักวิธีการสำหรับ discretizing unsupervised
คุณลักษณะตัวเลขเป็นเวก้า ตัวกรอง . unsupervised คุณลักษณะ discretize .
มันใช้สองวิธีการเหล่านี้ : ความกว้างเท่ากัน ( ค่าเริ่มต้น ) และค่าความถี่เท่ากับ
.
หาแก้วข้อมูล glass.arff และโหลดลงใน Explorer อินเตอร์เฟซ ใช้
ตัวกรองค่า unsupervised ใน 2 โหมดที่แตกต่างกันอธิบายก่อนหน้านี้
ออกกำลังกาย 17.4.1 . สิ่งที่คุณสังเกตเมื่อคุณเปรียบเทียบฮิสโตแกรม
ได้รับ ? หนึ่งสำหรับค่าความถี่เท่ากับค่อนข้างลาดสําหรับบาง
แอตทริบิวต์ ทำไม ?
หลักดูแลเทคนิค discretizing คุณลักษณะตัวเลขเป็นเวก้า ตัวกรอง .
supervised.attribute.discretize . ค้นหาข้อมูล ม่านตา โหลด มันใช้ควบคุมค่า
โครงการและดูฮิสโตแกรมที่ได้ ดูแลค่า
มุ่งมั่นที่จะสร้างช่วงเวลาภายในซึ่งชั้นเรียนกระจายสม่ำเสมอ แม้ว่า
กระจายแตกต่างไปจากช่วงการต่อไป
ออกกำลังกาย 17.4.2 . จากฮิสโตแกรมแบบจุดได้ ซึ่งจากคุณสมบัติที่คุณจะต้องพิจารณาที่จะ
ทำนายมากที่สุดโหลดแก้วข้อมูล และใช้ค่าดูแลมัน
.
ออกกำลังกาย 17.4.3 . สำหรับคุณลักษณะบางอย่างมีเพียงแถบเดียวใน histogram .
แปลว่าอะไร
แอตทริบิวต์แบบจุดเป็นปกติเขียนเป็นแอตทริบิวต์ระบุด้วยค่า
ต่อหนึ่งช่วง อย่างไรก็ตาม เนื่องจากช่วงที่สั่งเป็นแบบจุดๆบนมาตราส่วนแอตทริบิวต์
. .ทั้งสองตัวมีความสามารถในการสร้างคุณลักษณะของไบนารีมากกว่า
multivalued คน โดยการเลือก makebinary ที่จะเป็นจริง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.