In Table 6, we present a brief summ

In Table 6, we present a brief summary of the characteristics of these datasets: the first column shows the code of
the dataset, the second shows the number of training cases, the third includes the number of missing values, the fourth
shows the percentage of occurrence of the most frequent value of the class, the fifth and sixth show the number of
continuous and discrete attributes, respectively, and the last column shows the number of different values for the class.
For the experiment, two algorithms were implemented to build decision trees. In the first algorithm, the training
cases with missing values are distributed following the approach of C4.5; that is, the probability distribution function
of the attribute under consideration is used to distribute the cases with missing values in this attribute. In the second
algorithm (our method), the cases with missing values are distributed taking into account the probability distribution
obtained using the attribute and the class.
Our method is associated with the total percentage of missing attribute values in the training cases, and these
missing values are distributed in a random way among the attributes. The method works independently of the number
of attributes with missing values, that is, missing values can appear in any attribute. We have checked that the proposed
model does not fail when we increase the number of attributes with missing values and the total percentage of missing
values holds.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เรานำเสนอสรุปโดยย่อลักษณะของชุดข้อมูลเหล่านี้ในตารางที่ 6 : คอลัมน์แรกแสดงรหัสของชุดข้อมูล ที่สองแสดงจำนวนของกรณีการฝึกอบรม ที่สามรวมถึงจำนวนค่าที่หายไป สี่แสดงเปอร์เซ็นต์ของการเกิดค่าบ่อย ๆ ของคลา ห้าและหกแสดงจำนวนแอตทริบิวต์อย่างต่อเนื่อง และไม่ต่อเนื่อง ตาม ลำดับ และคอลัมน์สุดท้ายแสดงหมายเลขของค่าที่แตกต่างสำหรับคลาสสำหรับการทดลอง อัลกอริทึมทั้งสองถูกนำมาใช้ในการสร้างต้นไม้ตัดสินใจ ในขั้นตอนวิธีแรก การฝึกอบรมกรณีที่ มีค่าที่หายไปมีกระจายตามแนวทางของ C4.5 นั่นคือ ฟังก์ชันแจกแจงความน่าเป็นของแอตทริบิวต์ภายใต้การพิจารณาจะใช้การกระจายกรณี มีค่าหายไปในแอตทริบิวต์นี้ ในครั้งที่สองอัลกอริทึม (วิธีของเรา), กรณีที่ มีค่าที่หายไปจะกระจายการคำนึงถึงการกระจายความน่าเป็นใช้แอตทริบิวต์และคลาได้วิธีของเราเกี่ยวข้องกับผลรวมเปอร์เซ็นต์ของขาดค่าในกรณีฝึกอบรม และเหล่านี้ของแอตทริบิวต์ค่าที่หายไปมีกระจายแบบสุ่มระหว่างแอตทริบิวต์ วิธีการทำงานเป็นอิสระจากหมายเลขแอตทริบิวต์ที่มีค่าที่หายไป นั่นคือ ค่าหายไปจะปรากฏในแอตทริบิวต์ใด ๆ ขึ้น เราได้ตรวจสอบที่นำเสนอแบบจำลองล้มเหลวเมื่อเราเพิ่มจำนวนของแอตทริบิวต์ที่มีค่าที่หายไปและผลรวมเปอร์เซ็นต์ของหายไปค่าเก็บ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ในตารางที่ 6 เรานำเสนอสรุปโดยย่อของลักษณะของชุดข้อมูลเหล่านี้: คอลัมน์แรกแสดงรหัสของ
ชุดที่สองแสดงให้เห็นจำนวนของกรณีการฝึกอบรมที่สามรวมถึงจำนวนของค่าที่ขาดหายไปที่สี่
แสดงค่าร้อยละของ การเกิดขึ้นของมูลค่าที่พบบ่อยที่สุดของชั้นที่ห้าและหกแสดงจำนวนของ
คุณลักษณะอย่างต่อเนื่องและไม่ต่อเนื่องตามลำดับและคอลัมน์สุดท้ายแสดงให้เห็นจำนวนของค่าที่แตกต่างกันสำหรับการเรียน
สำหรับการทดสอบสองขั้นตอนวิธีการถูกนำมาใช้ในการสร้างต้นไม้ตัดสินใจ ในขั้นตอนวิธีแรกการฝึกอบรม
กรณีที่มีค่าที่ขาดหายไปจะกระจายต่อไปนี้วิธีการของ C4.5 นั้น นั่นคือ,
ฟังก์ชันการแจกแจงความน่าจะเป็น ของแอตทริบิวต์ภายใต้การพิจารณาจะใช้ในการแจกจ่ายกรณีที่มีค่าที่ขาดหายไปในแอตทริบิวต์นี้ ในครั้งที่สอง
อัลกอริทึม (วิธีของเรา) กรณีที่มีค่าที่ขาดหายไปจะมีการแจกจ่ายโดยคำนึงถึงการกระจายความน่าจะ
ได้ใช้แอตทริบิวต์และชั้นเรียน
วิธีการของเรามีความเกี่ยวข้องกับร้อยละรวมค่าแอตทริบิวต์ขาดหายไปในกรณีที่การฝึกอบรมและสิ่งเหล่านี้
ค่าที่ขาดหายไปจะกระจายในทางที่สุ่มหมู่แอตทริบิวต์ วิธีการทำงานเป็นอิสระจากจำนวน
ของคุณลักษณะที่มีค่าที่ขาดหายไปนั่นคือค่าที่ขาดหายสามารถปรากฏในแอตทริบิวต์ใด ๆ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ตารางที่ 6 เรา ปัจจุบัน สรุปลักษณะของข้อมูลเหล่านี้ : คอลัมน์แรกแสดงรหัสของข้อมูล วินาทีที่แสดงหมายเลขของกรณีการฝึกอบรมที่สามรวมถึงจำนวนของค่าสูญหาย ที่สี่แสดงร้อยละของการเกิดของมูลค่าที่พบบ่อยที่สุดของชั้น 5 และ 6 แสดงจำนวนของแอตทริบิวต์ที่ต่อเนื่องและไม่ต่อเนื่อง ตามลำดับ และคอลัมน์สุดท้ายแสดงให้เห็นจำนวนของค่าที่แตกต่างกันสำหรับชั้นเรียนสำหรับการทดลองสองขั้นตอนวิธีการดําเนินการสร้างต้นไม้เพื่อการตัดสินใจ ในขั้นตอนแรก , ฝึกอบรมกรณีของขาดกระจาย ตามวิธีการของโปรแกรม C4.5 ; นั่นคือ ฟังก์ชันการแจกแจงความน่าจะเป็นของแอตทริบิวต์ภายใต้การพิจารณาใช้ในการกระจายรายที่มีค่าสูญหายในลักษณะนี้ ในวินาทีขั้นตอนวิธี ( แบบของเรา ) กรณีกับค่าขาดกระจาย คำนึงถึงการแจกแจงความน่าจะเป็นการศึกษาคุณลักษณะและชั้นเรียนวิธีของเราคือที่เกี่ยวข้องกับรวมค่าไปค่าแอตทริบิวต์ ในการฝึกอบรม และ ตัวอย่างเหล่านี้ค่าขาดกระจายในลักษณะสุ่มระหว่างแอตทริบิวต์ วิธีการทำงานอย่างเป็นอิสระ จากหมายเลขแอตทริบิวต์ที่มีค่าสูญหาย คือ ค่านิยมที่ขาดหายไปจะปรากฏในคุณลักษณะ เราได้ตรวจสอบที่เสนอแบบไม่ล้มเหลวเมื่อเราเพิ่มจำนวนของแอตทริบิวต์ที่มีค่าหายไปและร้อยละทั้งหมดหายไปค่าเก็บ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.