Many real-world data mining tasks i

Many real-world data mining tasks involve continuous
attributes. Data discretization is defined as a process of
converting continuous data attribute values into a finite set of
intervals and associating with each interval some specific data value. There are no restrictions on discrete values associated
with a given data interval except that these values must induce
some ordering on the discretized attribute domain. Data
discretization significantly improves the quality of discovered
knowledge and also reduces the running time of various data
mining tasks such as association rule discovery, classification,
and prediction [6]. Good discretization can lead to new and more
accurate knowledge. On the other hand, bad discretization leads
to unnecessary loss of information or in some cases to false
information with disastrous consequences. There are a wide
variety of discretization methods starting with the naive methods
often referred to as unsupervised methods such as equal-width,
equal-frequency and supervised methods such as Minimum
Description Length(MDL) and Pearson’s X2 or Wilks’ G2
statistics based discretization algorithms[6, 7].

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

งานทำเหมืองจริงข้อมูลต่าง ๆ เกี่ยวข้องอย่างต่อเนื่องแอตทริบิวต์ Discretization ข้อมูลถูกกำหนดเป็นกระบวนการแปลงค่าแอตทริบิวต์ข้อมูลอย่างต่อเนื่องเป็นชุดมีจำกัดช่วงและเชื่อมโยงกับแต่ละช่วงค่าข้อมูลเฉพาะบางอย่าง ไม่มีข้อจำกัดค่าต่อเนื่องที่เกี่ยวข้องช่วงเวลาเป็นข้อมูลที่ยกเว้น ค่าเหล่านี้ต้องก่อให้เกิดบางอย่างสั่งบนโดเมนแอตทริบิวต์ discretized ข้อมูลdiscretization ช่วยปรับปรุงคุณภาพของการค้นพบความรู้ และยัง ช่วยลดเวลาทำงานของข้อมูลต่าง ๆงานทำเหมืองเช่นการค้นพบกฎของสมาคม จำแนกและการคาดเดา [6] Discretization ดีสามารถนำไปใหม่และอื่น ๆความรู้ที่ถูกต้อง บนมืออื่น ๆ discretization ดีนำการสูญเสียที่ไม่จำเป็น ของข้อมูล หรือ ในบางกรณีเป็นเท็จข้อมูลผลกระทบอย่างรุนแรง มีทั้งแบบหลากหลายวิธีการ discretization เริ่มต้น ด้วยวิธีการไร้เดียงสามักเรียกว่าวิธีขั่วเช่นเท่ากับความกว้างวิธีการความ ถี่ที่เท่ากับ และดูแลเช่นขั้นต่ำคำอธิบายของเพียร์สันและ Length(MDL) X2 หรือ G2 Wilks'สถิติใช้อัลกอริทึม discretization [6, 7]

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

หลายคนในโลกความจริงงานที่เกี่ยวข้องกับการทำเหมืองข้อมูลอย่างต่อเนื่อง
แอตทริบิวต์ เนื่องข้อมูลหมายถึงกระบวนการของ
การแปลงข้อมูลอย่างต่อเนื่องค่าแอตทริบิวต์เป็นขอบเขตของ
ช่วงเวลาและเชื่อมโยงกับแต่ละช่วงบางค่าข้อมูลที่เฉพาะเจาะจง ไม่มีข้อ จำกัด ค่าต่อเนื่องที่เกี่ยวข้องเป็น
กับช่วงข้อมูลที่ได้รับยกเว้นค่าเหล่านี้จะต้องทำให้เกิด
การสั่งซื้อบางอย่างเกี่ยวกับโดเมนแอตทริบิวต์ discretized ข้อมูลที่
ไม่ต่อเนื่องอย่างมีนัยสำคัญช่วยเพิ่มคุณภาพของการค้นพบ
ความรู้และยังช่วยลดเวลาทำงานของข้อมูลต่างๆ
งานเหมืองแร่เช่นการค้นพบกฎแห่งความสัมพันธ์การจำแนก
และการทำนาย [6] ไม่ต่อเนื่องที่ดีสามารถนำไปสู่การใหม่และเพิ่มเติม
ความรู้ที่ถูกต้อง บนมืออื่น ๆ ที่ไม่ดีต่อเนื่องนำไปสู่
การสูญเสียที่ไม่จำเป็นของข้อมูลหรือในบางกรณีเป็นเท็จ
ข้อมูลที่มีผลกระทบร้ายแรง มีความกว้าง
หลากหลายของวิธีการไม่ต่อเนื่องเริ่มต้นด้วยวิธีการไร้เดียงสา
มักจะเรียกว่าวิธีการเป็นใกล้ชิดเช่นเท่ากับความกว้าง
เท่ากับความถี่และวิธีการภายใต้การดูแลเช่นขั้นต่ำ
รายละเอียดความยาว (MDL) และ X2 เพียร์สันหรือ Wilks 'G2
สถิติตามขั้นตอนวิธีการไม่ต่อเนื่อง [6, 7]

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

งานเหมืองข้อมูลจริงหลายพันต่อเนื่องแอตทริบิวต์ ค่าข้อมูลหมายถึงกระบวนการของการแปลงข้อมูลอย่างต่อเนื่องค่าแอตทริบิวต์เป็นเซตจำกัดของและช่วงที่เกี่ยวข้องกับแต่ละช่วงเวลาข้อมูลเฉพาะบางค่า ไม่มีข้อ จำกัด ในค่าไม่ต่อเนื่องที่เกี่ยวข้องกับให้ช่วงข้อมูลยกเว้นว่าค่าเหล่านี้ต้องจูงแอตทริบิวต์แบบจุดบางสั่งบนโดเมน ข้อมูลค่าอย่างมีนัยสำคัญเพิ่มคุณภาพของการค้นพบความรู้ และยังช่วยลดเวลาการทำงานของข้อมูลต่าง ๆงานเหมืองแร่ เช่น สมาคมกฎการค้นพบ การจัดหมวดหมู่และการทำนาย [ 6 ] ดีค่าสามารถนําไปใหม่และเพิ่มเติมความรู้ที่ถูกต้อง บนมืออื่น ๆที่ไม่ดีค่านักกับการสูญเสียของข้อมูล หรือในบางกรณีการเท็จข้อมูลกับผลร้าย . มีกว้างหลากหลายวิธีที่ค่าเริ่มต้นด้วยวิธีการที่ไร้เดียงสามักเรียกว่าวิธีการ unsupervised เช่นความกว้างเท่ากันความถี่เท่ากัน และมีวิธีการ เช่น ต่ำสุดความยาวของคำอธิบาย ( MDL ) และค่าสัมประสิทธิ์สหสัมพันธ์ของ X2 " G2 หรือวิลสถิติตามขั้นตอนวิธีค่า [ 6 , 7 ]

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.