Data mining can be defined as the n

Data mining can be defined as the non trivial process of identifying valid, novel, potentially useful, ultimately understandable patterns in data
Even though the modeling phase is the core of the process, the quality of the results relies heavily on data preparation which usually takes around 80% of the total time. An interesting method for data preparation is to discretize the input variables Discretization of continuous attributes plays an important role in knowledge discovery. Many algorithms related to
data mining require the training examples that contain only discrete values, and the rules generated by classification algorithms with discrete values are normally shorter and more understandable. Suitable discretization is useful to increase the generalization and accuracy of discovered knowledge. Discretization is the process of dividing the range of the continuous attribute into intervals. Every interval is labeled a discrete value, and then the original data will be mapped to the discrete values. Discretization of the continuous attributes is an important preprocessing approach for data mining and machine learning algorithm. An effective discretization method not only can reduce the demand of system memory and improve the efficiency of data mining and machine learning algorithm, but also make the knowledge extracted from the discretized dataset more compact, easy to be understand and used. Research shows that picking the best split points is a NP-complete problem. The result of discrimination is related not only with the discretization algorithm itself but also with the data distribution and the number of split points. When the same discretization algorithm is applied to different dataset, we may get different result. We can only know the effectiveness of the discretization method by the result of post processing. So whether the discretization method is good or not is also related with the induction algorithm adopted later.
There are many advantages of using discrete values over continuous ones: (1) Discretization will reduce the number of continuous features' values, which brings smaller demands on system's storage. (2) Discrete features are closer to a knowledge-level representation than continuous ones. (3) Data can also be reduced and simplified through discretization. For both users and experts, discrete features are easier to understand, use, and explain. (4)

Data mining can be defined as the non trivial process of identifying valid, novel, potentially useful, ultimately understandable patterns in data
 Even though the modeling phase is the core of the process, the quality of the results relies heavily on data preparation which usually takes around 80% of the total time. An interesting method for data preparation is to discretize the input variables Discretization of continuous attributes plays an important role in knowledge discovery. Many algorithms related to 
data mining require the training examples that contain only discrete values, and the rules generated by classification algorithms with discrete values are normally shorter and more understandable. Suitable discretization is useful to increase the generalization and accuracy of discovered knowledge. Discretization is the process of dividing the range of the continuous attribute into intervals. Every interval is labeled a discrete value, and then the original data will be mapped to the discrete values. Discretization of the continuous attributes is an important preprocessing approach for data mining and machine learning algorithm. An effective discretization method not only can reduce the demand of system memory and improve the efficiency of data mining and machine learning algorithm, but also make the knowledge extracted from the discretized dataset more compact, easy to be understand and used. Research shows that picking the best split points is a NP-complete problem. The result of discrimination is related not only with the discretization algorithm itself but also with the data distribution and the number of split points. When the same discretization algorithm is applied to different dataset, we may get different result. We can only know the effectiveness of the discretization method by the result of post processing. So whether the discretization method is good or not is also related with the induction algorithm adopted later.
There are many advantages of using discrete values over continuous ones: (1) Discretization will reduce the number of continuous features' values, which brings smaller demands on system's storage. (2) Discrete features are closer to a knowledge-level representation than continuous ones. (3) Data can also be reduced and simplified through discretization. For both users and experts, discrete features are easier to understand, use, and explain. (4)

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การทำเหมืองข้อมูลสามารถกำหนดเป็นกระบวนการที่ไม่น่ารำคาญในการระบุที่ถูกต้องใหม่ที่มีประโยชน์อาจเป็นรูปแบบที่เข้าใจในที่สุดในข้อมูล
แม้ว่าขั้นตอนการสร้างแบบจำลองเป็นหลักของกระบวนการที่มีคุณภาพของผลลัพธ์ที่อาศัยอย่างหนักในการเตรียมข้อมูลที่จะใช้เวลา ประมาณ 80% ของเวลาทั้งหมดวิธีการที่น่าสนใจสำหรับการเตรียมข้อมูลที่จะ discretize ตัวแปรไม่ต่อเนื่องของคุณลักษณะอย่างต่อเนื่องมีบทบาทสำคัญในการค้นพบความรู้ ขั้นตอนวิธีการมากมายที่เกี่ยวข้องกับการทำเหมืองข้อมูล
ต้องการการฝึกอบรมตัวอย่างที่มีค่าต่อเนื่องเท่านั้นและกฎระเบียบที่เกิดจากขั้นตอนวิธีการจัดหมวดหมู่ที่มีค่าต่อเนื่องเป็นปกติสั้นและเข้าใจมากขึ้นไม่ต่อเนื่องที่เหมาะสมเป็นประโยชน์ในการเพิ่มความกว้างและความถูกต้องของความรู้ที่ค้นพบ ไม่ต่อเนื่องเป็นกระบวนการของการแบ่งช่วงของคุณลักษณะอย่างต่อเนื่องในช่วงเวลา ทุกช่วงเวลาที่มีข้อความระบุว่าค่าต่อเนื่องและจากนั้นข้อมูลเดิมจะถูกแมปไปเป็นค่าต่อเนื่องไม่ต่อเนื่องของคุณลักษณะอย่างต่อเนื่องเป็นวิธีการขั้นตอนการเตรียมที่สำคัญสำหรับการทำเหมืองข้อมูลและขั้นตอนวิธีการเรียนรู้เครื่อง วิธีการที่มีประสิทธิภาพไม่ต่อเนื่องไม่เพียง แต่สามารถลดความต้องการของหน่วยความจำของระบบและการปรับปรุงประสิทธิภาพของการทำเหมืองข้อมูลและขั้นตอนวิธีการเรียนรู้เครื่อง แต่ยังทำให้ความรู้ที่สกัดจากชุด discretized กะทัดรัดมากขึ้นเรื่องง่ายที่จะเข้าใจและใช้ การวิจัยแสดงให้เห็นว่าการเลือกที่ดีที่สุดจุดแยกเป็นปัญหาเอ็นพีสมบูรณ์ ผลของการเลือกปฏิบัติที่เกี่ยวข้องไม่เพียง แต่มีขั้นตอนวิธีการไม่ต่อเนื่องของตัวเอง แต่ยังมีการกระจายข้อมูลและจำนวนจุดแยก เมื่อขั้นตอนวิธี discretization เดียวกันจะนำไปใช้กับชุดที่แตกต่างกันเราอาจจะได้รับผลที่แตกต่างกันเราสามารถรู้เพียง แต่ประสิทธิภาพของวิธีการไม่ต่อเนื่องโดยผลของการประมวลผลการโพสต์ . ดังนั้นไม่ว่าวิธีการที่ไม่ต่อเนื่องเป็นสิ่งที่ดีหรือไม่เป็นเรื่องที่เกี่ยวข้องกับขั้นตอนวิธีการเหนี่ยวนำของตนภายหลัง
มีข้อดีของการใช้ค่าต่อเนื่องกว่าคนอย่างต่อเนื่อง (1) ไม่ต่อเนื่องจะช่วยลดจำนวนของค่าคุณสมบัติอย่างต่อเนื่อง ',ซึ่งนำความต้องการของขนาดเล็กในการจัดเก็บข้อมูลของระบบ (2) คุณสมบัติต่อเนื่องอยู่ใกล้กับการแทนความรู้ในระดับกว่าคนอย่างต่อเนื่อง (3) ข้อมูลที่สามารถจะลดลงและง่ายผ่านไม่ต่อเนื่อง สำหรับทั้งผู้ใช้และผู้เชี่ยวชาญด้านคุณสมบัติที่ไม่ต่อเนื่องที่ง่ายต่อการเข้าใจใช้และอธิบาย (4)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การทำเหมืองข้อมูลที่สามารถกำหนดเป็นการเล็กน้อยไม่มีการระบุรูปแบบที่ถูกต้อง นวนิยาย อาจมีประโยชน์ สุดเข้าใจในข้อมูล
ถึงแม้ว่าขั้นตอนการสร้างโมเดลเป็นหลักของกระบวนการ คุณภาพของผลลัพธ์อาศัยหนักในการเตรียมข้อมูลซึ่งโดยปกติจะใช้ประมาณ 80% ของเวลาทั้งหมด วิธีน่าสนใจสำหรับการเตรียมข้อมูลเป็นการ discretize ตัวแปรอินพุต Discretization แอตทริบิวต์อย่างต่อเนื่องมีบทบาทสำคัญในการค้นพบความรู้ อัลกอริทึมต่าง ๆ ที่เกี่ยวข้องกับ
ข้อมูลการทำเหมืองแร่ต้องการตัวอย่างการฝึกอบรมที่ประกอบด้วยเฉพาะค่าที่ไม่ต่อเนื่อง และกฎที่สร้างขึ้น โดยอัลกอริทึมจัดประเภทมีค่าไม่ต่อเนื่องปกติสั้น และเข้าใจมากขึ้น Discretization เหมาะใช้เพื่อเพิ่ม generalization และความถูกต้องของความรู้พบ Discretization เป็นกระบวนการแบ่งช่วงของแอตทริบิวต์อย่างต่อเนื่องในช่วง ทุกช่วงจะติดป้ายเป็นค่าไม่ต่อเนื่อง แล้ว ข้อมูลเดิมจะถูกแมปไปยังค่าที่ไม่ต่อเนื่อง Discretization ของแอตทริบิวต์อย่างต่อเนื่องเป็นวิธีการประมวลผลเบื้องต้นสำคัญสำหรับการทำเหมืองข้อมูลและอัลกอริทึมการเรียนรู้ของเครื่อง วิธีการ discretization มีประสิทธิภาพไม่เพียงแต่สามารถลดความต้องการของหน่วยความจำระบบ และช่วยเพิ่มประสิทธิภาพในการทำเหมืองข้อมูลและอัลกอริทึมการเรียนรู้ของเครื่อง แต่ยัง ให้ความรู้ที่แยกจากชุดข้อมูล discretized กระชับ สามารถเข้าใจง่าย และใช้ วิจัยแสดงรับจุดแบ่งดีที่สุดว่าปัญหาทำ NP ผลของการเลือกปฏิบัติเกี่ยวข้องไม่เพียงแต่ กับอัลกอริทึมการ discretization เอง แต่ยัง มีการกระจายข้อมูลและจำนวนจุดแยก เมื่อใช้อัลกอริทึม discretization เดียวกับชุดข้อมูลที่แตกต่างกัน เราอาจได้รับผลลัพธ์ที่แตกต่างกัน เราเท่านั้นสามารถทราบประสิทธิผลของวิธีการ discretization โดยผลลัพธ์ของการประมวลผลลง ดังนั้น ไม่ว่าวิธีการ discretization จะดี หรือไม่ยังสัมพันธ์กับอัลกอริทึมการเหนี่ยวนำที่นำมาใช้ในภายหลัง.
มีประโยชน์มากใช้เดี่ยว ๆ ค่ากว่าคนอย่างต่อเนื่อง: Discretization (1) จะลดจำนวนคุณลักษณะอย่างต่อเนื่องค่า ซึ่งจะต้องมีขนาดเล็กในการเก็บข้อมูลของระบบ (2) ลักษณะการทำงานแยกกันอยู่ใกล้ชิดกับตัวแทนระดับความรู้มากกว่าคนอย่างต่อเนื่อง (3) นอกจากนี้ยังสามารถลด และประยุกต์ผ่าน discretization ข้อมูล สำหรับทั้งผู้ใช้และผู้เชี่ยวชาญ ลักษณะแยกกันได้ง่าย ใช้ และเข้าใจอธิบาย (4)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การทำเหมืองแร่ข้อมูลสามารถกำหนดเป็นขั้นตอนไม่เป็นสาระไม่ได้ของการระบุรูปแบบการเข้าใจที่ถูกต้องอาจทำให้เกิดความเสียหายเป็นประโยชน์ในเรื่องข้อมูล
แม้ว่าขั้นตอนการสร้างแบบจำลองที่เป็นแกนหลักของการที่มี คุณภาพ ของผลที่ขึ้นอยู่กับการเตรียมการข้อมูลซึ่งปกติแล้วจะใช้เวลาเดินทางประมาณ 80% ของเวลาทั้งหมดที่วิธีการหนึ่งที่น่าสนใจสำหรับการเตรียมข้อมูลเพื่อ discretize ตัวแปรอินพุต discretization ของแอตทริบิวต์อย่างต่อเนื่องมีบทบาทที่สำคัญในการค้นหาความรู้ อัลกอริธึมจำนวนมากที่เกี่ยวข้องกับการทำเหมืองแร่
ข้อมูลจำเป็นต้องใช้ตัวอย่างการฝึกอบรมที่มีเฉพาะค่าแบบแยกต่างหากและกฎระเบียบที่สร้างขึ้นด้วยอัลกอริธึมการแบ่ง ประเภท พร้อมด้วยค่าแบบแยกต่างหากได้รับตามปกติน้อยลงและสามารถเข้าใจได้มากขึ้นdiscretization เหมาะจะเป็นประโยชน์ในการเพิ่มความถูกต้องแม่นยำและพูดคลุมทั่วๆไปของความรู้ได้ค้นพบ discretization เป็นกระบวนการที่แบ่งกลุ่มของแอตทริบิวต์อย่างต่อเนื่องเข้าไปในช่วงเวลา ช่วงเวลาทุกครั้งจะมีข้อความความคุ้มค่าแบบแยกต่างหาก)และจากนั้นจึงข้อมูลเดิมที่จะต้องถูกแม็ปไปยังค่าแบบแยกต่างหากได้discretization ของแอตทริบิวต์อย่างต่อเนื่องที่เป็นวิธีการ preprocessing ที่สำคัญสำหรับการเรียนรู้ของคอมพิวเตอร์และการทำเหมืองแร่ข้อมูลอัลกอริธึม วิธีการ discretization มี ประสิทธิภาพ ที่ไม่ได้เพียงอย่างเดียวเท่านั้นที่สามารถลดความต้องการหน่วยความจำของระบบและปรับปรุง ประสิทธิภาพ ของอัลกอริธึมการเรียนรู้ของคอมพิวเตอร์และข้อมูลการทำเหมืองแร่แต่ยังให้ความรู้ที่ถูกดึงมาจาก dataset discretized ขนาดกะทัดรัดที่มากขึ้นง่ายต่อการทำความเข้าใจและใช้งาน. การวิจัยแสดงให้เห็นว่าการแยกจุดที่ดีที่สุดเป็น NP - สมบรูณ์แบบปัญหา. ส่งผลให้การเลือกปฏิบัติที่เป็นผู้ที่เกี่ยวข้องไม่ได้เท่านั้นพร้อมด้วยอัลกอริธึม discretization ที่ตัวของมันเองแต่ยังมีการกระจายข้อมูลและหมายเลขของโซนแยก เมื่ออัลกอริธึม discretization เดียวกันจะมีผลใช้งานเพื่อ dataset แตกต่างกันเราอาจจะได้รับผลที่แตกต่างเราทราบว่ามี ประสิทธิภาพ ของวิธีการ discretization โดยผลของการประมวลผลที่ทำการไปรษณีย์เท่านั้น ดังนั้นไม่ว่าวิธีการ discretization ได้ดีหรือไม่มีความสัมพันธ์กับอัลกอริธึมเตาแม่เหล็กไฟฟ้าที่นำมาใช้ใน ภายหลัง ได้.
มีความได้เปรียบมากในการใช้ค่าแบบแยกต่างหากในคนอย่างต่อเนื่อง( 1 ) discretization จะลดจำนวนของคุณค่าของความโดดเด่นอย่างต่อเนื่องซึ่งจะนำมาซึ่งความต้องการขนาดเล็กที่เก็บข้อมูลของระบบ ( 2 )โดดเด่นไปด้วยแบบแยกต่างหาก)มีความใกล้ชิดกับการเป็นตัวแทนความรู้ - ระดับที่มากกว่าคนอย่างต่อเนื่อง ( 3 )ข้อมูลจะสามารถลดและง่ายขึ้นด้วย discretization ยัง สำหรับผู้เชี่ยวชาญและผู้ใช้ทั้งสองคุณสมบัติแบบแยกต่างหากได้รับความสะดวกในการทำความเข้าใจเกี่ยวกับการใช้และอธิบาย ( 4 )

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.