B. Classification
Classification is a data mining task that predicts group membership for data instances [6]. In this paper, the classification approaches are used to predict the Grade of thegraduate student and there are four grades (Excellent, Very good, Good, and Average) and how other attributes affect them.
Two classification methods are used which are Rule Induction and Naïve Bayesian classifier. A Rule-based classifier extracts a set of rules that show relationships between attributes of the data set and the class label. It uses a set of IFTHEN rules for classification. Rules are easier for humans to understand. Naïve Bayesian classifier is a technique for estimating probabilities of individual variable values, given a class, from training data and to then allow the use of these
probabilities to classify new entities [6].
Figure 4 depicts the rules that resulted from applying the Rule Induction classification algorithm on the Grade of the graduate student as a target class. As it is seen from the figure,
the attributes that influence the category of the target class are the Secondary_School_Type, the Matriculation_GPA, the City, the Gender and the Speciality, the model presented in figure 4
has an accuracy of 71.25% which is acceptable accuracy and we suggest using Rule Induction algorithm for predicting the grade of the student. To interpret the rules in the Rule Model,
the first rule says that, if the Secondary_School_Type equal Adabi and the Matriculation_GPA equal Poor, the grade of the student can be predicted as Average, and so on.
It is important to know that classification rules are different than rules generated from association. Association rules are characteristic rules (it describes current situation), but
classification rules are prediction rules (it describes future situation) [5].
Figure 5 presents the Distribution model for label attribute Grade that resulted from applying the Naïve Bayesian classifier, the model has an accuracy of 67.50% which is acceptable accuracy and we suggest using Naïve Bayesian method for predicting the grade of the student. Figure 5: The Distribution model for label attribute Grade
The benefit of these two methods is that it can predict low grades on time. For example the college management can predict Average students from the beginning and they may
work on them to improve their performance before the graduation.
B. การจัดหมวดหมู่
การจัดหมวดหมู่เป็นงานที่ทำเหมืองข้อมูลคาดการณ์ว่าสมาชิกของกลุ่มสำหรับกรณีข้อมูล [6] ในบทความนี้วิธีการจัดหมวดหมู่ที่มีการใช้ในการทำนายของนักเรียนชั้นประถมศึกษาปี thegraduate และมีเกรดสี่ (ดีเยี่ยม, ดีมาก, ดีและปานกลาง) และวิธีการที่คุณลักษณะอื่น ๆ ส่งผลกระทบต่อพวกเขา.
สองวิธีที่ใช้ในการจัดหมวดหมู่ที่มีกฎการเหนี่ยวนำและไร้เดียงสา ลักษณนามเบย์ สารสกัดจากจําแนกตามกฎชุดของกฎที่แสดงให้เห็นความสัมพันธ์ระหว่างคุณลักษณะของชุดข้อมูลและฉลากระดับ จะใช้ชุดของกฎ IFTHEN การจัดหมวดหมู่ กฎง่ายขึ้นสำหรับมนุษย์ที่จะเข้าใจ ลักษณนาม Bayesian ไร้เดียงสาเป็นเทคนิคสำหรับการประเมินความน่าจะเป็นของค่าตัวแปรแต่ละระดับได้รับจากการฝึกอบรมและข้อมูลแล้วช่วยให้การใช้งานของเหล่านี้
น่าจะเป็นที่จะจำแนกประเภทหน่วยงานใหม่ [6].
รูปที่ 4 แสดงให้เห็นถึงกฎที่เป็นผลมาจากการใช้กฎการเหนี่ยวนำ ขั้นตอนวิธีการจัดหมวดหมู่ในเกรดของนักศึกษาระดับบัณฑิตศึกษาเป็นระดับเป้าหมาย ในขณะที่มันจะเห็นได้จากรูปที่
แอตทริบิวต์ที่มีอิทธิพลต่อประเภทของระดับเป้าหมายที่มี Secondary_School_Type, Matriculation_GPA เมือง, เพศและความชำนาญพิเศษในรูปแบบที่นำเสนอในรูปที่ 4
มีความถูกต้องของ 71.25% ซึ่งเป็นความถูกต้องเป็นที่ยอมรับ และเราขอแนะนำให้ใช้ขั้นตอนวิธีการเหนี่ยวนำกฎการทำนายเกรดของนักเรียน ในการตีความกฎระเบียบในรุ่นกฎ,
กฎข้อแรกบอกว่าถ้าเท่ากับ Secondary_School_Type Adabi และ Matriculation_GPA เท่ากับแย่เกรดของนักเรียนสามารถคาดการณ์เป็นเฉลี่ย, และอื่น ๆ .
มันเป็นสิ่งสำคัญที่จะรู้ว่ากฎระเบียบที่มีการจัดหมวดหมู่ แตกต่างจากกฎระเบียบที่สร้างขึ้นจากการเชื่อมโยง กฎสมาคมกฎลักษณะ (มันอธิบายสถานการณ์ในปัจจุบัน) แต่
กฎการจัดหมวดหมู่กฎทำนาย (มันอธิบายสถานการณ์ในอนาคต) [5].
รูปที่ 5 ที่มีการจัดรูปแบบการจัดจำหน่ายฉลากแอตทริบิวต์ชั้นประถมศึกษาปีที่เกิดจากการใช้ลักษณนาม Bayesian ไร้เดียงสาแบบมี ความถูกต้องของ 67.50% ซึ่งเป็นที่ยอมรับและถูกต้องเราขอแนะนำให้ใช้วิธีการแบบเบย์ไร้เดียงสาในการทำนายเกรดของนักเรียน รูปที่ 5: รูปแบบการจัดจำหน่ายฉลากแอตทริบิวต์เกรด
ประโยชน์ของทั้งสองวิธีก็คือว่ามันสามารถคาดการณ์เกรดต่ำในเวลา ยกตัวอย่างเช่นการจัดการวิทยาลัยนักเรียนสามารถคาดการณ์ค่าเฉลี่ยจากจุดเริ่มต้นและพวกเขาอาจจะ
ทำงานกับพวกเขาในการปรับปรุงประสิทธิภาพการทำงานของพวกเขาก่อนที่จะจบการศึกษา
การแปล กรุณารอสักครู่..