Data mining, also called Knowledge Discovery in Databases (KDD), is the field of discovering novel and potentially useful information from large amounts of data. Educational Data Mining (EDM) is still in its infancy [15]. The field of EDM is new and emerging in the field of education sector which can also be applied in other areas like sports, accounts, transportation etc. The international working group in EDM established the Journal of Educational Data Mining (2009) and a yearly international conference that began in 2008. Han and Kamber [17] describes data mining software that allow the users to analyze data from different dimensions, Categorize it and summarize the relationships which are identified during the mining process. M.Ramaswami and R.Bhaskaran [12] applied CHAID prediction model to analyze the interrelation between variables that are used to predict the outcome of the performance at higher secondary school education. The CHAID prediction model of student performance was constructed with seven class predictor variable. Nguyen Thai-Nghe, Andre Busche, and Lars Schmidt-Thieme [13] used machine learning techniques to improve the prediction results of academic performances in real case studies. Three methods have been used by them to deal with the class imbalance problem and all of them show satisfactory results. They first balanced the datasets and used both cost-insensitive and sensitive learning with SVM for the small datasets with Decision Tree for the larger datasets. Arockiam et al. [14] implemented FP Tree and K-means clustering technique for finding the similarity between urban and rural students programming skills. FP Tree mining was applied to sieve the patterns from the dataset. K-means clustering was used to determine the programming skills of the students. The study clearly indicates that the rural and the urban students differ in their programming skills and found that huge proportions of urban students were good in programming skill compared to rural students. It divulges that academicians provide extra training to urban students in the programming subject. Cortez and Silva [15] attempted to predict failure in the two core classes (Mathematics and Portuguese) of two secondary school students from the Alentejo region of Portugal by utilizing 29 predictive variables. Four data mining algorithms such as Decision Tree (DT), Random Forest (RF), Neural Network (NN) and Support Vector Machine (SVM) were applied on a data set of 788 students, who appeared in 2006 examination. It was reported that DT and NN algorithms had the predictive accuracy of 93% and 91% for two-class dataset (pass/fail) respectively. It was also reported that both DT and NN algorithms had the predictive accuracy of 72% for a four-class dataset. Galit [18] gave a case study that uses student’s data to analyze their learning behaviour to predict the results and to warn students at risk before their final exams. V.Ramesh et al [16] tries to identify the factors influencing the performance of students in final examination. They adopted survey cum experimental methodology to generate the database. The algorithms which were used by them for implementation were Naïve Bayes, Multi Layer Perception, SMO, J48, and REPTree. The obtained results from hypothesis testing reveals that type of school is not influence student performance but parent’s occupation plays a major role in predicting grades.
Data mining, also called Knowledge Discovery in Databases (KDD), is the field of discovering novel and potentially useful information from large amounts of data. Educational Data Mining (EDM) is still in its infancy [15]. The field of EDM is new and emerging in the field of education sector which can also be applied in other areas like sports, accounts, transportation etc. The international working group in EDM established the Journal of Educational Data Mining (2009) and a yearly international conference that began in 2008. Han and Kamber [17] describes data mining software that allow the users to analyze data from different dimensions, Categorize it and summarize the relationships which are identified during the mining process. M.Ramaswami and R.Bhaskaran [12] applied CHAID prediction model to analyze the interrelation between variables that are used to predict the outcome of the performance at higher secondary school education. The CHAID prediction model of student performance was constructed with seven class predictor variable. Nguyen Thai-Nghe, Andre Busche, and Lars Schmidt-Thieme [13] used machine learning techniques to improve the prediction results of academic performances in real case studies. Three methods have been used by them to deal with the class imbalance problem and all of them show satisfactory results. They first balanced the datasets and used both cost-insensitive and sensitive learning with SVM for the small datasets with Decision Tree for the larger datasets. Arockiam et al. [14] implemented FP Tree and K-means clustering technique for finding the similarity between urban and rural students programming skills. FP Tree mining was applied to sieve the patterns from the dataset. K-means clustering was used to determine the programming skills of the students. The study clearly indicates that the rural and the urban students differ in their programming skills and found that huge proportions of urban students were good in programming skill compared to rural students. It divulges that academicians provide extra training to urban students in the programming subject. Cortez and Silva [15] attempted to predict failure in the two core classes (Mathematics and Portuguese) of two secondary school students from the Alentejo region of Portugal by utilizing 29 predictive variables. Four data mining algorithms such as Decision Tree (DT), Random Forest (RF), Neural Network (NN) and Support Vector Machine (SVM) were applied on a data set of 788 students, who appeared in 2006 examination. It was reported that DT and NN algorithms had the predictive accuracy of 93% and 91% for two-class dataset (pass/fail) respectively. It was also reported that both DT and NN algorithms had the predictive accuracy of 72% for a four-class dataset. Galit [18] gave a case study that uses student’s data to analyze their learning behaviour to predict the results and to warn students at risk before their final exams. V.Ramesh et al [16] tries to identify the factors influencing the performance of students in final examination. They adopted survey cum experimental methodology to generate the database. The algorithms which were used by them for implementation were Naïve Bayes, Multi Layer Perception, SMO, J48, and REPTree. The obtained results from hypothesis testing reveals that type of school is not influence student performance but parent’s occupation plays a major role in predicting grades.
การแปล กรุณารอสักครู่..

การทำเหมืองข้อมูลที่เรียกว่าการค้นพบความรู้ในฐานข้อมูล (KDD) เป็นเขตของการค้นพบใหม่และข้อมูลที่เป็นประโยชน์ที่อาจเกิดขึ้นจากจำนวนมากของข้อมูล การศึกษาการทำเหมืองข้อมูล (EDM) ยังอยู่ในวัยเด็กของตน [15] ด้านการ EDM เป็นใหม่และในเขตของภาคการศึกษาซึ่งยังสามารถนำไปใช้ในพื้นที่อื่น ๆ เช่นกีฬา, บัญชี, การขนส่ง ฯลฯ คณะทำงานระหว่างประเทศใน EDM ก่อตั้งวารสารการศึกษาการทำเหมืองข้อมูล (2009) และต่างประเทศเป็นประจำทุกปี การประชุมที่เริ่มต้นขึ้นในปี 2008 ฮัน Kamber [17] อธิบายการทำเหมืองข้อมูลซอฟต์แวร์ที่ช่วยให้ผู้ใช้ในการวิเคราะห์ข้อมูลจากขนาดที่แตกต่างกันแบ่งหมวดหมู่ของมันและสรุปความสัมพันธ์ซึ่งจะมีการระบุในระหว่างขั้นตอนการทำเหมืองแร่ M.Ramaswami และ R.Bhaskaran [12] ใช้แบบจำลองการคาดการณ์ CHAID ในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรที่ใช้ในการทำนายผลของการปฏิบัติงานที่โรงเรียนมัธยมการศึกษาที่สูงขึ้นนั้น แบบจำลองการคาดการณ์ผลการดำเนินงาน CHAID นักเรียนถูกสร้างด้วยตัวแปรทำนายที่ชั้นเจ็ด เหงียนไทย Nghe อังเดร Busche และลาร์ส Schmidt-Thieme [13] เทคนิคที่ใช้ในการเรียนรู้เครื่องเพื่อปรับปรุงผลการคาดการณ์ของนักวิชาการในการแสดงจริงกรณีศึกษา สามวิธีการที่มีการใช้โดยพวกเขาจะจัดการกับปัญหาความไม่สมดุลของชั้นเรียนและทั้งหมดของพวกเขาแสดงให้เห็นผลที่น่าพอใจ พวกเขามีความสมดุลแรกชุดข้อมูลและใช้ค่าใช้จ่ายในการเรียนรู้ทั้งตายและมีความสำคัญกับ SVM สำหรับชุดข้อมูลขนาดเล็กที่มีต้นไม้การตัดสินใจสำหรับชุดข้อมูลขนาดใหญ่ Arockiam et al, [14] ดำเนินต้นไม้ FP K-หมายถึงเทคนิคการจัดกลุ่มสำหรับการค้นหาความคล้ายคลึงกันระหว่างนักเรียนในเมืองและชนบททักษะการเขียนโปรแกรม การทำเหมืองแร่ต้นไม้ FP ถูกนำไปใช้ตะแกรงรูปแบบจากชุดข้อมูล การจัดกลุ่ม K-หมายถึงถูกใช้ในการตรวจสอบทักษะการเขียนโปรแกรมของนักเรียน ผลการศึกษาบ่งชี้อย่างชัดเจนว่าในชนบทและในเมืองของนักเรียนแตกต่างกันในการเขียนโปรแกรมของพวกเขาทักษะและพบว่าสัดส่วนใหญ่ของนักเรียนในเมืองได้ดีในทักษะการเขียนโปรแกรมเมื่อเทียบกับนักเรียนในชนบท มัน divulges นักวิชาการที่ให้การฝึกอบรมพิเศษให้กับนักเรียนในเมืองเรื่องการเขียนโปรแกรม คอร์เตซและซิลวา [15] ความพยายามที่จะคาดการณ์ความล้มเหลวในสองชั้นหลัก (คณิตศาสตร์และโปรตุเกส) สองนักเรียนชั้นมัธยมศึกษาจากภูมิภาค Alentejo โปรตุเกสโดยใช้ 29 ตัวแปรทำนาย สี่ขั้นตอนวิธีการทำเหมืองข้อมูลเช่นต้นไม้การตัดสินใจ (DT), ป่าสุ่ม (RF), ประสาทเครือข่าย (NN) และการสนับสนุนเครื่องเวกเตอร์ (SVM) ถูกนำมาใช้ในชุดข้อมูล 788 นักเรียนที่ปรากฏในปี 2006 การตรวจสอบ มีรายงานว่า DT และขั้นตอนวิธี NN มีความถูกต้องของการคาดการณ์ 93% และ 91% สำหรับชุดข้อมูลสองชั้น (ผ่าน / ไม่) ตามลำดับ นอกจากนั้นยังมีรายงานว่าทั้งสอง DT และขั้นตอนวิธี NN มีความถูกต้องของการคาดการณ์ 72% สำหรับชุดสี่ระดับ โกรธ [18] ให้กรณีศึกษาที่ใช้ข้อมูลของนักเรียนในการวิเคราะห์พฤติกรรมการเรียนรู้ที่จะคาดการณ์ผลและการเตือนนักเรียนที่มีความเสี่ยงก่อนที่จะสอบสุดท้ายของพวกเขา V.Ramesh et al, [16] พยายามที่จะหาปัจจัยที่มีอิทธิพลต่อการปฏิบัติงานของนักเรียนในการตรวจสอบขั้นสุดท้าย พวกเขานำมาใช้ในการสำรวจสุดยอดวิธีการทดลองในการสร้างฐานข้อมูล ขั้นตอนวิธีการที่ถูกนำมาใช้โดยพวกเขาสำหรับการดำเนินงานมีความไร้เดียงสา Bayes รับรู้หลายชั้น SMO, J48 และ REPTree ผลที่ได้จากการทดสอบสมมติฐานเผยให้เห็นประเภทของโรงเรียนที่ไม่ได้มีผลต่อประสิทธิภาพของนักเรียน แต่การประกอบอาชีพของผู้ปกครองมีบทบาทสำคัญในการทำนายเกรด
การแปล กรุณารอสักครู่..

การทําเหมืองข้อมูลที่เรียกว่าการค้นพบความรู้ในฐานข้อมูล ( KDD ) เป็นเขตที่ค้นพบใหม่และข้อมูลที่เป็นประโยชน์ที่อาจเกิดขึ้นจากจำนวนมากของข้อมูล การทำเหมืองข้อมูลเพื่อการศึกษา ( EDM ) ยังอยู่ในวัยเด็ก [ 15 ] ฟิลด์ของ EDM และเกิดใหม่ในเขตของภาคการศึกษาซึ่งสามารถใช้ในพื้นที่อื่น ๆเช่นกีฬา , บัญชี , ขนส่ง ฯลฯคณะทำงานระหว่างประเทศใน EDM ก่อตั้งวารสารการทำเหมืองข้อมูลการศึกษา ( 2009 ) และประจำปีการประชุมระหว่างประเทศที่เริ่มในปี 2008 ฮั่น และ แคมเบอร์ [ 17 ] อธิบายการทำเหมืองข้อมูลซอฟต์แวร์ที่อนุญาตให้ผู้ใช้เพื่อวิเคราะห์ข้อมูลที่ได้จากมิติที่แตกต่างกันประเภทและสรุปความสัมพันธ์ที่ระบุในระหว่างกระบวนการการทำเหมืองแร่ เมตร ramaswami และ R .bhaskaran [ 12 ] ใช้แบบจำลองการทำนาย chaid เพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรที่ใช้ทำนายผลการปฏิบัติงานระดับมัธยมศึกษาโรงเรียนสูง การ chaid แบบจำลองการทำนายของนักเรียนถูกสร้างด้วยเจ็ดชั้นทำนายตัวแปร Nguyen ไทย nghe busche , อังเดร ,และ Lars ชมิดท์เทียน [ 13 ] เครื่องจักรที่ใช้ในการเรียนรู้เทคนิคการปรับปรุงการทำนายผลการปฏิบัติงานวิชาการในกรณีศึกษาจริง สามวิธีที่ถูกใช้ โดยพวกเขาสามารถจัดการกับความไม่สมดุลของระดับปัญหาและทั้งหมดของพวกเขาแสดงผลลัพธ์ที่น่าพอใจพวกเขาสมดุลข้อมูลและใช้ต้นทุนตายด้านและอ่อนไหวแบบ SVM สำหรับข้อมูลขนาดเล็กที่มีโครงสร้างการตัดสินใจสำหรับชุดข้อมูลที่มีขนาดใหญ่ arockiam et al . [ 14 ] ใช้ FP และการจัดกลุ่มต้นไม้ k-means เทคนิคสำหรับการหาความคล้ายคลึงกันระหว่างทักษะการเขียนโปรแกรมนักศึกษา ชุมชนเมือง และชุมชนชนบท FP ต้นไม้เหมืองแร่ใช้ตะแกรงรูปแบบจากข้อมูล .k-means คลัสเตอร์ถูกใช้เพื่อตรวจสอบทักษะการเขียนโปรแกรมของนักศึกษา การศึกษาแสดงว่านักเรียนชนบทและเมือง มีทักษะการเขียนโปรแกรมของพวกเขาและพบว่าสัดส่วนของนักเรียนในเมืองใหญ่ อยู่ในระดับดี ทักษะการเขียนโปรแกรมเมื่อเทียบกับนักเรียนในชนบท มัน divulges ที่นักวิชาการให้การฝึกอบรมพิเศษให้กับนักเรียนในเมือง ในโปรแกรมวิชาคอร์เตซและซิลวา [ 15 ] พยายามที่จะทำนายความล้มเหลวใน 2 คลาสหลัก ( คณิตศาสตร์ และโปรตุเกส ) สอง นักเรียนจากภูมิภาค Alentejo ของโปรตุเกสโดยใช้ 29 ตัวแปรทำนาย . สี่เหมืองข้อมูลขั้นตอนวิธีเช่นแผนภาพการตัดสินใจแบบต้นไม้ ( DT ) สุ่มป่า ( RF ) , โครงข่ายประสาทเทียม ( NN ) และเครื่องเวกเตอร์สนับสนุน ( SVM ) ที่ใช้ในชุดข้อมูล 788 คนwho appeared in 2006 examination . มีรายงานว่า DT nn และขั้นตอนวิธีมีความแม่นยำการทำนายร้อยละ 93 และ 91 % 2 ชั้นข้อมูล ( ผ่าน / ไม่ผ่าน ) ตามลำดับ นอกจากนี้ยังรายงานว่าทั้งสอง DT NN ขั้นตอนวิธีและมีความแม่นยำในการทำนายของ 72% สำหรับวันที่สี่ชั้นใน [ 18 ] ให้กรณีศึกษาที่ใช้ข้อมูลเพื่อวิเคราะห์พฤติกรรมการเรียนรู้ของนักเรียน เพื่อทำนายผล และเตือนนักเรียนความเสี่ยงก่อนการสอบครั้งสุดท้ายของพวกเขา ราเมซ et al . [ 16 ] พยายามที่จะระบุปัจจัยที่มีอิทธิพลต่อการปฏิบัติงานของนักศึกษาในการสอบ พวกเขายอมรับการสำรวจ cum ทดลองวิธีการสร้างฐานข้อมูลขั้นตอนวิธีที่ใช้โดยพวกเขาสำหรับการเป็น na ไตได้ Bayes หลายชั้นการ SMO j48 , และ reptree . ผลจากการทดสอบสมมติฐาน พบว่า ประเภทของโรงเรียนไม่มีอิทธิพลต่อนักเรียน แต่พ่อแม่อาชีพเล่นบทบาทหลักในการพยากรณ์
เกรด
การแปล กรุณารอสักครู่..
