The data preprocessing phase was performed using a reduced log file, which was “cleaned” by removing
all useless, irregular, and missing data from the original LMS common log file. After the initial
preprocessing, a session filter was applied to the reduced log file for feature extractions. The purpose of
the filter was to aggregate all user requests within a session into a single set of variables. For example, a
session typically started when a student logged in to the LMS, and ended when the student pressed the
exit button. However, sometimes the session would be terminated when a student accidentally closed
the web browser, or a student might stay idle with the course website open yet doing nothing. In the
latter instance, the LMS would terminate the session automatically after 20 minutes of inactivity. In these
cases, the related raw data stored were removed from the database to reflect only normal learning
events of the students as per the purposes of this study. Feature extractions filtered out the following
primary variables: user identifier, session identifier, session start date and time, session end date and
time, user’s hit count, and session duration in minutes (Mor et al., 2006). Derived variables (duration and
frequency of data of each student) were extracted through calculating or accumulating primary variable
data on a daily and weekly basis. These variables were transformed into fields, assigned with proper
data attributes, and stored in the database management system. All data fields were organized with
tables and formed a rational database. Table 1 shows a partial list of primary and derived variables from
server logs.
Table 1. An Example of Primary and Derived Variables
Variable
Name Description
ID User ID
LoginFre Total frequency of LMS logins
LastLog When was the last time logged into LMS
ClassFre Total frequency of accessing course materials
LastClass When was the last time accessed course materials
NoPosting Total number of bulletin board messages posted
DisFre Total number of synchronous discussions attended
ReadHr Hours spent reading bulletin board messages
ReadMegs Total number of bulletin board messages read
The data mining phase included two sub-phases: (a) descriptive analysis, and (b) artificial intelligence
analysis. Descriptive analysis (Maimon & Rokach, 2005; Roiger & Geatz, 2003) was used with
summarizing, clustering, and association rules techniques to generate an overview on the dataset, to
gain an insight into students’ characteristics, and to depict students’ learning patterns. Artificial
intelligence analysis was used for predictive purposes (Hastie, Tibshirani, & Friedman, 2003). The
decision tree technique was applied to build a predictive model of online learning performance.
The pattern analysis phase included data interpretation and evaluation of the results. This phase was
needed to identify meaningful results from outcomes of the data mining phase. Details of variables and
further analysis were uncovered in the data mining phase and discussed in the pattern analysis phase.
Analytic tools and methods
Two open source data mining software packages, Weka (Witten & Frank, 2005) and Knime (Konstanz
University, 2006), were used to perform descriptive and artificial intelligence analysis. SPSS was utilized
to perform SQL queries and data visualization.
The purpose of descriptive analysis was to construct an overview of how all students were doing in a
given time frame. Processed data were visualized through tables and graphics. The graphical display
ขั้นตอนขั้นตอนการเตรียมข้อมูลที่ได้รับการดำเนินการโดยใช้แฟ้มบันทึกที่ลดลงซึ่งก็คือ "การทำความสะอาด" โดยการลบข้อมูลไร้ประโยชน์
สม่ำเสมอและหายไปทั้งหมดจาก LMS เดิมแฟ้มบันทึกร่วมกัน หลังจากเริ่มต้น
preprocessing กรองเซสชั่นที่ถูกนำไปใช้กับแฟ้มบันทึกการลดการสกัดคุณลักษณะ วัตถุประสงค์ของ
ตัวกรองคือการรวมคำขอของผู้ใช้ทั้งหมดที่อยู่ในเซสชั่นเป็นชุดเดียวของตัวแปร ตัวอย่างเช่น
เซสชั่นมักจะเริ่มต้นเมื่อนักเรียนเข้าสู่ระบบเพื่อ LMS และจบลงเมื่อนักเรียน
กดปุ่มออก แต่บางครั้งเซสชั่นจะได้รับการยกเลิกเมื่อนักเรียนไม่ตั้งใจปิด
เว็บเบราว์เซอร์หรือนักเรียนอาจอยู่ไม่ได้ใช้งานกับเว็บไซต์ของหลักสูตรที่เปิดยังไม่ทำอะไรเลย ใน
หลังเช่น LMS จะยุติเซสชั่นโดยอัตโนมัติหลังจาก 20 นาทีไม่มีการใช้งาน ในเหล่านี้
กรณีข้อมูลดิบที่เกี่ยวข้องกับการจัดเก็บที่ถูกถอดออกจากฐานข้อมูลในการสะท้อนให้เห็นถึงการเรียนรู้เพียง แต่ปกติ
เหตุการณ์ของนักเรียนตามวัตถุประสงค์ของการศึกษานี้ การสกัดสารที่มีคุณสมบัติกรองออกต่อไปนี้
ตัวแปรหลักที่ผู้ใช้ระบุตัวระบุช่วงวันที่เซสชั่นและเวลาเริ่มต้นวันที่สิ้นสุดเซสชั่นและ
เวลานับตีของผู้ใช้และระยะเวลาที่เซสชั่นในนาที (หมอ et al, 2006.) มาตัวแปร (ระยะเวลาและความถี่ของการ
ข้อมูลของนักเรียนแต่ละคน) ถูกสกัดผ่านการคำนวณหรือสะสมตัวแปรหลัก
ข้อมูลในชีวิตประจำวันและรายสัปดาห์ ตัวแปรเหล่านี้ได้กลายเป็นทุ่งนาที่ได้รับมอบหมายที่มีคุณลักษณะที่เหมาะสม
ข้อมูลและจัดเก็บไว้ในระบบการจัดการฐานข้อมูล เขตข้อมูลทั้งหมดถูกจัดด้วย
ตารางและกลายเป็นฐานข้อมูลที่มีเหตุผล ตารางที่ 1 แสดงรายการบางส่วนของตัวแปรหลักและมาจากเซิร์ฟเวอร์บันทึก
.
ตารางที่ 1 ตัวอย่างของตัวแปรหลักและมา
ตัวแปรชื่อคำอธิบายรหัส
รหัสผู้ใช้ความถี่รวม loginfre ของการเข้าสู่ระบบ LMS
lastlog เมื่อครั้งสุดท้ายที่เข้าสู่ LMS
ความถี่รวม classfre ในการเข้าถึงวัสดุหลักสูตร
lastclass เมื่อครั้งสุดท้ายที่เข้าถึงวัสดุหลักสูตร
noposting จำนวนรวมของข้อความที่โพสต์บอร์ด
disfre จำนวนรวมของการอภิปรายร่วม synchronous
readhr ชั่วโมงใช้เวลาในการอ่านข่าว กระดานข้อความ
readmegs จำนวนรวมของข้อความกระดานข่าวอ่าน
ขั้นตอนการทำเหมืองข้อมูลรวมย่อยสองขั้นตอนคือ (ก) การวิเคราะห์เชิงพรรณนาและ (ข) ปัญญาประดิษฐ์
วิเคราะห์ พรรณนาวิเคราะห์ (maimon & Rokach 2005; roiger & geatz, 2003) ถูกนำมาใช้กับ
สรุปการจัดกลุ่มและสมาคมกฎเทคนิคการสร้างภาพรวมในชุดการ
เข้าใจถึงนักเรียน 'ลักษณะและการแสดงของนักเรียน รูปแบบการเรียนรู้เทียม
วิเคราะห์ข่าวกรองถูกนำมาใช้เพื่อวัตถุประสงค์ในการทำนาย (Hastie, tibshirani, &ฟรีดแมน, 2003)
ตัดสินใจเทคนิคต้นไม้ถูกนำมาใช้ในการสร้างแบบจำลองการคาดการณ์ผลการดำเนินงานการเรียนรู้ออนไลน์.
ขั้นตอนการวิเคราะห์รูปแบบการรวมการตีความข้อมูลและการประเมินผล ขั้นตอนนี้
จำเป็นในการระบุผลลัพธ์ที่มีความหมายจากผลที่ได้จากขั้นตอนการทำเหมืองข้อมูลรายละเอียดของตัวแปรและ
วิเคราะห์ต่อไปได้รับการค้นพบในขั้นตอนการทำเหมืองข้อมูลและการกล่าวถึงในขั้นตอนการวิเคราะห์รูปแบบ.
เครื่องมือวิเคราะห์และวิธีการ
สองเปิดแหล่งที่มาการทำเหมืองข้อมูลซอฟแวร์, weka (Witten &จริงใจ, 2005) และ knime (Konstanz
มหาวิทยาลัย , 2006) ถูกนำมาใช้ในการดำเนินการวิเคราะห์ข่าวกรองบรรยายและเทียม spss ถูกนำมาใช้
เพื่อดำเนินการคำสั่ง SQL และการแสดงข้อมูล
. วัตถุประสงค์ของการพรรณนาวิเคราะห์เพื่อสร้างภาพรวมของวิธีการให้นักเรียนทุกคนทำใน
กรอบเวลาที่กำหนด ข้อมูลการประมวลผลได้รับการมองเห็นผ่านตารางและกราฟิก การแสดงผลกราฟิก
การแปล กรุณารอสักครู่..
ข้อมูลการทำขั้นตอนการประมวลผลเบื้องต้นโดยใช้แฟ้มบันทึกลดลง ซึ่งถูก "กำจัด" ออก
ทั้งหมดไร้ประโยชน์ ไม่สม่ำเสมอ และขาดข้อมูลจากเดิม LMS ทั่วไปขึ้น หลังจากต้น
ลดล็อกไฟล์สำหรับการสกัดคุณลักษณะประมวลผลเบื้องต้น ใช้ตัวเซสชันถูก วัตถุประสงค์ของ
ตัวคือการรวมคำขอของผู้ใช้ทั้งหมดในเซสชันเป็นตัวแปรชุดเดียวกัน ตัวอย่าง การ
เซสชันปกติเริ่มเมื่อนักเรียนสู่ LMS และสิ้นสุดเมื่อนักเรียนกด
ปุ่มจบการทำงาน อย่างไรก็ตาม บางครั้งรอบจะถูกยกเลิกเมื่อนักเรียนตั้งใจปิด
เว็บเบราว์เซอร์ หรือนักเรียนอาจไม่ได้ใช้งานกับเว็บไซต์หลักสูตรเปิดยัง ทำอะไร ในการ
อินสแตนซ์หลัง LMS จะสิ้นสุดเซสชันโดยอัตโนมัติหลังจาก 20 นาทีไม่มีกิจกรรม ในนี้
กรณี เก็บข้อมูลดิบที่เกี่ยวข้องออกจากฐานข้อมูลเพื่อสะท้อนการเรียนรู้ปกติเท่านั้น
เหตุการณ์ของนักเรียนตามวัตถุประสงค์ของการศึกษานี้ คุณสมบัติสกัดกรองออกต่อ
ตัวแปรหลัก: ตัวระบุผู้ใช้ รหัสรอบเวลา วันเริ่มต้นเซสชัน และเวลา วันสิ้นสุดเซสชัน และ
เวลา ผู้เข้าชมจำนวน และช่วงระยะเวลานาที (Mor และ al., 2006) มาแปร (ระยะเวลา และ
ความถี่ของข้อมูลของนักเรียน) ถูกแยกคำนวณ หรือหลังตัวแปรหลัก
ข้อมูลพื้นฐานรายวัน และรายสัปดาห์ ตัวแปรเหล่านี้ถูกเปลี่ยนเป็นเขต กำหนดให้ มีเฉพาะ
ข้อมูลคุณลักษณะ และจัดเก็บในระบบจัดการฐานข้อมูล เขตข้อมูลทั้งหมดถูกจัดโดย
ตาราง และรูปแบบฐานข้อมูลเชือด ตารางที่ 1 แสดงรายการบางส่วนของตัวแปรหลัก และสืบทอดจาก
ล็อกเซิร์ฟเวอร์การ
1 ตาราง ตัวอย่างของหลักและตัวแปรมา
แปร
คำอธิบายชื่อ
ID ผู้
LoginFre รวมความถี่ของการเข้าสู่ระบบ LMS
เมื่อ LastLog ครั้งสุดท้ายเข้าสู่ใน LMS
ClassFre รวมความถี่ของการเข้าถึงหลักสูตรวัสดุ
LastClass เมื่อมีวัสดุหลักสูตรเวลาเข้าถึงสุดท้าย
NoPosting รวมจำนวนกระดานข่าวลง
เข้าร่วมจำนวนรวม DisFre สนทนาแบบซิงโครนัส
ReadHr ชั่วโมงใช้เวลาอ่านกระดานข่าว
ReadMegs รวมจำนวนกระดานข่าวอ่าน
ขั้นตอนการทำเหมืองข้อมูลรวมระยะย่อยที่ 2: วิเคราะห์ (ก) คำอธิบาย และ (ข) ปัญญาประดิษฐ์
วิเคราะห์ อธิบายวิเคราะห์ (Maimon & Rokach, 2005 Roiger & Geatz, 2003) ใช้กับ
สรุป คลัสเตอร์ และสมาคมเทคนิคกฎเพื่อสร้างภาพบนชุดข้อมูล การ
เข้าใจผิด เป็นลักษณะของนักเรียน และ การวาดรูปแบบการเรียนรู้ของนักเรียน ประดิษฐ์
วิเคราะห์ข่าวกรองถูกใช้สำหรับการคาดการณ์ (Hastie, Tibshirani &ฟรีดแมน 2003) ใน
เทคนิคต้นไม้ตัดสินใจนำมาใช้ในการสร้างแบบจำลองคาดการณ์ของการเรียนรู้ออนไลน์ประสิทธิภาพ
รวมขั้นตอนการวิเคราะห์รูปแบบตีความข้อมูลและการประเมินผลการ ระยะนี้ถูก
ต้องระบุผลลัพธ์มีความหมายจากผลลัพธ์ของขั้นตอนการทำเหมืองข้อมูล รายละเอียดของตัวแปร และ
วิเคราะห์ถูกเปิดในขั้นตอนการทำเหมืองข้อมูล และกล่าวถึงในรูปแบบวิเคราะห์ระยะ
สร้างเครื่องมือและวิธี
สองเปิดแหล่งข้อมูลเหมืองซอฟต์แวร์แพคเกจ Weka (Witten & Frank, 2005) และ Knime (Konstanz
มหาวิทยาลัย 2006), ใช้การวิเคราะห์ข่าวกรองอธิบาย และประดิษฐ์ มีใช้โปรแกรม
การ SQL แบบสอบถามและข้อมูลแสดงภาพประกอบเพลง
วัตถุประสงค์ของการวิเคราะห์การอธิบายคือการ สร้างภาพรวมของวิธีนักเรียนทุกคนได้ทำในการ
กำหนดกรอบเวลา ประมวลผลข้อมูลมี visualized ตารางและกราฟิก การแสดงผลกราฟิก
การแปล กรุณารอสักครู่..