VI. DATA MINING TECHNIQUES USED FOR PREDICTIONS
The three different data mining classification techniques, i.e. Neural Networks, Decision Trees, and Naive
Bayes are used to analyze the dataset.
4.1. Neural Networks
An artificial neural network (ANN), often just called a "neural network" (NN), is a mathematical model or
computational model based on biological neural network. In other words, it is an emulation of biological neural system
[13]. A Multi-layer Perceptron Neural Networks (MLPNN) is used.
It maps a set of input data onto a set of appropriate output data. It consists of 3 layers input layer, hidden layer &
output layer. There is connection between each layer & weights are assigned to each connection. The primary function of
neurons of input layer is to divide input xi into neurons in hidden layer. Neuron of hidden layer adds input signal xi with
weights wji of respective connections from input layer. The output Yj is function of Yj = f (Σ wji xi) Where f is a simple
threshold function such as sigmoid or hyperbolic tangent function.
4.2. Decision Trees
The decision tree approach is more powerful for classification problems. There are two steps in this techniques
building a tree & applying the tree to the dataset. There are many popular decision tree algorithms CART, ID3, C4.5,
CHAID, and J48. From these J48 algorithm is used for this system. J48 algorithm uses pruning method to build a tree.
Pruning is a technique that reduces size of tree by removing over fitting data, which leads to poor accuracy in
predications. The J48 algorithm recursively classifies data until it has been categorized as perfectly as possible. This
technique gives maximum accuracy on training data. The overall concept is to build a tree that provides balance of
flexibility & accuracy.
เหมืองแร่ไทย ข้อมูล เทคนิคที่ใช้ในการคาดการณ์
3 การทำเหมืองข้อมูลเทคนิคการจำแนกเครือข่ายประสาท คือ , ต้นไม้ตัดสินใจและใสซื่อ
Bayes จะใช้วิเคราะห์ข้อมูล .
4.1 . โครงข่ายประสาทเทียม
โครงข่ายประสาทเทียม ( ANN ) , มักจะเรียกว่า " เครือข่ายประสาท " ( NN ) เป็นแบบจำลองทางคณิตศาสตร์หรือแบบจำลองคอมพิวเตอร์
ตามเครือข่ายประสาทชีวภาพ ในคำอื่น ๆมันคือการแข่งขันของทางระบบประสาท
[ 13 ] หลายชั้นธรรมดาเครือข่ายประสาท ( mlpnn ) ใช้ .
มันแผนที่ชุดของข้อมูลลงในชุดข้อมูลผลผลิตที่เหมาะสม มันประกอบด้วย 3 ชั้นข้อมูลชั้น , ชั้นซ่อน&
ออกชั้น มีการเชื่อมต่อระหว่างแต่ละชั้น&น้ำหนักให้กับการเชื่อมต่อแต่ละ หน้าที่หลักของ
เซลล์ประสาทในชั้นข้อมูลจะแบ่งใส่ซีเป็นเซลล์ประสาทในชั้นซ่อน . เซลล์ประสาทในชั้นซ่อนเพิ่มสัญญาณ Xi กับน้ำหนักของตน
wji การเชื่อมต่อจากชั้นข้อมูล ผลผลิตเยจินเป็นฟังก์ชันของเยจิน = F ( Σ wji Xi ) โดยที่ f เป็นฟังก์ชันง่ายๆ
เกณฑ์เช่น sigmoid หรือค่าฟังก์ชันแทนเจนต์ .
4.2 . ต้นไม้การตัดสินใจ
ต้นไม้การตัดสินใจแนวทางที่มีประสิทธิภาพมากขึ้นสำหรับปัญหาการจำแนกประเภท มีสองขั้นตอนในเทคนิคนี้
สร้างต้นไม้&ใช้ต้นไม้กับข้อมูล . มีหลายนิยมขั้นตอนวิธีต้นไม้ตัดสินใจรถเข็น , ID3 , โปรแกรม C4.5
chaid , และ j48 . จาก j48 ขั้นตอนวิธีที่ใช้ในระบบนี้ ขั้นตอนวิธี j48 ใช้วิธีการสร้างต้นไม้ .
การตัดแต่งกิ่งเป็นเทคนิคที่ช่วยลดขนาดของต้นไม้ โดยเอาข้อมูลที่เหมาะสม ซึ่งจะนำไปสู่ความไม่ดีใน
predications . การ j48 ขั้นตอนวิธี recursively ประมวลข้อมูลจนกว่าจะถูกจัดประเภทเป็นอย่างดีที่สุด เทคนิคนี้จะช่วยให้ความถูกต้องสูงสุด
ข้อมูลการฝึกอบรม แนวคิดโดยรวม คือ การสร้างความสมดุลของต้นไม้ ที่ให้ความยืดหยุ่น&
ความถูกต้อง .
การแปล กรุณารอสักครู่..
