2.4. Statistical analysis and pattern recognition
Statistical analysis and pattern recognition was employed using
the maximum or minimum response values of sensors in e-nose.
MD is used to calculate the similarity of two unknown samples.
It is calculated using the inverse of the variance–covariance matrix
of the data set of interest. Geometrically, the MD class model is an
ellipsoid-shaped cluster with the population mean at its centroid
and its size defined by the value of chi-squared at a user-specified
confidence level [20].
PCA is a very powerful multivariate statistics method used to
analyze the inherent structure of the data [16]. The main purpose
of this linear feature extraction method is to reduce dimensions,
that is projecting the m-dimensional data set (m is the numbers of
the sensors) in a dimension smaller than m.
LDA is another widely used statistic method. Similar to PCA, it is
also a linear combination of the original variable to construct a discriminant
function [21]. Compared with PCA, the LDA method can
notice the distribution of points in the same category and the distance
between them. The graphical view of LDA analysis is similar
to a PCA display.
Stepwise LDA was applied to select the variables with the
highest power of discrimination, it differs from the classical LDA
procedure in the choice of PCs to be used. For classical LDA, the PCs
are taken in order PC1, PC2, PC3, etc. However, the stepwise LDA
procedure picks out, as the first PC in the model, the one that gives
the highest classification success rate. The next and subsequent PCs
are added to the model using the same criterion regardless of the
proportion of variance associated with them. In the development
of the discriminant function, variables are added or deleted based
on their effect on the Wilks’ lambda and on their significance as
measured by a suitable F test [22].
2.4 . สถิติที่ใช้ในการวิเคราะห์ข้อมูล และรูปแบบการวิเคราะห์ทางสถิติและรูปแบบ
เป็นเครื่องมือในการตอบสนองสูงสุดหรือค่าต่ำสุดของเซ็นเซอร์ในจมูก .
MD จะใช้ในการคำนวณความคล้ายกันของทั้งสองไม่รู้จักตัวอย่าง
ซึ่งคำนวณโดยใช้ผกผันของเมทริกซ์ความแปรปรวนร่วม (
ของชุดข้อมูลที่น่าสนใจ ทางเรขาคณิต , MD ชั้นแบบเป็น
มีรูปกลุ่มที่มีประชากรหมายถึงที่เซนทรอยด์
และขนาดที่กำหนดโดยค่าไคกำลังสองที่ผู้ใช้กำหนดระดับความเชื่อมั่น
[ 20 ] .
PCA เป็นสถิติหลายตัวแปรใช้วิธีที่มีประสิทธิภาพมาก
ศึกษาโครงสร้างที่แท้จริงของข้อมูล [ 16 ] จุดประสงค์หลักของเส้นลักษณะการสกัดวิธีนี้
เพื่อลดขนาดนั่นคือการยื่น m-dimensional ชุดข้อมูล ( เป็นเบอร์ของ
เซ็นเซอร์ ) ในมิติขนาดเล็กกว่า M .
lda เป็นอีกหนึ่งสถิติที่ใช้กันอย่างแพร่หลาย . คล้ายกับ PCA เป็น
ยังเส้นเดิมรวมกันของตัวแปรที่จะสร้างฟังก์ชันจำแนก
[ 21 ] เมื่อเทียบกับ PCA , lda วิธีการ
สังเกตเห็นการกระจายตัวของคะแนนในประเภทเดียวกันและระยะทาง
ระหว่างพวกเขามุมมองแบบกราฟิกของการวิเคราะห์ lda คล้ายคลึง
กับ PCA แสดง .
= lda มาประยุกต์ใช้ในการเลือกตัวแปรที่มีอำนาจสูงสุด
เลือกปฏิบัติ มันแตกต่างจากกระบวนการ lda
คลาสสิกในการเลือกชิ้นที่จะใช้ แบบ lda , ชิ้น
ถ่ายเพื่อ PC pc2 ด้วย , , , ฯลฯ แต่วิธีการ lda
= หยิบออกมาเป็นครั้งแรกในรูปแบบหนึ่งที่ให้
การจำแนกสูงสุดอัตราความสําเร็จ ต่อไปและต่อมาชิ้น
จะเพิ่มรูปแบบ โดยใช้เกณฑ์เดียวกันโดยไม่คำนึงถึง
อัตราส่วนของความแปรปรวนที่เกี่ยวข้องกับพวกเขา ในการพัฒนา
ของฟังก์ชันจำแนกตัวแปรจะถูกเพิ่มหรือลบตาม
ผลของพวกเขาในวิลก์ส ' lambda และความสำคัญของพวกเขา
วัดโดยเหมาะทดสอบ F [ 22 ]
การแปล กรุณารอสักครู่..
