2.6. Spectral data management
High dimensionality of the input data is a known problem
associated with SVM classifier (Mountrakis et al., 2011). This problem
was approached with MNF transformation, which is a feature
reduction algorithm based on two PCA transformations. The first
PCA rotation decorrelates and rescales the noise in the data based
on estimated noise covariance matrix. The second PCA rotation uses
the PCA components derived from the original data, which have
been noise whitened by the first rotation and rescaled by noise
standard deviation (Green et al., 1988; RSI, 2004).
We applied MNF transformation to reflectance data where nonvegetation
targets were masked out. The result was 64 MNF bands
keeping all the spectral variation of the original data with most
spectral variation packed in the first bands. The last band containing
any spatially coherent information in visual interpretation was
band 14. A plot of MNF values (eigenvalues) against the number
of MNF bands was generated and inspected. According to Zhang
and Xie (2012) the useful bands have MNF values a magnitude
higher than the noise dominated bands. The plot had significant
break around band 12, which indicates that the following bands
are dominated by noise. Preliminary classification tests were made
with sets of 8–14 first MNF bands and the set that produced the
highest classification accuracy was used for further classifications.
2.7. Image classification
We applied SVM classification to the MNF transformed data
using pairwise classification strategy in ENVI software (RSI, 2004).
The soft margin approach (Bennet and Mangasarian, 1992; Cortes
and Vapnik, 1995) was used to tackle the problem of linearly nonseparable
data problem (Pal and Watanachaturaporn, 2004). The
soft margin method relaxes the requirement that all data points in
the same class need to be located on the same side of the separating
hyperplane. It is controlled by penalty value C that controls
the trade-off between allowing training errors and forcing rigid
margins.
SVM was applied with radial basis function (RBF) kernel. Kernels
are used to stretch the input data as it is transformed into feature
space, which makes the class separability better. RBF has been
shown to outperform other kernels (Melgani and Bruzzone, 2004;
Roli and Fumera, 2001). However, there are indications that optimal
kernel might depend on the used pixel size (Zhu and Blumberg,
2002). RBF kernel uses user defined kernel width parameter (γ).
There exists no common practice for defining C and γ parameters
(Mountrakis et al., 2011). The C value was set to 100, which has
been used in previous studies (Petropoulos et al., 2012). After testing
a wide range of γ values and finding no effect to classification
accuracy, we used the γ value corresponding to the inverse of the
number of input bands, which is the default value in ENVI.
The species used in the classification constituted only a small
fraction of the natural and cultivated species growing in the region.
Therefore, if all the pixels are classified into one of the seven classes,
the pixels of remaining 28 species and other non-mapped species
that occur in the area would be classified incorrectly. To reduce
this type of misclassification we adjusted the PT that determines
the probability level that is needed for a pixel to be classified into
one of the classes. If PT is 0.0, all the pixels are classified. Conversely,
if PT is 0.9, only pixels with probability greater than 0.9 to belong
to one of the classes are classified, while 1.0 is the highest possible
probability for a pixel. We assume that probabilities are lower for
pixels that are covered by non-target plant species, and hence PT
could be used for limiting mapped area to pixels that are covered by
target species. PT between 0.0 and 0.9 with 0.1 steps were tested.
2.6 การจัดการข้อมูลสเปกตรัมDimensionality สูงของข้อมูลป้อนเข้าเป็นปัญหารู้จักเกี่ยวข้องกับ classifier SVM (Mountrakis et al., 2011) ปัญหานี้ถูกทาบทามกับแปลงบด ซึ่งเป็นคุณลักษณะขั้นตอนวิธีลดที่ตามสอง PCA แปลง ครั้งแรกPCA หมุน decorrelates และ rescales เสียงในโครงในประมาณเมตริกซ์ความแปรปรวนร่วมของเสียง ใช้หมุน PCA ที่สองส่วนประกอบของสมาคมมาจากข้อมูลเดิม ซึ่งมีแล้วเสียง whitened ตามวาระแรก และ rescaled โดยเสียงส่วนเบี่ยงเบนมาตรฐาน (Green et al., 1988 RSI, 2004)เราใช้การบดแบบสะท้อนแสงข้อมูลที่ nonvegetationเป้าหมายสวมหน้ากากออก ผลลัพธ์คือ 64 บดวงรักษาทั้งหมดที่สเปกตรัมความผันแปรของข้อมูลต้นฉบับ มีมากสุดเปลี่ยนแปลงสเปกตรัมบรรจุในวงแรก ประกอบด้วยวงสุดท้ายข้อมูลใด ๆ spatially coherent ในการตีความภาพวงที่ 14 ลงจุดของค่าบด (เวกเตอร์) กับหมายเลขบดวงถูกสร้างขึ้น และตรวจสอบ ตามเตียวเจีย (2012) และวงดนตรีที่มีประโยชน์มีค่าบดมีขนาดสูงกว่าเสียงที่ครอบงำวง แปลงได้อย่างมีนัยสำคัญตัดรอบวง 12 ซึ่งหมายถึงวงดนตรีต่อไปนี้ถูกครอบงำ โดยเสียง ทำการทดสอบเบื้องต้นประเภทชุดที่ 8 – 14 แรกบดวงและชุดที่ผลิตในจัดประเภทความแม่นยำที่สูงสุดที่ใช้สำหรับจัดประเภทเพิ่มเติม2.7 การภาพที่จัดประเภทเราใช้ SVM จัดประเภทข้อมูลแปลงบดใช้กลยุทธ์ประเภทแพร์ไวส์ในซอฟต์แวร์สามารถ (RSI, 2004)วิธีการขอบนุ่ม (Bennet และ Mangasarian, 1992 สคอทส์และ Vapnik, 1995) ใช้เล่นงานปัญหาเชิงเส้น nonseparableปัญหาของข้อมูล (Pal และ Watanachaturaporn, 2004) ที่ขอบนุ่มวิธีคลายความที่จุดข้อมูลทั้งหมดในประเภทเดียวกันต้องอยู่บนด้านเดียวของการแยกhyperplane มันถูกควบคุม โดยปรับค่า C ที่ควบคุมtrade-off ระหว่างให้ข้อผิดพลาดในการฝึกอบรม และการบังคับเข้มงวดระยะขอบSVM ถูกประยุกต์ใช้กับเคอร์เนล (RBF) ฟังก์ชันฐานรัศมี เมล็ดใช้ในการยืดข้อมูลป้อนเข้ามีแปลงเป็นลักษณะการทำงานพื้นที่ ซึ่งทำให้ separability ชั้นดี RBF ได้แสดงมีประสิทธิภาพสูงกว่าเมล็ดอื่น ๆ (Melgani และ Bruzzone, 2004Roli และ Fumera, 2001) อย่างไรก็ตาม มีบ่งชี้ที่เหมาะสมเคอร์เนลอาจขึ้นอยู่กับขนาดพิกเซลที่ใช้ (Zhu และ Blumberg2002) . RBF เคอร์เนลใช้พารามิเตอร์ความกว้างเคอร์เนลผู้ใช้กำหนด (γ)มีแล้วไม่ปฏิบัติทั่วไปสำหรับการกำหนดพารามิเตอร์ C และγ(Mountrakis et al., 2011) ค่า C ถูกตั้งค่าให้ 100 ซึ่งมีการใช้ในการศึกษาก่อนหน้า (Petropoulos et al., 2012) หลังจากการทดสอบค่าγและไม่มีผลต่อการจัดประเภทการค้นหาที่หลากหลายความถูกต้อง เราใช้ค่าγที่สอดคล้องกับค่าผกผันของการหมายเลขของวงสำหรับการป้อนค่า ซึ่งเป็นค่าเริ่มต้นในสามารถพันธุ์ที่ใช้ในการจัดประเภททะลักขนาดเล็กเศษส่วนชนิดธรรมชาติ และปลูกเพิ่มขึ้นในภูมิภาคดังนั้น ถ้าพิกเซลทั้งหมดจะแบ่งเป็นชั้น 7 อย่างใดอย่างหนึ่งพิกเซลเหลือ 28 ชนิดและพันธุ์อื่น ๆ ไม่ได้แมปที่เกิดขึ้นในพื้นที่จะจัดประเภทไม่ถูกต้อง เพื่อลดmisclassification ชนิดนี้เราปรับ PT ที่กำหนดระดับความน่าเป็นที่จำเป็นสำหรับเซลจะแบ่งออกเป็นหนึ่งของการเรียน ถ้า PT เป็น 0.0 พิกเซลทั้งหมดแบ่งออก ในทางกลับกันถ้า PT 0.9 พิกเซลเท่ากับ 0.9 อยู่มากกว่าน่าเป็นชั้นที่หนึ่งประเภท 1.0 เป็น ไปได้สูงสุดน่าเป็นพิกเซล เราคิดว่า กิจกรรมต่ำกว่าสำหรับพิกเซลโดยเป้าหมายไม่ใช่พืชพันธุ์ และดังนั้น PTใช้พิกเซลโดยพื้นที่แมปจำกัดชนิดเป้าหมาย PT ระหว่าง 0.0 และ 0.9 0.1 ตอนทดสอบ
การแปล กรุณารอสักครู่..
2.6 สเปกตรัมการจัดการข้อมูลมิติที่สูงของการป้อนข้อมูลเป็นปัญหาที่รู้จักกันที่เกี่ยวข้องกับการจําแนกSVM (Mountrakis et al., 2011) ปัญหานี้ได้รับการติดต่อกับการเปลี่ยนแปลงเอมซึ่งเป็นคุณลักษณะที่มีขั้นตอนวิธีการลดลงขึ้นอยู่กับสองแปลงPCA ครั้งแรกที่หมุน PCA decorrelates rescales และเสียงในข้อมูลตามในเมทริกซ์เสียงแปรปรวนประมาณ การหมุน PCA ที่สองใช้ส่วนประกอบPCA ที่ได้มาจากข้อมูลเดิมที่ได้รับขาวเสียงโดยการหมุนครั้งแรกและrescaled ด้วยเสียงส่วนเบี่ยงเบนมาตรฐาน(สีเขียว et al, 1988;. อาร์เอส, 2004). เราใช้การเปลี่ยนแปลงเอมข้อมูลสะท้อนที่ nonvegetation เป้าหมายถูกสวมหน้ากากออก ผลที่ได้คือ 64 วงดนตรีที่เอมรักษาทุกรูปแบบสเปกตรัมของข้อมูลเดิมที่มีมากที่สุดรูปแบบสเปกตรัมบรรจุในวงดนตรีที่แรก วงดนตรีที่ผ่านมาที่มีข้อมูลใด ๆ ที่เชื่อมโยงกันตำแหน่งในการตีความภาพเป็นวง14. พล็อตของค่าเอม A (ค่าลักษณะเฉพาะ) กับจำนวนของวงเอมถูกสร้างขึ้นและการตรวจสอบ ตามที่จางและ Xie (2012) วงดนตรีที่มีประโยชน์มีคุณค่าเอมขนาดสูงกว่าวงดนตรีที่โดดเด่นเสียง พล็อตที่สำคัญมีการแบ่งรอบวง 12 ซึ่งบ่งชี้ว่าวงดนตรีที่ดังต่อไปนี้มีความโดดเด่นด้วยเสียง การจัดหมวดหมู่การทดสอบเบื้องต้นได้ทำกับชุดของวงดนตรีที่ 8-14 เอมครั้งแรกและชุดที่ผลิตถูกต้องจำแนกสูงสุดที่ใช้ในการจำแนกประเภทต่อไป. 2.7 การจัดหมวดหมู่ภาพที่เรานำมาใช้การจัดหมวดหมู่ SVM จะเอมเปลี่ยนข้อมูลที่ใช้กลยุทธ์การจัดหมวดหมู่คู่ซอฟต์แวร์ENVI (RSI, 2004). วิธีการที่อัตรากำไรขั้นต้นอ่อน (เบนเนตและ Mangasarian 1992; คอร์เทสและVapnik, 1995) ถูกใช้ในการจัดการปัญหาของเส้นตรง nonseparable ปัญหาข้อมูล (Pal และ Watanachaturaporn, 2004) วิธีอัตรากำไรขั้นต้นอ่อนผ่อนคลายความต้องการที่ทุกจุดข้อมูลที่อยู่ในความต้องการที่ระดับเดียวกันกับที่จะตั้งอยู่บนฝั่งเดียวกันของแยกไฮเปอร์เพล มันจะถูกควบคุมโดยค่าโทษ C ที่ควบคุมการค้าออกระหว่างที่ช่วยให้ข้อผิดพลาดของการฝึกอบรมและการบังคับให้แข็งอัตรากำไรขั้นต้น. SVM ถูกนำมาใช้กับฟังก์ชั่นพื้นฐานรัศมี (RBF) เคอร์เนล เมล็ดจะใช้ในการยืดการป้อนข้อมูลในขณะที่มันจะกลายเป็นคุณลักษณะพื้นที่ซึ่งจะทำให้แยกได้ระดับที่ดีกว่า RBF ได้รับการแสดงที่จะมีประสิทธิภาพสูงกว่าเมล็ดอื่นๆ (Melgani และ Bruzzone 2004; Roli และ Fumera, 2001) แต่มีข้อบ่งชี้ว่าดีที่สุดเคอร์เนลอาจจะขึ้นอยู่กับขนาดของพิกเซลที่ใช้ (จู้และ Blumberg, 2002) เคอร์เนล RBF ใช้พารามิเตอร์ที่ผู้ใช้กำหนดความกว้างของเคอร์เนล (γ). มีอยู่ไม่มีการปฏิบัติร่วมกันสำหรับการกำหนดค่าพารามิเตอร์ซีและγ (Mountrakis et al., 2011) ค่า C ถูกกำหนดให้ 100 ซึ่งได้ถูกนำมาใช้ในการศึกษาก่อนหน้า(Petropoulos et al., 2012) หลังจากการทดสอบที่หลากหลายของค่าγและหาผลกระทบที่จะจัดหมวดหมู่ความถูกต้องที่เราใช้ค่าγสอดคล้องกับการผกผันของจำนวนวงดนตรีอินพุทที่เป็นค่าเริ่มต้นในENVI. สายพันธุ์ที่นำมาใช้ในการจัดหมวดหมู่ประกอบด้วยเพียงเล็ก ๆส่วนของสายพันธุ์ธรรมชาติและการเพาะปลูกที่เพิ่มขึ้นในภูมิภาค. ดังนั้นถ้าพิกเซลทั้งหมดจะถูกแบ่งออกเป็นหนึ่งในเจ็ดชั้นเรียนพิกเซลที่เหลืออยู่ 28 สายพันธุ์และอื่น ๆ ที่ไม่ใช่สายพันธุ์แมปที่เกิดขึ้นในพื้นที่จะได้รับการจัดอย่างไม่ถูกต้อง เพื่อลดประเภทของการจำแนกนี้เราปรับ PT ที่กำหนดระดับความน่าจะเป็นที่จำเป็นสำหรับพิกเซลจะถูกแบ่งออกเป็นหนึ่งในชั้นเรียน หาก PT คือ 0.0 พิกเซลทั้งหมดที่มีการจัด ตรงกันข้ามถ้า PT คือ 0.9 เท่านั้นพิกเซลมีความน่าจะสูงกว่า 0.9 จะเป็นที่หนึ่งของชั้นเรียนจะจัดในขณะที่1.0 เป็นไปได้มากที่สุดน่าจะเป็นพิกเซล เราคิดว่าน่าจะเป็นที่ต่ำกว่าสำหรับพิกเซลที่ถูกปกคลุมไปด้วยไม่ใช่เป้าหมายพันธุ์พืชและด้วยเหตุนี้ PT สามารถนำมาใช้สำหรับการ จำกัด พื้นที่แมปไปพิกเซลที่ถูกปกคลุมไปด้วยสายพันธุ์เป้าหมาย PT ระหว่าง 0.0 และ 0.9 กับ 0.1 ขั้นตอนที่ได้รับการทดสอบ
การแปล กรุณารอสักครู่..
2.6 สเปกตรัมการจัดการ
ข้อมูลสูง dimensionality ของข้อมูลเข้าเป็นปัญหารู้จัก
เกี่ยวข้องกับ SVM ลักษณนาม ( mountrakis et al . , 2011 )
ปัญหานี้เข้าหาเอมกับการเปลี่ยนแปลง ซึ่งเป็นคุณลักษณะ
ลดขั้นตอนวิธีขึ้นอยู่กับสองระบบการแปลง . ครั้งแรก
decorrelates rescales PCA หมุนและเสียงในข้อมูลพื้นฐานเกี่ยวกับเสียง
ประมาณร่วมเมทริกซ์การหมุน PCA ที่สองใช้
PCA ส่วนประกอบที่ได้มาจากข้อมูลเดิมที่ได้ถูกรบกวนไปด้วย
โดยรอบแรก และ rescaled โดยใช้ส่วนเบี่ยงเบนมาตรฐานเสียง
( สีเขียว et al . , 1988 ; RSI , 2004 ) .
เราใช้แปลงค่าข้อมูลที่ nonvegetation เอม
เป้าหมายคือหน้ากากออก ผลที่ได้คือ 64 วงเอม
รักษาทั้งหมดสเปกตรัมการเปลี่ยนแปลงข้อมูลเดิมกับที่สุด
รูปแบบการบรรจุในกลุ่มแรก เมื่อวงดนตรีที่มีความแตกต่างกันในข้อมูลใด ๆ
ภาพตีความเป็นวงดนตรี 14 แผนของเอมค่า ( ค่า ) กับหมายเลขของเอม
วงถูกสร้างขึ้นและตรวจสอบ . ตาม Zhang
และซือ ( 2012 ) วงดนตรีที่มีประโยชน์ที่มีค่าขนาด
สูงกว่าเสียงครอบงำวงเอม . พล็อตมีความแตกต่าง
แบ่งรอบวง 12 ซึ่งพบว่าวงดนตรี
ต่อไปนี้เป็น dominated โดยเสียง การทดสอบจำแนกเบื้องต้นได้
กับชุด 8 – 14 แรกเอมวงและตั้งค่าที่ผลิต
สูงสุดใช้ความแม่นยำในการจำแนกหมวดหมู่เพิ่มเติม .
2.7 . รูปภาพหมวดหมู่
เราใช้หมวดหมู่ SVM กับเอม
เปลี่ยนข้อมูลโดยใช้กลยุทธ์ประเภทคู่ในโปรแกรม ENVI ( RSI , 2004 ) .
ขอบนุ่มเข้าใกล้ เบนเน็ต และ mangasarian , 1992 ; Cortes
และ vapnik , 1995 ) คือใช้ในการแก้ไขปัญหาของปัญหาน้ำหนัก nonseparable
ข้อมูล ( PAL ) และ watanachaturaporn , 2004 )
ขอบนุ่ม วิธีการผ่อนคลายความต้องการของข้อมูลทั้งหมดในจุด
ห้องเดียวกันต้องอยู่ในด้านเดียวกันของแยก
ระนาบเกิน . มันถูกควบคุมโดยการลงโทษ ค่า C ที่ควบคุมการแลกเปลี่ยนระหว่าง
ให้ข้อผิดพลาดการฝึกอบรมและบังคับให้ขอบแข็ง
.
SVM ก็ใช้ฟังก์ชันเรเดียลเบซิส ( RBF ) เคอร์เนล เมล็ด
ใช้ยืดข้อมูลเข้ามันก็กลายเป็นคุณลักษณะ
พื้นที่ซึ่งทำให้ชั้นแยกออกจากกันได้ดีขึ้น บริษัทได้ถูก
แสดงดีกว่าเมล็ดอื่น ๆ ( melgani และ bruzzone , 2004 ;
โรลี และ fumera , 2001 ) อย่างไรก็ตาม มีข้อบ่งชี้ที่เหมาะสมจะขึ้นอยู่กับเคอร์เนล
ใช้ขนาดพิกเซล ( Zhu Blumberg
และ , 2002 ) RBF kernel ใช้ผู้ใช้กำหนดพารามิเตอร์ของเคอร์เนล ( γ ) .
มีอยู่ไม่มีการปฏิบัติทั่วไปสำหรับการกำหนด C และγพารามิเตอร์
( mountrakis et al . , 2011 ) C ค่าตั้งไว้ที่ 100 ซึ่งมี
ถูกใช้ในการศึกษาก่อนหน้านี้ ( petropoulos et al . , 2012 ) หลังจากการทดสอบ
ช่วงกว้างของγค่าและการหาไม่มีผลต่อการจำแนก
ความถูกต้อง เราใช้γสอดคล้องกับค่าผกผันของ
จำนวนวงเข้า ซึ่งเป็นค่าเริ่มต้นใน Envi .
ชนิดที่ใช้ในการจำแนกตั้งขึ้นเพียงเศษเล็ก ๆของสายพันธุ์ที่ปลูก
ธรรมชาติเติบโตในภูมิภาค
ดังนั้นถ้าพิกเซลทั้งหมด แบ่งเป็น หนึ่งในเจ็ดชั้นเรียน
พิกเซลที่เหลือ 28 ชนิด และชนิดอื่น ๆที่ไม่ใช่แมป
เกิดขึ้นในพื้นที่จะถูกจัดอย่างไม่ถูกต้อง ลด
ประเภทนี้ผิดพลาดเราปรับ PT ที่กำหนด
น่าจะเป็นระดับที่จำเป็นสำหรับพิกเซลจะแบ่ง
หนึ่งของชั้นเรียน ถ้า PT คือ 0.0 , พิกเซลทั้งหมดเป็นความลับในทางกลับกัน ถ้าจุดเป็น 0.9
, พิกเซลเท่านั้นที่มีโอกาสมากกว่า 0.9 อยู่
หนึ่งของชั้นเรียนจะแบ่งในขณะที่ 1.0 สูงสุด
ความน่าจะเป็นสำหรับพิกเซล เราสันนิษฐานว่า อาจจะต่ำกว่าสำหรับ
พิกเซลที่ถูกปกคลุมด้วยพืชที่ไม่ใช่เป้าหมาย ดังนั้น PT
สามารถใช้สำหรับการแมปพื้นที่พิกเซลที่ถูกปกคลุมไปด้วย
ชนิดเป้าหมาย PT ระหว่าง 0.0 0 .9 กับ 0.1 ขั้นตอนดำเนินการ
การแปล กรุณารอสักครู่..