Experiments have been also carried out using HV pol or HH pol only (results not shown here). The use of dual-pol SAR image is able to produce a better ice concentration estimation than using HH or HV only, as has been demonstrated in previ- ous research [12], [34]. When using HH pol only, the results are strongly affected by the incidence angle, whereas using only HV pol shows banding in the resulting ice concentration estimate. CNNs have a large number of hyperparameters, such as input image patch size, number of layers, number of filters, size of filters, and parameters for training. The tuning of these hyperpa- rameters is essential to obtain good performance for a specific task. The patch size of the input for CNN, the filter size and pooling stride of the first convolution layer, and the size of the filters have been tuned to maximize performance in this study. Exhaustive searching of the best combination of hy- perparameters is very time consuming. In this experiment, the hyperparameters are tuned in two steps. First, the input image patch size and filter sizes are tuned using only three images, each of which is used for training, validation, and training. Then, the numbers of filters and layers are tuned on the full data set using the size of input image patch and the size of filters from the last step.
The patch size of the input image and the filter size are related with the intrinsic scale and complexity of the problem. In the tuning experiment, different patch sizes were tested. The patch size was found to have an impact on the results with most of the differences coming from the banding effect and melt surfaces. A patch size of 41 showed the least banding
effect and ice concentration underestimation, which might be caused by melt conditions, and was therefore adopted. CNN models with smaller patch size tend to underestimate ice con- centration. Intuitively, the strength and the small-scale texture of the backscatter of a melt pond are very similar to calm water [33]; thus, the correct identification of melt ice needs more information from its neighborhood in the image. A small patch size causes confusion between melt and water due to this lack of enough supporting neighborhood information. Using patch size over 41 does not lead to improved performance. Similarly, larger patch size also benefits the recognition of wind-roughened water. If the banding effect were to be totally removed from the image, the optimal patch size might be different. Our tuning experiments suggest that the model is not very sensitive to the selection of other parameters as long as the model is large enough (sufficient number of filters and layers).
The image analyses are subsampled because their spatial res- olution is much coarser than the SAR images, which introduces representation errors. It would be beneficial to model the errors explicitly [35], although the CNN is relatively robust to training sample errors [17]. Another benefit of the CNN is that it is a flexible computational structure. More observations can be easily incorporated into the current CNN as additional features of the input.
The training process ran for 500 epochs. The training and validation error started to converge at around 300 epochs, which is relatively slow. This may be caused by imbalance in the train- ing samples used. Imbalanced training samples means there is a dominant class in the samples. In our case, the number of water (ice concentration is 0) samples is about eight times the second most common ice concentration level in the training samples. Intuitively, this pushes the model to a “dangerous local mini- mum” quickly [36]. When the model is at this local minimum, it detects most of the input as water and can still achieve a low cost. This causes underestimation of the ice concentration in general if the training is stopped early. It may take many epochs to get out of this local minimum, which leads to long training period. There are several approaches that may be investigated to resolve this issue, including undersampling the majority [37], [38], oversampling the minority [37], [38], or using a Bayesian cross-entropy cost function [36]. Our experiments (not shown here) show that learning normally converges within 50 epochs when using those methods, but none of the aforementioned methods converges to a model better than training directly on all the training samples for a long time. In this paper, we choose to prioritize precision and bear with the long training time. A better method to reduce the effect of imbalanced data is needed for better performance in terms of computational time and result accuracy.
Preliminary investigation of the connection between CNN filters and sea surface conditions is conducted by visualizing the activation maps (output) of the trained convolution layers (see Fig. 8). It shows that the network identifies SAR image structures. Some convolutional filters of the first convolutional layer produce feature map
การทดลองการยังดำเนินใช้ HV pol หรือ pol HH เท่า (ผลลัพธ์ไม่แสดงที่นี่) การใช้ภาพแบบ dual pol SAR จะสามารถผลิตเป็นการประเมินความเข้มข้นน้ำแข็งดีกว่าใช้ HH หรือ HV เท่านั้น ที่ได้แสดงให้เห็นในงานวิจัย previ-ou ที่อยู่ [12], [34] เมื่อใช้ HH pol เท่า ผลลัพธ์จะขอผลจากมุมอุบัติการณ์ ในขณะที่ใช้เพียง HV pol แสดงแถบในการประเมินความเข้มข้นของน้ำแข็งได้ CNNs มี hyperparameters เช่นป้อนข้อมูลภาพแก้ไขขนาด จำนวนชั้น จำนวนของตัวกรอง ขนาดของตัวกรอง และพารามิเตอร์สำหรับการฝึกอบรมเป็นจำนวนมาก การปรับแต่งเหล่านี้ hyperpa-rameters เป็นสิ่งสำคัญที่จะได้รับประสิทธิภาพที่ดีสำหรับงานที่เฉพาะเจาะจง ปรับปรุงขนาดของอินพุตสำหรับ CNN ขนาดกรองและร่วมกันก้าวเดินของการพัฒนาชั้นแรก และขนาดของตัวกรองที่มีปรับแต่งได้เพื่อเพิ่มประสิทธิภาพในการศึกษานี้ ค้นหาข้อมูลของของ hy perparameters จะใช้เวลานานมาก ในการทดลองนี้ hyperparameters การปรับในสองขั้นตอน ครั้งแรก ขนาดโปรแกรมแก้ไขภาพที่นำเข้าและตัวกรองขนาดปรับใช้เพียงสามภาพ แต่ละที่จะใช้สำหรับการฝึกอบรม ตรวจสอบ และการฝึกอบรม แล้ว การปรับแต่งตามหมายเลขของตัวกรองและชั้นบนชุดข้อมูลทั้งหมดโดยใช้ขนาดของภาพที่นำเข้าโปรแกรมปรับปรุงและขนาดของตัวกรองจากขั้นตอนสุดท้ายแก้ไขขนาดของภาพนำเข้าและตัวกรองขนาดเกี่ยวข้องกับลักษณะขนาดและความซับซ้อนของปัญหา ในการทดลองปรับแต่ง ขนาด patch ต่าง ๆ รับการทดสอบ แพทช์ขนาดพบว่ามีผลต่อผลลัพธ์กับที่สุดของความแตกต่างที่มาจากผลกระทบแถบ และละลายพื้นผิว แพทช์ขนาด 41 พบแถบอย่างน้อยผลและน้ำแข็งเข้มข้น underestimation ซึ่งอาจเกิดจากสภาพการละลาย และถูกนำมาใช้ดัง นี้ รุ่นที่ CNN มีแพทช์ขนาดเล็กมักจะ ประมาทปรับแข็ง-centration ธรรมชาติ ความแข็งแรงและผิวขนาดเล็กของแสงกระจายกลับของบ่อละลายจะคล้ายกับสงบน้ำ [33]; ดังนั้น รหัสถูกต้องละลายน้ำแข็งต้องการข้อมูลเพิ่มเติมจากของย่านในภาพ แพทช์เล็กขนาดสาเหตุความสับสนระหว่างละลายน้ำเนื่องจากนี้ไม่เพียงพอ และสนับสนุนข้อมูลย่าน ใช้แพทช์ขนาด 41 กว่านำไปเพื่อปรับปรุงประสิทธิภาพ ในทำนองเดียวกัน แพทช์ขนาดยังประโยชน์การรับรู้ของผิวกระดูกลมน้ำ ถ้าผลแถบจะถูกเอาออกจากรูปภาพทั้งหมด โปรแกรมปรับปรุงที่เหมาะสมขนาดอาจแตกต่าง ทดลองปรับแต่งแนะนำแบบว่าไม่มีความสำคัญมากการเลือกพารามิเตอร์อื่น ๆ ตราบใดที่แบบจำลองมีขนาดใหญ่เพียงพอ (เพียงพอจำนวนตัวกรองชั้น)วิเคราะห์ภาพมี subsampled เนื่องจากตน spatial res olution หยาบมากกว่าภาพ SAR ที่แนะนำแสดงข้อผิดพลาด มันจะเป็นประโยชน์ต่อรุ่นข้อผิดพลาดอย่างชัดเจน [35], แม้ว่าซีเอ็นเอ็นจะค่อนข้างแข็งแกร่งในการฝึกอบรมข้อผิดพลาดตัวอย่าง [17] ประโยชน์ของซีเอ็นเอ็นคือ ว่า มันเป็นโครงสร้างการคำนวณที่มีความยืดหยุ่น ข้อสังเกตเพิ่มเติมสามารถรวมเข้าไปในซีเอ็นเอ็นปัจจุบันง่าย ๆ เป็นคุณสมบัติเพิ่มเติมของการป้อนข้อมูลกระบวนการฝึกวิ่งสำหรับ 500 epochs การฝึกอบรมและตรวจสอบข้อผิดพลาดเริ่มต้นที่มาบรรจบกันที่ประมาณ 300 epochs ซึ่งจะค่อนข้างช้า ซึ่งอาจมีสาเหตุจากความไม่สมดุลในตัวอย่างรถไฟ-ing ใช้ ตัวอย่างการฝึกอบรมขาดดุลหมายความว่า มีคลาสที่โดดเด่นในตัวอย่าง ในกรณีของเรา จำนวนของน้ำ (ความเข้มข้นของน้ำแข็งเป็น 0) ตัวอย่างคือ แปดครั้งสองทั่วไปน้ำแข็งความเข้มข้นระดับในตัวอย่างการฝึกอบรม สังหรณ์ใจ นี้ผลักดันรูปแบบการเป็น "อันตรายเฉพาะมินิ-mum" อย่างรวดเร็ว [36] เมื่อรุ่นนี้น้อยท้องถิ่น ตรวจพบมากที่สุดของการป้อนข้อมูลเป็นน้ำ และยังคงสามารถรับราคาประหยัด ทำให้ underestimation ความเข้มข้นของน้ำแข็งทั่วไปถ้าหยุดการฝึกอบรมก่อน มันอาจใช้เวลา epochs จำนวนมากจะได้รับจากนี้ท้องถิ่นน้อยที่สุด ซึ่งนำไปสู่ระยะเวลาการอบรมยาวนาน มีวิธีการต่าง ๆ ที่อาจถูกตรวจสอบเพื่อแก้ไขปัญหานี้ รวมทั้ง undersampling ส่วนใหญ่ [37], [38], oversampling ชนก [37], [38], หรือใช้เป็นทฤษฎีข้าม-เอนโทรปีฟังก์ชัน [36] ต้นทุน การทดลองของเรา (ไม่ได้แสดงที่นี่) แสดงว่า การเรียนรู้ปกติแร็คภายใน 50 epochs เมื่อใช้วิธีการเหล่านั้น แต่วิธีการดังกล่าวไม่มีแร็ครุ่นที่ดีกว่าการฝึกอบรมโดยตรงจากตัวอย่างการฝึกอบรมเป็นเวลานาน ในกระดาษนี้ เราเลือกที่จะจัดลำดับความสำคัญของความแม่นยำ และทนกับเวลาฝึกนาน วิธีดีเพื่อลดผลของการขาดดุลข้อมูลจำเป็นสำหรับประสิทธิภาพที่ดีกว่าในแง่ของการคำนวณเวลาและความแม่นยำของผลลัพธ์ตรวจสอบเบื้องต้นของการเชื่อมต่อระหว่างตัวกรอง CNN และสภาพพื้นผิวของทะเลจะดำเนินการ โดยการแสดงผลแผนที่เปิดใช้งาน (ผลผลิต) ของชั้นการพัฒนาฝึกอบรม (ดูรูป 8) มันแสดงให้เห็นว่า เครือข่ายระบุโครงสร้างภาพ SAR แผนผังคุณลักษณะของผลิตฟิลเตอร์บางสลับลำดับข้อมูลของชั้นสลับลำดับข้อมูลแรก
การแปล กรุณารอสักครู่..
ทดลองได้รับการจัดการหรือ HH HV พลพลเท่านั้น ( ผลลัพธ์ไม่แสดงที่นี่ ) การใช้ Dual Pol SAR ภาพสามารถผลิตดีขึ้นมากกว่าการใช้น้ำแข็งความเข้มข้นประมาณ HH HV เท่านั้นหรือที่ได้แสดงใน previ - [ วิจัยที่ดิน 12 ] , [ 34 ] เมื่อใช้ HH พลเท่านั้น ผลลัพธ์ที่ได้จะมีผลต่อจากอุบัติการณ์มุม ในขณะที่ใช้เพียง hv โพลแสดงแถบในผลน้ำแข็ง ความเข้มข้นประมาณ cnns มีจํานวน hyperparameters เช่นใส่รูปขนาดหย่อม จำนวนชั้น จำนวนของตัวกรอง ตัวกรองขนาด และค่าฝึกอบรม การปรับแต่งเหล่านี้ hyperpa - rameters เป็นสิ่งจำเป็นเพื่อให้ได้ประสิทธิภาพที่ดี สำหรับงานเฉพาะ แก้ไขขนาดของ input สำหรับซีเอ็นเอ็น กรองขนาดและการก้าวย่างของชั้นขดแรก และขนาดของตัวกรองได้รับการปรับเพื่อเพิ่มประสิทธิภาพในการ ค้นหาหมดจดของการรวมกันที่ดีที่สุดของ HY - perparameters จะใช้เวลานานมาก ในการทดลองนี้ hyperparameters จะปรับใน 2 ขั้นตอน ภาพแรก เข้าแก้ไขขนาดและขนาดกรองปรับใช้เพียงสามภาพแต่ละที่ใช้สำหรับการฝึกอบรม , การตรวจสอบและการฝึกอบรม แล้วหมายเลขของตัวกรองและชั้นจะติดตามในข้อมูลเต็มรูปแบบ โดยใช้ขนาดของแผ่นรับภาพและตัวกรองขนาดจากขั้นตอนที่แล้วแก้ไขขนาดของรูปสัญญาณและกรองขนาดเกี่ยวข้องกับขนาดที่แท้จริงและความซับซ้อนของปัญหา ในการปรับแต่งแก้ไขทดลอง ขนาดต่าง ๆทดสอบ แพทช์ขนาด พบว่ามีผลกระทบต่อผลลัพธ์กับที่สุดของความแตกต่างที่มาจากแถบ Effect และละลายพื้นผิว แพทช์ขนาด 41 พบน้อยแถบผลการการประเมินค่าต่ำไปและปริมาณน้ำแข็งละลาย ซึ่งอาจเกิดจากเงื่อนไข ดังนั้นจึงใช้ ซีเอ็นเอ็นรุ่นที่มีขนาดหย่อมขนาดเล็กมักจะประมาท ไอซ์คอน - centration . สังหรณ์ใจ , ความแข็งแรงและเนื้อขนาดเล็กของกระเจิงกลับของละลายบ่อจะคล้ายกับน้ำที่สงบ [ 33 ] ; ดังนั้น , ถูกต้องตัวละลายน้ำแข็ง ต้องการข้อมูลเพิ่มเติมจากละแวกนั้นในรูป ขนาดหย่อมเล็กๆ ทำให้เกิดความสับสนระหว่างละลายและน้ำเนื่องจากขาดข้อมูลสนับสนุนเพียงพอ ละแวก ใช้ขนาดหย่อมกว่า 41 ไม่นำไปสู่การปรับปรุงประสิทธิภาพ โดยแพทช์ขนาดใหญ่ขนาดยังประโยชน์ต่อการจด roughened ลมน้ำ ถ้าแถบ Effect จะถูกทั้งหมดออกจากภาพ , แพทช์ที่เหมาะสมขนาดอาจจะแตกต่างกัน ของเราปรับการทดลองชี้ให้เห็นว่ารูปแบบจะไม่อ่อนไหวกับการเลือกพารามิเตอร์อื่น ๆตราบใดที่รูปแบบมีขนาดใหญ่พอ ( จำนวนที่เพียงพอของตัวกรองและชั้น )ภาพการวิเคราะห์ subsampled เพราะพื้นที่ RES - olution มากหยาบกว่าและภาพ ซึ่งก่อให้เกิดการผิดพลาด มันจะเป็นประโยชน์กับรูปแบบข้อผิดพลาดอย่างชัดเจน [ 3 ] ถึงแม้ CNN ค่อนข้างมีเสถียรภาพเพื่อการฝึกอบรมตัวอย่างข้อผิดพลาด [ 17 ] ประโยชน์อื่นของซีเอ็นเอ็นว่า มันเป็นความยืดหยุ่นในการคำนวณโครงสร้าง ข้อสังเกตเพิ่มเติมสามารถรวมได้อย่างง่ายดายในซีเอ็นเอ็นปัจจุบันเป็นคุณสมบัติเพิ่มเติมของการป้อนข้อมูลขั้นตอนการฝึกวิ่ง 500 epochs . การฝึกอบรมและการตรวจสอบข้อผิดพลาดเริ่มมารวมกันที่ประมาณ 300 ยุคสมัยที่ค่อนข้างช้า ซึ่งอาจจะเกิดจากความไม่สมดุลในรถไฟ - ตัวอย่างไอเอ็นจีที่ใช้ สมดุลตัวอย่างการฝึกอบรม หมายถึง มีชั้นเด่นในตัวอย่างที่ ในกรณีของเรา , จํานวนของน้ำ ( น้ำแข็งความเข้มข้นคือ 0 ) ตัวอย่างประมาณแปดครั้งที่สองที่พบมากที่สุดน้ำแข็งระดับความเข้มข้นในการฝึกอบรมคน สังหรณ์ใจ มันดันแบบ " อันตรายท้องถิ่นขนาดเล็ก - แม่ " เร็ว [ 36 ] เมื่อนางแบบน้อยในท้องถิ่นนี้ ตรวจพบ มาก ของ ใส่น้ำ และยังสามารถบรรลุต้นทุนต่ำ นี้เป็นสาเหตุของการการประเมินค่าต่ำไปของน้ำแข็งที่ความเข้มข้นในทั่วไปถ้าการฝึกอบรมจะหยุดเร็ว มันอาจใช้เวลาหลายยุคสมัยออกไปจากขั้นต่ำในท้องถิ่นนี้ ซึ่งนำไปสู่การฝึกนาน มีหลายวิธีที่อาจจะใช้เพื่อแก้ไขปัญหานี้ รวมถึง undersampling ส่วนใหญ่ [ 37 ] , [ 38 ] oversampling ส่วนน้อย [ 37 ] , [ 38 ] หรือใช้ฟังก์ชันต้นทุนแบบเอนโทรปีข้าม [ 36 ] การทดลองของเรา ( ไม่แสดง ) แสดงให้เห็นว่าการเรียนตามปกติภายในยุคสมัย - 50 เมื่อใช้วิธีการเหล่านั้น แต่ไม่มีวิธีการดังกล่าวเข้าสู่รูปแบบดีกว่าการฝึกอบรมโดยตรงในการฝึกทั้งหมด อย่างนาน ในกระดาษนี้เราเลือกที่จะเน้นความแม่นยํา และอดทนกับเวลาฝึกนาน เป็นวิธีที่ดีเพื่อลดผลของข้อมูลไม่สมดุลเป็นสิ่งจำเป็นสำหรับประสิทธิภาพที่ดีขึ้นในแง่ของเวลาการคำนวณและความถูกต้องของผลลัพธ์จากการตรวจสอบเบื้องต้นของการเชื่อมต่อระหว่างตัวกรองซีเอ็นเอ็นและสภาพพื้นผิวทะเล โดยการเปิดใช้งานแผนที่ ( output ) ของชั้นสังวัตนาการฝึก ( ดูรูปที่ 8 ) มันแสดงให้เห็นว่าเครือข่ายระบุโครงสร้างภาพข ตัวกรองบางคอนแรกของคอนชั้นผลิตสารคดีมา
การแปล กรุณารอสักครู่..