Color texture classification plays an important role in real world computer-vision applications, where the images are acquired under different ambient illuminations. The current work tests different normalization algorithms to achieve illuminance invariance, combined with different color spaces, and different color and texture features. We also compare the integrative and parallel color texture classification approaches on the 6 most popular public color texture datasets. The experiments outlined illustrate that parallel approaches are superior to integrative approaches for color texture classification. For parallel approaches, the best options use different color spaces and normalization to compute the intensity texture and pure color features: specifically, the illuminance–chrominance color spaces (Lab or Lab2) combined with Local Binary Patterns (vector MLBP) and normalization RGBcb to compute the intensity texture features, and the color space RGB combined with First Order Statistics (FOS) and normalization Lmax to compute pure color features. For integrative approaches, the luminance–chrominance color spaces (Lab and Lab2) combined with wavelet texture features and normalization RGBib achieve the best performance. Regarding computational efficiency, the
parallel vectors are also faster than the integrative vectors.
The behavior in relation to texture features depends of the type of approach used to compute the color texture features. Hence, the features based on Local Binary Patterns are the best among parallel approaches, which compute texture features on a intensity version of the color image, while the wavelet family features provide the best results for integrative approaches. The good results of MLBP and wavelet feature vectors are due to their ability to capture efficiently the local spatial relation defined by a texture and to discriminate between different relations. Gabor filters provide intermediate results for both approaches, and fractal features work very bad in both cases. From the elapsed time viewpoint, MLBP and Daub4 are relatively fast, only four times slower than the fastest method (LBP, which works bad), while Gabor filter are twenty six times slower. In relation to pure color features, the discrimination power of FOS (First Order Statistics) is superior to the features based on histograms (Table 2). When the pure color features are used in parallel approaches, a paired T-Test shows that FOS is significantly better than the histogram features. The elapsed time of FOS vector is in intermediate, much faster than JCHXX and slower than CCHXX and CHPXX.
Regarding the normalization of a color image before transforming to other color space, the color balance (RGBcb) in the parallel approach and the intensity balance (RGBib) in the integrative approach seem to be superior to other normalizations, although the differences with respect to absence of normalization are not statistically significant, and they are the slowest ones. Nevertheless, this results might be due to the fact that the datasets are acquired under very controlled conditions (Outex, ALOT and CUReT datasets) or maximizing contrast (VisTex and USPTex), so that the training set contains samples with the same, or very close, acquisition conditions as the test set. Hence, for dataset Outex14, where the training set do not contain images with the illuminance of testing test, the normalization increases the accuracy nearly 5 points for intensity texture classification for all color spaces, from 4.4 up to 31.9 points for pure color and more than 16 points for color texture classification and all color spaces (see the last column in Tables 1 and 6).
Although the classification was developed using a 1-Nearest Neighbor classifier, the conclusions of our study have been confirmed by further experiments using a Random Forest classifier. Among learning methods, VZ-PATCH gives the best results on the four smallest datasets (see Section 4.2) for intensity texture classification, but its high computational cost avoided its application to the four bigger datasets. However, for color image classification (see Section 4.10) the direct methods achieve better performance than learning methods on gray level images with much lower computational cost.
A future research should: (1) develop further insights into the application of learning methods for color texture images; (2) study the influence of normalization on ill-defined problems, underexposed, overexposed, different illuminance, scales and view angles images, without incorporating similar samples in the training set; (3) analyze the influence of the “clipping” percentage (5% of pixels in this work) in normalization methods RGBcb and RGBib, which gave the best results; and (4) extend this comparison applying convolutional neural networks for image classification.
การจำแนกพื้นผิวสีมีบทบาทสำคัญในการมองเห็นคอมพิวเตอร์โลกจริง ซึ่งภาพที่ได้มาภายใต้สภาวะแสงที่แตกต่างกัน การทดสอบงานที่แตกต่างกันเพื่อให้บรรลุการฟื้นฟูขั้นตอนวิธีการแปรเปลี่ยน รวมกับเป็นสีที่แตกต่างกันและคุณสมบัติต่างสีและพื้นผิว นอกจากนี้เรายังศึกษาแบบบูรณาการและวิธีการในการจำแนกสีพื้นผิวแบบ 6 สีเนื้อข้อมูลสาธารณะที่ได้รับความนิยมมากที่สุด . การทดลองที่ระบุไว้ แสดงให้เห็นว่าแนวทางขนานเหนือกว่าวิธีการแบบบูรณาการสำหรับการจำแนกเนื้อสี สำหรับแนวทางขนาน , ตัวเลือกที่ดีที่สุดที่ใช้เป็นสีต่าง ๆ และการฟื้นฟูเพื่อคำนวณความเข้มเนื้อผ้าและคุณสมบัติสีบริสุทธิ์ โดยเฉพาะ ความสว่างและสีเป็น ( Lab หรือ lab2 โครมิแนนซ์ ) รวมกับรูปแบบไบนารีท้องถิ่น ( mlbp เวกเตอร์ ) และการฟื้นฟู rgbcb คำนวณพื้นผิวเข้มลักษณะและพื้นที่สี RGB เพื่อรวมกับสถิติ แรก ( FOS ) และการฟื้นฟู Lmax คำนวณคุณสมบัติสีบริสุทธิ์ สำหรับแนวทางบูรณาการ ความสว่าง และสีเป็นโครมิแนนซ์ ( Lab และ lab2 ) รวมกับเวฟเนื้อคุณลักษณะและการฟื้นฟู rgbib บรรลุประสิทธิภาพที่ดีที่สุด เกี่ยวกับประสิทธิภาพของคอมพิวเตอร์ ,เวกเตอร์ขนานยังเร็วกว่าเวกเตอร์แบบบูรณาการพฤติกรรมในความสัมพันธ์กับลักษณะพื้นผิว ขึ้นอยู่กับชนิดของวิธีการที่ใช้ในการคำนวณพื้นผิวสีคุณสมบัติ ดังนั้น คุณสมบัติตามรูปแบบไบนารีที่ท้องถิ่นจะดีที่สุดในแนวขนาน ซึ่งคำนวณคุณสมบัติเนื้อในรุ่นที่ความเข้มของภาพสี ในขณะที่ครอบครัวเวฟคุณลักษณะให้ผลลัพธ์ที่ดีที่สุดสำหรับแนวทางบูรณาการ ผลลัพธ์ที่ดีและคุณลักษณะของ mlbp เวฟเวกเตอร์เนื่องจากความสามารถของพวกเขาที่จะจับภาพได้อย่างมีประสิทธิภาพ ท้องถิ่นมิติสัมพันธ์ที่กำหนดไว้ตามพื้นผิวและแยกแยะระหว่างความสัมพันธ์ที่แตกต่างกัน กาบอร์กรองให้ผล สื่อกลางสำหรับทั้งสองวิธี และคุณสมบัติเศษส่วนทำงานไม่ดีมากในทั้งสองกรณี จากเวลาที่ผ่านไป และจุดชมวิว mlbp daub4 รวดเร็วค่อนข้างช้ากว่าวิธีที่เร็วที่สุดเพียงสี่ครั้ง ( LBP ซึ่งผลงานไม่ดี ) ในขณะที่ตัวกรองกาบอร์เป็นยี่สิบครั้งช้าๆ ในความสัมพันธ์กับคุณลักษณะของสีที่บริสุทธิ์และค่าอำนาจจำแนกของ FOS ( สถิติการสั่งซื้อครั้งแรก ) เป็น superior กับคุณลักษณะตามปี ( ตารางที่ 2 ) เมื่อสีบริสุทธิ์คุณสมบัติใช้ในแนวขนาน , Paired t-test แสดงให้เห็นว่า FOS เป็นอย่างมีนัยสำคัญดีกว่ากราฟคุณสมบัติ เวลาที่ผ่านไปของเวกเตอร์ผสมอยู่ในระดับกลาง เร็วกว่า และช้ากว่าและ jchxx cchxx chpxx .เกี่ยวกับการฟื้นฟูของภาพสีก่อนที่จะเปลี่ยนพื้นที่สี อื่น ๆ , ความสมดุลของสี ( rgbcb ) ในแบบขนานและสมดุลความเข้ม ( rgbib ) ในการบูรณาการที่ดูเหมือนจะเหนือกว่า normalizations อื่น ๆแม้ว่าความแตกต่างด้วยความเคารพไม่มีบรรทัดฐานไม่ได้ อย่างมีนัยสำคัญ และพวกเขาเป็นคนที่ช้าที่สุด อย่างไรก็ตาม ผลการทดลองนี้อาจจะเนื่องจากความจริงที่ว่าข้อมูลจะได้รับภายใต้เงื่อนไขควบคุม ( outex เยอะมาก และ ขูดข้อมูล ) หรือ เพิ่มความคมชัด ( vistex และ usptex ) เพื่อให้ชุดการฝึกมีตัวอย่างด้วยเหมือนกัน หรือใกล้ๆ ซื้อเงื่อนไขเป็นแบบทดสอบชุด ดังนั้น สำหรับข้อมูล outex14 ที่ชุดฝึกอบรมไม่ประกอบด้วยภาพที่มีความสว่างของการทดสอบการทดสอบการฟื้นฟูเพิ่มความแม่นยำเกือบ 5 จุดสำหรับการจำแนกเนื้อความเข้มเป็นสีทั้งหมด จาก 4.4 ถึง 31.9 คะแนนสำหรับสีที่บริสุทธิ์และกว่า 16 จุดสีพื้นผิวและการจำแนกเป็นสีทั้งหมด ( ดูที่คอลัมน์ สุดท้ายในตารางที่ 1 และ 6 )แม้ว่าการได้รับการพัฒนาโดยใช้ 1-nearest เพื่อนบ้านลักษณนาม ผลสรุปของการศึกษาของเราได้ถูกยืนยันโดยการทดลองเพิ่มเติม โดยใช้การสุ่มป่าลักษณนาม ระหว่างวิธีการเรียน vz-patch ให้ผลลัพธ์ที่ดีที่สุดบนสี่เล็กข้อมูล ( ดูมาตรา 4.2 ) สำหรับการจำแนกประเภทเนื้อเข้ม แต่ต้นทุนการคำนวณสูงหลีกเลี่ยงการไปสี่ใหญ่ ชุดข้อมูล อย่างไรก็ตาม สำหรับประเภทภาพสี ( ดูมาตรา 4.10 ) วิธีการโดยตรงบรรลุประสิทธิภาพดีกว่าวิธีภาพระดับสีเทาที่เรียนที่ต่ำกว่าการคำนวณต้นทุนวิจัยในอนาคตควร ( 1 ) พัฒนาข้อมูลเชิงลึกเพิ่มเติมลงในโปรแกรมของการเรียนรู้วิธีการภาพพื้นผิวสี ; ( 2 ) ศึกษาอิทธิพลของบรรทัดฐานที่ป่วยกำหนดปัญหา แสงโอเวอร์ที่แตกต่างกัน , ความสว่าง , เครื่องชั่งและดูมุมภาพโดยรวมอย่างที่คล้ายกันในชุดฝึกอบรม ( 3 ) ศึกษาอิทธิพลของ " ตัด " เปอร์เซ็นต์ ( 5 % ของพิกเซลในงานนี้ ) ในการฟื้นฟู rgbcb วิธีการและ rgbib ซึ่งให้ผลดีที่สุด และ ( 4 ) การเปรียบเทียบนี้ใช้ขยายโครงข่ายขดสำหรับหมวดหมู่ภาพ
การแปล กรุณารอสักครู่..
