The object-based analysis of remotely sensed imagery provides valuable spatial and structural information that
is complementary to pixel-based spectral information in classification. In this paper, we present novel methods for automatic
object detection in high-resolution images by combining spectral information with structural information exploited by using
image segmentation. The proposed segmentation algorithm uses
morphological operations applied to individual spectral bands
using structuring elements in increasing sizes. These operations
produce a set of connected components forming a hierarchy of
segments for each band. A generic algorithm is designed to select meaningful segments that maximize a measure consisting
of spectral homogeneity and neighborhood connectivity. Given
the observation that different structures appear more clearly at
different scales in different spectral bands, we describe a new
algorithm for unsupervised grouping of candidate segments belonging to multiple hierarchical segmentations to find coherent
sets of segments that correspond to actual objects. The segments
are modeled by using their spectral and textural content, and
the grouping problem is solved by using the probabilistic latent
semantic analysis algorithm that builds object models by learning
the object-conditional probability distributions. The automatic
labeling of a segment is done by computing the similarity of its
feature distribution to the distribution of the learned object models
using the Kullback–Leibler divergence. The performances of the
unsupervised segmentation and object detection algorithms are
evaluated qualitatively and quantitatively using three different
data sets with comparative experiments, and the results show that
the proposed methods are able to automatically detect, group, and
label segments belonging to the same object classes.
INTRODUCTION
D of very high resolution remotely sensed data, automatic UE TO the constantly increasing coverage and availability
content extraction, object detection, and classification for urban
applications have continued to be important research problems.
There is an extensive literature on the classification of remotely
sensed imagery, where pixel-level processing has been the
common choice for remote sensing image analysis systems.
These systems use a broad range of features, including multi- or
hyperspectral information, texture features, edge detection, and
Manuscript received November 3, 2007; revised December 19, 2007. This
work was supported in part by the TUBITAK CAREER Grant 104E074 and
in part by the European Commission Sixth Framework Program Marie Curie
International Reintegration Grant MIRG-CT-2005-017504.
The authors are with Department of Computer Engineering, Bilkent University, Ankara 06800, Turkey (e-mail: akcay@cs.bilkent.edu.tr; saksoy@cs.
bilkent.edu.tr).
Color versions of one or more of the figures in this paper are available online
at http://ieeexplore.ieee.org.
Digital Object Identifier 10.1109/TGRS.2008.916644
Fig. 1. Example classification results using a pixel-based quadratic Gaussian
classifier with (c) PCA and Gabor features and (d) DAFE features. The
classification maps for (c) and (d) are taken from [1] and [2], respectively.
(a) False color. (b) Reference map. (c) Classification using PCA and Gabor
features. (d) Classification using DAFE features.
linear or nonlinear transformations of these features. Such features are used with a wide range of classifiers, including probabilistic methods employing maximum-likelihood or Bayesian
estimation techniques, neural networks, decision trees, support
vector machines, and genetic algorithms for applications like
land cove/land use classifications.
Despite the high success rates that have been published in the
literature using limited ground truth data, visual inspection of
the results shows that most of the urban structures still cannot
be delineated as accurately as expected, particularly in highresolution images. For example, Fig. 1(a) shows the false-color
การวิเคราะห์ภาพถ่ายระยะไกล และวัตถุที่ใช้ให้มีคุณค่าเชิงพื้นที่และโครงสร้างของข้อมูลที่เป็นข้อมูลพื้นฐานประกอบกับพิกเซล
สเปกตรัมในการจำแนก ในกระดาษนี้เราเสนอวิธีใหม่สำหรับการตรวจหาวัตถุโดยอัตโนมัติในสภาพความละเอียดสูง โดยการรวมข้อมูลสเปกตรัมด้วย
การใช้โครงสร้างข้อมูลโดยใช้ภาพเสนอการแบ่งส่วนขั้นตอนวิธีใช้งานแต่ละลักษณะการใช้
ใช้องค์ประกอบในโครงสร้างวงเพิ่มขนาด การดำเนินงานเหล่านี้
ผลิตชุดของการเชื่อมต่อส่วนประกอบสร้างลำดับชั้นของ
ส่วนสำหรับแต่ละวง ขั้นตอนวิธีทั่วไปถูกออกแบบมาเพื่อเลือกความหมายส่วนที่ขยายมาตรการประกอบด้วย
ของค่าสเปกตรัมและเชื่อมต่อเพื่อนบ้าน ให้สังเกตว่าโครงสร้างที่แตกต่างกัน
ปรากฏอย่างชัดเจนมากขึ้นในระดับที่แตกต่างกันในแถบสเปกตรัมที่แตกต่างกันเราอธิบายขั้นตอนวิธีใหม่สำหรับการจัดกลุ่มของกลุ่มผู้สมัคร
unsupervised ของหลายลำดับชั้น segmentations หาชุดติดต่อกัน
กลุ่มที่สอดคล้องกับวัตถุจริง ส่วน
มีแบบจำลองโดยใช้เนื้อหาสเปกตรัมและเนื้อของพวกเขาและ
จัดกลุ่มปัญหาจะแก้ไขได้โดยใช้การแฝง
ความหมายการวิเคราะห์ขั้นตอนวิธีที่สร้างแบบจำลองวัตถุ โดยการเรียนรู้
วัตถุตามเงื่อนไขการแจกแจงความน่าจะเป็น . โดย
ฉลากส่วนทำโดยคอมพิวเตอร์ ความเหมือนของ
คุณลักษณะกระจายเพื่อการกระจายของวัตถุแบบจำลอง
เรียนรู้ใช้คัลแบ็ก–ลี๊บเลอร์ divergence การแสดงของ
แบ่งส่วน unsupervised และขั้นตอนวิธีการตรวจจับวัตถุมีการประเมินเชิงคุณภาพ และเชิงปริมาณโดยใช้
3
ชุดข้อมูลเปรียบเทียบกับการทดลอง และพบว่าวิธีที่เสนอ
สามารถที่จะตรวจสอบโดยอัตโนมัติ , กลุ่ม , และ
ป้ายกลุ่มเป็นของคลาสของวัตถุเดียวกัน
แนะนำงความละเอียดสูงมากข้อมูลจากระยะไกล , อัตโนมัติ UE ที่เพิ่มขึ้นอย่างต่อเนื่อง และมีเนื้อหาครอบคลุม
การสกัดวัตถุตรวจจับและหมวดหมู่สำหรับการใช้งานในเมือง
มียังคงเป็นปัญหาการวิจัยที่สำคัญ
มีวรรณกรรมในการจำแนกระยะไกล
รู้สึกภาพที่ประมวลผลได้
ระดับพิกเซลตัวเลือกทั่วไปสำหรับการวิเคราะห์ภาพถ่ายระยะไกลระบบ .
ระบบเหล่านี้ใช้หลากหลายคุณสมบัติรวมถึง Multi - หรือ
hyperspectral ข้อมูลคุณลักษณะ ( การตรวจหาขอบและ
ต้นฉบับได้รับ 3 พฤศจิกายน , 2007 ; แก้ไขเมื่อวันที่ 19 ธันวาคม พ.ศ. 2550 งานนี้
ได้รับการสนับสนุนในส่วนของ tubitak และอาชีพให้ 104e074
ในส่วนของคณะกรรมาธิการยุโรป และมารี กูรี
6 โปรแกรมmirg-ct-2005-017504 ให้สังคมระหว่างประเทศ .
นักเขียนกับภาควิชาวิศวกรรมคอมพิวเตอร์ bilkent 06800 มหาวิทยาลัยอังการา , ตุรกี ( E-mail : akcay@cs.bilkent.edu.tr ; saksoy @ CS .
bilkent . edu . TR ) .
สีรุ่นหนึ่งหรือมากกว่าตัวเลขในกระดาษนี้จะพร้อมใช้งานแบบออนไลน์
http : / / IEEE ieeexplore . . org .
ดิจิตอลระบุวัตถุ 10.1109 / tgrs . 2008.916644
รูปที่ 1ตัวอย่างการจำแนกการพิกเซลตามสมเสียน
กับลักษณนาม ( C ) PCA และกาบอร์คุณลักษณะและ ( d ) dafe คุณสมบัติ
หมวดหมู่แผนที่ ( ค ) และ ( ง ) เอามาจาก [ 1 ] และ [ 2 ] )
( สี ) ที่เป็นเท็จ ( ข ) แผนที่อ้างอิง ( c ) การใช้ PCA และคุณลักษณะกาบอร์
( D ) การใช้คุณลักษณะ dafe .
เส้นหรือการแปลงเชิงเส้นของลักษณะเหล่านี้คุณลักษณะดังกล่าวจะใช้กับหลากหลายของการใช้คำลักษณนาม รวมทั้งวิธีความเป็นไปได้สูงสุดหรือประมาณคชกรรม
เทคนิคโครงข่ายประสาทเทียม , ต้นไม้ตัดสินใจ , เครื่องเวกเตอร์สนับสนุน
และขั้นตอนวิธีเชิงพันธุกรรมสำหรับการใช้งานเช่น
อ่าวที่ดิน / ที่ดินหมวดหมู่ใช้ แม้จะมีอัตราความสำเร็จสูง
ที่ได้รับการตีพิมพ์ในวรรณคดีโดยใช้ข้อมูล ความจริงพื้นดินจำกัดการตรวจสอบภาพของ
ผลลัพธ์ที่แสดงให้เห็นว่าส่วนใหญ่ของโครงสร้างในเมืองยังไม่สามารถ
จะอธิบายเป็นอย่างถูกต้องเป็น คาด โดยเฉพาะใน highresolution ภาพ ตัวอย่าง รูปที่ 1 ( a ) จะแสดงสีเท็จ
การแปล กรุณารอสักครู่..
