of an
institution and give it visibility and more impact on
worldwide level whereas optical music recognition has many
applications like processing of different classes of music,
large scale digitization of musical data and also it can be used
for diversity in musical notation.
The primary step involved in the implementation of optical
character recognition is object segmentation. According to
the literature survey, a number of methods have been used for
segmentation. In the bimodal images used for the
applications, the histogram shows a sharp and deep valley
between two peaks representing the objects and background
respectively. The histogram can be used to select the
threshold representing the bottom of this valley.
Khankasikam et al [8], [9] proposed the valley sharpening
techniques which restricts the histogram to the pixels with
large absolute values of derivatives where as S. Wantanable
et. Al [10], [11] proposed the histogram difference method,
which selects threshold at the gray level with the maximum
amount of difference. This method uses the information
concerning neighboring pixels or edges in the original picture
to modify the histogram so as to make it useful for
thresholding. Another method includes directly dealing with
the grey level histogram by parametric techniques. By a sum
of Gaussian distributions histogram is approximated in the
least sense square and a statistical decision procedures are
applied [10]. These methods are tedious and they involve
high computational power. In Di gesu [12], [10] the idea of
using both intensities and spatial information has been
considered to take into account local information used in
human perception. A number of new methodologies and
strategies have been proposed over the past few years to find
global as well as local solutions in nonlinear multimodal
function optimization [12], [13], [14]. In addition attempts
have also been made to use Fuzzy Logic [15], Artificial
Neural Network [16] for optical character recognition. With
the help of crowding multiple peaks can be maintained in
multimodal optimization problem. Crowding method is
extremely reliable in detecting the peaks on bimodal
histogram. Further, GA can be applied to discover the valley
bottom between these peaks which can be used as threshold
for extracting information from the background. Genetic
algorithms offer a particularly interesting approach as they
are quite effective for rapid global search of large, non-liner
and poorly understood spaces. Moreover genetic algorithms
are every effective in solving large scale problems [17].
This paper makes use of an OCR system which makes use
of histogram equalization to extract images. The histogram
used by the mentioned algorithm is bimodal in nature hence it
can be divided into two classes [18]. Genetic algorithm is
further used to select the threshold from the histogram for
extracting the object from the background. The abilities of
the system are tested on images with noise, blur and change
in illumination.
ของการสถาบัน และให้มองเห็นและผลกระทบเพิ่มเติมในทั่วโลกระดับขณะการแสงดนตรีมีจำนวนมากโปรแกรมประยุกต์เช่นการประมวลผลประเภทต่าง ๆ ของเพลงdigitization ขนาดใหญ่ของข้อมูลดนตรี และยังสามารถใช้สำหรับความหลากหลายในสัญกรณ์ดนตรีขั้นตอนหลักที่เกี่ยวข้องในการดำเนินงานของอักขระจะแบ่งวัตถุ ตามที่สำรวจวรรณกรรม ตัวเลขวิธีการใช้สำหรับแบ่ง ในรูป bimodal ที่ใช้สำหรับการโปรแกรมประยุกต์ ฮิสโตแกรมแสดงราคาหุบเขาลึก และคมชัดระหว่างยอดเขาสองแสดงวัตถุและพื้นหลังตามลำดับ สามารถใช้ฮิสโตแกรมที่ต้องการขีดจำกัดที่แสดงด้านล่างของหุบเขานี้Khankasikam et al [8], [9] การนำเสนอเรื่องวัลเลย์เทคนิคซึ่งจำกัดฮิสโตแกรมพิกเซลด้วยค่าขนาดใหญ่ของตราสารอนุพันธ์ที่เป็น S. Wantanableร้อยเอ็ด อัล [10], [11] เสนอวิธีแตกต่างฮิสโตแกรมที่เลือกขีดจำกัดระดับสูงสุดสีเทาจำนวนผลต่าง วิธีนี้ใช้ข้อมูลเกี่ยวกับพิกเซลใกล้เคียงหรือขอบรูปภาพต้นฉบับฮิสโตแกรมเพื่อให้เป็นประโยชน์ในการปรับเปลี่ยนthresholding นั้น วิธีอื่นมีการจัดการโดยตรงกับตัวสีเทาระดับฮิสโตแกรม โดยเทคนิคพาราเมตริก โดยรวมของการกระจาย Gaussian ฮิสโตแกรมจะเลียนแบบในการตารางอย่างน้อยความรู้สึกและกระบวนการตัดสินใจทางสถิติใช้ [10] วิธีการเหล่านี้จะน่าเบื่อ และที่เกี่ยวข้องกับกำลังคำนวณสูง ในดิ gesu [12], [10] แนวคิดของใช้ข้อมูลปริภูมิและปลดปล่อยก๊าซแล้วถือเป็นข้อมูลเฉพาะบัญชีที่ใช้ในมนุษย์รับรู้ จำนวนหลักสูตรใหม่ และกลยุทธ์ที่ได้รับการเสนอผ่านไม่กี่ปีที่ผ่านมาในการค้นหาโซลูชั่นทั่วโลก รวมทั้งเครื่องในเนื่องไม่เชิงเส้นฟังก์ชันปรับ [12], [13], [14] นอกจากนี้ พยายามนอกจากนี้ยังทำการใช้ตรรกศาสตร์ [15], ประดิษฐ์ข่ายประสาท [16] สำหรับการรู้จำอักขระด้วยแสง มีความช่วยเหลือของกครั้งพีคส์หลายสามารถเก็บรักษาไว้ในเพิ่มประสิทธิภาพทุกปัญหา กครั้งวิธีคือความน่าเชื่อถืออย่างมากในการตรวจสอบยอดใน bimodalฮิสโตแกรม เพิ่มเติม ใช้ GA จะเยือนหุบเขาระหว่างยอดเขาเหล่านี้ซึ่งสามารถใช้เป็นขีดจำกัดล่างสำหรับการดึงข้อมูลรายละเอียดจากพื้นหลัง ทางพันธุกรรมอัลกอริทึมมีวิธีการน่าสนใจโดยเฉพาะอย่างยิ่งเป็นพวกเขามีประสิทธิภาพมากสำหรับการค้นหาอย่างรวดเร็วของใหญ่ ไม่ซับและช่องว่างเข้าใจงาน นอกจากนี้พันธุกรรมอัลกอริทึมมีขนาดใหญ่ทุกมีประสิทธิภาพในการแก้ปัญหา [17] การปรับมาตราส่วนเอกสารนี้ช่วยให้ใช้ OCR เป็นระบบที่ทำให้ใช้ของฮิสโตแกรมปรับแต่งขยายภาพ ฮิสโตแกรมใช้ที่กล่าวถึงอัลกอริทึมเป็น bimodal ในธรรมชาติดังนั้นสามารถแบ่งออกได้เป็น 2 ประเภท [18] เป็นอัลกอริทึมทางพันธุกรรมใช้เพื่อเลือกขีดจำกัดจากฮิสโตแกรมสำหรับเพิ่มเติมแยกวัตถุจากพื้นหลัง ความสามารถของทดสอบระบบในภาพที่มีเสียงรบกวน เบลอ และเปลี่ยนแปลงในรัศมี
การแปล กรุณารอสักครู่..
