Document often composes of different artifacts
ranging from the essential text in the forms of
paragraphs, tables, and inserts/sidebars, to various
illustrations such as charts, diagrams, and
pictures/images. The problem of documentation
occurs when editing is called for of the document
with the absence of the electronic sources. This is
where optical character recognition (OCR)
technique comes into play. Dealing with mixture of
the aforementioned artifacts poses a big challenge
to researchers. As depicted in Figure 1, one must
resort to a means for separating image and textual
information, known as image segmentation.
One of the fundamental principles of
conventional image segmentation is the use of
attribute characteristics of text, image, and
background objects. These distinctions, henceforth
referred to as features, are extracted during image
processing stages to identify text, image, and
background objects by means of various wellknown
techniques such as wavelet transform,
segmentation, or feature extraction. This research
proposes a method called Fuzzy C-Mean (FCM)
which employs two simple and straightforward
statistical features, namely, mean and standard
deviation of block pixel gray scale level1
to
distinguish those objects from one another. The
principles rest on the observation that image pixel
colors are lighter than those of background in gray
scale level. In addition, every pixel’s feature values
belonging to the same object block are relatively
close to those of its neighbors.
We further observed that the standard
deviation of text block pixel was approximately
1
The gray scale level of each pixel under
investigation was computed from the corresponding
RGB value.
Figure 1: Problems of image segmentation2
twice as high as the corresponding mean in gray
scale. The background pixel, on the contrary, had
high mean (bright) and low standard deviation
values. Such findings have led to clustering
classification of the three objects by virtue of their
respective dispersion.
The remaining of this paper will discuss
the proposed FCM method in greater detail as
follows: Section 2 describes the underlying
principles of FCM clustering method. Section 3
establishes the formality of the proposed FCM
method. Section 4 elucidates the detail of FCM as
apply to image processing. Section 5 shows the
experimental results obtained from selected input
images. Final thoughts and future work are
summarized in the concluding section.
เอกสารมักจะประกอบด้วยสิ่งประดิษฐ์
แตกต่างกันตั้งแต่ข้อความที่จำเป็นในรูปแบบของ
ย่อหน้า , ตาราง , แทรก / sidebars , ภาพประกอบต่างๆ
เช่นแผนภูมิ แผนผัง และ
ภาพ / ภาพ ปัญหาของเอกสาร
เกิดขึ้นเมื่อแก้ไขชื่อของเอกสาร
ด้วยขาดแหล่งข้อมูลอิเล็กทรอนิกส์ นี่คือ
ที่การรู้จำอักขระด้วยแสง ( OCR )
เทคนิคเข้ามาในเล่น จัดการกับส่วนผสมของสิ่งประดิษฐ์ดังกล่าวท่าน
ใหญ่ท้าทายนักวิจัย เป็นภาพในรูป 1 , หนึ่งต้อง
รีสอร์ทหมายถึงการแยกภาพและข้อมูลต้นฉบับเดิม
) , ที่รู้จักกันเป็นภาพหนึ่งของหลักการพื้นฐานของ
การแบ่งส่วนภาพปกติคือการใช้แอตทริบิวต์
ลักษณะของข้อความ , ภาพ , และ
วัตถุพื้นหลังความแตกต่างเหล่านี้ ตั้งแต่นี้ไป
เรียกว่าคุณสมบัติได้ในระหว่างขั้นตอนการประมวลผลภาพ
ระบุข้อความ , ภาพ , และพื้นหลังวัตถุโดยใช้เทคนิค
กรรมต่างๆเช่นการแปลงเวฟ
, การแบ่งส่วนตลาด หรือคุณลักษณะการสกัด งานวิจัยนี้ได้เสนอวิธีการที่เรียกว่า Fuzzy c-mean
( FCM ) ซึ่งมี 2 ง่ายและตรงไปตรงมา
สถิติคุณสมบัติ คือค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน
บล็อกพิกเซลระดับสีเทา Level1
แยกแยะวัตถุเหล่านั้นจากคนอื่น ส่วนที่เหลือ
หลักให้สังเกตว่าสีพิกเซล
ภาพเบากว่าของพื้นหลังในระดับมาตราส่วนสีเทา
นอกจากนี้ ค่านิยม คุณลักษณะของพิกเซลทุก
เป็นของบล็อกวัตถุเดียวกันค่อนข้าง
ใกล้ชิดกับบรรดาประเทศเพื่อนบ้าน เราสังเกตต่อไปว่ามาตรฐาน
การเบี่ยงเบนของพิกเซลบล็อกข้อความประมาณ
1
สีเทาขนาดระดับของแต่ละพิกเซลตาม
สืบสวนจากการคำนวณค่า RGB ที่สอดคล้องกัน
.
รูปที่ 1 : ปัญหาของภาพ segmentation2
สูงเป็นสองเท่าเป็นค่าเฉลี่ยที่สอดคล้องกันในระดับสีเทา
พิกเซลพื้นหลัง ในทางตรงกันข้ามมี
หมายถึงสูง ( สว่าง ) และค่าความเบี่ยงเบน
มาตรฐานต่ำ นอกจากนี้ ยังพบนำไปสู่การจัดกลุ่ม
การจำแนกประเภทของวัตถุโดยอาศัย 3 การกระจายของตน
.
ที่เหลือของบทความนี้จะกล่าวถึงวิธีการเสนอ FCM
รายละเอียดมากกว่าเป็นดังนี้ ส่วนที่ 1 กล่าวถึง
อ้างอิงหลักการ FCM การจัดกลุ่มโดยวิธี หมวด 3
สร้างรูปแบบของการนำเสนอ FCM
วิธี มาตรา ๔ ได้รายละเอียดของ FCM เป็น
ใช้การประมวลผลภาพ ส่วนที่ 5 แสดง
ผลการทดลองที่ได้จากภาพที่เลือกใส่
ความคิดสุดท้ายและทำงานในอนาคต
สรุปภายในส่วน
การแปล กรุณารอสักครู่..