Document often composes of differen

Document often composes of different artifacts
ranging from the essential text in the forms of
paragraphs, tables, and inserts/sidebars, to various
illustrations such as charts, diagrams, and
pictures/images. The problem of documentation
occurs when editing is called for of the document
with the absence of the electronic sources. This is
where optical character recognition (OCR)
technique comes into play. Dealing with mixture of
the aforementioned artifacts poses a big challenge
to researchers. As depicted in Figure 1, one must
resort to a means for separating image and textual
information, known as image segmentation.
One of the fundamental principles of
conventional image segmentation is the use of
attribute characteristics of text, image, and
background objects. These distinctions, henceforth
referred to as features, are extracted during image
processing stages to identify text, image, and
background objects by means of various wellknown
techniques such as wavelet transform,
segmentation, or feature extraction. This research
proposes a method called Fuzzy C-Mean (FCM)
which employs two simple and straightforward
statistical features, namely, mean and standard
deviation of block pixel gray scale level1
to
distinguish those objects from one another. The
principles rest on the observation that image pixel
colors are lighter than those of background in gray
scale level. In addition, every pixel’s feature values
belonging to the same object block are relatively
close to those of its neighbors.
We further observed that the standard
deviation of text block pixel was approximately

1
The gray scale level of each pixel under
investigation was computed from the corresponding
RGB value.
Figure 1: Problems of image segmentation2
twice as high as the corresponding mean in gray
scale. The background pixel, on the contrary, had
high mean (bright) and low standard deviation
values. Such findings have led to clustering
classification of the three objects by virtue of their
respective dispersion.
The remaining of this paper will discuss
the proposed FCM method in greater detail as
follows: Section 2 describes the underlying
principles of FCM clustering method. Section 3
establishes the formality of the proposed FCM
method. Section 4 elucidates the detail of FCM as
apply to image processing. Section 5 shows the
experimental results obtained from selected input
images. Final thoughts and future work are
summarized in the concluding section.

1
 The gray scale level of each pixel under
investigation was computed from the corresponding
RGB value.
Figure 1: Problems of image segmentation2
twice as high as the corresponding mean in gray
scale. The background pixel, on the contrary, had
high mean (bright) and low standard deviation
values. Such findings have led to clustering
classification of the three objects by virtue of their
respective dispersion.
The remaining of this paper will discuss
the proposed FCM method in greater detail as
follows: Section 2 describes the underlying
principles of FCM clustering method. Section 3
establishes the formality of the proposed FCM
method. Section 4 elucidates the detail of FCM as
apply to image processing. Section 5 shows the
experimental results obtained from selected input
images. Final thoughts and future work are
summarized in the concluding section.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เอกสารมัก composes สิ่งประดิษฐ์ต่าง ๆตั้งแต่ข้อความสำคัญในรูปแบบของย่อหน้า ตาราง และ แทรก/sidebars ต่าง ๆภาพประกอบเช่นแผนภูมิ ไดอะแกรม และรูปภาพ/ภาพ ปัญหาของเอกสารเกิดขึ้นเมื่อแก้ไขถูกเรียกสำหรับเอกสารกับการขาดแหล่งข้อมูลอิเล็กทรอนิกส์ นี่คือซึ่งการรู้จำอักขระด้วยแสง (OCR)เทคนิคมาเล่น จัดการกับส่วนผสมของสิ่งประดิษฐ์ดังกล่าวซึ่งทำให้เกิดความท้าทายใหญ่การวิจัย ตามที่แสดงในรูปที่ 1 หนึ่งต้องรีสอร์ทจะหมายถึง การแยกภาพ และข้อความข้อมูล เรียกว่าแบ่งส่วนรูปภาพหลักพื้นฐานอย่างใดอย่างหนึ่งแบ่งรูปแบบเดิมคือ การใช้กำหนดลักษณะของข้อความ ภาพ และพื้นหลังของวัตถุ ข้อแตกต่างเหล่านี้ ต่อไปเรียกว่าลักษณะการทำงาน แยกระหว่างภาพขั้นตอนการประมวลผลเพื่อระบุข้อความ ภาพ และวัตถุพื้นหลัง โดยอุดรธานีต่าง ๆเทคนิคเช่น wavelet แปลงแบ่งกลุ่ม หรือสกัดคุณลักษณะ งานวิจัยนี้เสนอวิธีเรียกว่า C หมายถึงเอิบ (FCM)ซึ่งมีสองง่าย และตรงไปตรงมาสถิติ คุณลักษณะ คือ หมายถึงมาตรฐานความเบี่ยงเบนของ level1 บล็อกพิกเซลโทนสีเทา ถึงแยกวัตถุเหล่านั้นจากคนอื่น ที่หลักวางตัวในการสังเกตพิกเซลภาพที่สีที่มีน้ำหนักเบากว่าของพื้นหลังเป็นสีเทาที่ระดับอัตราการ นอกจากนี้ ค่าคุณลักษณะแต่ละพิกเซลเป็นสมาชิกบล็อกวัตถุเดียวกันมีค่อนข้างปิดที่บ้านของเราสังเกตเพิ่มเติมที่มาตรฐานความเบี่ยงเบนของพิกเซลของบล็อกข้อความมีประมาณ1 ระดับโทนสีเทาของพิกเซลแต่ละภายใต้ตรวจสอบถูกคำนวณจากการให้สอดคล้องกับค่า RGBรูปที่ 1: ปัญหาของภาพ segmentation2สองสูงหมายความว่าเกี่ยวข้องในสีเทามาตราส่วน พิกเซลพื้นหลัง กลับ มีสูงหมายถึง (สว่าง) และส่วนเบี่ยงเบนมาตรฐานต่ำค่า ผลการวิจัยดังกล่าวได้นำไปสู่คลัสเตอร์การจัดประเภทของวัตถุสามโดย virtue ของพวกเขาแพร่กระจายตามลำดับเหลือของเอกสารนี้จะหารือวิธี FCM เสนอรายละเอียดที่มากกว่าเป็นดังต่อไปนี้: อธิบายส่วน 2 ตัวหลักของคลัสเตอร์วิธี FCM หมวดที่ 3กำหนดระดับของ FCM เสนอวิธีการ รายละเอียดของ FCM เป็น elucidates 4 ส่วนใช้การประมวลผลภาพ หมวดที่ 5 แสดงการผลทดลองที่ได้รับจากการป้อนข้อมูลที่เลือกภาพ ความคิดสุดท้ายและทำงานในอนาคตสรุปในส่วนสรุป

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เอกสารมักจะประกอบด้วยสิ่งประดิษฐ์ที่แตกต่างกัน
ตั้งแต่ข้อความสำคัญในรูปแบบของ
ย่อหน้าตารางและแทรก / แถบด้านข้างเพื่อต่างๆ
ภาพประกอบเช่นแผนภูมิไดอะแกรมและ
ภาพ / ภาพ ปัญหาของเอกสาร
เกิดขึ้นเมื่อการแก้ไขจะเรียกเอกสาร
ที่มีตัวตนของแหล่งอิเล็กทรอนิกส์ นี้เป็น
ที่จดจำตัวอักษรแสง (OCR)
เทคนิคเข้ามาในเล่น การจัดการที่มีส่วนผสมของ
สิ่งประดิษฐ์ดังกล่าวก่อให้เกิดความท้าทายใหญ่
ที่นักวิจัย ในฐานะที่เป็นที่ปรากฎในรูปที่ 1 หนึ่งต้อง
หันไปใช้วิธีการสำหรับการแยกภาพและข้อความ
ข้อมูลหรือที่เรียกว่าการแบ่งส่วนภาพ.
หนึ่งในหลักการพื้นฐานของ
การแบ่งส่วนภาพทั่วไปคือการใช้
ลักษณะแอตทริบิวต์ของข้อความรูปภาพและ
วัตถุพื้นหลัง ความแตกต่างเหล่านี้ต่อจากนี้ไป
จะเรียกว่าคุณสมบัติเป็นสารสกัดในช่วงภาพ
ขั้นตอนการประมวลผลที่จะระบุข้อความรูปภาพและ
วัตถุพื้นหลังด้วยวิธีการต่าง ๆ ที่รู้จัก
เทคนิคเช่นแปลงเวฟเล็ต,
การแบ่งส่วนหรือการสกัดคุณลักษณะ งานวิจัยนี้
ได้นำเสนอวิธีการที่เรียกว่าฟัซซี่ C-Mean (FCM)
ซึ่งมีพนักงานสองที่ง่ายและตรงไปตรงมา
คุณสมบัติทางสถิติคือค่าเฉลี่ยและมาตรฐาน
การเบี่ยงเบนของบล็อกพิกเซล level1 ระดับสีเทา
ที่จะ
แยกแยะวัตถุเหล่านั้นจากคนอื่น
หลักการส่วนที่เหลือในการสังเกตว่าพิกเซลภาพ
สีที่มีน้ำหนักเบากว่าพื้นหลังสีเทา
ระดับขนาด นอกจากนี้ทุกค่าคุณลักษณะพิกเซลของ
ที่อยู่ในประเภทบล็อกวัตถุเดียวกันจะค่อนข้าง
ใกล้เคียงกับประเทศเพื่อนบ้าน.
เรายังสังเกตเห็นว่ามาตรฐาน
การเบี่ยงเบนของพิกเซลบล็อกข้อความที่ประมาณ1 ระดับระดับสีเทาของพิกเซลในแต่ละสอบสวนถูกคำนวณจากที่สอดคล้อง. ค่า RGB รูปที่ 1: ปัญหาของภาพ segmentation2 สูงเป็นสองเท่าในขณะที่ค่าเฉลี่ยที่สอดคล้องกันในสีเทาขนาด พิกเซลพื้นหลังในทางตรงกันข้ามมีค่าเฉลี่ยสูง (สว่าง) และค่าเบี่ยงเบนมาตรฐานต่ำค่า ผลการวิจัยดังกล่าวได้นำไปสู่การจัดกลุ่มการจัดหมวดหมู่ของวัตถุสามโดยอาศัยอำนาจของการกระจายตัวตามลำดับ. ที่เหลือของบทความนี้จะหารือเกี่ยวกับวิธี FCM เสนอในรายละเอียดมากขึ้นในขณะที่ต่อไปนี้มาตราที่ 2 อธิบายพื้นฐานหลักการของวิธีการจัดกลุ่ม FCM มาตรา 3 ให้กำหนดหลักการของ FCM เสนอวิธีการ หมวดที่ 4 การอภิปรายรายละเอียดของ FCM เป็นนำไปใช้กับการประมวลผลภาพ หมวดที่ 5 แสดงให้เห็นผลการทดลองที่ได้รับจากการป้อนข้อมูลที่เลือกภาพ ความคิดสุดท้ายและการทำงานในอนาคตจะมีการสรุปในส่วนสุดท้าย

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เอกสารมักจะประกอบด้วยสิ่งประดิษฐ์
แตกต่างกันตั้งแต่ข้อความที่จำเป็นในรูปแบบของ
ย่อหน้า , ตาราง , แทรก / sidebars , ภาพประกอบต่างๆ
เช่นแผนภูมิ แผนผัง และ
ภาพ / ภาพ ปัญหาของเอกสาร
เกิดขึ้นเมื่อแก้ไขชื่อของเอกสาร
ด้วยขาดแหล่งข้อมูลอิเล็กทรอนิกส์ นี่คือ
ที่การรู้จำอักขระด้วยแสง ( OCR )
เทคนิคเข้ามาในเล่น จัดการกับส่วนผสมของสิ่งประดิษฐ์ดังกล่าวท่าน

ใหญ่ท้าทายนักวิจัย เป็นภาพในรูป 1 , หนึ่งต้อง
รีสอร์ทหมายถึงการแยกภาพและข้อมูลต้นฉบับเดิม

) , ที่รู้จักกันเป็นภาพหนึ่งของหลักการพื้นฐานของ
การแบ่งส่วนภาพปกติคือการใช้แอตทริบิวต์
ลักษณะของข้อความ , ภาพ , และ
วัตถุพื้นหลังความแตกต่างเหล่านี้ ตั้งแต่นี้ไป
เรียกว่าคุณสมบัติได้ในระหว่างขั้นตอนการประมวลผลภาพ
ระบุข้อความ , ภาพ , และพื้นหลังวัตถุโดยใช้เทคนิค

กรรมต่างๆเช่นการแปลงเวฟ
, การแบ่งส่วนตลาด หรือคุณลักษณะการสกัด งานวิจัยนี้ได้เสนอวิธีการที่เรียกว่า Fuzzy c-mean

( FCM ) ซึ่งมี 2 ง่ายและตรงไปตรงมา
สถิติคุณสมบัติ คือค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน
บล็อกพิกเซลระดับสีเทา Level1

แยกแยะวัตถุเหล่านั้นจากคนอื่น ส่วนที่เหลือ
หลักให้สังเกตว่าสีพิกเซล
ภาพเบากว่าของพื้นหลังในระดับมาตราส่วนสีเทา

นอกจากนี้ ค่านิยม คุณลักษณะของพิกเซลทุก
เป็นของบล็อกวัตถุเดียวกันค่อนข้าง
ใกล้ชิดกับบรรดาประเทศเพื่อนบ้าน เราสังเกตต่อไปว่ามาตรฐาน

การเบี่ยงเบนของพิกเซลบล็อกข้อความประมาณ

1
สีเทาขนาดระดับของแต่ละพิกเซลตาม
สืบสวนจากการคำนวณค่า RGB ที่สอดคล้องกัน
.
รูปที่ 1 : ปัญหาของภาพ segmentation2
สูงเป็นสองเท่าเป็นค่าเฉลี่ยที่สอดคล้องกันในระดับสีเทา

พิกเซลพื้นหลัง ในทางตรงกันข้ามมี
หมายถึงสูง ( สว่าง ) และค่าความเบี่ยงเบน
มาตรฐานต่ำ นอกจากนี้ ยังพบนำไปสู่การจัดกลุ่ม
การจำแนกประเภทของวัตถุโดยอาศัย 3 การกระจายของตน
.
ที่เหลือของบทความนี้จะกล่าวถึงวิธีการเสนอ FCM
รายละเอียดมากกว่าเป็นดังนี้ ส่วนที่ 1 กล่าวถึง

อ้างอิงหลักการ FCM การจัดกลุ่มโดยวิธี หมวด 3
สร้างรูปแบบของการนำเสนอ FCM
วิธี มาตรา ๔ ได้รายละเอียดของ FCM เป็น
ใช้การประมวลผลภาพ ส่วนที่ 5 แสดง
ผลการทดลองที่ได้จากภาพที่เลือกใส่

ความคิดสุดท้ายและทำงานในอนาคต
สรุปภายในส่วน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.