where n is the number of testing sa

where n is the number of testing samples, i and 0
i are true
N-WER and predicted N-WER for each testing sample. The
MSE obtained for our system was 6.5%.
To evaluate the classification capability of the proposed
system, we firstly divided the testing data set to two parts:
high quality (positive) part and low quality (negative) part. If
the actual N-WER of the testing sample was bigger than a predefined
threshold T, it was labeled as a low quality (negative)
image. Otherwise, it was labeled as a high quality (positive)
image. During the classification, a test image was classified
as positive or negative according to its predict N-WER and
a threshold T0 which traversed from 0 to 1. Fig 4 illustrated
ROC curves of the classification results where the pre-defined
threshold T for testing sets were 0.1, 0.3, 0.5 and 0.7 respectively.
It can be observed that the proposed system achieved
better classification performance when threshold T was set to
be 0.3 and 0.5 for the testing data set.
In Table 3, we showed the equal error rates (EER) and
the corresponding optimal threshold T0 which was based on
the predicted N-WER for different classification tests. From
Table 3, we observed that the system had the best performance
and the optimal threshold T0 was consistent with the
pre-defined threshold when T = 0:3. By analyzing the distribution
of the N-WER, we can see that threshold T = 0:3
best describes the difference between good and bad OCR results
of the data sets, even though some document images
have “good” quality visually but have bad OCR and document
analysis capability.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

โดยที่ n คือ จำนวนของการทดสอบตัวอย่าง ฉัน และ 0ฉันเป็นจริงN WER และ N-WER ที่คาดการณ์สำหรับแต่ละตัวอย่างทดสอบ ที่MSE ได้ระบบของเราได้ 6.5%การประเมินความสามารถในการจัดประเภทของการนำเสนอระบบ เราประการแรกแบ่งชุดข้อมูลทดสอบไปยังส่วนที่สอง:ส่วนคุณภาพสูง (บวก) และส่วนที่คุณภาพต่ำ (ลบ) หากN-WER จริงของตัวอย่างทดสอบใหญ่กว่าที่กำหนดไว้ล่วงหน้าขีดจำกัด T มันถูกติดป้ายว่าเป็นคุณภาพต่ำ (ติดลบ)รูปภาพของ อื่น มันถูกติดป้ายว่าเป็นคุณภาพ (ค่าบวก)รูปภาพของ ในระหว่างการจัดประเภท รูปแบบทดสอบประเภทเป็นบวก หรือลบตามทำนาย N WER และขีดจำกัด T0 ซึ่งถูกตรวจสอบจาก 0 เป็น 1 ฟิกที่มีภาพประกอบ 4เส้นโค้ง ROC ผลการจัดประเภทที่กำหนดไว้ล่วงหน้าขีดจำกัด T สำหรับทดสอบชุดได้ 0.1, 0.3, 0.5 และ 0.7 ตามลำดับสามารถสังเกตระบบการนำเสนอได้ประเภทประสิทธิภาพเมื่อมีตั้งขีดจำกัด Tเป็น 0.3 และ 0.5 ชุดข้อมูลทดสอบในตาราง 3 เราพบว่าราคาผิดพลาดเท่า (ตัว) และขีดจำกัดสูงสุดสอดคล้อง T0 ซึ่งเป็นไปตามทดสอบ N-WER คาดการณ์การจัดแตกต่างกัน จากตาราง 3 เราพบว่า ระบบมีประสิทธิภาพสูงสุดขีดจำกัดสูงสุด T0 และสอดคล้องกับการขีดจำกัดที่กำหนดไว้ล่วงหน้าเมื่อ T = 0:3 โดยการวิเคราะห์การกระจายของ N-WER เราสามารถเห็นขีดจำกัดที่ T = 0:3ส่วนอธิบายความแตกต่างระหว่างผลลัพธ์ OCR ที่ดี และไม่ดีชุดข้อมูล แม้บางเอกสารรูปภาพมีคุณภาพ "ดี" เห็น แต่มีดี OCR และเอกสารความสามารถในการวิเคราะห์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ที่ n คือจำนวนของตัวอย่างทดสอบ? ฉันและ 0
ฉันเป็นจริง
N-WER และคาดการณ์ N-WER ตัวอย่างการทดสอบแต่ละ
. MSE ได้รับสำหรับระบบของเราเป็น 6.5% เพื่อประเมินความสามารถในการจัดหมวดหมู่ของที่นำเสนอระบบที่เราแบ่งแรกข้อมูลการทดสอบที่กำหนดให้สองส่วนที่มีคุณภาพสูง(บวก) และเป็นส่วนหนึ่งที่มีคุณภาพต่ำ (ลบ) ส่วนหนึ่ง หากเกิดขึ้นจริง N-WER ของตัวอย่างทดสอบมีขนาดใหญ่กว่าที่กำหนดไว้ล่วงหน้า T เกณฑ์มันก็ระบุว่าเป็นที่มีคุณภาพต่ำ (ลบ) ภาพ มิฉะนั้นจะถูกตราหน้าว่าเป็นที่มีคุณภาพสูง (บวก) ภาพ ในระหว่างการจัดหมวดหมู่ภาพการทดสอบถูกจัดเป็นบวกหรือลบตามที่คาดการณ์ N-WER และ T0 เกณฑ์ซึ่งสำรวจจาก 0 ถึง 1 รูปที่ 4 แสดงเส้นโค้งROC ผลการจัดหมวดหมู่ที่กำหนดไว้ล่วงหน้าT เกณฑ์สำหรับชุดทดสอบ เป็น 0.1, 0.3, 0.5 และ 0.7 ตามลำดับ. ก็สามารถที่จะตั้งข้อสังเกตว่าระบบที่นำเสนอประสบความสำเร็จในการปฏิบัติงานการจัดหมวดหมู่ที่ดีขึ้นเมื่อเกณฑ์ทีถูกกำหนดให้เป็น0.3 และ 0.5 สำหรับข้อมูลชุดทดสอบ. ในตารางที่ 3 เราแสดงให้เห็นว่าอัตราความผิดพลาดเท่ากับ (EER ) และT0 เกณฑ์ที่เหมาะสมสอดคล้องกันซึ่งขึ้นอยู่กับที่คาดการณ์N-WER สำหรับการทดสอบการจัดหมวดหมู่ที่แตกต่างกัน จากตารางที่ 3 เราสังเกตว่าระบบที่มีประสิทธิภาพที่ดีที่สุดและT0 เกณฑ์ที่ดีที่สุดคือสอดคล้องกับเกณฑ์ที่กำหนดไว้ล่วงหน้าเมื่อT = 0: 3 โดยการวิเคราะห์การกระจายของ N-WER เราจะเห็นว่าเกณฑ์ T = 0: 3 ที่ดีที่สุดจะอธิบายความแตกต่างระหว่างผล OCR ดีและไม่ดีของชุดข้อมูลแม้ว่าภาพเอกสารบางอย่างที่มี"ดี" ที่มีคุณภาพทางสายตา แต่มี OCR ที่ไม่ดี และเอกสารความสามารถในการวิเคราะห์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

โดยที่ n คือจำนวนตัวอย่างทดสอบ ฉันและ 0
ผม n-wer จริง
และคาดการณ์ n-wer สำหรับแต่ละการทดสอบตัวอย่าง
MSE ได้สำหรับระบบของเราเป็น 6.5% .
เพื่อประเมินความสามารถของระบบการเสนอ
เราตอนแรกแบ่งการทดสอบชุดข้อมูลสองส่วน :
คุณภาพสูง ( บวก ) ส่วนหนึ่งและคุณภาพต่ำ ( ลบ ) ส่วน ถ้า
การ n-wer ที่แท้จริงของการทดสอบครั้งนี้มีขนาดใหญ่กว่าที่กำหนดไว้ล่วงหน้า
( t , มันถูกระบุว่าเป็น ที่มีคุณภาพต่ำ ( ลบ )
ภาพ ไม่งั้น มันถูกระบุว่าเป็น คุณภาพสูง ( บวก )
ภาพ ในระหว่างการสอบภาพจัด
เป็นบวกหรือลบตามความคาดเดาและเกณฑ์ n-wer
t0 ซึ่งเดินทางไปจาก 0 ถึง 1 รูปที่ 4 แสดง
หมวดหมู่ : เส้นโค้งของผลลัพธ์ที่กำหนดไว้ล่วงหน้าสำหรับชุดทดสอบ T
ธรณีประตูคือ 0.1 , 0.3 , 0.5 และ 0.7 ตามลำดับ
พบว่าระบบที่เสนอสามารถแสดงการจำแนกดีขึ้นเมื่อเกณฑ์ T

ถูกตั้งค่าเป็น 0.3 และ 0.5 สำหรับการทดสอบชุดข้อมูล .
ในตารางที่ 3 เรา พบว่า อัตราความผิดพลาดเท่ากับ ( EER ) และ
ที่เหมาะสมซึ่งขึ้นอยู่กับเกณฑ์ t0
ทำนาย n-wer สำหรับการทดสอบประเภทต่าง ๆ จาก
3 ตาราง เราตรวจสอบว่าระบบมีประสิทธิภาพที่ดีที่สุดและเหมาะสมที่สุด
t0 เกณฑ์สอดคล้องกับเกณฑ์ที่กำหนดไว้ล่วงหน้าเมื่อ t =
0:3 . โดยการวิเคราะห์การกระจาย
ของ n-wer เราจะเห็นได้ว่า ค่า t = 0:3
ที่ดีที่สุดอธิบายถึงความแตกต่างระหว่างดีและไม่ดีผล OCR
ของข้อมูลชุด แม้ว่าบางภาพเอกสาร
" คุณภาพดี " สายตาไม่ดีแต่ OCR และความสามารถในการวิเคราะห์เอกสาร

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.