ABSTRACT: In this paper, we present

ABSTRACT: In this paper, we present a method using webpage
segmentation algorithm to improve the performace of the
webpage content extraction. The traditional methods often
depend on parsing the DOM tree of the webpage and judging
each node of the DOM tree to determin which node is the text
node, this kind of method has a potential problem, it sometimes
throws part of the content away because of its local judgement
strategy. But our method which is based on the VIPS (Visionbased
Page Segmentation) algorithm, can solve the problem
satisfactorily, it can extract the content according to the
coordinate information of the block and help the traditional
method to recall the lost part of the content

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

บทคัดย่อ: ในกระดาษนี้ เรานำเสนอวิธีการใช้เว็บเพจอัลกอริทึมการแบ่งเซกเมนต์ performace ของปรับปรุงการเว็บเพจแบบเนื้อหาแยก วิธีการแบบดั้งเดิมมักจะแยกต้นโดมของเว็บเพจ และตัดสินแต่ละโหนดในทรีโดมไป determin โหนที่เป็นข้อความโหน ชนิดของวิธีการนี้มีปัญหาอาจเกิดขึ้น มันบางครั้งพ่นเก็บส่วนหนึ่งของเนื้อหาเนื่องจากการตัดสินของท้องถิ่นกลยุทธ์การ แต่วิธีของเราที่อยู่ VIPS (Visionbasedอัลกอริทึมที่แบ่งหน้า) สามารถแก้ปัญหาผ่าน มันสามารถแยกเนื้อหาตามข้อมูลของบล็อกประสานงาน และช่วยให้แบบดั้งเดิมวิธีการเรียกคืนเนื้อหาบางส่วนหายไป

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

บทคัดย่อ: ในบทความนี้เราจะนำเสนอวิธีการใช้หน้าเว็บ
ขั้นตอนวิธีการแบ่งส่วนในการปรับปรุง performace ของ
การสกัดเนื้อหาของหน้าเว็บ วิธีการแบบดั้งเดิมมักจะ
ขึ้นอยู่กับการแยกต้นไม้ DOM ของหน้าเว็บและการตัดสิน
โหนดของต้นไม้ DOM แต่ละโหนด determin ซึ่งเป็นข้อความ
โหนดชนิดของวิธีการนี้มีปัญหาที่อาจเกิดขึ้นบางครั้งมันก็
พ่นส่วนหนึ่งของเนื้อหาออกไปเพราะของ คำพิพากษาท้องถิ่น
กลยุทธ์ แต่วิธีการของเราซึ่งจะขึ้นอยู่กับวีไอพี (Visionbased
หน้า Segmentation) อัลกอริทึมสามารถแก้ปัญหาได้
อย่างน่าพอใจก็สามารถดึงเนื้อหาตาม
ข้อมูลพิกัดของบล็อกและช่วยแบบดั้งเดิม
วิธีการที่จะจำส่วนที่หายไปของเนื้อหา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

บทคัดย่อ ในกระดาษนี้เราได้เสนอวิธีการใช้เว็บเพจ
ขั้นตอนวิธีเพื่อปรับปรุงสมรรถนะของ
เว็บเพจเนื้อหาการสกัด วิธีการแบบดั้งเดิมมักจะ
ขึ้นอยู่กับการแยกต้นไม้ DOM ของหน้าเว็บและดู
แต่ละโหนดของต้นไม้ดอมให้ทราบซึ่งโหนดเป็นข้อความ
โหนด วิธีนี้มีปัญหาที่อาจเกิดขึ้นบางครั้ง
พ่นส่วนของเนื้อหาออกไปเพราะกลยุทธ์การตัดสินใจ
ของท้องถิ่น แต่วิธีของเราซึ่งจะขึ้นอยู่กับวีไอพี ( visionbased
แบ่งหน้า ) ขั้นตอนวิธีแก้ปัญหา
น่าพอใจ มันสามารถแยกเนื้อหาตาม
ประสานงานข้อมูลของบล็อกและช่วยให้วิธีการดั้งเดิม
เรียกคืนสูญเสียส่วนหนึ่งของเนื้อหา

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.