Duplicate and near-duplicate docume

Duplicate and near-duplicate documents occur in many situations.
Making copies and creating new versions of documents is a constant activity in offices,
and keeping track of these is an important part of information management.
On the Web, however, the situation is more extreme.
In addition to the normal sources of duplication, plagiarism and spam are common,
and the use of multiple URLs to point to the same web page and mirror sites can cause a crawler to generate large numbers of duplicate pages.
Studies have shown that about 30% of the web pages in a large crawl are exact or near duplicates of pages in the other 70% (e.g., Fetterly et al., 2003).

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เอกสารซ้ำ และใกล้ซ้ำเกิดขึ้นได้ในหลายสถานการณ์ ทำสำเนา และการสร้างเวอร์ชันใหม่ของเอกสารเป็นกิจกรรมแบบคงที่ในสำนักงาน และติดตามของเหล่านี้เป็นส่วนสำคัญของการจัดการข้อมูล บนเว็บ สถานการณ์ก็รุนแรงขึ้น นอกจากปกติแหล่งที่มาของข้อมูลซ้ำ ชีวประวัติและสแปมมีทั่วไป และใช้หลาย Url เพื่อชี้ไปยังหน้าเว็บเดียวกัน และมิเรอร์ไซต์สามารถทำให้ crawler เพื่อสร้างหน้าซ้ำกันจำนวนมาก ศึกษาแสดงให้เห็นที่หน้าเว็บในการตระเวนขนาดใหญ่ประมาณ 30% เป็นที่แน่นอน หรือ ใกล้ซ้ำหน้าในอื่น ๆ 70% (เช่น Fetterly et al. 2003)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ซ้ำและเอกสารที่อยู่ใกล้ที่ซ้ำกันเกิดขึ้นในหลาย ๆ สถานการณ์.
การทำสำเนาและการสร้างรุ่นใหม่ของเอกสารเป็นกิจกรรมอย่างต่อเนื่องในสำนักงาน
และติดตามความเคลื่อนไหวของเหล่านี้เป็นส่วนสำคัญของการจัดการข้อมูล.
บนเว็บ แต่สถานการณ์จะรุนแรงมากขึ้น .
นอกจากนี้ยังมีแหล่งที่มาตามปกติของการทำสำเนา, การขโมยความคิดและสแปมอยู่ร่วมกัน
และการใช้งานของ URL หลายรายการเพื่อชี้ไปยังหน้าเว็บเดียวกันและเว็บไซต์กระจกอาจทำให้เกิดการรวบรวมข้อมูลในการสร้างจำนวนมากซ้ำหน้า.
การศึกษาพบว่าประมาณ 30 % ของหน้าเว็บในการรวบรวมข้อมูลที่มีขนาดใหญ่มีการซ้ำกันแน่นอนหรือใกล้หน้าในอีก 70% (เช่น Fetterly et al., 2003)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ที่ซ้ำกันและใกล้เอกสารซ้ำเกิดขึ้นได้ในหลายสถานการณ์การทําสําเนาและสร้างเวอร์ชันใหม่ของเอกสารเป็นกิจกรรมอย่างต่อเนื่องในสํานักงานและการติดตามของเหล่านี้เป็นส่วนสำคัญของการจัดการข้อมูลบนเว็บ อย่างไรก็ตาม สถานการณ์จะรุนแรงมากขึ้นนอกจากแหล่งปกติของการทำซ้ำ คัดลอกงานคนอื่น และขยะทั่วไปและใช้ URL หลายจุด ที่หน้าเว็บไซต์เดียวกัน และกระจกสามารถทำให้ไม้เลื้อยเพื่อสร้างจำนวนมากของหน้าเว็บที่ซ้ำกันมีการศึกษาแสดงให้เห็นว่าประมาณ 30 % ของหน้าเว็บในหรือใกล้คลานขนาดใหญ่แน่นอนซ้ำกันของหน้าเว็บในอื่น ๆ 70 % ( เช่น fetterly et al . , 2003 )

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.