Today, big data has been attracting more and more attention. Challenges and opportunities of big data era are defined as being five Vs, i.e., volume (amount of data), velocity (speed of data in and out), variety (range of data types and sources), value (desirable quality of data) and veracity (trustworthiness of various data).1 The volume of big data is massive, and main technologies to store big data include distributed cache, distributed database and distributed file system (Zhang et al., 2014 and Zhang X and Liu C et al., 2014). The big data is also time-sensitive, defined as velocity, referring to the speed at which new data is generated and the speed at which data1 moves around, and main methods to face this challenge include MapReduce (Dean and Ghemawat, 2008) and concurrency control. Moreover, types of big data consist of text, video, audio, webpage, stream and even aggregation of above, which is the meaning of variety. Another V to take into account when looking at big data is value, which is important as the result that users can make a benefit for any attempt to collect and leverage big data. The last V, veracity, refers to the trustworthiness of the big data, with large amount, high speed, many forms and uneven quality. We can safely argue that ‘veracity’ is the most important V of big data to gain ultimate and valid value. This paper aims to measure the veracity of web data which occurs as one challenge bridging users and big data.
วันนี้ ข้อมูลขนาดใหญ่ดึงดูดความสนใจมาก ขึ้น ความท้าทายและโอกาสของยุคข้อมูลขนาดใหญ่ไว้เป็น ห้า Vs เช่น ปริมาณ (จำนวนข้อมูล), ความเร็ว (ความเร็วของข้อมูลเข้า และออก), (ช่วงของชนิดข้อมูลและแหล่ง), ค่า (ต้องการคุณภาพของข้อมูล) และหลากหลาย veracity (น่าเชื่อถือของข้อมูลต่าง ๆ) .1 ปริมาณข้อมูลขนาดใหญ่มีขนาดใหญ่ และเทคโนโลยีหลักการเก็บข้อมูลขนาดใหญ่รวมถึงแคกระจายกระจายฐานข้อมูลและระบบแฟ้มแบบกระจาย (Zhang et al., 2014 และ Zhang X และหลิว C et al., 2014) ข้อมูลขนาดใหญ่ก็ตามเวลา กำหนดเป็นความเร็ว การอ้างอิงความเร็วในการสร้างข้อมูลใหม่และความเร็วในการเคลื่อนไหวของสินค้า 1 รอบ และหลักวิธีการเผชิญความท้าทายนี้รวม MapReduce (คณบดีและ Ghemawat, 2008) และการควบคุมการเกิดพร้อมกัน นอกจากนี้ ชนิดของข้อมูลขนาดใหญ่ประกอบด้วยข้อความ วิดีโอ เสียง เว็บเพจ กระแส และแม้กระทั่งรวมข้างต้น ซึ่งมีความหมายหลากหลาย V อื่นถึงมองข้อมูลใหญ่คือ ค่า ซึ่งเป็นสิ่งสำคัญเป็นผลให้ผู้ใช้สามารถทำให้สวัสดิการใด ๆ พยายามที่จะรวบรวม และใช้ข้อมูลขนาดใหญ่ได้ สุดท้าย V, veracity อ้างอิงน่าเชื่อถือของข้อมูลขนาดใหญ่ จำนวนมาก เร็ว หลายรูปแบบ และคุณภาพไม่สม่ำเสมอ นอกจากนี้เราได้อย่างปลอดภัยสามารถโต้เถียงได้ว่า 'veracity' V ที่สำคัญที่สุดของข้อมูลขนาดใหญ่เพื่อให้ได้ค่าที่ดีที่สุด และถูกต้อง เอกสารนี้มีวัตถุประสงค์เพื่อวัด veracity เว็บข้อมูลที่เกิดขึ้นเป็นความท้าทายหนึ่งที่เชื่อมโยงผู้ใช้และข้อมูลขนาดใหญ่
การแปล กรุณารอสักครู่..

วันนี้ , ข้อมูลใหญ่ได้รับการดึงดูดความสนใจมากขึ้นและมากขึ้น โอกาสและความท้าทายของยุคใหญ่ข้อมูลถูกกำหนดเป็นห้า ปะทะ เช่น ปริมาณ ( จำนวนข้อมูล ) , ความเร็ว ( ความเร็วของข้อมูลที่เข้าและออก ) , ความหลากหลาย ( ช่วงของชนิดข้อมูลและแหล่งที่มา ) , ค่า ( คุณภาพที่พึงประสงค์ของข้อมูล ) และคำพูด ( ความน่าเชื่อถือของข้อมูลต่าง ๆ ) 1 ปริมาณของข้อมูล ใหญ่เป็นจำนวนมากเทคโนโลยีหลักในการจัดเก็บข้อมูลที่ใหญ่รวมถึงแคชแบบกระจาย การกระจายฐานข้อมูลและระบบแฟ้มแบบกระจาย ( Zhang et al . , 2014 และจาง เอ็กซ์ และ หลิว ซี et al . , 2010 ) ข้อมูลที่ใหญ่คือเวลาที่อ่อนไหว เช่น ความเร็วตามความเร็วที่ข้อมูลใหม่จะถูกสร้างขึ้นและความเร็วในการย้าย data1 รอบหลักและวิธีการเผชิญความท้าทายนี้รวมถึง mapreduce ( คณบดี และ ghemawat , 2008 ) และควบคุมการเห็นพ้องด้วย นอกจากนี้ ประเภทใหญ่ข้อมูลประกอบด้วยข้อความ , วิดีโอ , เสียง , เว็บ สตรีมและรวมถึงข้างต้น ซึ่งความหมายของความหลากหลาย หนึ่ง V ที่จะเข้าบัญชีเมื่อค้นหาข้อมูลใหญ่ค่าที่สำคัญ เป็นผลให้ผู้ใช้สามารถให้ประโยชน์ใด ๆพยายามที่จะเก็บรวบรวมและใช้ประโยชน์จากข้อมูลใหญ่ ความจริงสุดท้าย V หมายถึงความน่าเชื่อถือของข้อมูลใหญ่ ที่มีปริมาณมาก ความเร็วสูง หลายรูปแบบและคุณภาพไม่สม่ำเสมอ เราสามารถยืนยันว่า ' จริง ' สำคัญที่สุด 5 ข้อมูลใหญ่ที่จะได้รับที่ดีที่สุดและค่าที่ถูกต้องบทความนี้มีวัตถุประสงค์เพื่อวัดความเป็นจริงของเว็บข้อมูลซึ่งเกิดขึ้นเป็นหนึ่งในความท้าทายระหว่างผู้ใช้และข้อมูลใหญ่
การแปล กรุณารอสักครู่..
