such data can be highly structured (data from relational
databases), semi-structured (web logs, social media feeds, raw
feed directly from a sensor source, email, etc.) or unstructured
(video, still images, audio, clicks) [12]. Another “V”, for Variability,
can be added to variety to emphasize on semantics,
or the variability of meaning in language and communication
protocols.
Velocity (Data in motion). Velocity involves streams of
data, structured records creation, and availability for access
and delivery.3 Indeed it is not just the velocity of the incoming
data that is the issue: it is possible to stream fast-moving data
into bulk storage for later batch processing, for example. The
importance lies in the speed of the feedback loop, taking data
from input through to decision [12].
Value (Data in highlight). This feature is the purpose
of Big Data technology. This view is well expressed by
the International Data Corporation4 when saying that Big
Data architectures are: “designed to economically extract value
from very large volumes of a wide variety of data, by enabling
high-velocity capture, discovery, and/or analysis”. This value
falls into two categories: analytical use (replacing/supporting
human decision, discovering needs, segmenting populations
to customize actions) and enabling new business models,
products and services [12,10].
Veracity (Data in doubt). Veracity is what is conform
with truth or fact, or in short, Accuracy, Certainty, Precision.
Uncertainty can be caused by inconsistencies, model
approximations, ambiguities, deception, fraud, duplication,
incompleteness, spam and latency. Due to veracity, results
derived from Big data cannot be proven; but they can be
assigned a probability.
To conclude, dealing effectively with Big Data requires one
to create value against the volume, variety and veracity of data
while it is still in motion (velocity), not just after it is at
rest [11]. And at the end, as recommended by [13], scientists
must jointly tackle Big Data with all its features.
ข้อมูลดังกล่าวจะมีโครงสร้างสูง (ข้อมูลจากเชิงสัมพันธ์
ฐานข้อมูล) กึ่งโครงสร้าง (บันทึกการใช้เว็บสื่อสังคมฟีดดิบ
ฟีดโดยตรงจากแหล่งเซ็นเซอร์, อีเมล์, ฯลฯ ) หรือไม่มีโครงสร้าง
(วิดีโอภาพนิ่งเสียงคลิก) [ 12] อีก "วี" สำหรับแปรปรวน
สามารถเพิ่มความหลากหลายในการให้ความสำคัญกับความหมาย
หรือความแปรปรวนของความหมายในภาษาและการสื่อสาร
โปรโตคอล.
Velocity (ข้อมูลในการเคลื่อนไหว) ความเร็วที่เกี่ยวข้องกับการไหลของ
ข้อมูลการสร้างบันทึกที่มีโครงสร้างและความพร้อมสำหรับการเข้าถึง
และ delivery.3 จริงมันไม่ได้เป็นเพียงความเร็วของการเข้า
ข้อมูลที่มีปัญหา: มันเป็นไปได้ที่จะสตรีมอย่างรวดเร็วย้ายข้อมูล
ในการจัดเก็บจำนวนมากสำหรับการประมวลผลชุดต่อมา , ตัวอย่างเช่น.
ความสำคัญอยู่ในความเร็วของห่วงความคิดเห็นที่นำข้อมูล
จากการป้อนข้อมูลผ่านไปสู่การตัดสินใจ [12].
มูลค่า (ข้อมูลในไฮไลท์) คุณลักษณะนี้จะเป็นจุดประสงค์
ของเทคโนโลยีข้อมูลขนาดใหญ่ มุมมองนี้จะแสดงเป็นอย่างดีจาก
นานาชาติข้อมูล Corporation4 เมื่อบอกว่าบิ๊ก
สถาปัตยกรรมข้อมูลจะถูก "ออกแบบมาเพื่อดึงค่าทางเศรษฐกิจ
จากปริมาณมากของความหลากหลายของข้อมูลโดยการเปิดใช้
ความเร็วสูงจับภาพการค้นพบและ / หรือการวิเคราะห์" ค่านี้
ตกอยู่ในสองประเภท: การใช้การวิเคราะห์ (เปลี่ยน / สนับสนุน
การตัดสินใจของมนุษย์ค้นพบความต้องการแบ่งกลุ่มประชากร
ในการปรับแต่งการกระทำ) และการเปิดใช้งานรูปแบบธุรกิจใหม่
. สินค้าและบริการ [12,10]
ความจริง (ข้อมูลในการสงสัย) ความจริงคือสิ่งที่เป็นไปตาม
ความจริงหรือความเป็นจริงหรือในระยะสั้นความถูกต้องแน่นอนแม่นยำ.
ความไม่แน่นอนอาจเกิดจากความไม่สอดคล้องกัน, รุ่น
ใกล้เคียง, งงงวยหลอกลวงฉ้อโกงซ้ำ,
ไม่สมบูรณ์สแปมและแฝง เนื่องจากความจริงผล
ที่ได้มาจากข้อมูลขนาดใหญ่ไม่สามารถพิสูจน์; แต่พวกเขาสามารถ
ได้รับมอบหมายความน่าจะเป็น.
สรุปการจัดการอย่างมีประสิทธิภาพกับข้อมูลขนาดใหญ่ต้องใช้อย่างใดอย่างหนึ่ง
ในการสร้างมูลค่ากับปริมาณความหลากหลายและความถูกต้องของข้อมูล
ในขณะที่มันยังคงอยู่ในการเคลื่อนไหว (ความเร็ว) ไม่เพียง แต่หลังจากที่
เหลือ [11] . และในตอนท้ายตามคำแนะนำ [13] นักวิทยาศาสตร์
ร่วมกันจะต้องรับมือกับข้อมูลขนาดใหญ่ที่มีคุณสมบัติทั้งหมดของ
การแปล กรุณารอสักครู่..