2. What is big data?
Manyika et al. [10, page 1] define Big Data as “datasets whose
size is beyond the ability of typical database software tools
to capture, store, manage, and analyze”. Likewise, Davis and
Patterson [1, page 4] say “Big data is data too big to be handled
and analyzed by traditional database protocols such as SQL”;
and the same opinion is shared by [11,3,4], etc. Both groups of
authors previously mentioned go beyond the only size aspects
of data when defining Big Data! Edd Dumbill in [12, page 3]
explicitly conveys the multi-dimensionality of Big Data when
adding that “the data is too big, moves too fast, or doesn’t fit
the strictures of your database architectures”. This quotation
allows us to see that extra characteristics should be added to
large datasets to be considered as Big Data, or big size data as
often found throughout the literature [2].
Now it is assumed that size is not the only feature of Big
Data. Many authors [1,12,11,9,13,4] explicitly use the Three
V’s (Volume, Variety and Velocity) to characterize Big Data. If
the three V’s are largely found in the literature, many authors
[10,13] and institutes like IEEE focus on Big Data Value, Veracity
and Visualization. This last “V” to notice how important it is to
provide good tools to figure out data and analysis’ results.2
Volume (Data in rest). The benefit gained from the
ability to process large amounts of information is the main
attraction of big data analytics. Having more data beats
having better models [12]. The consequence is that it is a
trend for many companies to store vast amount of various
sorts of data: social networks data, health care data, financial
data, biochemistry and genetic data, astronomical data, etc.
Variety (Data in many forms). These data do not have
a fixed structure and rarely present themselves in a perfectly ordered form and ready for processing [12]. Indeed,
2.เป็นข้อมูลManyika ร้อยเอ็ด [10 หน้า 1] กำหนดข้อมูลเป็น "ชุดข้อมูลที่มีขนาดอยู่นอกเหนือความสามารถของเครื่องมือซอฟต์แวร์ฐานข้อมูลทั่วไปการจับภาพ จัดเก็บ จัดการ และวิเคราะห์" ในทำนองเดียวกัน Davis และต [1 หน้า 4] กล่าวว่า "ข้อมูลคือ ข้อมูลใหญ่เกินไปที่จะจัดการและวิเคราะห์ โดยโพรโทคอฐานข้อมูลดั้งเดิมเช่น SQL"และสอดคล้องร่วมกัน [11,3,4], เป็นต้น กลุ่มของผู้เขียนเคย กล่าวถึงไปไกลกว่าเพียงขนาดลักษณะข้อมูลเมื่อกำหนดข้อมูล Edd Dumbill ใน [12 หน้า 3]สื่อมิติหลายของข้อมูลอย่างชัดเจนเมื่อเพิ่ม "ข้อมูลใหญ่เกินไป เคลื่อนที่เร็วเกินไป ไม่พอดีstrictures ของสถาปัตยกรรมของฐานข้อมูล" ใบเสนอราคานี้ช่วยให้เราเห็นว่า ควรจะเพิ่มลักษณะพิเศษการชุดข้อมูลขนาดใหญ่จะถือว่า เป็น ข้อมูลขนาดใหญ่ หรือใหญ่ขนาดข้อมูลมักจะพบทั่วทั้งวรรณกรรม [2]ตอนนี้ มันจะสันนิษฐานว่า ขนาดไม่ใช่คุณลักษณะเฉพาะของใหญ่ข้อมูล ผู้เขียนหลาย [1,12,11,9,13,4] ใช้สามอย่างชัดเจนโวลต์ของ (ปริมาณ ความหลากหลาย และความเร็ว) กับลักษณะข้อมูล ถ้าของ V สามส่วนใหญ่พบในวรรณคดี ผู้เขียนมากมาย[10,13] และสถาบันเช่น IEEE เน้นใหญ่ข้อมูลค่า จริงและการมองเห็น นี้ล่าสุด "V" สังเกตมีความสำคัญอย่างไรให้เครื่องมือเพื่อดูข้อมูลและการวิเคราะห์ของ results.2ปริมาณ (ข้อมูลในส่วนที่เหลือ) ประโยชน์ที่ได้จากการความสามารถในการประมวลผลข้อมูลจำนวนมากเป็นหลักแหล่งท่องเที่ยวของการวิเคราะห์ข้อมูลขนาดใหญ่ มีเต้นข้อมูลเพิ่มเติมมีรุ่นดีขึ้น [12] โทษคือ ว่า มันเป็นการแนวโน้มสำหรับหลายบริษัทในการจัดเก็บของต่าง ๆ มากมายมหาศาลประเภทของข้อมูล: ข้อมูลเครือข่ายทางสังคม ข้อมูลสุขภาพ การเงินข้อมูล ชีวเคมี และข้อมูลทางพันธุกรรม ข้อมูลดารา ฯลฯหลากหลาย (ข้อมูลในหลายรูปแบบ) ไม่มีข้อมูลเหล่านี้ที่คงโครงสร้าง และไม่ค่อยแสดงตัวเองในแบบฟอร์มการสั่งซื้ออย่างสมบูรณ์แบบและพร้อมสำหรับการประมวลผล [12] แน่นอน
การแปล กรุณารอสักครู่..

2. ข้อมูลขนาดใหญ่อะไร
Manyika et al, [10 หน้า 1] กำหนดข้อมูลขนาดใหญ่เป็น "ชุดข้อมูลที่มี
ขนาดเกินความสามารถของเครื่องมือซอฟต์แวร์ฐานข้อมูลทั่วไป
บันทึกจัดเก็บจัดการและวิเคราะห์" ในทำนองเดียวกันเดวิสและ
แพตเตอร์สัน [1, หน้า 4] พูดว่า "ข้อมูลขนาดใหญ่เป็นข้อมูลที่มีขนาดใหญ่เกินไปที่จะจัดการ
และวิเคราะห์โดยโปรโตคอลฐานข้อมูลแบบดั้งเดิมเช่น SQL";
และมีความคิดเห็นแบบเดียวกันจะใช้ร่วมกันโดย [11,3,4] ฯลฯ ทั้งสองกลุ่มของ
ผู้เขียนกล่าวถึงก่อนหน้านี้ไปไกลกว่าด้านขนาดเพียง
ของข้อมูลเมื่อกำหนดข้อมูลขนาดใหญ่! กรม Dumbill ใน [12, หน้า 3]
อย่างชัดเจนบ่งบอกถึงหลายมิติของข้อมูลขนาดใหญ่เมื่อ
เสริมว่า "ข้อมูลที่มีขนาดใหญ่เกินไปย้ายเร็วเกินไปหรือไม่พอดี
ระบายสถาปัตยกรรมฐานข้อมูลของคุณ" คำพูดนี้
ช่วยให้เราเห็นว่าลักษณะพิเศษควรจะเพิ่ม
ชุดข้อมูลขนาดใหญ่ที่จะได้รับการพิจารณาเป็นข้อมูลขนาดใหญ่หรือข้อมูลขนาดใหญ่เป็น
มักจะพบได้ทั่ววรรณกรรม [2].
ตอนนี้ก็จะถือว่าเป็นขนาดที่ไม่ได้เป็นคุณลักษณะเฉพาะของบิ๊ก
ดาต้า . ผู้เขียนหลาย [1,12,11,9,13,4] อย่างชัดเจนใช้สาม
วี (ปริมาณ, วาไรตี้และความเร็ว) ที่จะอธิบายลักษณะข้อมูลขนาดใหญ่ ถ้า
สามวีส่วนใหญ่จะพบในวรรณคดีหลายคนเขียน
[10,13] และสถาบันเช่น IEEE มุ่งเน้นไปที่ราคาข้อมูลขนาดใหญ่ความจริง
และการมองเห็น สุดท้ายนี้ "วี" เพื่อแจ้งให้ทราบว่าสำคัญก็คือการ
มีเครื่องมือที่ดีที่จะคิดออกและวิเคราะห์ข้อมูล 'results.2
ปริมาณ (ข้อมูลในส่วนที่เหลือ) ผลประโยชน์ที่ได้รับจาก
ความสามารถในการประมวลผลข้อมูลจำนวนมากเป็นหลัก
ที่น่าสนใจของการวิเคราะห์ข้อมูลขนาดใหญ่ มีมากขึ้นเต้นข้อมูลที่
มีรูปแบบที่ดีขึ้น [12] ผลที่ตามมาก็คือว่ามันเป็น
เทรนด์สำหรับหลาย บริษัท ในการจัดเก็บจำนวนมากมายหลาย
ประเภทของข้อมูล: ข้อมูลเครือข่ายทางสังคม, ข้อมูลการดูแลสุขภาพทางการเงิน
ข้อมูลชีวเคมีและข้อมูลทางพันธุกรรมข้อมูลดาราศาสตร์ ฯลฯ
วาไรตี้ (ข้อมูลในหลายรูปแบบ) ข้อมูลเหล่านี้ไม่ได้มี
โครงสร้างพื้นฐานและไม่ค่อยนำเสนอตัวเองในรูปแบบที่ได้รับคำสั่งอย่างสมบูรณ์และพร้อมสำหรับการประมวลผล [12] อันที่จริง
การแปล กรุณารอสักครู่..

2 . อะไรคือข้อมูลใหญ่manyika et al . [ 10 หน้า 1 ] กำหนดข้อมูลเป็นข้อมูลที่มีขนาดใหญ่ขนาดมันเกินความสามารถของเครื่องมือทั่วไปซอฟต์แวร์ฐานข้อมูลจับ , เก็บ , จัดการ และวิเคราะห์ " อนึ่ง เดวิส และแพตเตอร์สัน [ 1 ] หน้า 4 ว่า " ใหญ่ข้อมูล คือ ข้อมูลมีขนาดใหญ่เกินไปที่จะจัดการและวิเคราะห์ข้อมูลโดยใช้โปรโตคอลแบบดั้งเดิมเช่น SQL ฐานข้อมูล " ;และมีความเห็นร่วมกัน โดย 11,3,4 [ ] , ฯลฯ ทั้ง 2 กลุ่มผู้เขียนกล่าวถึงก่อนหน้านี้นอกเหนือไปจากด้านขนาดเท่านั้นข้อมูล เมื่อกำหนดข้อมูลใหญ่ ของ dumbill [ 3 ] หน้า 12โดยสื่อหลาย dimensionality ข้อมูลใหญ่เมื่อเพิ่มว่า " ข้อมูลที่มีขนาดใหญ่เกินไป รวดเร็วเกินไป หรือ ไม่เหมาะกับที่ทบทวนของสถาปัตยกรรมฐานข้อมูลของคุณ ใบเสนอราคานี้ช่วยให้เราเพื่อดูว่า ลักษณะพิเศษควรเพิ่มขนาดใหญ่ข้อมูลจะถือว่าเป็นข้อมูลที่เป็นข้อมูลขนาดใหญ่ หรือบิ๊กที่พบบ่อยตลอดวรรณกรรม [ 2 ]ตอนนี้ก็ถือว่า ขนาดไม่ได้เป็นคุณลักษณะเฉพาะของใหญ่ข้อมูล ผู้เขียนหลายคน [ 1,12,11,9,13,4 ] อย่างชัดเจนใช้สามV ( ระดับเสียงที่หลากหลายและความเร็ว ) ในลักษณะของข้อมูลใหญ่ ถ้า3 V เป็นส่วนใหญ่พบในวรรณคดีมากมาย ผู้เขียน[ 10,13 ] และสถาบันเช่น IEEE มุ่งเน้นคุณค่าจริงข้อมูลใหญ่และการมองเห็น นี้ล่าสุด " วี " จะสังเกตเห็นว่ามันสำคัญ คือให้เครื่องมือที่ดีที่จะหาข้อมูล และการวิเคราะห์ผล 2 .ปริมาณข้อมูลในส่วนที่เหลือ ) ผลประโยชน์ที่ได้รับจากความสามารถในการประมวลผลจำนวนมากของข้อมูลเป็นหลักสถานที่น่าสนใจในการวิเคราะห์ข้อมูลใหญ่ มีข้อมูลเพิ่มเติมที่จังหวะมีที่ดีกว่ารุ่น [ 12 ] ผลคือ มันเป็นแนวโน้มสำหรับหลาย บริษัท ที่จะเก็บจำนวนเงินที่มากมายของต่าง ๆประเภทของข้อมูลที่เครือข่ายทางสังคม , ข้อมูลการดูแลสุขภาพทางการเงินข้อมูล ข้อมูล ดาราศาสตร์ ชีวเคมี และทางพันธุกรรมข้อมูล ฯลฯความหลากหลาย ( ข้อมูลหลายรูปแบบ ) ข้อมูลเหล่านี้ไม่ได้มีกำหนดโครงสร้างและไม่ค่อยนำเสนอตัวเองในรูปแบบสมบูรณ์ สั่งและพร้อมสำหรับการประมวลผล [ 12 ] แน่นอน
การแปล กรุณารอสักครู่..
