What is big data
Manyika et al. [10, page 1] define Big Data as “datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze”. Likewise, Davis and Patterson [1, page 4] say “Big data is data too big to be handled and analyzed by traditional database protocols such as SQL”; and the same opinion is shared by [11,3,4], etc. Both groups of authors previously mentioned go beyond the only size aspects of data when defining Big Data! Edd Dumbill in [12, page 3] explicitly conveys the multi-dimensionality of Big Data when adding that “the data is too big, moves too fast, or doesn’t fit the strictures of your database architectures”. This quotation allows us to see that extra characteristics should be added to large datasets to be considered as Big Data, or big size data as often found throughout the literature [2].
Now it is assumed that size is not the only feature of Big Data. Many authors [1,12,11,9,13,4] explicitly use the Three V’s (Volume, Variety and Velocity) to characterize Big Data. If the three V’s are largely found in the literature, many authors [10,13] and institutes like IEEE focus on Big Data Value, Veracity and Visualization. This last “V” to notice how important it is to
provide good tools to figure out data and analysis’ results.2
Volume (Data in rest). The benefit gained from the ability to process large amounts of information is the main attraction of big data analytics. Having more data beats having better models [12]. The consequence is that it is a trend for many companies to store vast amount of various sorts of data: social networks data, health care data, financial data, biochemistry and genetic data, astronomical data, etc.
Variety (Data in many forms). These data do not have a fixed structure and rarely present themselves in a per- fectly ordered form and ready for processing [12]. Indeed
ข้อมูลคืออะไรManyika ร้อยเอ็ด [10 หน้า 1] กำหนดข้อมูลเป็น "ชุดข้อมูลที่มีขนาดไม่เกินความสามารถของเครื่องมือซอฟต์แวร์ฐานข้อมูลทั่วไปจับภาพ จัดเก็บ จัดการ และวิเคราะห์" ทำนองเดียวกัน Davis และต [1 หน้า 4] กล่าวว่า "ข้อมูลคือ ข้อมูลใหญ่เกินไปที่จะจัดการ และวิเคราะห์ โดยโพรโทคอฐานข้อมูลดั้งเดิมเช่น SQL" และสอดคล้องร่วมกัน [11,3,4], เป็นต้น กลุ่มของผู้เขียนที่กล่าวถึงก่อนหน้านี้ ไปไกลกว่าเพียงขนาดของข้อมูลเมื่อกำหนดข้อมูล Edd Dumbill ใน [12 หน้า 3] ถ่ายทอดมิติหลายของข้อมูลอย่างชัดเจนเมื่อมีการเพิ่ม "ข้อมูลใหญ่เกินไป เคลื่อนที่เร็วเกินไป ไม่พอดีกับ strictures ของสถาปัตยกรรมของฐานข้อมูล" ใบเสนอราคานี้ให้เราได้เห็นว่า ลักษณะพิเศษควรเพิ่มชุดข้อมูลขนาดใหญ่จะถือว่าเป็นข้อมูลขนาดใหญ่ หรือข้อมูลขนาดใหญ่ที่พบบ่อยทั้งวรรณกรรม [2]ตอนนี้ มันจะสันนิษฐานว่า ขนาดไม่ใช่คุณลักษณะเฉพาะของข้อมูลขนาดใหญ่ ผู้เขียนหลาย [1,12,11,9,13,4] ได้ใช้สาม V ของ (ปริมาณ ความหลากหลาย และความเร็ว) กับลักษณะข้อมูล ถ้าของ V สามส่วนใหญ่พบในวรรณคดี ผู้สร้าง [10,13] และสถาบันหลายเช่น IEEE เน้น ค่าข้อมูลใหญ่ จริง และแสดงภาพประกอบเพลง นี้ล่าสุด "V" สังเกตมีความสำคัญอย่างไรให้เครื่องมือเพื่อดูข้อมูลและการวิเคราะห์ของ results.2ปริมาณ (ข้อมูลในส่วนที่เหลือ) ประโยชน์ที่ได้รับจากความสามารถในการประมวลผลข้อมูลจำนวนมากเป็นแหล่งท่องเที่ยวหลักของการวิเคราะห์ข้อมูลขนาดใหญ่ มีข้อมูลเพิ่มเติมก็เต้นดีกว่ามีรุ่น [12] โทษคือ ว่า มันเป็นแนวโน้มสำหรับเก็บข้อมูลประเภทต่าง ๆ จำนวนมากหลายบริษัท: ข้อมูลเครือข่ายทางสังคม ข้อมูลสุขภาพ ข้อมูลทางการเงิน ชีวเคมี และข้อมูลทางพันธุกรรม ข้อมูลดารา ฯลฯหลากหลาย (ข้อมูลในหลายรูปแบบ) ข้อมูลเหล่านี้ไม่มีโครงสร้างถาวร และไม่ค่อยแสดงตัวในการต่อ-fectly สั่งแบบฟอร์มและพร้อมสำหรับการประมวลผล [12] แน่นอน
การแปล กรุณารอสักครู่..

คือข้อมูลขนาดใหญ่อะไรManyika et al, [10 หน้า 1] กำหนดข้อมูลขนาดใหญ่เป็น "ชุดข้อมูลที่มีขนาดเกินความสามารถของเครื่องมือซอฟต์แวร์ฐานข้อมูลทั่วไปในการจับภาพ, จัดเก็บจัดการและวิเคราะห์" ในทำนองเดียวกันเดวิสและแพตเตอร์สัน [1, หน้า 4] พูดว่า "ข้อมูลขนาดใหญ่เป็นข้อมูลที่มีขนาดใหญ่เกินไปที่จะจัดการและวิเคราะห์โดยโปรโตคอลฐานข้อมูลแบบดั้งเดิมเช่น SQL"; และมีความคิดเห็นแบบเดียวกันจะใช้ร่วมกันโดย [11,3,4] ฯลฯ ทั้งสองกลุ่มของผู้เขียนกล่าวถึงก่อนหน้านี้ไปไกลกว่าในด้านขนาดของข้อมูลเท่านั้นเมื่อกำหนดข้อมูลขนาดใหญ่! กรม Dumbill ใน [12, หน้า 3] บ่งบอกอย่างชัดเจนหลายมิติของข้อมูลขนาดใหญ่เมื่อเสริมว่า "ข้อมูลที่มีขนาดใหญ่เกินไปย้ายเร็วเกินไปหรือไม่พอดีระบายสถาปัตยกรรมฐานข้อมูลของคุณ" คำพูดนี้ช่วยให้เราเห็นว่าลักษณะพิเศษควรจะเพิ่มชุดข้อมูลขนาดใหญ่ที่จะได้รับการพิจารณาเป็นข้อมูลขนาดใหญ่หรือข้อมูลขนาดใหญ่เป็นมักจะพบได้ทั่ววรรณกรรม [2]. ตอนนี้ก็จะถือว่าเป็นขนาดที่ไม่ได้เป็นคุณลักษณะเฉพาะของข้อมูลขนาดใหญ่ . ผู้เขียนหลาย [1,12,11,9,13,4] อย่างชัดเจนใช้สามวี (ปริมาณ, วาไรตี้และความเร็ว) ที่จะอธิบายลักษณะข้อมูลขนาดใหญ่ ถ้าสามวีส่วนใหญ่จะพบในวรรณคดีหลายคนเขียน [10,13] และสถาบันเช่น IEEE มุ่งเน้นไปที่ราคาข้อมูลขนาดใหญ่และการมองเห็นความจริง สุดท้ายนี้ "วี" เพื่อแจ้งให้ทราบว่าสำคัญก็คือการมีเครื่องมือที่ดีที่จะคิดออกและวิเคราะห์ข้อมูล 'results.2 ปริมาณ (ข้อมูลในส่วนที่เหลือ) ผลประโยชน์ที่ได้รับจากความสามารถในการประมวลผลข้อมูลจำนวนมากเป็นแหล่งท่องเที่ยวหลักของการวิเคราะห์ข้อมูลขนาดใหญ่ มีมากขึ้นเต้นข้อมูลที่มีรูปแบบที่ดีขึ้น [12] ผลที่ตามมาก็คือว่ามันเป็นเทรนด์สำหรับหลาย บริษัท ในการจัดเก็บจำนวนมากมายของประเภทต่างๆของข้อมูล: ข้อมูลเครือข่ายทางสังคม, ข้อมูลการดูแลสุขภาพ, ข้อมูลทางการเงิน, ชีวเคมีและข้อมูลทางพันธุกรรมข้อมูลดาราศาสตร์ ฯลฯวาไรตี้ (ข้อมูลในหลายรูปแบบ) ข้อมูลเหล่านี้ไม่ได้มีโครงสร้างพื้นฐานและไม่ค่อยนำเสนอตัวเองในรูปแบบที่ได้รับคำสั่ง fectly ละและพร้อมสำหรับการประมวลผล [12] จริง
การแปล กรุณารอสักครู่..

อะไรคือข้อมูลใหญ่manyika et al . [ 10 หน้า 1 ] กำหนดข้อมูลใหญ่เป็นข้อมูลที่มีขนาดเกินความสามารถของเครื่องมือซอฟต์แวร์ฐานข้อมูลทั่วไปเพื่อจับภาพ , จัดเก็บ , จัดการ และวิเคราะห์ " อนึ่ง เดวิส และ แพตหน้า 4 [ 1 ] บอกว่า " ใหญ่ข้อมูล คือ ข้อมูลมีขนาดใหญ่เกินไปที่จะจัดการ และวิเคราะห์โดยโปรแกรมฐานข้อมูลแบบดั้งเดิมเช่น SQL " และมีความเห็นร่วมกัน โดย 11,3,4 [ ] , ฯลฯ ทั้งกลุ่มของผู้เขียนกล่าวถึงก่อนหน้านี้นอกเหนือไปจากด้านเดียวของข้อมูลเมื่อมีการกำหนดขนาดข้อมูลใหญ่ ของ dumbill ใน [ 12 หน้า 3 ] ชัดเจนสื่อมัลติ dimensionality ใหญ่ข้อมูลเมื่อเพิ่มว่า " ข้อมูลที่มีขนาดใหญ่เกินไป รวดเร็วเกินไป หรือ ไม่เหมาะกับ ทบทวน ของสถาปัตยกรรมฐานข้อมูลของคุณ ใบเสนอราคานี้ช่วยให้เราเพื่อดูว่า ลักษณะพิเศษ ควรเพิ่มข้อมูลขนาดใหญ่จะถือว่าเป็นข้อมูลที่ใหญ่ หรือใหญ่ขนาดข้อมูลที่พบบ่อยตลอดวรรณกรรม [ 2 ]ตอนนี้ก็ถือว่า ขนาดไม่ได้เป็นคุณลักษณะเฉพาะของข้อมูลใหญ่ ผู้เขียนหลายคน [ 1,12,11,9,13,4 ] อย่างชัดเจนใช้ 3 V ( ระดับเสียงที่หลากหลายและความเร็ว ) ในลักษณะของข้อมูลใหญ่ ถ้า 3 V เป็นส่วนใหญ่พบในวรรณกรรม ผู้เขียนหลายคน [ 10,13 ] และสถาบันเช่น IEEE มุ่งเน้นข้อมูลค่าใหญ่จริงและการมองเห็น นี้ล่าสุด " วี " จะสังเกตเห็นว่ามันสำคัญ คือให้เครื่องมือที่ดีที่จะหาข้อมูล และการวิเคราะห์ผล 2 .ปริมาณข้อมูลในส่วนที่เหลือ ) ผลประโยชน์ที่ได้รับจากความสามารถในการประมวลผลจำนวนมากของข้อมูลที่เป็นจุดดึงดูดหลักของการวิเคราะห์ข้อมูลใหญ่ มีข้อมูลเพิ่มเติมที่เต้นมีกว่ารุ่น [ 12 ] ผลคือ มันเป็นแนวโน้มสำหรับหลาย บริษัท ที่จะเก็บจำนวนเงินที่มากมายของประเภทต่างๆของข้อมูลที่เครือข่ายทางสังคม , การดูแลสุขภาพ ข้อมูลทางการเงิน และข้อมูลทางชีวเคมี , ดาราศาสตร์ข้อมูล ฯลฯความหลากหลาย ( ข้อมูลหลายรูปแบบ ) ข้อมูลเหล่านี้ไม่ได้มีโครงสร้างถาวรและไม่ค่อยแสดงตัวเองเป็น ต่อ - fectly สั่งแบบฟอร์มและพร้อมสำหรับการประมวลผล [ 12 ] แน่นอน
การแปล กรุณารอสักครู่..
