To sum up handle Big Data implies having an infrastructure linear scalable, able to handle high throughput multi-formatted data, fault tolerant, auto recoverable, with a high degree of parallelism and a distributed data processing [3]. It is important to note that, in this management, integrating data (i.e “access, parse, normalize, standardize, integrate, cleanse,extract, match, classify, mask, and deliver data.” [4, chap. 21])represents 80% of a Big Data project. This aspect is deeply discussed in Section 3.3.
รวมการจัดการข้อมูลเชิงเส้นใหญ่แสดงถึงการมีโครงสร้างพื้นฐานที่ปรับขนาดได้สูง throughput ข้อมูลหลายรูปแบบของใจกว้าง , รถยนต์ใช้กับระดับสูงของขนานและกระจายการประมวลผลข้อมูล [ 3 ] มันเป็นสิ่งสำคัญที่จะทราบว่าในการจัดการนี้ การรวมข้อมูล ( เช่น " การเข้าถึง , แยก , ทำให้ปกติ , มาตรฐาน , บูรณาการ , ทำความสะอาด , สารสกัด , ตรงกับ , แยกประเภท , หน้ากากและส่งมอบข้อมูล . " [ 4 ] CHAP 21 ) หมายถึง 80% ของโครงการข้อมูลใหญ่ ด้านนี้เป็นอย่างที่กล่าวถึงในมาตรา 3 .
การแปล กรุณารอสักครู่..
