• Storage and Management Capability
– Cloudera Manager8: an end-to-end management application for Cloudera’s Distribution of Apache Hadoop.
– RCFile (Record Columnar File) [24], a data placement structure for structured data. Here, tables are vertically and
horizontally partitioned, lazily compressed. It is an efficient storage structure which allows fast data loading
and query processing.
• Database Capability:
– Oracle NoSQL a high performance pair
database convenient for non-predictive and dynamic
data thus for Big Data;
– Apache HBase a distributed, column-oriented database
management system, modeled on Google’s Big Table
[10], that runs on top of HDFS [11,12,15];
– Apache Cassandra a database which combines the
convenience of column-indexes and the performance of
log-structured updates;
– Apache Hive can be seen as a distributed data warehouse [15]. It enables easy data ETL from HDFS or
other data storage like HBase [11,15] or other traditional
DBMS [25]. It has the advantage of using a SQL-like syntax, the Hive QL;
– Apache ZooKeeper is “an open-source, in-memory, distributed NoSQL database” [3, page 69] that is used for
coordination and naming services for managing distributed applications [3,12,11,15].
•จัดเก็บข้อมูลและความสามารถในการจัดการ– Cloudera Manager8: โปรแกรมประยุกต์การจัดการสิ้นสุดเพื่อสิ้นสุดสำหรับการกระจายของ Cloudera ของ Apache Hadoop-RCFile (บันทึกคอลัมน์แฟ้ม) [24], โครงสร้างการจัดวางข้อมูลโครงสร้างข้อมูล ที่นี่ ตารางเป็นแนวตั้ง และแบ่งตามแนวนอน มูมบีบอัด เป็นโครงสร้างที่มีเก็บมีประสิทธิภาพซึ่งช่วยให้การโหลดข้อมูลที่รวดเร็วและการประมวลผลแบบสอบถาม•ความสามารถฐานข้อมูล:– Oracle NoSQL ประสิทธิภาพสูง คู่ฐานข้อมูลที่สะดวกไม่ใช่ทำนาย และแบบไดนามิกข้อมูลดังนั้นข้อมูล– HBase Apache กระจาย แนวคอลัมน์ฐานข้อมูลระบบการจัดการ จำลองบนโต๊ะขนาดใหญ่ของ Google[10], ที่ทำงานบน HDFS [11,12,15];– นี่ Apache ฐานข้อมูลซึ่งรวมการคอลัมน์ดัชนีและประสิทธิภาพของการปรับปรุงโครงสร้างบันทึก– สามารถมองเห็นกลุ่ม Apache เป็นคลังข้อมูลกระจาย [15] ช่วยให้ข้อมูลง่าย ๆ ETL จาก HDFS หรือการจัดเก็บข้อมูลอื่น ๆ เช่น HBase [11,15] หรืออื่น ๆ แบบดั้งเดิมDBMS [25] มีประโยชน์ของการใช้ไวยากรณ์ SQL เช่น ชา QL ไฮฟ์– Apache ZooKeeper เป็น "การเปิดแหล่ง ในหน่วยความจำ ฐานข้อมูล NoSQL กระจาย" [3 หน้า 69] ที่ใช้สำหรับประสานงานและบริการตั้งชื่อสำหรับการจัดการโปรแกรมประยุกต์การกระจาย [3,12,11,15]
การแปล กรุณารอสักครู่..

•การจัดเก็บและการจัดการความสามารถ
- Cloudera Manager8: การประยุกต์ใช้การจัดการแบบ end-to-end สำหรับการกระจาย Cloudera ของ Apache Hadoop.
- RCFile (Record Columnar File) [24], โครงสร้างการจัดวางข้อมูลสำหรับข้อมูลที่มีโครงสร้าง ที่นี่จะมีตารางในแนวตั้งและ
แนวนอนแบ่งพาร์ติชันที่ถูกบีบอัดอย่างเฉื่อยชา มันเป็นโครงสร้างการจัดเก็บที่มีประสิทธิภาพซึ่งจะช่วยให้การโหลดข้อมูลได้อย่างรวดเร็ว
และการประมวลผลแบบสอบถาม.
•ความสามารถในฐานข้อมูล:
- Oracle NoSQL ที่มีประสิทธิภาพสูงคู่
ฐานข้อมูลที่สะดวกสำหรับการที่ไม่ได้คาดการณ์และแบบไดนามิก
ข้อมูลดังนั้นสำหรับข้อมูลขนาดใหญ่;
- Apache HBase กระจายฐานข้อมูลคอลัมน์ที่มุ่งเน้น
ระบบการบริหารจัดการในรูปแบบตารางใหญ่ของ Google
[10], ที่ทำงานอยู่ด้านบนของ HDFS [11,12,15] ;
- Apache Cassandra ฐานข้อมูลซึ่งรวม
ความสะดวกสบายของคอลัมน์ดัชนีและประสิทธิภาพการทำงานของ
การปรับปรุงเข้าสู่ระบบโครงสร้าง
- Apache Hive สามารถมองเห็นเป็นคลังข้อมูลกระจาย [15] ซึ่งจะช่วยให้ ETL ข้อมูลได้ง่ายจาก HDFS หรือ
การจัดเก็บข้อมูลอื่น ๆ เช่น HBase [11,15] หรือแบบดั้งเดิมอื่น ๆ
DBMS [25] มันมีความได้เปรียบของการใช้แบบ SQL ไวยากรณ์รัง QL นั้น
- Apache ZooKeeper คือ "โอเพนซอร์สในหน่วยความจำกระจาย NoSQL ฐานข้อมูล" [3, หน้า 69] ที่ใช้สำหรับการ
ประสานงานและการตั้งชื่อบริการสำหรับการจัดการ โปรแกรมการกระจาย [3,12,11,15]
การแปล กรุณารอสักครู่..

- จัดเก็บและการจัดการความสามารถ- cloudera manager8 : end การจัดการโปรแกรมประยุกต์สำหรับการกระจายของ cloudera Apache Hadoop .- rcfile ( บันทึกโดยแฟ้ม ) [ 24 ] เป็นข้อมูลแบบโครงสร้างสำหรับข้อมูลที่มีโครงสร้าง ที่นี่เป็นแนวตั้ง และ ตารางแนวนอนแบ่งอัดซม . มันเป็นโครงสร้างที่มีประสิทธิภาพซึ่งจะช่วยให้ข้อมูลที่เก็บโหลดเร็วและประมวลผลแบบสอบถาม- ความสามารถในฐานข้อมูล :สำหรับ Oracle nosql ประสิทธิภาพสูงคู่ค่า > < คีย์ฐานข้อมูลเพื่อสะดวกไม่พยากรณ์ และไดนามิกข้อมูล ดังนั้น ข้อมูลใหญ่และ Apache hbase กระจายเชิงฐานข้อมูล คอลัมน์ระบบการจัดการแบบบนโต๊ะใหญ่ของ Google[ 10 ] ที่วิ่งอยู่ด้านบนของ hdfs [ 11,12,15 ] ;และ Apache Cassandra ฐานข้อมูลซึ่งรวมความสะดวกสบายของดัชนีคอลัมน์และประสิทธิภาพของเข้าสู่ระบบโครงสร้างการปรับปรุง ;และ Apache รังสามารถเห็นได้เป็นการกระจายข้อมูลคลังสินค้า [ 15 ] มันช่วยให้เพิ่มข้อมูลได้ง่ายจาก hdfs หรืออื่น ๆที่เก็บข้อมูลเหมือน hbase [ 11,15 ] หรืออื่น ๆแบบดั้งเดิมระบบจัดการฐานข้อมูล [ 25 ] มีข้อดีของการใช้ไวยากรณ์ SQL เช่น รังเข้าร่วม ;และ Apache Zookeeper " โอเพ่นซอร์สในหน่วยความจำแบบกระจาย nosql ฐานข้อมูล " [ 3 , หน้า 69 ] ที่ใช้สำหรับการประสานงานและการตั้งชื่อบริการการจัดการกระจายการใช้งาน [ 3,12,11,15 ]
การแปล กรุณารอสักครู่..
