There are a number of interesting c

There are a number of interesting conclusions that can be drawn
from the results presented in this paper. First, at the scale of the experiments we conducted, both parallel database systems displayed a
significant performance advantage over Hadoop MR in executing a
variety of data intensive analysis benchmarks. Averaged across all
five tasks at 100 nodes, DBMS-X was 3.2 times faster than MR and
Vertica was 2.3 times faster than DBMS-X. While we cannot verify
this claim, we believe that the systems would have the same relative
performance on 1,000 nodes (the largest Teradata configuration is
less than 100 nodes managing over four petabytes of data). The dual
of these numbers is that a parallel database system that provides the
same response time with far fewer processors will certainly uses far
less energy; the MapReduce model on multi-thousand node clusters
is a brute force solution that wastes vast amounts of energy. While it
is rumored that the Google version of MR is faster than the Hadoop
version, we did not have access to this code and hence could not test
it. We are doubtful again, however, that there would be a substantial
difference in the performance of the two versions as MR is always
forced to start a query with a scan of the entire input file.
This performance advantage that the two database systems share
is the result of a number of technologies developed over the past
25 years, including (1) B-tree indices to speed the execution of
selection operations, (2) novel storage mechanisms (e.g., columnorientation), (3) aggressive compression techniques with ability to
operate directly on compressed data, and (4) sophisticated parallel
algorithms for querying large amounts of relational data. In the case
of a column-store database like Vertica, only those columns that are
needed to execute a query are actually read from disk. Furthermore,
the column-wise storage of data results in better compression factors (approximately a factor of 2.0 for Vertica, versus a factor of 1.8
for DBMS-X and 1.25 for Hadoop); this also further reduces the
amount of disk I/O that is performed to execute a query.
Although we were not surprised by the relative performance advantages provided by the two parallel database systems, we were
impressed by how easy Hadoop was to set up and use in comparison
to the databases. The Vertica installation process was also straightforward but temperamental to certain system parameters. DBMSX, on the other hand, was difficult to configure properly and required repeated assistance from the vendor to obtain a configuration
that performed well. For a mature product such as DBMS-X, the
entire experience was indeed disappointing. Given the upfront cost
advantage that Hadoop has, we now understand why it has quickly
attracted such a large user community.
Extensibility was another area where we found the database systems we tested lacking. Extending a DBMS with user-defined types
and functions is an idea that is now 25 years old [16]. Neither of
the parallel systems we tested did a good job on the UDF aggregation tasks, forcing us to find workarounds when we encountered
limitations (e.g., Vertica) and bugs (e.g., DBMS-X).
While all DB systems are tolerant of a wide variety of software
failures, there is no question that MR does a superior job of minimizing the amount of work that is lost when a hardware failure occurs. This capability, however, comes with a potentially large per-
formance penalty, due to the cost of materializing the intermediate
files between the map and reduce phases. Left unanswered is how
significant this performance penalty is. Unfortunately, to investigate this question properly requires implementing both the materialization and no-materialization strategies in a common framework,
which is an effort beyond the scope of this paper. Despite a clear
advantage in this domain, it is not completely clear how significant
a factor Hadoop’s ability to tolerate failures during execution really
is in practice. In addition, if a MR system needs 1,000 nodes to
match the performance of a 100 node parallel database system, it is
ten times more likely that a node will fail while a query is executing. That said, better tolerance to failures is a capability that any
database user would appreciate.
Many people find SQL difficult to use initially. This is partially
due to having to think differently when solving a problem and that
SQL has evolved into a complex language that is quite different than
the original design by Don Chamberlin in the 1970s. Though most
languages become more complex over time, SQL is particularly bad
as many of its features were designed by competing database companies who each sought to include their own proprietary extensions.
Despite its faults, SQL is still a powerful tool. Consider the
following query to generate a list of Employees ordered by their
salaries and the corresponding rank of each salary (i.e., the highest
paid employee gets a rank of one):

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

มีจำนวนของบทสรุปที่น่าสนใจที่สามารถดึงจากผลที่แสดงในเอกสารนี้ ครั้งแรก ในระดับของการทดลองที่เราดำเนินการ ทั้งแบบขนานแสดงระบบฐานข้อมูลการประโยชน์ผลกระทบต่อประสิทธิภาพมากกว่าอย่างไร Hadoop นายในการดำเนินการหลากหลายข้อมูลเกณฑ์มาตรฐานวิเคราะห์เร่งรัด เฉลี่ยทั้งหมดงานห้าที่โหน 100, DBMS X ได้ 3.2 ครั้งเร็วกว่านาย และVertica ได้เวลา 2.3 เร็วกว่า DBMS X ในขณะที่เราไม่สามารถตรวจสอบข้อเรียกร้องนี้ เราเชื่อว่า ระบบต้องสัมพันธ์กันประสิทธิภาพการทำงานบนโหน 1000 (การกำหนดค่า Teradata ที่ใหญ่ที่สุดคือน้อยกว่า 100 โหน petabytes 4 ข้อมูลการจัดการ) แบบสองตัวเลขเหล่านี้เป็นที่ระบบฐานข้อมูลแบบขนานที่มีการแน่นอนใช้กับตัวประมวลผลมากน้อยกว่ากันตอบจะไกลพลังงานน้อยกว่า แบบ MapReduce บนคลัสเตอร์โหนหลายพันเป็นโซลูชั่นแรงเดรัจฉานที่เปลืองพลังงานไพศาล ในขณะนั้นมีข่าวลือว่า รุ่น MR Google เร็วกว่าอย่างไร Hadoopรุ่น เราไม่มีการเข้ารหัสนี้ และดังนั้นจึง ไม่ได้ทดสอบมัน เราเป็นหนี้สงสัยสูญอีก อย่างไรก็ตาม จะมีความสำคัญความแตกต่างในประสิทธิภาพการทำงานของสองรุ่นเป็นนายเสมอบังคับให้เริ่มต้นแบบสอบถามกับการสแกนของแฟ้มป้อนข้อมูลทั้งหมดประโยชน์จากประสิทธิภาพนี้ที่ระบบฐานข้อมูลที่สองเป็นผลของเทคโนโลยีที่ได้รับการพัฒนาที่ผ่านมา25 ปี รวมถึง (1) บี-ทรีดัชนีเพื่อความเร็วในการดำเนินการเลือกการดำเนินการ, (2) เก็บนวนิยายกลไก (เช่น columnorientation), (3) เทคนิคบีบอัดก้าวร้าว มีความสามารถในการดำเนินงานโดยตรงในการบีบอัดข้อมูล และขนาน (4) มีความซับซ้อนอัลกอริทึมสำหรับการสอบถามข้อมูลที่เกี่ยวข้องจำนวนมาก ในกรณีคอลัมน์เก็บฐานข้อมูลเช่น Vertica เฉพาะคอลัมน์ที่ต้องดำเนินการแบบสอบถามจะมีอ่านจากดิสก์ นอกจากนี้ผลการจัดเก็บข้อมูล column-wise ข้อมูลปัจจัยการบีบอัดดีกว่า (ประมาณตัวของ 2.0 สำหรับ Vertica เมื่อเทียบกับตัวคูณ 1.8การ DBMS X 1.25 สำหรับอย่างไร Hadoop); นี้ยังเพิ่มเติมลดการจำนวนดิสก์ I/O ดำเนินการดำเนินการแบบสอบถามถึงแม้ว่าเราไม่ได้ประหลาดใจ โดยประโยชน์ประสิทธิภาพสัมพัทธ์โดยระบบฐานข้อมูลแบบขนาน 2 แนะนำประทับใจ โดยวิธีอย่างไร Hadoop กลายเป็นการ ตั้งค่า และใช้ในการเปรียบเทียบกับฐานข้อมูล กระบวนการติดตั้ง Vertica ยังไม่ตรงไปตรงมาแต่ temperamental บางพารามิเตอร์ระบบ DBMSX เป็นเรื่องที่ยากในการกำหนดค่าอย่างถูกต้อง และต้องการความช่วยเหลือซ้ำจากผู้ขายได้รับการกำหนดค่าบนมืออื่น ๆที่ทำดี สำหรับผลิตภัณฑ์เช่น DBMS-X ผู้ใหญ่ประสบการณ์ทั้งหมดแน่นอนย่อมได้ กำหนดต้นทุนตะวันประโยชน์ที่ได้อย่างไร Hadoop เราตอนนี้เข้าใจทำไมมันได้อย่างรวดเร็วดึงดูดเช่นชุมชนผู้ใช้ขนาดใหญ่เพิ่มความสามารถได้พื้นที่อื่นที่เราพบฐานข้อมูลระบบเราทดสอบขาด ขยาย DBMS ชนิดผู้ใช้กำหนดและฟังก์ชันเป็นความคิดที่ตอนนี้อายุ 25 ปี [16] ไม่ระบบคู่ขนานที่เราทดสอบได้งานที่ดีงาน UDF รวม บังคับให้เราหาวิธีการแก้ปัญหาเมื่อเราพบข้อจำกัด (เช่น Vertica) และข้อผิดพลาด (เช่น DBMS-X)ในขณะที่ระบบฐานข้อมูลทั้งหมดจะทนกับความหลากหลายของซอฟต์แวร์ความล้มเหลว มีคำถามไม่ว่า นายงานที่เหนือกว่าของการลดจำนวนของงานที่สูญเสียไปเมื่อเกิดความล้มเหลวของฮาร์ดแวร์ ความสามารถนี้ อย่างไร ตามมา ด้วยอาจขนาดใหญ่ต่อ-โทษ formance เนื่องจากต้นทุนของ materializing ในระดับปานกลางแฟ้มระหว่างแผนที่ และลดขั้นตอนการ ด้านซ้ายยังไม่ได้ตอบเป็นอย่างไรสำคัญโทษนี้ประสิทธิภาพการทำงานคือ อับ การตรวจสอบคำถามนี้ได้อย่างถูกต้องต้องใช้ materialization และไม่ materialization กลยุทธ์ในกรอบงานทั่วไปซึ่งเป็นความพยายามในขอบเขตของเอกสารนี้ แม้ มีการล้างประโยชน์ในโดเมนนี้ มันไม่มีไม่สำคัญอย่างไรเป็นอย่างไร Hadoop ปัจจัยความสามารถในการทนต่อความล้มเหลวในระหว่างการดำเนินการจริง ๆในทางปฏิบัติได้ นอกจากนี้ ถ้าระบบนายต้องโหน 1000เปรียบเทียบประสิทธิภาพของระบบฐานข้อมูลแบบขนานโหน 100สิบครั้งมีแนวโน้มที่จะการล้มเหลวโหนในขณะที่แบบสอบถามจะดำเนินการ ที่กล่าวว่า ยอมรับดีกว่าผิดพลาดเป็นความสามารถในการให้ขอบคุณผู้ใช้ฐานข้อมูลหลายคนพบ SQL ที่ยากที่จะใช้เริ่มต้น นี้เป็นบางส่วนเนื่องจากต้องคิดแตกต่างกันเมื่อการแก้ปัญหาและมีพัฒนา SQL เป็นภาษาที่ค่อนข้างแตกต่างซับซ้อนการออกแบบเดิม โดย Chamberlin ดอนในทศวรรษ 1970 แม้ว่าส่วนใหญ่ภาษาที่ซับซ้อนมากขึ้นเป็นช่วงเวลา SQL ไม่ดีโดยเฉพาะหลายคุณสมบัติถูกออกแบบแข่งขัน ฐานข้อมูลบริษัทที่แต่ละจะมีนามสกุลเป็นกรรมสิทธิ์ของตนเองแม้ มีความบกพร่อง SQL ยังคงเป็นเครื่องมือที่มีประสิทธิภาพ พิจารณาสอบถามต่อไปนี้เพื่อสร้างรายการของพนักงานตามความเงินเดือนและตำแหน่งที่สอดคล้องกันของแต่ละเดือน (เช่น สูงสุดพนักงานได้รับค่าจ้างได้รับอันดับหนึ่ง):

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

มีจำนวนของข้อสรุปที่น่าสนใจที่สามารถดึงออกมาเป็นผลจากที่นำเสนอในบทความนี้ ครั้งแรกในระดับของการทดลองที่เราดำเนินการทั้งระบบฐานข้อมูลแบบขนานแสดงประโยชน์การปฏิบัติงานที่สำคัญกว่า Hadoop นายในการดำเนินหลากหลายของมาตรฐานการวิเคราะห์ข้อมูลอย่างเข้มข้น เฉลี่ยในทุกงานที่ห้าที่ 100 โหนด DBMS-X 3.2 ครั้งเร็วกว่านายและ Vertica เป็น 2.3 เท่าเร็วกว่า DBMS-X ในขณะที่เราไม่สามารถตรวจสอบการเรียกร้องนี้เราเชื่อว่าระบบจะมีญาติเดียวกันประสิทธิภาพการทำงานบน1,000 โหนด (Teradata การกำหนดค่าที่ใหญ่ที่สุดคือน้อยกว่า100 โหนดการจัดการมากกว่าสี่เพตาไบต์ของข้อมูล) คู่ของตัวเลขเหล่านี้ก็คือระบบฐานข้อมูลแบบขนานที่ให้การตอบสนองเวลาเดียวกันกับการประมวลผลน้อยลงแน่นอนจะใช้ไกลพลังงานน้อยกว่า รูปแบบ MapReduce ในหลายพันกลุ่มโหนดเป็นโซลูชั่นที่กำลังดุร้ายที่เสียจำนวนมากมายของพลังงาน ในขณะที่มันเป็นข่าวลือว่ารุ่นของ Google MR จะเร็วกว่า Hadoop รุ่นเราไม่ได้มีการเข้าถึงรหัสนี้และด้วยเหตุนี้ไม่สามารถทดสอบมัน เรามีหนี้สงสัยจะสูญอีกครั้ง แต่ที่จะมีมากความแตกต่างในการทำงานของทั้งสองรุ่นเป็นนายมักจะบังคับให้เริ่มต้นแบบสอบถามด้วยการสแกนแฟ้มใส่ทั้งหมด. ประโยชน์ประสิทธิภาพการทำงานนี้ว่าหุ้นทั้งสองระบบฐานข้อมูลเป็นผลมาจากจำนวนของเทคโนโลยีที่พัฒนาขึ้นในช่วงที่ผ่านมา25 ปีรวมทั้ง (1) ดัชนี B ต้นไม้เพื่อเพิ่มความเร็วในการดำเนินการของการดำเนินงานของการเลือก(2) กลไกการจัดเก็บนวนิยาย (เช่น columnorientation), (3) เทคนิคการบีบอัดในเชิงรุกที่มีความสามารถในการดำเนินการโดยตรงในการบีบอัดข้อมูลและ (4) ขนานที่มีความซับซ้อนขั้นตอนวิธีการสำหรับการสอบถามจำนวนมากของข้อมูลเชิงสัมพันธ์ ในกรณีของฐานข้อมูลคอลัมน์เก็บเช่น Vertica เพียงคอลัมน์ผู้ที่มีความจำเป็นในการดำเนินการสอบถามจะอ่านจริงจากดิสก์ นอกจากนี้การจัดเก็บคอลัมน์ที่ชาญฉลาดของผลข้อมูลในการบีบอัดที่ดีกว่าปัจจัย (ประมาณปัจจัยจาก 2.0 สำหรับ Vertica เมื่อเทียบกับปัจจัย 1.8 สำหรับ DBMS-X และ 1.25 สำหรับ Hadoop); นี้ต่อไปจะช่วยลดปริมาณของดิสก์ I / O ที่จะดำเนินการในการดำเนินการแบบสอบถาม. แม้ว่าเราไม่ได้ประหลาดใจโดยข้อดีประสิทธิภาพญาติให้โดยทั้งสองระบบฐานข้อมูลแบบขนานที่เราได้สร้างความประทับใจด้วยวิธีการที่ง่าย Hadoop คือการตั้งค่าและการใช้งาน ในการเปรียบเทียบเพื่อให้ฐานข้อมูล กระบวนการติดตั้ง Vertica ก็ยังตรงไปตรงมา แต่เจ้าอารมณ์พารามิเตอร์ระบบบางอย่าง DBMSX ในมืออื่น ๆ ที่เป็นเรื่องยากที่จะกำหนดค่าอย่างถูกต้องและต้องทำซ้ำความช่วยเหลือจากผู้ขายที่จะได้รับการกำหนดค่าที่ดี สำหรับผลิตภัณฑ์ที่เป็นผู้ใหญ่เช่น DBMS-X ที่ประสบการณ์ทั้งหมดเป็นจริงที่น่าผิดหวัง ได้รับค่าใช้จ่ายล่วงหน้าเปรียบที่ Hadoop มีตอนนี้เราเข้าใจว่าทำไมมันได้อย่างรวดเร็วดึงดูดเช่นชุมชนผู้ใช้ขนาดใหญ่. ขยายเป็นพื้นที่อื่นที่เราพบว่าระบบฐานข้อมูลเราทดสอบขาด ขยาย DBMS ประเภทที่ผู้ใช้กำหนดและฟังก์ชั่นเป็นความคิดที่ตอนนี้อายุ25 ปี [16] ทั้งระบบขนานเราทดสอบได้งานที่ดีใน UDF งานรวมบังคับให้เราที่จะหาวิธีการแก้ปัญหาเมื่อเราพบข้อจำกัด (เช่น Vertica) และข้อบกพร่อง (เช่น DBMS-X). ในขณะที่ทุกระบบฐานข้อมูลมีความอดทนของกว้าง ความหลากหลายของซอฟต์แวร์ความล้มเหลวมีคำถามว่านายไม่ได้งานที่ดีกว่าในการลดปริมาณของงานที่จะหายไปเมื่อมีการล้มเหลวของฮาร์ดแวร์เกิดขึ้น ความสามารถนี้ แต่มาพร้อมกับขนาดใหญ่ที่อาจเกิดขึ้นละโทษformance เนื่องจากค่าใช้จ่ายของรายอื่นกลางไฟล์ระหว่างแผนที่และลดขั้นตอน ยังไม่ได้ตอบซ้ายเป็นวิธีการอย่างมีนัยสำคัญลงโทษประสิทธิภาพนี้ แต่น่าเสียดายที่ในการตรวจสอบคำถามนี้อย่างถูกต้องต้องดำเนินการทั้งเป็นตัวเป็นตนและกลยุทธ์ไม่มีเป็นตัวเป็นตนในกรอบร่วมกันซึ่งเป็นความพยายามที่เกินขอบเขตของบทความนี้ที่ แม้จะมีความชัดเจนได้เปรียบในโดเมนนี้มันไม่สมบูรณ์ชัดเจนว่ามีนัยสำคัญความสามารถในปัจจัยHadoop ที่จะทนต่อความล้มเหลวในระหว่างการดำเนินจริงๆคือในทางปฏิบัติ นอกจากนี้หากระบบ MR ต้องการ 1,000 โหนดเพื่อให้ตรงกับประสิทธิภาพการทำงานของ100 โหนดระบบฐานข้อมูลแบบขนานนั้นมันเป็นสิบครั้งมีแนวโน้มว่าโหนดจะล้มเหลวในขณะที่การดำเนินการแบบสอบถาม ที่กล่าวว่าความอดทนที่ดีกว่าเพื่อความล้มเหลวคือความสามารถใด ๆ ที่ผู้ใช้ฐานข้อมูลจะขอบคุณ. หลายคนพบว่าการใช้ SQL ยากในตอนแรก นี่คือบางส่วนเนื่องจากมีที่จะคิดแตกต่างกันเมื่อการแก้ปัญหาและที่SQL มีการพัฒนาเป็นภาษาที่ซับซ้อนที่ค่อนข้างแตกต่างจากการออกแบบเดิมโดยดอนแชมเบอร์ในปี1970 แต่ส่วนใหญ่เป็นภาษาที่ซับซ้อนมากขึ้นเมื่อเวลาผ่านไป SQL ไม่ดีโดยเฉพาะอย่างยิ่งเป็นจำนวนมากของคุณลักษณะของมันได้รับการออกแบบโดยการแข่งขันบริษัท ฐานข้อมูลแต่ละคนพยายามที่จะรวมส่วนขยายที่เป็นกรรมสิทธิ์ของตัวเอง. แม้จะมีความผิดพลาดของ SQL ยังคงเป็นเครื่องมือที่มีประสิทธิภาพ พิจารณาแบบสอบถามต่อไปนี้เพื่อสร้างรายการได้รับคำสั่งจากพนักงานของพวกเขาเงินเดือนและตำแหน่งที่สอดคล้องกันของแต่ละเงินเดือน(เช่นที่สูงที่สุดของพนักงานจ่ายเงินที่ได้รับการจัดอันดับของหนึ่ง):

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

มีข้อสรุปที่น่าสนใจที่สามารถดึง
จากผลที่นำเสนอในบทความนี้ ครั้งแรกในระดับของการทดลองเราดำเนินการทั้งขนานระบบฐานข้อมูลแสดง
สําคัญประสิทธิภาพเหนือ Hadoop นายในดำเนินการความหลากหลายของข้อมูลการวิเคราะห์
เข้มข้นมาตรฐาน . เฉลี่ยในทั้งหมด
5 งานที่ 100 โหนด , dbms-x เป็น 3.2 เท่าเร็วกว่าคุณและ
ฐานเป็น 2.3 เท่าเร็วกว่า dbms-x. ในขณะที่เราไม่สามารถตรวจสอบ
อ้างนี้ เราเชื่อว่า ระบบจะมีประสิทธิภาพสัมพัทธ์
เดียวกัน 1 , 000 โหนด ( ที่ใหญ่ที่สุดของโน้ตบุ๊กปรับแต่ง
น้อยกว่า 100 โหนดการจัดการกว่าสี่ petabytes ข้อมูล ) คู่
ของตัวเลขเหล่านี้มีขนานระบบฐานข้อมูลที่ให้
เวลาเดียวกันกับโปรเซสเซอร์น้อยลงมาก จะใช้พลังงานน้อยกว่าไกล
; mapreduce รูปแบบหลายพันโหนดคลัสเตอร์
เป็นใช้กำลังแก้ปัญหาของเสียจํานวนมากมายของพลังงาน ในขณะที่มีข่าวลือว่า Google
รุ่นคุณจะเร็วกว่า Hadoop
รุ่น เราไม่ได้มีการเข้าถึงรหัสนี้และดังนั้นจึงไม่สามารถทดสอบ
. เราสงสัยอีกครั้ง อย่างไรก็ตามจะมีความแตกต่างอย่างมาก
ในประสิทธิภาพของทั้งสองรุ่นเป็นนายเสมอ
บังคับให้เริ่มค้นหาด้วยการสแกนของไฟล์ทั้งหมด .
แสดงประโยชน์ที่ 2 ใช้ระบบฐานข้อมูล
เป็นผลของเทคโนโลยีที่พัฒนาตลอด
25 ปีรวมทั้ง ( 1 ) ต้นไม้ดัชนีความเร็วในการ
งานคัดเลือก( 2 ) กลไกกระเป๋าใหม่ ( เช่น columnorientation ) , ( 3 ) เทคนิคการบีบอัดที่ก้าวร้าวกับความสามารถ

ใช้งานได้โดยตรงบนข้อมูลที่ถูกบีบอัด และ ( 4 ) ขั้นตอนวิธีแบบขนาน
ซับซ้อนเพื่อสอบถามจำนวนมากของข้อมูลเชิงสัมพันธ์ ในกรณี
ของคอลัมน์เก็บฐานข้อมูล เช่น ฐานเสา เฉพาะผู้ที่
ต้องการรันการสืบค้นจริงอ่านจากดิสก์ นอกจากนี้
คอลัมน์ฉลาดเก็บข้อมูลในการบีบอัดที่ดีกว่าปัจจัย ( ประมาณ 2.0 สำหรับฐานปัจจัย และปัจจัยของ 1.8
สำหรับ dbms-x และ 1.25 สำหรับ Hadoop ) ; นี้ยังเพิ่มเติม ลดปริมาณของดิสก์ I / O
ที่ดําเนินการรันการสืบค้น .
ถึงแม้ว่าเราจะไม่ได้ประหลาดใจโดยเทียบประสิทธิภาพ ข้อดีโดยสองขนานระบบฐานข้อมูลเรา
ประทับใจว่า Hadoop ที่ง่าย คือ การตั้งค่า และใช้ในการเปรียบเทียบ
ไปยังฐานข้อมูล ขั้นตอนการติดตั้งที่ฐานก็ตรงไปตรงมา แต่เจ้าอารมณ์กับพารามิเตอร์ของระบบบางอย่าง dbmsx บนมืออื่น ๆที่เป็นเรื่องยากที่จะปรับแต่งอย่างถูกต้อง และต้องย้ำช่วยเหลือจากผู้ขายเพื่อให้ได้ค่า
ที่ทำได้ดี สำหรับผู้ใหญ่ ผลิตภัณฑ์เช่น dbms-x
,ประสบการณ์ทั้งหมดที่เป็นจริงที่น่าผิดหวัง ได้รับประโยชน์จากค่าใช้จ่ายล่วงหน้า
Hadoop ได้ เราเข้าใจแล้วว่าทำไมมันเร็ว
ดึงดูดเช่นผู้ใช้ขนาดใหญ่ของชุมชน เป็นอีกพื้นที่ที่เรา
ขยายพบฐานข้อมูลระบบที่เราทดสอบ ขาด การขยายหรือกับผู้ใช้กำหนดประเภท
และฟังก์ชันเป็นไอเดียที่ตอนนี้อายุ 25 ปี [ 16 ] ทั้ง
คือระบบที่เราทดสอบได้งานที่ดีบน UDF ของงานบังคับให้เราหาวิธีการแก้ปัญหาเมื่อเราพบ
ข้อจำกัด ( เช่นฐาน ) และแมลง ( เช่น dbms-x ) .
ในขณะที่ระบบ DB จะใจกว้างของหลากหลายของซอฟต์แวร์
ความล้มเหลว มีคำถามว่าคุณไม่ได้งานที่เหนือกว่า ลดปริมาณงานที่สูญเสียไปเมื่อฮาร์ดแวร์ล้มเหลวที่เกิดขึ้น ความสามารถนี้อย่างไรก็ตาม มาพร้อมกับมากมีแนวโน้มต่อ -
formance โทษ เนื่องจากต้นทุนของ materializing ไฟล์กลาง
ระหว่างแผนที่และลดระยะ แล้วยังไม่เป็นผลการปฏิบัติงานนี้โทษเป็นอย่างไร
อย่างมีนัยสำคัญ แต่น่าเสียดายที่การตรวจสอบคำถามนี้อย่างถูกต้อง ต้องใช้ทั้งเด่นและไม่มีกลยุทธ์เด่นในกรอบทั่วไป
ซึ่งมีความพยายามอยู่นอกเหนือขอบเขตของบทความนี้ แม้จะมีข้อได้เปรียบที่ชัดเจน
ในโดเมนนี้ มันไม่ได้ชัดเจนว่าเป็นปัจจัยสําคัญ
Hadoop สามารถทนต่อความล้มเหลวในการดำเนินการจริงๆ
อยู่ในการปฏิบัติ นอกจากนี้ถ้าคุณต้องการโหนดระบบ 1000

ตรงกับประสิทธิภาพของ 100 โนดขนานระบบฐานข้อมูล คือ
สิบครั้งโอกาสที่โหนดจะล้มเหลวในขณะที่การดำเนิน . ที่บอกว่าความอดทนกว่าความล้มเหลวของความสามารถที่ผู้ใช้งานฐานข้อมูลใด ๆที่จะชื่นชม
.
หลายคนพบ SQL ใช้ยากในตอนแรก นี่คือบางส่วน
เนื่องจากต้องคิดต่างออกไป เมื่อการแก้ปัญหาและ
SQL ได้กลายมาเป็นภาษาที่มีความซับซ้อนค่อนข้างแตกต่างกว่า
การออกแบบเดิมโดยยังคะในทศวรรษ แม้ว่าภาษาส่วนใหญ่
กลายเป็นความซับซ้อนมากขึ้นเมื่อเวลาผ่านไป , SQL โดยเฉพาะอย่างยิ่งเลว
เป็นจำนวนมากคุณสมบัติที่ออกแบบโดย บริษัท ที่แข่งขันกัน ฐานข้อมูลแต่ละแสวงหาเพื่อรวมส่วนขยายของตัวเองที่เป็นกรรมสิทธิ์ .
แม้จะมีข้อบกพร่อง , SQL เป็นเครื่องมือที่มีประสิทธิภาพ พิจารณา
ต่อไปนี้แบบสอบถามเพื่อสร้างรายชื่อของพนักงานของพวกเขา
สั่งโดยเงินเดือนและตำแหน่งที่สอดคล้องกันของแต่ละเดือน เช่น พนักงานได้รับการจ่ายสูงสุด
อันดับหนึ่ง ) :

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.