partly due to the increased automat

partly due to the increased automation with which data can be produced
(more business processes are becoming digitized), the proliferation
of sensors and data-producing devices, Web-scale interactions
with customers, and government compliance demands along
with strategic corporate initiatives requiring more historical data
to be kept online for analysis. It is no longer uncommon to hear
of companies claiming to load more than a terabyte of structured
data per day into their analytical database system and claiming data
warehouses of size more than a petabyte [19].
Given the exploding data problem, all but three of the above
mentioned analytical database start-ups deploy their DBMS on a
shared-nothing architecture (a collection of independent, possibly
virtual, machines, each with local disk and local main memory,
connected together on a high-speed network). This architecture
is widely believed to scale the best [17], especially if one takes
hardware cost into account. Furthermore, data analysis workloads
tend to consist of many large scan operations, multidimensional aggregations,
and star schema joins, all of which are fairly easy to
parallelize across nodes in a shared-nothing network. Analytical
DBMS vendor leader, Teradata, uses a shared-nothing architecture.
Oracle and Microsoft have recently announced shared-nothing analytical
DBMS products in their Exadata1 and Madison projects,
respectively. For the purposes of this paper, we will call analytical
DBMS systems that deploy on a shared-nothing architecture parallel
databases2.
Parallel databases have been proven to scale really well into the
tens of nodes (near linear scalability is not uncommon). However,
there are very few known parallel databases deployments consisting
of more than one hundred nodes, and to the best of our knowledge,
there exists no published deployment of a parallel database with
nodes numbering into the thousands. There are a variety of reasons
why parallel databases generally do not scale well into the hundreds
of nodes. First, failures become increasingly common as one adds
more nodes to a system, yet parallel databases tend to be designed
with the assumption that failures are a rare event. Second, parallel
databases generally assume a homogeneous array of machines, yet
it is nearly impossible to achieve pure homogeneity at scale. Third,
until recently, there have only been a handful of applications that required
deployment on more than a few dozen nodes for reasonable
performance, so parallel databases have not been tested at larger
scales, and unforeseen engineering hurdles await.
As the data that needs to be analyzed continues to grow, the number
of applications that require more than one hundred nodes is beginning
to multiply. Some argue that MapReduce-based systems

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ส่วนหนึ่งเนื่องจากการทำงานอัตโนมัติที่เพิ่มขึ้นซึ่งสามารถผลิตข้อมูล(กระบวนการทางธุรกิจมากขึ้นจะกลายเป็นรูปดิจิทัล), ขยายเซนเซอร์ และอุปกรณ์ผลิตข้อมูล โต้ตอบมาตราส่วนเว็บกับลูกค้า และรัฐบาลต้องปฏิบัติตามมีทธิ์ของบริษัทต้องการข้อมูลเพิ่มเติมประวัติศาสตร์จะเก็บไว้ออนไลน์สำหรับการวิเคราะห์ ไม่ใช่ฟังของบริษัทที่ว่า โหลด มากกว่าเทราไบต์ของโครงสร้างข้อมูลสำหรับแต่ละวันลงในระบบฐานข้อมูลวิเคราะห์ของพวกเขาและการอ้างข้อมูลคลังสินค้าขนาดมากกว่า [19] เพตะไบต์ให้ระเบิดข้อมูลปัญหา แต่ทั้งสามข้างต้นตอัพฐานข้อมูลการวิเคราะห์ดังกล่าวใช้ของ DBMS ในการสถาปัตยกรรมมีอะไรใช้ร่วมกัน (เป็นชุดของอิสระ อาจจะเครื่องเสมือน แต่ละดิสก์ภายในเครื่องและหน่วยความจำหลักภายในเครื่องเชื่อมต่อกันบนเครือข่ายความเร็วสูง) สถาปัตยกรรมนี้กันอย่างแพร่หลายเชื่อว่าขนาดดีที่สุด [17], โดยเฉพาะอย่างยิ่งถ้าเรานำฮาร์ดแวร์ที่ต้นทุนเป็นต้น นอกจากนี้ ข้อมูลวิเคราะห์ปริมาณงานมักจะ ประกอบด้วยหลายแกนใหญ่การดำเนินงาน รวมหลายและดาวแผนรวม ที่ได้ค่อนข้างง่ายparallelize ข้ามโหนดในเครือข่ายที่ใช้ร่วมกันไม่ วิเคราะห์ผู้นำของผู้จัดจำหน่าย DBMS, Teradata ใช้สถาปัตยกรรมมีอะไรร่วมกันOracle และ Microsoft ได้ออกมาประกาศไม่ร่วมวิเคราะห์ผลิตภัณฑ์ DBMS ในโครงการของพวกเขา Exadata1 และเมดิสันตามลำดับ สำหรับวัตถุประสงค์ของเอกสารนี้ เราจะเรียกวิเคราะห์DBMS systems that deploy on a shared-nothing architecture paralleldatabases2.Parallel databases have been proven to scale really well into thetens of nodes (near linear scalability is not uncommon). However,there are very few known parallel databases deployments consistingof more than one hundred nodes, and to the best of our knowledge,there exists no published deployment of a parallel database withnodes numbering into the thousands. There are a variety of reasonswhy parallel databases generally do not scale well into the hundredsof nodes. First, failures become increasingly common as one addsmore nodes to a system, yet parallel databases tend to be designedwith the assumption that failures are a rare event. Second, paralleldatabases generally assume a homogeneous array of machines, yetit is nearly impossible to achieve pure homogeneity at scale. Third,until recently, there have only been a handful of applications that requireddeployment on more than a few dozen nodes for reasonableperformance, so parallel databases have not been tested at largerscales, and unforeseen engineering hurdles await.As the data that needs to be analyzed continues to grow, the numberof applications that require more than one hundred nodes is beginningto multiply. Some argue that MapReduce-based systems

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ส่วนหนึ่งเป็นเพราะระบบอัตโนมัติเพิ่มขึ้นด้วยซึ่งข้อมูลที่สามารถผลิตได้
(กระบวนการทางธุรกิจมากขึ้นจะกลายเป็นดิจิตอล)
การแพร่กระจายของเซ็นเซอร์และอุปกรณ์ข้อมูลการผลิต, การปฏิสัมพันธ์เว็บแบบกับลูกค้าและความต้องการการปฏิบัติตามรัฐบาลพร้อมกับความคิดริเริ่มขององค์กรเชิงกลยุทธ์ที่ต้องทางประวัติศาสตร์มากขึ้นข้อมูลจะถูกเก็บไว้สำหรับการวิเคราะห์ออนไลน์ มันไม่แปลกที่จะได้ยินเสียงของ บริษัท ที่อ้างว่าในการโหลดมากกว่าเทราไบต์ของโครงสร้างข้อมูลต่อวันในระบบฐานข้อมูลการวิเคราะห์ของพวกเขาและอ้างข้อมูลคลังสินค้าที่มีขนาดมากกว่าpetabyte a [19]. ได้รับปัญหาข้อมูลที่ระเบิดทั้งหมด แต่สาม ดังกล่าวข้างต้นที่กล่าวถึงการวิเคราะห์ฐานข้อมูลเริ่มอัพปรับใช้ระบบจัดการฐานข้อมูลของพวกเขาในสถาปัตยกรรมที่ใช้ร่วมกันไม่มีอะไร(คอลเลกชันที่เป็นอิสระอาจจะเป็นเสมือนเครื่องแต่ละคนมีดิสก์ท้องถิ่นและหน่วยความจำหลักท้องถิ่นเชื่อมต่อกันบนเครือข่ายความเร็วสูง) สถาปัตยกรรมนี้เป็นที่เชื่อกันอย่างแพร่หลายในการวัดที่ดีที่สุด [17] โดยเฉพาะอย่างยิ่งถ้าใครจะใช้เวลาค่าฮาร์ดแวร์เข้าบัญชี นอกจากนี้ปริมาณงานการวิเคราะห์ข้อมูลมีแนวโน้มที่จะประกอบด้วยการดำเนินงานสแกนที่มีขนาดใหญ่เป็นจำนวนมากรวมหลายมิติและสคีดาวร่วมทั้งหมดที่มีค่อนข้างง่ายที่จะคู่ขนานข้ามโหนดในเครือข่ายที่ไม่มีอะไรที่ใช้ร่วมกัน วิเคราะห์DBMS ผู้นำผู้ผลิต Teradata ใช้สถาปัตยกรรมที่ใช้ร่วมกันไม่มีอะไร. Oracle และไมโครซอฟท์ได้ประกาศเมื่อเร็ว ๆ นี้ร่วมกันไม่มีอะไรการวิเคราะห์ผลิตภัณฑ์DBMS ใน Exadata1 และโครงการเมดิสันของพวกเขาตามลำดับ สำหรับจุดประสงค์ของบทความนี้เราจะเรียกการวิเคราะห์ระบบ DBMS ที่ใช้งานบนสถาปัตยกรรมที่ใช้ร่วมกันไม่มีอะไรขนาน databases2. ฐานข้อมูลแบบขนานได้รับการพิสูจน์ในการปรับขนาดได้ดีจริงๆเข้ามาในสิบของโหนด (ใกล้ scalability เชิงเส้นก็ไม่แปลก) แต่มีน้อยมากที่รู้จักกันการใช้งานฐานข้อมูลแบบขนานที่ประกอบด้วยมากกว่าหนึ่งร้อยโหนดและที่ดีที่สุดของความรู้ของเรามีอยู่ไม่มีการใช้งานตีพิมพ์ของฐานข้อมูลแบบคู่ขนานกับโหนดนับเป็นพัน มีความหลากหลายของเหตุผลที่ว่าทำไมฐานข้อมูลแบบขนานโดยทั่วไปไม่ได้ดีขนาดเป็นร้อยโหนด ครั้งแรกที่ความล้มเหลวกลายเป็นเรื่องธรรมดามากขึ้นเป็นหนึ่งเพิ่มโหนดมากขึ้นในระบบฐานข้อมูลแบบขนานยังมีแนวโน้มที่จะได้รับการออกแบบด้วยสมมติฐานที่ว่าความล้มเหลวเป็นเหตุการณ์ที่ยาก ประการที่สองขนานฐานข้อมูลโดยทั่วไปถือว่าอาร์เรย์เป็นเนื้อเดียวกันของเครื่องแต่มันเป็นไปไม่ได้เกือบที่จะบรรลุความเป็นเนื้อเดียวกันที่บริสุทธิ์ในระดับ ประการที่สามจนเมื่อเร็ว ๆ นี้ได้รับเพียงไม่กี่คนของการใช้งานที่จำเป็นต้องใช้งานมากกว่าโหนดไม่กี่โหลสำหรับที่เหมาะสมประสิทธิภาพการทำงานเพื่อให้ฐานข้อมูลแบบขนานยังไม่ได้รับการทดสอบที่มีขนาดใหญ่กว่าเครื่องชั่งน้ำหนักและอุปสรรควิศวกรรมคาดไม่ถึงรอ. เป็นข้อมูลที่จำเป็นต้องไป ได้รับการวิเคราะห์ยังคงเติบโตจำนวนของการใช้งานที่ต้องมีมากกว่าหนึ่งร้อยโหนดเป็นจุดเริ่มต้นในการคูณ บางคนอ้างว่าระบบ MapReduce ตาม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ส่วนหนึ่งเนื่องจากการเพิ่มข้อมูลอัตโนมัติซึ่งสามารถผลิต
( กระบวนการทางธุรกิจมากขึ้นจะกลายเป็นดิจิตอล ) , การงอก
ของเซ็นเซอร์ และข้อมูลการผลิตอุปกรณ์ , เว็บแบบโต้ตอบ
กับลูกค้า และเรียกร้องให้รัฐบาลปฏิบัติตามตาม
กับองค์กรเชิงกลยุทธ์ริเริ่มที่ต้องการข้อมูลทางประวัติศาสตร์มากขึ้น
จะถูกออนไลน์สำหรับการวิเคราะห์ มันไม่เรื่องแปลกที่จะได้ยิน
ของ บริษัท ที่อ้างว่าโหลดมากกว่าเทราไบต์ของข้อมูลต่อวันเป็นระบบโครงสร้าง
ฐานข้อมูล วิเคราะห์ และอ้างว่าข้อมูล
โกดังขนาดมากกว่าสำหรับ [ 19 ] .
ให้ระเบิดปัญหาข้อมูลทั้งหมด แต่สามของข้างต้นที่กล่าวถึงการปรับใช้ DBMS ฐานข้อมูลเริ่ม

ไม่มีอะไรในสถาปัตยกรรม ( แบ่งปัน คอลเลกชันของอิสระอาจ
เสมือนเครื่องจักรแต่ละดิสก์ท้องถิ่นและหน่วยความจําหลักท้องถิ่น , เชื่อมต่อเข้าด้วยกันในเครือข่ายความเร็วสูง
) สถาปัตยกรรม
เป็นที่เชื่อกันอย่างกว้างขวางระดับดีที่สุด [ 17 ] , โดยเฉพาะอย่างยิ่งถ้าหนึ่งใช้เวลา
ต้นทุนอุปกรณ์ ลงในบัญชี นอกจากนี้การวิเคราะห์ข้อมูลงาน
มักจะประกอบด้วยหลายขนาดหลายชนิด หลายมิติ , สแกนงาน
และดาวคีมาร่วมทีม ซึ่งทั้งหมดเป็นค่อนข้างง่าย

parallelize ข้ามจุดที่ไม่มีเครือข่าย วิเคราะห์
DBMS ผู้ขายหัวหน้าทีใช้ร่วมกันไม่มีอะไรสถาปัตยกรรม ออราเคิล และไมโครซอฟท์ได้ประกาศเมื่อเร็ว ๆ นี้

แบ่งปันไม่มีอะไร DBMS วิเคราะห์ผลิตภัณฑ์ในโครงการของพวกเขา exadata1 เมดิสัน
ตามลำดับ สำหรับวัตถุประสงค์ของบทความนี้เราจะเรียกวิเคราะห์
DBMS ระบบที่ปรับบนสถาปัตยกรรมแบบขนาน
ไม่มีอะไรแบ่งปันdatabases2 .
ฐานข้อมูลแบบขนานได้รับการพิสูจน์แล้วว่าขนาดจริงๆดีใน
หลักสิบของโหนด ( ใกล้ระบบเชิงเส้นไม่พิสดาร ) อย่างไรก็ตาม มี น้อยมากที่รู้จัก

) ขนานประกอบด้วยฐานข้อมูลของมากกว่าหนึ่งร้อยจุด และที่ดีที่สุดของความรู้ของเรา
มีอยู่ไม่เผยแพร่การใช้งานของระบบฐานข้อมูลแบบขนานกับ
โหนดเลขในหลักพันมีความหลากหลายของเหตุผล
ทำไมฐานข้อมูลแบบขนานโดยทั่วไปไม่ได้ระดับดีเป็นร้อย
ของโหนด แรก ความล้มเหลวกลายเป็นสามัญมากขึ้นเป็นหนึ่งเพิ่ม
โหนดเพิ่มเติมระบบยังฐานข้อมูลขนานมีแนวโน้มที่จะออกแบบ
กับอัสสัมชัญความล้มเหลวเป็นเหตุการณ์ที่หายาก 2 ฐานข้อมูลโดยทั่วไปถือว่าเป็นแถวขนาน

เครื่องยังมันเป็นไปไม่ได้เกือบที่จะบรรลุเพียวเอกพันธ์ที่ขนาด . 3
จนกระทั่งเมื่อเร็ว ๆ นี้ มีเพียงกำมือของการใช้งานที่ต้องใช้
การใช้งานมากกว่าไม่กี่โหลโหนดสำหรับการทำงานที่เหมาะสม
ดังนั้นฐานข้อมูลขนานยังไม่ได้รับการทดสอบในระดับที่ใหญ่กว่าและวิศวกรรมอุปสรรคที่ไม่คาดฝัน

รอคอย เป็นข้อมูลที่ต้องวิเคราะห์ตัวเลข
ยังคงเติบโตโปรแกรมที่ต้องใช้มากกว่าหนึ่งร้อยโหนดเริ่มต้น
คูณ . บางคนโต้แย้งว่า mapreduce ตามระบบ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.