There are several reasons that make

There are several reasons that make MapReduce preferable over a parallel RDBMS for log processing. First, there is the sheer amount of data involved. For example, China Mobile gathers 5 – 8 TB of phone call records per day [4]. At Facebook [7], almost 6 TB of new log data is collected every day, with 1.7 PB of log data accumulated over time. Just formatting and loading that much data into a parallel RDBMS in a timely manner is a challenge. Second, the log records do not always follow the same schema. Developers often want the flexibility to add and drop attributes and the interpretation of a log record may also change over time. This makes the lack of a rigid schema in MapReduce a feature rather than a shortcoming. Third, all the log records within a time period are typically analyzed together, making simple scans preferable to index scans. Fourth, log processing can be very time consuming and therefore it is important to keep the analysis job going even in the event of failures. While most parallel RDBMSs have fault tolerance support, a query usually has to be restarted from scratch even if just one node in the cluster fails. In contrast, MapReduce deals more gracefully with failures and can redo only the part of the computation that was lost because of a failure. Last but not least, the Hadoop [8] implementation of MapReduce is freely available as open-source and runs well on inexpensive commodity hardware. For non-critical log data that is analyzed and eventually discarded, cost can be an important factor. In comparison, a commercial parallel RDBMS can cost hundreds of thousands of dollars, even on a moderate size cluster.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

มีเหตุผลหลายประการที่ทำให้ MapReduce กว่ากว่า RDBMS ขนานสำหรับการประมวลผลบันทึกเป็น ครั้งแรกที่มีเป็นจำนวนเงินที่แท้จริงของข้อมูลที่เกี่ยวข้องกับ เช่นมือถือจีนรวบรวม 5-8 tb ของบันทึกการโทรโทรศัพท์ต่อวัน [4] ที่ facebook ของ [7], เกือบ 6 tb ของข้อมูลเข้าสู่ระบบใหม่จะมีการเก็บทุกวันที่มี 1.7 PB ของข้อมูลที่บันทึกสะสมเมื่อเวลาผ่านไปเพียงแค่การจัดรูปแบบและการโหลดข้อมูลมากที่เป็น RDBMS ขนานในเวลาที่เหมาะสมเป็นสิ่งที่ท้าทาย สองบันทึกเข้าสู่ระบบไม่เคยทำตามแบบแผนเดียวกัน นักพัฒนามักจะต้องการความยืดหยุ่นในการเพิ่มและวางคุณลักษณะและการแปลความหมายของการบันทึกเข้าสู่ระบบนอกจากนี้ยังอาจมีการเปลี่ยนแปลงเมื่อเวลาผ่านไป นี้จะทำให้ขาดความเข้มงวดในคี MapReduce คุณสมบัติมากกว่าข้อบกพร่อง ที่สามทั้งหมดบันทึกเข้าสู่ระบบภายในระยะเวลาที่มักจะมีการวิเคราะห์เข้าด้วยกันทำให้การสแกนง่ายกว่าที่จะสแกนดัชนี สี่การประมวลผลเข้าสู่ระบบสามารถใช้เวลานานมากและจึงเป็นสิ่งสำคัญที่จะทำให้งานการวิเคราะห์ที่เกิดขึ้นแม้ในกรณีของความล้มเหลว ในขณะที่ rdbmss ขนานส่วนใหญ่จะมีการสนับสนุนความทนทานต่อความผิดแบบสอบถามมักจะต้องมีการเริ่มต้นใหม่ตั้งแต่เริ่มต้นแม้เพียงหนึ่งโหนดในคลัสเตอร์ล้มเหลว ในทางตรงกันข้ามข้อเสนอ MapReduce มากขึ้นอย่างสง่างามกับความล้มเหลวและสามารถทำซ้ำเพียงส่วนหนึ่งของการคำนวณที่หายไปนั้นเพราะความล้มเหลว สุดท้าย แต่ไม่น้อย Hadoop [8] การดำเนินการของ MapReduce เป็นอิสระสามารถเป็นโอเพนซอร์สและทำงานได้ดีกับฮาร์ดแวร์สินค้าโภคภัณฑ์มีราคาไม่แพงสำหรับข้อมูลที่เข้าสู่ระบบที่ไม่สำคัญที่มีการวิเคราะห์และทิ้งในที่สุดค่าใช้จ่ายอาจจะเป็นปัจจัยที่สำคัญ ในการเปรียบเทียบ RDBMS ขนานเชิงพาณิชย์สามารถค่าใช้จ่ายหลายร้อยหลายพันดอลลาร์แม้ในกลุ่มขนาดปานกลาง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

มีหลายสาเหตุที่ทำให้ MapReduce กว่ากว่า RDBMS ขนานสำหรับการประมวลผลแฟ้มบันทึก ครั้งแรก ได้จำนวนแท้จริงของข้อมูลที่เกี่ยวข้อง ตัวอย่าง มือถือจีนรวบรวม 5 – 8 TB ของโทรศัพท์แต่ละวัน [4] ใน Facebook [7], ข้อมูลล็อกใหม่เกือบ 6 TB จะรวบรวมทุกวัน 1.7 PB ล็อกข้อมูลสะสมเวลา เพียงจัดรูปแบบ และโหลดข้อมูลที่มากเป็น RDBMS ขนานในเวลาเหมาะสมเป็นสิ่งที่ท้าทาย สอง การบันทึกเสมอไปเค้าร่างเดียวกัน นักพัฒนามักจะต้องยืดหยุ่นในการเพิ่ม และลบแอตทริบิวต์ และการตีความของข้อมูลล็อกอาจเปลี่ยนช่วงเวลา ซึ่งทำให้การขาดแผนการเข้มงวดใน MapReduce คุณลักษณะมากกว่าคงเป็น ที่สาม ระเบียนบันทึกทั้งหมดภายในระยะเวลาโดยทั่วไปลักษณะกัน ทำให้การสแกนง่ายกว่าจะสแกนดัชนี สี่ ประมวลผลแฟ้มบันทึกอาจใช้เวลามากนาน และดังนั้น จึงเป็นสิ่งสำคัญเพื่อให้งานการวิเคราะห์ที่เกิดขึ้นแม้แต่ในกรณีความล้มเหลว ในขณะที่ RDBMSs ส่วนใหญ่ขนานมีข้อบกพร่องยอมรับสนับสนุน แบบสอบถามมักจะมีเริ่มตั้งแต่ถ้าโหนหนึ่งในคลัสเตอร์ล้มเหลว ในทางตรงกันข้าม MapReduce เกี่ยวข้องอย่างมากกับความล้มเหลว และสามารถทำซ้ำเฉพาะส่วนของการคำนวณที่สูญเสียเนื่องจากความล้มเหลว สุดท้าย แต่ไม่ น้อย ปฏิบัติ [8] อย่างไร Hadoop MapReduce ได้อิสระเป็นแหล่งเปิดและทำงานดีในราคาไม่แพงสินค้าฮาร์ดแวร์ ไม่สำคัญบันทึกข้อมูลที่วิเคราะห์ และยกเลิกในที่สุด ต้นทุนที่สามารถจะเป็นปัจจัยสำคัญ ในการเปรียบเทียบ RDBMS ขนานการพาณิชย์สามารถต้นทุนหลายร้อยหลายพันดอลลาร์ แม้ในคลัสเตอร์ขนาดปานกลาง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

มีหลายเหตุผลที่ทำให้ mapreduce ดีกว่ามากกว่า rdbms แบบคู่ขนานสำหรับการประมวลผลล็อกอินเข้าสู่ ครั้งแรกมีปริมาณสูงของข้อมูลมีส่วนร่วม ตัวอย่างเช่นจีนจิต 5 - 8 TB ของบันทึกการโทรต่อวัน[ 4 ] ใน Facebook :[ 7 ],เกือบ 6 TB ของข้อมูลล็อกอินเข้าสู่ใหม่จะถูกเก็บรวบรวมทุกวันพร้อมด้วย 1.7 PB ของข้อมูลล็อกอินเข้าสู่สะสมมากกว่าเวลาเพียงการจัดรูปแบบและการโหลดข้อมูลที่เป็น rdbms แบบคู่ขนานในเวลาที่เหมาะสมเป็นสิ่งที่ท้าทาย บันทึกข้อมูลล็อกอินที่สองที่ไม่ได้ทำตามค่าเดียวกันกับที่อยู่เสมอ บริษัทพัฒนาอสังหาริมทรัพย์มักต้องการความยืดหยุ่นในการเพิ่มและลดลงแอตทริบิวต์และการแปลความหมายของการบันทึกล็อกอินเข้าสู่ที่อาจมีการเปลี่ยนแปลงในแต่ละครั้งด้วย โรงแรมแห่งนี้จะทำให้การขาดของ Schema แข็งใน mapreduce โดดเด่นไปด้วยความล้มเหลวหรือความบกพร่องที่มากกว่า ที่สามบันทึกข้อมูลล็อกอินทั้งหมดที่อยู่ในช่วงเวลาที่มีการวิเคราะห์ด้วยกันทำให้การสแกนแบบเรียบง่ายดีกว่าที่จะสแกนหาดัชนีโดยทั่วไป ล็อกอินเข้าสู่ที่สี่การประมวลผลสามารถเป็นอย่างมากใช้เวลานานและดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องทำให้งานการวิเคราะห์ที่จะไปแม้กระทั่งในกรณีที่เกิดความล้มเหลว ในขณะที่ส่วนใหญ่ rdbmss แบบขนานได้มีการสนับสนุนลดการเกิดความผิดพลาดคำถามที่โดยปกติจะมีต้องรีสตาร์ทเครื่องจากรอยขีดข่วนแม้เพียงหนึ่งโหนดในกลุ่มที่ไม่ผ่าน ในทางตรงข้าม mapreduce ขายได้มากขึ้นอย่างสง่างามพร้อมด้วยความล้มเหลวและสามารถทำซ้ำเท่านั้นที่เป็นส่วนหนึ่งของมาตรวัดที่ได้หายไปหมดเพราะของความล้มเหลวที่ สุดท้ายแต่ไม่ได้อย่างน้อย hadoop [ 8 ]การนำไปใช้งานของ mapreduce เป็นได้อย่างอิสระเป็นแบบเปิดโล่งและแหล่งที่มาวิ่งได้ดีบนฮาร์ดแวร์สินค้าราคาไม่แพงมากนักสำหรับข้อมูลล็อกอินไม่สำคัญที่ได้รับการวิเคราะห์และในที่สุดต้นทุนต่ำจะถูกยกเลิกจะเป็นปัจจัยสำคัญที่ ในการเปรียบเทียบ rdbms แบบคู่ขนานทางการค้าที่จะสามารถประหยัดค่าใช้จ่ายหลายร้อยหลายพันดอลลาร์แม้ในกลุ่มขนาดกลาง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.