4.3.2. Results for the person activ

4.3.2. Results for the person activity dataset
Fig. 12 shows the classification accuracy of the three big data
mining procedures over the person activity dataset. We can see
that when using the distributed procedure the classification accuracy
gradually decreases as the number of computer nodes increases.
In particular, the degradation in performance is more obvious
than with the covertype dataset when more computer nodes
are used.
In contrast, the MapReduce based procedure allows the SVM
classifier to produce the highest rate of classification accuracy and
the classification accuracy remains stable no matter how many
computer nodes are used, at 90.91%. As this dataset is an 11-class
classification domain problem, which can be regarded as a complex
dataset like the covertype dataset, these results demonstrate
the suitability of using the MapReduce based procedure for this
type of large dataset.
Fig. 13 shows the computational costs of the distributed and
MapReduce based procedures. The baseline procedure takes 542
seconds to accomplish this task. In the distributed procedure, as
the number of computer nodes increases, the computational cost
is reduced, but it becomes larger in the MapReduced based procedure.
This indicates that there is no need to use a large number
of computer nodes in this dataset to ensure classification accuracy
and processing times. Specifically, one single machine can be
used in the MapReduce based procedure to make the SVM produce
the highest accuracy rate and require the least processing time, i.e.
21 s.
The covertype and person activity datasets contain very large
numbers of data samples and they are multi-class classification
domain problems, which are much larger and more complex than
two-class datasets used in Section 4.2. For this type of big dataset,
the MapReduce based procedure (by one to ten visual machines) is
the best choice since it can allow the classifier to provide the highest
rate of classification accuracy and requires the least amount of
processing time compared with the baseline and distributed procedures.
In other words, the MapReduce based procedure can deal
with more complex and larger volumes of data more effectively
and efficiently than the conventional baseline and distributed procedures.
This indicates that the MapReduce based procedure is a
better solution for big data mining, especially when the datasets
contain some highly complex characteristics, such as a very large
volume of data samples and multi-class classification problems.
For the memory consumption during the classifier training
stage, on average the baseline, distributed (20 nodes), and MapReduce
(20 nodes) procedures require 15.7 GB of RAM, 1.5 GB of RAM,
and 1.1 GB of RAM, respectively. On the other hand, for the classi-
fier testing stage, which is similar to the results of Section 4.2, the

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.3.2. ผลสำหรับชุดข้อมูลกิจกรรมที่บุคคลรูปที่ 12 แสดงความถูกต้องของการจัดประเภทของข้อมูลใหญ่สามขั้นตอนการทำเหมืองผ่านชุดข้อมูลกิจกรรมคน เราสามารถมองเห็นซึ่งเมื่อใช้ขั้นตอนความถูกต้องของการจำแนกแจกจ่ายค่อย ๆ ลดลงเป็นจำนวนเพิ่มขึ้นโหนคอมพิวเตอร์โดยเฉพาะ ลดประสิทธิภาพการทำงานเป็นที่ชัดเจนมากขึ้นกว่า ด้วยการชุดข้อมูล covertype เมื่อคอมพิวเตอร์โหนจะใช้ตรงกันข้าม MapReduce ตามขั้นตอนให้การ SVMลักษณนามการผลิตอัตราสูงสุดของการจัดประเภทความแม่นยำ และความถูกต้องของการจัดประเภทยังคงมีเสถียรภาพไม่ว่ากี่คอมพิวเตอร์โหนไว้ 90.91% ชุดข้อมูลนี้เป็น คลาสที่มี 11ปัญหาโดเมนประเภท ซึ่งอาจถือเป็นคอมเพล็กซ์ชอบชุดข้อมูลชุดข้อมูล covertype เหล่านี้แสดงให้เห็นว่าความเหมาะสมของการใช้ MapReduce ที่ตามขั้นตอนนี้ชนิดของชุดข้อมูลขนาดใหญ่รูป 13 แสดงการคำนวณต้นทุนของการกระจาย และMapReduce ตามขั้นตอน ขั้นตอนพื้นฐานใช้เวลา 542วินาทีเพื่อทำงานนี้ ในขั้นตอนการกระจาย เป็นเพิ่มจำนวนคอมพิวเตอร์โหน คำนวณต้นทุนลดลง แต่เพิ่มขึ้นใน MapReduced ตามขั้นตอนบ่งชี้ว่า มีความต้องการใช้จำนวนมากของคอมพิวเตอร์โหนในชุดข้อมูลนี้การจัดประเภทแม่นยำและเวลาประมวลผล โดยเฉพาะ เป็นเครื่องเดียวที่หนึ่งใช้ในกระบวนการ MapReduce คะแนนการผลิต SVMความแม่นยำสูงสุดอัตรา และอย่างน้อยต้องใช้เวลา การประมวลผลเช่น21 sชุดข้อมูลกิจกรรม covertype และท่านประกอบด้วยขนาดใหญ่มากตัวเลขของข้อมูล ตัวอย่างและพวกเขาจะจัดประเภทหลายชั้นปัญหาโดเมน ที่มีขนาดใหญ่ และซับซ้อนกว่าชุดข้อมูลสองชั้นที่ใช้ในหัวข้อ 4.2 สำหรับชนิดของชุดข้อมูลขนาดใหญ่ขั้น MapReduce คะแนน (จากหนึ่งถึงสิบเครื่อง visual)ดีสุด เพราะมันสามารถช่วยให้จำแนกให้สูงที่สุดอัตราความแม่นยำของการจำแนกประเภท และต้องการน้อยที่สุดเวลาประมวลผลเมื่อเทียบกับพื้นฐาน และขั้นตอนกระจายในคำอื่น ๆ สามารถจัดการขั้นตอน MapReduce คะแนนมีไดรฟ์ข้อมูลขนาดใหญ่ และซับซ้อนมากขึ้นของข้อมูลได้อย่างมีประสิทธิภาพและมีประสิทธิภาพ กว่าพื้นฐานทั่วไปและขั้นตอนการกระจายบ่งชี้ว่า กระบวนการ MapReduce คะแนนได้เป็นดีกว่าโซลูชั่นสำหรับการทำเหมืองข้อมูล โดยเฉพาะอย่างยิ่งเมื่อการ datasetsประกอบด้วยลักษณะที่ซับซ้อนบางอย่าง เช่นขนาดใหญ่ปริมาตรของตัวอย่างข้อมูลและปัญหาการจัดประเภทหลายชั้นสำหรับปริมาณการใช้หน่วยความจำในระหว่างการฝึกอบรมจำแนกขั้น ตอน เฉลี่ยพื้นฐาน แบบกระจาย (20 โหน), และ MapReduceขั้นตอน (20 โหน) ต้อง RAM, 1.5 กิกะไบต์ GB 15.7และ 1.1 GB RAM ตามลำดับ บนมืออื่น ๆ สำหรับ classi-การทดสอบระยะ ซึ่งคล้ายกับผลลัพธ์ของส่วน 4.2, fier

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.3.2 ผลการค้นหาสำหรับชุดกิจกรรมที่คน
รูป 12 แสดงให้เห็นถึงความถูกต้องของการจำแนกประเภทของข้อมูลขนาดใหญ่สาม
ขั้นตอนการทำเหมืองแร่มากกว่าชุดกิจกรรมคน เราจะเห็นได้
ว่าเมื่อใช้ขั้นตอนการกระจายความถูกต้องของการจัดหมวดหมู่
ค่อยๆลดลงเป็นจำนวนโหนดคอมพิวเตอร์ที่เพิ่มขึ้น.
โดยเฉพาะอย่างยิ่งลดประสิทธิภาพการทำงานที่เห็นได้ชัดมากขึ้น
กว่าด้วยชุด covertype เมื่อโหนดคอมพิวเตอร์
จะใช้.
ในทางตรงกันข้าม MapReduce ตาม ขั้นตอนการช่วยให้ SVM
ลักษณนามในการผลิตอัตราที่สูงที่สุดของความถูกต้องจำแนกและ
ความถูกต้องของการจำแนกประเภทยังคงมีเสถียรภาพไม่ว่ากี่
โหนดคอมพิวเตอร์มีการใช้ที่ 90.91% ในฐานะที่เป็นชุดข้อมูลนี้เป็น 11 ระดับ
ปัญหาการจัดหมวดหมู่โดเมนซึ่งถือได้ว่าเป็นความซับซ้อน
ชุดเช่นชุด covertype ผลเหล่านี้แสดงให้เห็นถึง
ความเหมาะสมของการใช้ขั้นตอนที่ใช้สำหรับ MapReduce นี้
ประเภทของชุดข้อมูลที่มีขนาดใหญ่.
รูป 13 แสดงให้เห็นถึงค่าใช้จ่ายในการคำนวณของการกระจายและ
ขั้นตอนตาม MapReduce ขั้นตอนพื้นฐานจะใช้เวลา 542
วินาทีในการทํางานนี้ ในขั้นตอนการกระจายเป็น
จำนวนโหนดคอมพิวเตอร์เพิ่มขึ้นค่าใช้จ่ายในการคำนวณ
จะลดลง แต่มันจะกลายเป็นขนาดใหญ่ในขั้นตอน MapReduced ตาม.
นี้ชี้ให้เห็นว่าไม่มีความจำเป็นต้องใช้เป็นจำนวนมาก
ของโหนดคอมพิวเตอร์ในชุดนี้เพื่อให้แน่ใจว่าการจัดหมวดหมู่ ความถูกต้อง
และการประมวลผลครั้ง โดยเฉพาะเครื่องหนึ่งเดียวที่สามารถ
นำมาใช้ในขั้นตอนการ MapReduce ตามที่จะทำให้ SVM ผลิต
อัตราความแม่นยำสูงสุดและต้องใช้เวลาในการประมวลผลน้อยที่สุดคือ
21 s.
covertype และคนชุดข้อมูลกิจกรรมประกอบด้วยขนาดใหญ่มาก
ตัวเลขของตัวอย่างข้อมูลและพวกเขามีหลาย การจัดหมวดหมู่ -class
ปัญหาโดเมนซึ่งมีขนาดใหญ่และซับซ้อนมากขึ้นกว่า
ชุดข้อมูลสองชั้นใช้ในส่วน 4.2 สำหรับประเภทของชุดข้อมูลขนาดใหญ่
MapReduce ขั้นตอนตาม (โดย 1-10 เครื่องภาพ) เป็น
ทางเลือกที่ดีที่สุดเพราะมันสามารถช่วยให้ลักษณนามเพื่อให้สูงสุด
อัตราความแม่นยำของการจัดหมวดหมู่และต้องมีจำนวนน้อยที่สุดของ
เวลาการประมวลผลเมื่อเทียบกับพื้นฐานและ กระจายขั้นตอน.
ในคำอื่น ๆ ขั้นตอน MapReduce ตามสามารถจัดการ
กับปริมาณที่ซับซ้อนมากขึ้นและมีขนาดใหญ่ของข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น
และมีประสิทธิภาพกว่าพื้นฐานทั่วไปและขั้นตอนการกระจาย.
นี้ชี้ให้เห็นว่าขั้นตอน MapReduce ตามเป็น
ทางออกที่ดีสำหรับการทำเหมืองข้อมูลขนาดใหญ่โดยเฉพาะอย่างยิ่ง เมื่อชุดข้อมูล
มีลักษณะที่ซับซ้อนบางอย่างเช่นมีขนาดใหญ่มาก
ปริมาณของตัวอย่างข้อมูลและปัญหาการจัดหมวดหมู่หลายระดับ.
สำหรับใช้หน่วยความจำในระหว่างการฝึกลักษณนาม
เวทีโดยเฉลี่ยพื้นฐานกระจาย (20 โหนด) และ MapReduce
(20 โหนด) ขั้นตอนต้องใช้ 15.7 GB of RAM 1.5 GB of RAM,
และ 1.1 GB of RAM ตามลำดับ ในทางตรงกันข้ามสำหรับ classi-
ขั้นตอนการทดสอบ Fier ซึ่งมีลักษณะคล้ายผลของมาตรา 4.2 ที่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

4.3.2 . ผลการค้นหาสำหรับกิจกรรมข้อมูลบุคคลรูปที่ 12 แสดงความแม่นยำในการจำแนกของใหญ่สามข้อมูลเหมืองแร่ขั้นตอนกว่าบุคคล กิจกรรม ข้อมูล . เราสามารถดูเมื่อใช้กระบวนการความแม่นยำในการจำแนกแจกจ่ายค่อย ๆ ลดลงเป็นจำนวนเพิ่มโหนดคอมพิวเตอร์โดยเฉพาะอย่างยิ่ง การย่อยสลายในการปฏิบัติได้ชัดเจนมากขึ้นกว่ากับ covertype เมื่อโหนดคอมพิวเตอร์ข้อมูลเพิ่มเติมจะใช้ในทางตรงกันข้าม , mapreduce ตามขั้นตอนให้ SVMลักษณนามผลิตอัตราความแม่นยำในการจำแนกและความแม่นยำในการจำแนกยังคงไม่ว่ากี่โหนดของคอมพิวเตอร์ที่ใช้ใน 90.91 % เป็นชุดข้อมูลนี้คือ 11 ชั้นปัญหาโดเมนหมวดหมู่ซึ่งสามารถถือได้ว่าเป็นคอมเพล็กซ์ข้อมูล เช่น ข้อมูล covertype ผลลัพธ์เหล่านี้แสดงความเหมาะสมของการใช้ขั้นตอนตาม mapreduce นี้ประเภทของชุดข้อมูลที่มีขนาดใหญ่รูปที่ 13 แสดงการคำนวณต้นทุนของการกระจายและmapreduce ตามขั้นตอน ขั้นตอนที่ 4 ใช้ 542วินาทีเพื่อให้บรรลุงานนี้ ในการกระจายกระบวนการ เช่นจำนวนที่เพิ่มขึ้น , คอมพิวเตอร์ , ราคาคอมพิวเตอร์จะลดลง แต่มันจะกลายเป็นขนาดใหญ่ใน mapreduced ขั้นตอนตามแสดงว่าไม่ต้องใช้จำนวนมากของโหนดคอมพิวเตอร์ในชุดข้อมูลนี้เพื่อให้แน่ใจว่า ความแม่นยำในการจำแนกและการประมวลผลครั้ง โดยเฉพาะเครื่องเดียวสามารถที่ใช้ใน mapreduce ตามขั้นตอนเพื่อให้ SVM ผลิตสูงสุดอัตราความถูกต้องและต้องการการประมวลผลเวลาที่น้อยที่สุด คือ21 .การ covertype คนกิจกรรมและข้อมูลมีขนาดใหญ่มากตัวอย่างข้อมูลและตัวเลขของพวกเขาจะจัดชั้นเรียนหลายปัญหาโดเมนซึ่งมีมากขนาดใหญ่และซับซ้อนกว่า2 ห้อง ข้อมูลที่ใช้ในส่วนของ 4.2 . สำหรับของข้อมูลชนิดนี้ขั้นตอน mapreduce ตาม ( หนึ่งถึงสิบเครื่อง ภาพ )ทางเลือกที่ดีที่สุดเพราะมันสามารถให้ตัวให้มากที่สุดอัตราความแม่นยำในการจำแนกและต้องมีจํานวนน้อยของเวลาในการประมวลผลเมื่อเทียบกับพื้นฐานและการกระจายการในคำอื่น ๆ mapreduce ขั้นตอนตามสามารถจัดการที่ซับซ้อนมากขึ้นและขนาดใหญ่ปริมาณของข้อมูลได้อย่างมีประสิทธิภาพและมีประสิทธิภาพมากกว่าพื้นฐานปกติ และการกระจายการนี้บ่งชี้ว่า mapreduce ขั้นตอนพื้นฐานคือทางออกที่ดีสำหรับการทำเหมืองข้อมูลใหญ่ โดยเฉพาะอย่างยิ่งเมื่อข้อมูลมีบางลักษณะที่ซับซ้อนสูง เช่น มีขนาดใหญ่มากปริมาณของตัวอย่างข้อมูลและหลายชั้นหมวดหมู่ปัญหาสำหรับการบริโภคหน่วยความจำในตัว ฝึกอบรมเวที เฉลี่ยพื้นฐานกระจาย ( 20 ข้อ ) และ mapreduce( 20 ข้อ ) รวมทั้งต้อง 4 GB RAM 1.5 GB of RAM ,และ 1.1 GB of RAM , ตามลำดับ บนมืออื่น ๆ , classi - สำหรับเฟียร์ขั้นตอนการทดสอบซึ่งคล้ายกับผลของมาตรา 4.2 ,

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.