The other two datasets considered are from real-world settings and are publicly
available from the UC Irvine Machine Learning repository. The Bag of Words Data
Set(BoW) consists of 2,351,710,420 points in 3 dimensions and represents features
available to (docID, wordID, count). The Individual household electric power consumption Data Set (House) consists of 4,296,075,259 points in 9 dimensions.The
Gauss dataset is studied in a single machine and the other two datasets are studied
with the parallel implementation in the Hadoop framework.
Datasets สองอื่น ๆ ที่พิจารณาจากค่าจริง และอย่างเปิดเผยว่างจากเก็บ UC เออร์วินเครื่องเรียน กระเป๋าข้อมูลคำSet(BoW) ประกอบด้วยจุด 2,351,710,420 ในขนาด 3 และแสดงลักษณะการทำงานว่าง (docID, wordID จำนวน) ปริมาณการใช้ไฟฟ้าในครัวเรือนแต่ละชุดข้อมูล (บ้าน) ประกอบด้วยจุด 4,296,075,259 ในขนาด 9 ที่ศึกษาชุดข้อมูลเกาส์ในเครื่องเดียว และ datasets สองอื่น ๆ ได้ศึกษาพร้อมใช้งานพร้อมกันในกรอบอย่างไร Hadoop
การแปล กรุณารอสักครู่..
