4. Experiments4.1. Experimental set

4. Experiments
4.1. Experimental setup
To compare the performance of the three different big data
mining procedures, four large scale datasets that cover different
domain problems are used. They are the KDD Cup2 2004 (protein
homology prediction) and 2008 (breast cancer prediction), covertype3
and person activity4 datasets. Table 2 lists the basic information
for these four datasets. The former two datasets (i.e. KDD
Cup 2004 and 2008) belong to 2-class classification problems and
the latter two (i.e. covertype and person activity) are multi-class
classification problems.
In addition, each dataset is divided into 90% training and 10%
testing sets based on the 10-fold cross validation strategy (Kohavi,
1995), for training and testing the SVM classifier, respectively. The
classification accuracy of the SVM and the times for training and

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4. การทดลอง4.1. ทดลองติดตั้งเพื่อเปรียบเทียบประสิทธิภาพของข้อมูลใหญ่แตกต่างกันสามขั้นตอนการทำเหมืองแร่ สี่ขนาดใหญ่ขยายชุดข้อมูลที่ครอบคลุมแตกต่างกันปัญหาโดเมนถูกใช้ มี 2004 Cup2 KDD (โปรตีนคาดเดา homology) และ 2551 (ทำนายมะเร็งเต้านม), covertype3และ datasets activity4 คน ตารางที่ 2 แสดงข้อมูลพื้นฐานสำหรับชุดข้อมูลสี่เหล่านี้ การ datasets สองอดีต (เช่น KDDถ้วย 2004 และ 2008) อยู่ใน 2 ระดับการจัดประเภทปัญหา และทั้งสอง latter (เช่น covertype และท่านกิจกรรม) หลายชั้นการจัดประเภทปัญหานอกจากนี้ แต่ละชุดข้อมูลแบ่งเป็นการฝึก 90% และ 10%การทดสอบกำหนดตามกลยุทธ์การตรวจสอบข้าม 10-fold (Kohavi1995), การฝึกอบรม และการทดสอบจำแนก SVM ตามลำดับ การความถูกต้องของการจัดประเภทของ SVM และเวลาสำหรับการฝึกอบรม และ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4. การทดลอง
4.1 การตั้งค่าการทดลอง
เพื่อเปรียบเทียบประสิทธิภาพในสามของข้อมูลขนาดใหญ่ที่แตกต่างกัน
ขั้นตอนการทำเหมืองแร่สี่ชุดข้อมูลขนาดใหญ่ที่ครอบคลุมที่แตกต่างกัน
ปัญหาโดเมนถูกนำมาใช้ พวกเขาเป็น KDD cup2 2004 (โปรตีน
ที่คล้ายคลึงกันทำนาย) และ 2008 (การทำนายโรคมะเร็งเต้านม) covertype3
และคนชุดข้อมูล activity4 ตารางที่ 2 แสดงข้อมูลพื้นฐาน
ทั้งสี่ชุดข้อมูล อดีตสองชุดข้อมูล (เช่น KDD
คัพปี 2004 และ 2008) เป็นปัญหาการจัดหมวดหมู่ 2 ชั้นและ
หลังสอง (เช่น covertype และกิจกรรมของคน) มีหลายระดับ
ปัญหาการจัดหมวดหมู่.
นอกจากนี้ในชุดข้อมูลที่แต่ละคนจะถูกแบ่งออกเป็นการฝึกอบรม 90% และ 10 %
ชุดทดสอบขึ้นอยู่กับ 10 เท่ากลยุทธ์การตรวจสอบข้าม (Kohavi,
1995) สำหรับการฝึกอบรมและการทดสอบลักษณนาม SVM ตามลำดับ
ความถูกต้องของการจำแนกประเภทของ SVM และเวลาในการฝึกอบรมและ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.