3.5. Experimental Results
Ten-fold cross-validation is performed to test the classifier. During the initial classification test, we notice that the produced classifier confused several classes due to topic similarity and imbalance in training sets assigned to each category. To address this issue, we combine similar categories. Table 2 column 1 and 5 shows the merged categories and their corresponding sub-categories. The number of annotated messages for each category is displayed in the last column. Additionally, we also discard several categories with training samples less than a predefined threshold (e.g., 20) since we are unable to train the classier to accurately assign tweets to those categories based on the small size of the training set. Examples include preparedness.plans, preparedness.tip, recovery.school, recovery.restore, recovery.housing, recovery.repair, recovery.stock, recovery.utilities.power, recovery.utilities.gas, and impact.housing.
3.5 การทดลอง Ten-fold ข้ามตรวจสอบจะดำเนินการทดสอบลักษณนาม ในระหว่างทดสอบจำแนกประเภทเริ่มต้น เราพบว่า ลักษณนามผลิตสับสนหลายชั้นเนื่องจากความคล้ายคลึงกันของหัวข้อและความไม่สมดุลในชุดฝึกอบรมที่กำหนดให้กับแต่ละประเภท เพื่อแก้ไขปัญหานี้ เรารวมประเภทคล้ายกัน ตาราง 2 คอลัมน์ 1 และ 5 แสดงประเภทถูกผสานและประเภทย่อยที่สอดคล้องกันของพวกเขา จำนวนข้อความที่ใส่คำอธิบายประกอบสำหรับแต่ละประเภทจะแสดงในคอลัมน์ นอกจากนี้ เรายังละทิ้งหลายประเภทฝึกอบรมตัวอย่างที่น้อยกว่าเกณฑ์กำหนดไว้ล่วงหน้า (เช่น 20) เนื่องจากเราไม่สามารถฝึก classier การกำหนดทวีประเภทเหล่านั้นตามขนาดเล็กของชุดฝึกอบรมอย่างถูกต้อง ตัวอย่างเช่น preparedness.plans, preparedness.tip, recovery.school, recovery.restore, recovery.housing, recovery.repair, recovery.stock, recovery.utilities.power, recovery.utilities.gas และ impact.housing
การแปล กรุณารอสักครู่..

3.5 ทดลองผลลัพธ์
สิบเท่าการตรวจสอบข้ามจะดำเนินการเพื่อทดสอบลักษณนาม ในระหว่างการทดสอบการจำแนกแรกเราสังเกตเห็นว่าลักษณนามผลิตสับสนหลายชั้นเนื่องจากความคล้ายคลึงกันหัวข้อและความไม่สมดุลในชุดฝึกอบรมที่ได้รับมอบหมายในแต่ละหมวดหมู่ เพื่อแก้ไขปัญหานี้เรารวมประเภทที่คล้ายกัน ตารางที่ 2 คอลัมน์ที่ 1 และ 5 แสดงประเภทที่ผสานกันและประเภทย่อยของพวกเขา จำนวนข้อความข้อเขียนสำหรับแต่ละประเภทจะแสดงอยู่ในคอลัมน์สุดท้าย นอกจากนี้เรายังทิ้งหลายประเภทที่มีตัวอย่างการฝึกอบรมน้อยกว่าเกณฑ์ที่กำหนดไว้ล่วงหน้า (เช่น 20) เนื่องจากเราไม่สามารถที่จะฝึก classier ที่จะต้องกำหนดทวีตไปยังประเภทเหล่านั้นขึ้นอยู่กับขนาดที่เล็กของชุดการฝึกอบรม ตัวอย่าง ได้แก่ preparedness.plans, preparedness.tip, recovery.school, recovery.restore, recovery.housing, recovery.repair, recovery.stock, recovery.utilities.power, recovery.utilities.gas และ impact.housing
การแปล กรุณารอสักครู่..

3.5 . ผลการทดลองสิบโฟลดจะดําเนินการสอบลักษณนาม ในระหว่างการทดสอบการเริ่มต้น เราสังเกตเห็นว่าผลิตแบบสับสนหลายชั้นเรียนเนื่องจากความไม่สมดุลในเรื่องความเหมือนและชุดการฝึกที่ได้รับมอบหมายในแต่ละประเภท เพื่อแก้ไขปัญหานี้ , เรารวมประเภทที่คล้ายกัน ตารางที่ 2 คอลัมน์ที่ 1 และ 5 แสดงผสานประเภทและประเภทย่อยที่สอดคล้องกันของพวกเขา เลขที่บันทึกย่อข้อความสำหรับแต่ละประเภทจะปรากฏในคอลัมน์สุดท้าย นอกจากนี้เรายังทิ้งหลายประเภทด้วยการฝึกอบรมตัวอย่างน้อยกว่าเกณฑ์ที่กำหนด ( 20 เช่น เนื่องจากเราไม่สามารถฝึกดูมีระดับที่ถูกต้องกำหนด tweets ที่ประเภทขึ้นอยู่กับขนาดของชุดฝึกอบรม . ตัวอย่าง ได้แก่ preparedness.plans preparedness.tip recovery.school recovery.restore , , , , recovery.housing recovery.repair recovery.stock recovery.utilities.power , , , , recovery.utilities.gas และ impact.housing .
การแปล กรุณารอสักครู่..
