5.3.2 Top-K Correlation Method We evaluate the individual performance  การแปล - 5.3.2 Top-K Correlation Method We evaluate the individual performance  ไทย วิธีการพูด

5.3.2 Top-K Correlation Method We e

5.3.2 Top-K Correlation Method
We evaluate the individual performance of TCC and CCC, by measuring their average compression error and its variance while varying top-k sizes from 1 to 10 times of their initial length. To construct the top-k list, we computed correlations over disjoint pairs of demographic nodes for fixed time intervals (with local averages), taken from 17 different topics in MovieLens. Then, we filtered correlations according to the significance and minimum correlation criteria, obtaining the lists of (approximately) 12 K high( l >0.50) and 2 K very high( l >0.75) top-k correlations for an initial set of 140 K disjoint pairs.
Compression error is computed as the root mean squared error (RMSE) between actual correlations and those retrieved according to Algorithm 5. We note that an optimal compression (with the smallest error) for CCC clustering method was sometimes achieved with a size, smaller than that required by the compression ratio parameter. In such cases the remaining space was filled with the highest non-clustered correlations.
In Figure 8 we present the results of our evaluation. We observe that TCC triangulation compression shows better performance when it is able to fit all the high correlations necessary for describing the rest of correlations, what happens in the case of large initial top k list( l >0.50). In the case when all correlations are high (l > 0.75) and there is a high compression ratio, there is a large portion of correlations which do not fit into the compressed top-k list and neither can be triangulated from the correlations present in the list. The error in this case is the highest. On the other hand, CCC clustering compression benefits from compressing higher correlations as soon as there is enough space in top-k to store an optimal number of clusters. In this case most of the high correlations appear within clusters and the amount of correlations which are not approximated by cluster-cluster distances becomes relatively small. Nevertheless, CCC can be come in efficient due to the clustering information overhead if there are many distanced small clusters of 3 items. Since TCC method is able to approximate the third correlation using the remaining two, it can be a good companion in such cases. We recommend to use hybrid CCC+TCC method for compressing correlations as the most universally applicable, especially in the case of moderate compression ratios.
We now look at the efficiency of correlation extraction of our top-k method using the same synthetic dataset, we used to evaluate the base line methods. We calculated lists of high correlations (l min=0.5) for each of the fixed time intervals, containing 20-50K top-k values out of 15 M (disjoint) and 40M (total) group pairs, and compressed them using the hybrid CCC+TCC method with clustering parameters optimized individually for the specific top-k size. We varied top-k sizes from 4 to 16 four-kilo byte disk pages (each page can hold up to 800 correlations or cluster distances). Figure 9 demonstrates that with the sufficient list of top-k correlations, computed for fixed-windows, it is possible to match the accuracy of conventional methods. A more detailed inspection shows that the drop in accuracy for smaller top-k sizes is caused mainly by a decreasing recall, due to the in ability of top-k to fit all the high correlations, which our synthetic dataset is mainly composed of.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
5.3.2 วิธีการความสัมพันธ์ด้านบน-K เราสามารถประเมินการปฏิบัติงานของ TCC และ CCC โดยการวัดผิดพลาดของพวกเขาอัดเฉลี่ยและความแปรปรวนในขณะที่ด้านบน-k ขนาดจาก 1 ถึง 10 เท่าของความยาวเริ่มต้นที่แตกต่างกัน การสร้างรายการด้านบน-k เราคำนวณความสัมพันธ์ผ่านโหนประชากร disjoint คู่สำหรับช่วงเวลาที่ fixed (มีเฉพาะค่าเฉลี่ย), ดำเนินการจาก 17 หัวข้อที่แตกต่างกันใน MovieLens จากนั้น เรา filtered สัมพันธ์ตามถึงความและต่ำสุดสัมพันธ์เงื่อนไข การขอรับรายการของสูง (โดยประมาณ) 12 K (l > 0.50) และ 2 K สูงมาก (l > 0.75) ความสัมพันธ์ k ด้านบนสำหรับการตั้งค่าเริ่มต้นของ 140 K disjoint คู่ คำนวณผิดพลาดอัดเป็นรากเฉลี่ยกำลังสองข้อผิดพลาด (RMSE) ระหว่างความสัมพันธ์จริงและข้อมูลที่ดึงมาตาม 5 อัลกอริทึม เราทราบว่า การบีบอัดที่เหมาะสม (กับข้อผิดพลาดน้อยที่สุด) สำหรับ CCC clustering วิธีบางครั้งสำเร็จขนาด ขนาดเล็กกว่าที่กำหนด โดยพารามิเตอร์อัตราส่วนการบีบอัด ในกรณี พื้นที่เหลือเป็น filled กับสัมพันธ์ไม่ใช่ภูมิสูง ในรูปที่ 8 เรานำเสนอผลการประเมินของเรา เราสังเกตว่า การบีบอัดระบบสามสกุล TCC แสดงประสิทธิภาพที่ดีขึ้นเมื่อสามารถพอความสัมพันธ์ที่สูงทั้งหมดจำเป็นสำหรับการอธิบายของความสัมพันธ์ สิ่งที่เกิดขึ้นในกรณีที่รายการ k บนต้นขนาดใหญ่ (l > 0.50) ในกรณีเมื่อความสัมพันธ์ทั้งหมดสูง (l > 0.75) และมีอัตราส่วนการบีบอัดสูง มีพื้นที่ส่วนใหญ่ของความสัมพันธ์ที่ทำไม่พอเข้ารายการ k ด้านบนบีบอัด และไม่สามารถระบุได้จากความสัมพันธ์ที่แสดงในรายการ ข้อผิดพลาดในกรณีนี้สูงที่สุด คง CCC clustering ผลการบีบอัดจากการบีบอัดความสัมพันธ์สูงขึ้นทันทีที่มีพื้นที่เพียงพอในด้าน k เก็บปรับจำนวนคลัสเตอร์ ในกรณีนี้ ส่วนใหญ่ของความสัมพันธ์สูงปรากฏอยู่ในคลัสเตอร์ และจำนวนของความสัมพันธ์ที่ไม่มีประมาณ โดยคลัสเตอร์คลัสเตอร์ระยะทางจะค่อนข้างเล็ก อย่างไรก็ตาม CCC สามารถมาในประสิทธิผลเนื่องจากค่าโสหุ้ยข้อมูลระบบคลัสเตอร์ถ้ามีหลาย distanced กลุ่มเล็ก ๆ จาก 3 รายการ ตั้งแต่วิธีที่ท่านสามารถที่จะประมาณความสัมพันธ์สามเหลือสองใช้ ได้เพื่อนดีในกรณีดังกล่าว เราขอแนะนำให้ใช้วิธีไฮบริ CCC + คันสำหรับการบีบอัดความสัมพันธ์เป็นที่สุดหยุ่น โดยเฉพาะอย่างยิ่งในกรณีที่อัตราส่วนการอัดปานกลางตอนนี้เรามอง efficiency สกัดความสัมพันธ์ของวิธีด้านบน k ของเราใช้สังเคราะห์ชุดข้อมูลเดียวกัน เราใช้ในการประเมินวิธีการเส้นฐาน เราคำนวณรายการของความสัมพันธ์สูง (นาที l = 0.5) สำหรับแต่ละช่วงเวลา fixed ด้านบน 20-50 K-k ที่ประกอบด้วยค่าจาก (disjoint) 15 M และ 40 M (รวม) กลุ่มคู่ และบีบอัดโดยใช้วิธีไฮบริ CCC + TCC ด้วยพารามิเตอร์ที่เหมาะสำหรับขนาด specific k บนคลัสเตอร์ เราแตกต่างกันบน k ขนาด 4 16 4 กิโลไบต์ดิสก์หน้า (แต่ละหน้าสามารถเก็บความสัมพันธ์หรือคลัสเตอร์ระยะทางถึง 800) รูปที่ 9 แสดงว่า ความสัมพันธ์ด้าน k คำนวณสำหรับ fixed windows รายการ sufficient จำเป็นต้องตรงกับความแม่นยำของวิธีการแบบเดิม การตรวจสอบรายละเอียดเพิ่มเติมแสดงว่า ลดลงในความถูกต้องสำหรับขนาดเล็กยอดนิยม-k ขนาดเกิดส่วนใหญ่ โดยการลดการเรียกคืน เนื่องจากความสามารถในของด้านบน-k พอทั้งความสูงความสัมพันธ์ ซึ่งชุดข้อมูลสังเคราะห์ของเราส่วนใหญ่ประกอบด้วย
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
5.3.2 Top-K วิธีการความสัมพันธ์
เราจะประเมินผลการดำเนินงานของแต่ละ บริษัท ทีซีซีและ CCC โดยการวัดผิดพลาดการบีบอัดเฉลี่ยของพวกเขาและความแปรปรวนในขณะที่ขนาดแตกต่างกันด้านบน-K 1-10 เท่าของความยาวแรกของพวกเขา เพื่อสร้างรายการ Top-K เราคำนวณความสัมพันธ์มากกว่าคู่เคลื่อนของโหนดประชากรสำหรับช่วงเวลาที่คงที่ (มีค่าเฉลี่ยท้องถิ่น) นำมาจาก 17 หัวข้อที่แตกต่างใน MovieLens จากนั้นเรา fi ltered ความสัมพันธ์ตามนัยมีนัยสำคัญและเกณฑ์ความสัมพันธ์ขั้นต่ำที่ได้รับรายชื่อของ (โดยประมาณ) 12 K สูง (L> 0.50) และ 2 K สูงมาก (L> 0.75) ด้านบน-K ความสัมพันธ์สำหรับการตั้งค่าเริ่มต้น 140 K คู่เคลื่อน.
ข้อผิดพลาดการบีบอัดคำนวณเป็นรากคลาดเคลื่อนกำลังสองเฉลี่ย (RMSE) ระหว่างความสัมพันธ์ที่เกิดขึ้นจริงและผู้ที่ดึงมาตามขั้นตอนวิธีการ 5. เราทราบว่ามีการบีบอัดที่ดีที่สุด (ที่มีข้อผิดพลาดน้อยที่สุด) สำหรับวิธีการจัดกลุ่ม CCC บางครั้งก็ประสบความสำเร็จกับขนาด, มีขนาดเล็กกว่าที่จำเป็นต้องใช้โดยพารามิเตอร์อัตราส่วนการอัด ในกรณีเช่นพื้นที่ที่เหลือถูก Fi lled กับความสัมพันธ์ไม่มีคลัสเตอร์สูงสุด.
ในรูปที่ 8 เรานำเสนอผลการประเมินของเรา เราสังเกตว่าการบีบอัด TCC สมการแสดงให้เห็นถึงประสิทธิภาพการทำงานที่ดีขึ้นเมื่อมันสามารถไปยัง FI T ทุกความสัมพันธ์สูงที่จำเป็นสำหรับการอธิบายส่วนที่เหลือของความสัมพันธ์ที่สิ่งที่เกิดขึ้นในกรณีของการเริ่มต้นรายการด้านบน K ขนาดใหญ่ (L> 0.50) ในกรณีที่ความสัมพันธ์ทั้งหมดสูง (L> 0.75) และมีอัตราส่วนการอัดสูงมีเป็นส่วนใหญ่ของความสัมพันธ์ที่ไม่ fi T เข้ามาบีบอัดรายการด้านบน-K และไม่สามารถดักจากความสัมพันธ์ที่มีอยู่ใน รายการ. ข้อผิดพลาดในกรณีนี้เป็นที่สูงที่สุด บนมืออื่น ๆ , การจัดกลุ่มการบีบอัด CCC TS Bene Fi จากการบีบอัดความสัมพันธ์ที่สูงขึ้นเร็วที่สุดเท่าที่มีพื้นที่เพียงพอในด้านบน-K ในการจัดเก็บในจำนวนที่เหมาะสมของกลุ่ม ในกรณีนี้ส่วนใหญ่ของความสัมพันธ์สูงปรากฏภายในกลุ่มและปริมาณของความสัมพันธ์ที่ไม่ได้ห้วงระยะทางคลัสเตอร์คลัสเตอร์จะกลายเป็นที่ค่อนข้างเล็ก อย่างไรก็ตาม CCC สามารถมาในประสิทธิภาพ Fi EF เนื่องจากค่าใช้จ่ายในการจัดกลุ่มข้อมูลถ้ามีหลายห่างกลุ่มเล็ก ๆ จาก 3 รายการ ตั้งแต่วิธีการทีซีซีสามารถที่จะใกล้เคียงกับความสัมพันธ์ที่สามโดยใช้ส่วนที่เหลืออีกสองคนก็สามารถเป็นเพื่อนที่ดีในกรณีดังกล่าว เราขอแนะนำให้ใช้ไฮบริด CCC + วิธีทีซีซีสำหรับการบีบอัดความสัมพันธ์เป็นส่วนใหญ่ในระดับสากลที่บังคับใช้โดยเฉพาะอย่างยิ่งในกรณีของอัตราส่วนการอัดปานกลาง.
ตอนนี้เรามองไปที่ ciency Fi EF ของการสกัดความสัมพันธ์ของวิธีการด้านบน-K ของเราโดยใช้ชุดข้อมูลที่สังเคราะห์เดียวกันเราใช้ ในการประเมินวิธีเส้นฐาน เราคำนวณรายชื่อของความสัมพันธ์สูง (L นาที = 0.5) สำหรับแต่ละคงที่ช่วงเวลาที่มีค่า 20-50K ด้านบน-K จาก 15 เมตร (ไม่เป็นสมาชิกร่วม) และ 40M (รวม) คู่กลุ่มและบีบอัดพวกเขาโดยใช้ CCC ไฮบริด + วิธีทีซีซีที่มีพารามิเตอร์การจัดกลุ่มเป็นรายบุคคลที่ดีที่สุดสำหรับ Fi C ขนาดด้านบน-K speci เราแตกต่างกันขนาดด้านบน-K 4-16 สี่กิโลไบต์หน้าดิสก์ (แต่ละหน้าสามารถถือได้ถึง 800 ความสัมพันธ์หรือระยะทางที่คลัสเตอร์) รูปที่ 9 แสดงให้เห็นว่ามีการ SUF Fi รายการประสิทธิภาพของความสัมพันธ์ด้านบน-K คำนวณคงที่หน้าต่างก็เป็นไปได้เพื่อให้ตรงกับความถูกต้องของวิธีการแบบเดิม การตรวจสอบรายละเอียดเพิ่มเติมได้แสดงให้เห็นว่าการลดลงของความถูกต้องมีขนาดเล็กกว่าด้านบน-K เป็นส่วนใหญ่เกิดจากการเรียกคืนลดลงเนื่องจากในความสามารถของด้านบน-K ไปยัง FI T ทุกความสัมพันธ์สูงซึ่งชุดข้อมูลที่สังเคราะห์ของเราส่วนใหญ่ประกอบด้วย
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
5.3.2 เป็น top-k วิธีสหสัมพันธ์เราประเมินผลการดำเนินงานของแต่ละโครงการและ CCC โดยการวัดการบีบอัดและความแปรปรวนของความคลาดเคลื่อนเฉลี่ยในขณะที่การ top-k ขนาดจาก 1 ถึง 10 เท่าของความยาวเริ่มต้นของพวกเขา สร้างรายการ top-k เราคำนวณความสัมพันธ์มากกว่ายู่คู่โหนดสถิติจึง xed ช่วงเวลา ( กับค่าเฉลี่ยท้องถิ่น ) ถ่ายจาก 17 หัวข้อที่แตกต่างกันใน movielens . แล้ว เราจึง ltered ความสัมพันธ์ไปตาม signi จึงแคนส์และเกณฑ์ความสัมพันธ์น้อยที่สุด ได้รับรายชื่อ ( โดยประมาณ ) 12 K สูง ( L > 0.50 ) 2 K สูงมาก ( ผม > 0.75 ) top-k ความสัมพันธ์สำหรับชุดเริ่มต้นของ 140 K ยู่คู่ข้อผิดพลาดการบีบอัดจะคำนวณเป็นค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง ( RMSE ) ของรากระหว่างความสัมพันธ์ที่แท้จริงและผู้ที่เรียกตามวิธีที่ 5 เราทราบว่ามีการบีบอัดที่เหมาะสม ( กับข้อผิดพลาดน้อยที่สุด ) วิธีการได้รับการจัดกลุ่ม CCC บางครั้งที่มีขนาด เล็กกว่าที่บังคับใช้โดยอัตราส่วนการอัดพารามิเตอร์ ในบางกรณีพื้นที่ที่เหลืออยู่จึงไม่สะสมกับสูงสุดแบบสหสัมพันธ์ในรูปที่ 8 เรานำเสนอผลการประเมินของเรา เราสังเกตว่า ทีซีซี สามเหลี่ยมอัดแสดงประสิทธิภาพดีกว่าเมื่อมันสามารถจึงไม่สูงทั้งหมดที่จำเป็นสำหรับการพักความสัมพันธ์ความสัมพันธ์ สิ่งที่เกิดขึ้นในกรณีของขนาดใหญ่เริ่มต้นรายการด้านบน K ( L > 0.50 ) ในกรณีเมื่อความสัมพันธ์สูง ( L > 0.75 ) และมีอัตราส่วนการอัดสูง มันเป็นส่วนใหญ่ของความสัมพันธ์ที่ไม่จึงไม่เข้าไป top-k อัดรายการและไม่สามารถตรวจพบจากความสัมพันธ์ที่มีอยู่ในรายการ ข้อผิดพลาดในกรณีนี้มากที่สุด บนมืออื่น ๆ , CCC การจัดกลุ่มการบีบอัดดีจึงใช้ความสัมพันธ์จากการบีบอัดที่สูงขึ้นทันทีที่มีพื้นที่เพียงพอในการจัดเก็บ top-k จำนวนสูงสุดของกลุ่ม ในกรณีนี้มากที่สุดของความสัมพันธ์สูงปรากฏภายในกลุ่มและจำนวนของความสัมพันธ์ที่ไม่โดยประมาณ โดยระยะทางกลุ่มคลัสเตอร์จะค่อนข้างเล็ก อย่างไรก็ตาม , CCC สามารถมาในหลักสูตรจึง cient เนื่องจากสามารถค่าใช้จ่ายข้อมูลหากมีหลายกลุ่มที่อยู่เล็ก ๆ 3 รายการ เนื่องจากวิธีการพัฒนาสามารถประมาณโดยใช้ความสัมพันธ์ที่สาม เหลืออีกสอง มันเป็นสหายที่ดีในกรณีดังกล่าว เราขอแนะนำให้ใช้วิธีบีบอัดแบบ CCC + พัฒนาความสัมพันธ์มากที่สุด สามารถใช้ได้ โดยเฉพาะอย่างยิ่งในกรณีของอัตราส่วนการบีบอัดอยู่ตอนนี้เราดูถ่ายทอดประสิทธิภาพของการสกัดของ EF ) วิธี top-k ของเราโดยใช้ข้อมูลสังเคราะห์เหมือนกัน เราเคยประเมินพื้นฐานวิธีการ เราคำนวณรายการความสัมพันธ์สูง ( L min = 0.5 ) แต่ละแห่งจึง xed ช่วงเวลาที่มีค่าออก 20-50k top-k 15 เมตร ( ไม่ต่อเนื่อง ) และ 40 ( รวม ) กลุ่มคู่และบีบอัดพวกเขาใช้ไฮบริด CCC + TCC ด้วยวิธีจัดกลุ่มแบบพารามิเตอร์ที่ดีที่สุดสำหรับกาจึง top-k C ขนาด เรา top-k หลากหลายขนาดจาก 4 ถึง 16 สี่กิโลไบต์ดิสก์ หน้าแต่ละหน้าสามารถถือได้ถึง 800 ความสัมพันธ์หรือระยะทางคลัสเตอร์ ) รูปที่ 9 แสดงให้เห็นว่ากับซุฟจึง cient รายชื่อ top-k สหสัมพันธ์ที่คำนวณสำหรับจึง xed Windows , มันเป็นไปได้เพื่อให้ตรงกับความถูกต้องของวิธีการแบบเดิม การตรวจสอบรายละเอียดเพิ่มเติม พบว่า ลดลง ในความถูกต้อง สำหรับขนาด top-k ขนาดเล็กมีสาเหตุส่วนใหญ่จากการเรียกคืน เนื่องจากมีความสามารถในการถ่ายทอด top-k T ทั้งหมดสูงความสัมพันธ์ซึ่งข้อมูลสังเคราะห์ของเราประกอบด้วยส่วนใหญ่ของ
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: