We use a “stripes” approach. Each t

We use a “stripes” approach. Each term and its associated pairs are stored in a hashmap H, and the whole is H considered as a value emitted together with the term,which is the key. In contrast, Fan et al.
take an alternative approach and directly emit each term and each cooccurrence term pair.
Obviously, our approach generates much fewer intermediate key-value pairs compared to Fan’s approach. For example, if a document contains ¬m unique terms, our approach generates O(m) number of pairs, while Fan’s approach produces O(m2) pairs.
Since the intermediate outputs produced by the Map ( ) method are sorted locally in order for grouping key-value pairs sharing the same key, in our approach the MapReduce execution framework performs less sorting and thus be more efficient.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เราใช้วิธี "ลาย" แต่ละคำและคู่ความที่เกี่ยวข้องจะเก็บใน hashmap H และทั้งหมดคือ H เป็นค่าออกมาพร้อมกับระยะ ซึ่งเป็นสิ่งสำคัญ ในทางตรงกันข้าม พัดลม et al ใช้วิธีการอื่น และปล่อยแต่ละคำและแต่ละคู่ระยะ cooccurrence โดยตรง อย่างชัดเจน วิธีการของเราสร้างน้อยลงมากปานกลางค่าคีย์คู่เปรียบเทียบกับวิธีการของ ตัวอย่าง ถ้าเอกสารประกอบด้วยเงื่อนไขเฉพาะ ¬m วิธีการของเราสร้าง O(m) จำนวนคู่ ในขณะที่วิธีการของสร้างคู่ O(m2) ด้วย เนื่องจากแสดงผลกลางที่ผลิต โดยวิธี()แผนที่เรียงภายในใบสั่งสำหรับการจัดกลุ่มคู่ค่าคีย์ที่ใช้คีย์เดียวกัน ในวิธีของเรา กรอบดำเนินการ MapReduce ทำน้อยกว่าการเรียงลำดับ แล้วจึง จะมีประสิทธิภาพมากขึ้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เราใช้ "ลายเส้น" วิธีการ แต่ละคำและคู่ที่เกี่ยวข้องถูกเก็บไว้ใน H HashMap และทั้งหมดจะถูก H ถือว่าเป็นค่าที่ปล่อยออกมาพร้อมกับคำว่าซึ่งเป็นกุญแจสำคัญ ในทางตรงกันข้าม, พัดลม et al.
ใช้วิธีการทางเลือกและปล่อยโดยตรงในแต่ละระยะและแต่ละคู่ระยะ cooccurrence.
เห็นได้ชัดว่าวิธีการของเราสร้างมากน้อยคู่ค่าคีย์กลางเมื่อเทียบกับวิธีการของแฟนคลับของ ตัวอย่างเช่นถ้าเอกสารมี¬mแง่ที่ไม่ซ้ำกันวิธีการของเราสร้าง O (เมตร) จำนวนคู่ในขณะที่วิธีการของแฟนคลับของผลิต O (m2) คู่.
เนื่องจากผลกลางที่ผลิตโดยแผนที่ () วิธีการจะถูกจัดเรียงในประเทศเพื่อให้ การจัดกลุ่มคู่ค่าคีย์ร่วมกันที่สำคัญเหมือนกันในแนวทางของเรากรอบการดำเนินการดำเนินการเรียงลำดับ MapReduce น้อยลงและทำให้มีประสิทธิภาพมากขึ้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เราใช้วิธีการ " ลายเส้น " ในแต่ละเทอมและคู่ที่เกี่ยวข้องจะถูกเก็บไว้ในตารางแฮช H และ H ทั้งหมดถือว่าเป็นค่าออกมาพร้อมกับระยะยาว ซึ่งเป็นกุญแจสำคัญ ในทางตรงกันข้าม , พัดลม et al .
เอาแบบโดยตรงและปล่อยในแต่ละเทอม แต่ละเทอม cooccurrence คู่
แน่นอนวิธีการสร้างมากน้อยระดับกลางค่าคีย์คู่เปรียบเทียบกับวิธีการของแฟนคลับ . ตัวอย่างเช่น ถ้าเอกสารมี¬ M เฉพาะ เงื่อนไข วิธีการของเราสร้าง O ( M ) หลายคู่ ในขณะที่วิธีการผลิตพัดลม o ( m2 ) คู่
ตั้งแต่กลางผลผลิตที่ผลิตโดยแผนที่ ( ) วิธีการเรียงไว้ภายใน เพื่อจัดกลุ่มค่าคีย์คู่ใช้คีย์เดียวกันในแนวทางของเรา mapreduce กรอบมีประสิทธิภาพน้อยกว่าการคัดแยกและจึงจะมีประสิทธิภาพมากขึ้น .

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.