Reuters-RCV1 has 100million tokens.

Reuters-RCV1 has 100million tokens. Collecting all termID–docIDpairs of
the collection using 4 bytes each for termID and docID therefore requires 0.8
GB of storage. Typical collections today are often one or two orders of magnitude
larger than Reuters-RCV1. You can easily see how such collections
overwhelm even large computers if we try to sort their termID–docID pairs
in memory. If the size of the intermediate files during index construction is
within a small factor of available memory, then the compression techniques
introduced in Chapter 5 can help; however, the postings file of many large
collections cannot fit into memory even after compression.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

Reuters-RCV1 has 100million tokens. Collecting all termID–docIDpairs ofthe collection using 4 bytes each for termID and docID therefore requires 0.8GB of storage. Typical collections today are often one or two orders of magnitudelarger than Reuters-RCV1. You can easily see how such collectionsoverwhelm even large computers if we try to sort their termID–docID pairsin memory. If the size of the intermediate files during index construction iswithin a small factor of available memory, then the compression techniquesintroduced in Chapter 5 can help; however, the postings file of many largecollections cannot fit into memory even after compression.

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

สำนักข่าวรอยเตอร์-RCV1 มี 100million สัญญาณ เก็บรวบรวมทั้งหมด termID-docIDpairs ของ
คอลเลกชันโดยใช้ 4 ไบต์แต่ละ termID และ docid จึงต้อง 0.8
GB ของการจัดเก็บ คอลเลกชันทั่วไปในวันนี้มักจะมีหนึ่งหรือสองคำสั่งของขนาด
ใหญ่กว่ารอยเตอร์-RCV1 คุณสามารถดูว่าคอลเลกชันดังกล่าว
ครอบงำคอมพิวเตอร์ขนาดใหญ่แม้ว่าเราจะพยายามที่จะจัดเรียงคู่ termID-docid ของพวกเขา
ในความทรงจำ ถ้าขนาดของไฟล์กลางในระหว่างการก่อสร้างดัชนีอยู่
ภายในเป็นปัจจัยเล็ก ๆ ของหน่วยความจำที่มีอยู่แล้วเทคนิคการบีบอัด
ที่รู้จักในบทที่ 5 สามารถช่วย; แต่การโพสต์ของไฟล์ที่มีขนาดใหญ่หลาย
คอลเลกชันไม่สามารถใส่ลงในหน่วยความจำแม้หลังจากการบีบอัด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

reuters-rcv1 มี 100million สัญญาณ การเก็บรวบรวมทั้งหมดของ termid – docidpairs
คอลเลกชันโดยใช้ 4 ไบต์แต่ละสำหรับและดังนั้นจึงต้องมี termid docid 0.8
GB ของการจัดเก็บ คอลเลกชันทั่วไปวันนี้มักจะเป็นอันดับของขนาด
ขนาดใหญ่กว่า reuters-rcv1 หนึ่งหรือสอง คุณสามารถดูคอลเลกชัน
ต่อคอมพิวเตอร์ขนาดใหญ่ เช่น ถ้าเราพยายามที่จะจัดเรียงของพวกเขา termid – docid คู่
ในหน่วยความจำถ้าขนาดของไฟล์ขั้นกลางระหว่างการก่อสร้างดัชนี
ภายในปัจจัยเล็ก ๆของหน่วยความจำแล้วอัดเทคนิค
แนะนำในบทที่ 5 ช่วย อย่างไรก็ตาม แฟ้มของคอลเลกชันที่มีขนาดใหญ่มากไม่สามารถโพสต์
พอดีความทรงจำแม้หลังจากการบีบอัด

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.