While this is not a very effective

While this is not a very effective or efficient
method of classification, it proved adequate for
creating document classes (subsets of documents in
a corpus) matching an information need expressed
using Boolean operators as the Boolean model merely
views a document as a set of words; A document
class matching an information need is formed using
Boolean operators – AND, OR, NOT. However, the
limitations of such an approach to classification
were realised quite early and refinements followed.
Let us consider a realistic situation of a corpus
of 100000 documents requiring classification to
support retrieval. If each document, on an average,
is 1000 words long and there are 100000 unique
words in the corpus, the term-document matrix will
have 10 billion ‘0s’ and ‘1s’; the ‘1s’ will probably
be less than 10 % of this with over 90 % of the
cells in the matrix being ‘0s’; A more efficient
approach is to record only the ‘1s’ which is what
an inverted file or back of the book index (with
terms arranged alphabetically) does, a classificatory
approach extensively used in today’s database
management systems. This still left unsolved the
problem of ‘dodging’ irrelevant documents, a problem
frequently faced while using Web search engines.
The problems could be traced to:

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ในขณะนี้ไม่ได้เป็นวิธีที่มีประสิทธิภาพมากหรือมีประสิทธิภาพในการจำแนกประเภท
มันได้รับการพิสูจน์ที่เพียงพอสำหรับการสร้างการเรียน
เอกสาร (ส่วนย่อยของเอกสารในคลัง
) ที่ตรงกับข้อมูลที่จำเป็นต้องแสดงความ
ใช้ประกอบการบูลีนเป็นรูปแบบบูลีนเพียง
มุมมองเอกสารเป็น ชุดของคำ; เอกสารที่ตรงกับความต้องการ
ข้อมูลชั้นมีรูปแบบการใช้ประกอบการบูลีน
- และหรือไม่ แต่
ข้อ จำกัด ของวิธีการดังกล่าวจะจัดหมวดหมู่
ได้ตระหนักถึงค่อนข้างเร็วและการปรับแต่งตาม.
ให้เราพิจารณาสถานการณ์ที่เป็นจริงของร่างกายของ
100000 เอกสารที่ต้องใช้ในการจัดหมวดหมู่
ดึงการสนับสนุน ถ้าเอกสารแต่ละเฉลี่ย
1000 คำยาวและมี 100000
คำที่ไม่ซ้ำกันในคอร์ปัส, เมทริกซ์ระยะเอกสารจะ
มี 10 พันล้าน '0 s 'และ '1 s';'1 s '
อาจจะน้อยกว่า 10% ของผู้ที่มีกว่า 90% ของ
เซลล์ในเมทริกซ์เป็น '0 s'; มีประสิทธิภาพมากขึ้น
วิธีการคือการบันทึกเพียง '1 s 'ซึ่งเป็นสิ่งที่
ไฟล์คว่ำ หรือด้านหลังของดัชนีหนังสือ (ที่มี
แง่การจัดลำดับตัวอักษร) ไม่ classificatory
วิธีการใช้อย่างกว้างขวางในวันนี้ฐานข้อมูล
ระบบการจัดการ นี้ยังเหลือปริศนา
ปัญหาของ 'หลบ' เอกสารที่ไม่เกี่ยวข้องกับปัญหาที่ต้องเผชิญ
บ่อยครั้งในขณะที่ใช้เครื่องมือค้นหาเว็บ
ปัญหาที่อาจจะโยงไปถึง.

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ขณะนี้ไม่มีประสิทธิภาพมาก หรือมีประสิทธิภาพ
วิธีการจัดประเภท มันพิสูจน์เพียงพอสำหรับ
สร้างคลาสเอกสาร (ชุดย่อยของเอกสารใน
เป็นคอร์พัสคริ) ต้องการข้อมูลที่แสดงการจับคู่
ใช้ตัวดำเนินการแบบบูลีนเป็นแบบ Boolean เพียง
มุมมองเอกสารเป็นชุดของคำ เอกสาร
ระดับที่ตรงกับความต้องการข้อมูลมีรูปแบบการใช้
บูตัว – AND, OR, NOT อย่างไรก็ตาม การ
ข้อจำกัดของวิธีการดังกล่าวเพื่อจัดประเภท
เองก็ยังถูกคิดเชพ และ refinements ตาม.
ให้เราพิจารณาสถานการณ์ที่เป็นจริงของเป็นคอร์พัสคริ
100000 เอกสารต้องการประเภท
สนับสนุนเรียก ถ้าแต่ละเอกสาร โดยเฉลี่ย,
เป็น 1000 คำยาว และมีเป็น 100000 เฉพาะ
คำในคอร์พัสคริ เมทริกซ์เงื่อนไขเอกสารจะ
0 พันล้าน ' s 'และ ' 1s'; '1s' จะคง
จะน้อยกว่า 10% นี้กว่า 90% ของการ
เซลล์ในเมตริกซ์การ 0 ' s ' ; มีประสิทธิภาพมากขึ้น
วิธีคือบันทึกเฉพาะ ' 1s' ซึ่งเป็น
แฟ้มกลับการกลับของดัชนี (กับ
เงื่อนไขจัดเรียงตามตัวอักษร) ไม่ เป็น classificatory
วิธีใช้อย่างกว้างขวางในปัจจุบันฐานข้อมูล
ระบบการจัดการ นี้มากยังคงเหลือการ
ปัญหาของ 'dodging' เกี่ยวข้องกับเอกสาร ปัญหา
มักประสบในขณะที่ใช้เครื่องมือค้นหาเว็บได้
สามารถติดตามปัญหาเพื่อ:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ในขณะที่โรงแรมแห่งนี้ไม่ได้เป็นอย่างมากมีผลใช้บังคับหรือมี ประสิทธิภาพ วิธีการ
ซึ่งจะช่วยในการแบ่ง ประเภท ,มันพิสูจน์แล้วว่ามีเพียงพอสำหรับ
ซึ่งจะช่วยการสร้างเอกสารชั้นเรียน(ส่วนย่อยของเอกสารใน
ที่สําคัญ)ที่ตรงกันที่ต้องการแสดงออก
ซึ่งจะช่วยโดยใช้ตัวปฏิบัติการ Boolean ที่ตัวปฏิบัติการ Boolean รุ่นเพียง
วิวทิวทัศน์ที่เอกสารเป็นที่ตั้งของคำ;เอกสาร
Class ที่ตรงกันที่ต้องการจะใช้
ตัวปฏิบัติการ Boolean - และ,หรือไม่. แต่ถึงอย่างไรก็ตามที่
ตามมาตรฐานข้อจำกัดของการเข้าถึงเช่นการจัด ประเภท
นั้นเป็นความจริงมากช่วงต้นและความละเอียดปราณีตตามด้วย.
ปล่อยให้เราพิจารณาถึงสถานการณ์ที่ดูสมจริงของที่สําคัญ
ของ 100000 เอกสารต้องใช้การแบ่ง ประเภท การกู้คืน
ซึ่งจะช่วยให้การสนับสนุน หากเอกสารแต่ละโดยเฉลี่ยแล้ว
คือ 1000 คำมานานและมี 100000 ที่โดดเด่น
คำใน corpus ตารางคำ - เอกสารจะ
มี' 10 ล้าน' 0 'และ 1 S '' 1 S 'จะเป็นไปได้ว่า
ซึ่งจะช่วยจะต้องไม่น้อยกว่า 10% ของโรงแรมแห่งนี้พร้อมด้วยพื้นที่มากกว่า 90% ของ
ซึ่งจะช่วยให้เซลล์ในตารางเป็น' 0 S ';ที่มี ประสิทธิภาพ มากขึ้น
ซึ่งจะช่วยแนวทางคือการบันทึกอย่างเดียว' 1 S 'ซึ่งเป็นสิ่งที่
ซึ่งจะช่วยให้ติดตั้งแบบกลับด้านหรือไฟล์กลับมาของหนังสือดัชนี(พร้อมด้วย
ข้อกำหนดตามลำดับตัวอักษร)ไม่ให้ที่ classificatory
การใช้อย่างแพร่หลายในวันนี้ของฐานข้อมูล
ซึ่งจะช่วยการบริหารจัดการระบบ. โรงแรมแห่งนี้ยังคงเหลือที่ยังคาราคาซัง
ปัญหาของ'เอกสารไม่เกี่ยวข้อง'วิ่งหลบปัญหา
ซึ่งจะช่วยที่ต้องเผชิญกับการค้นหาในขณะที่การใช้เว็บ engines.problems
ที่สามารถตรวจสอบได้ใน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.