4.3 Example of VSM applicationThe e

4.3 Example of VSM application
The example will consider four documents, and one query.
During the indexing, all the terms were extracted from the documents to create representation of each of the document. In the process an Inverse Document Frequency vector has to be generated. To generate IDF vector the indexer first has to create Document Frequency vector (DF) that for every term counts the number of documents that contains the term. Subsequently, the total number of documents is divided by the number of document that contains a specific term, and the logarithm of that value is stored in the Inverse Document Frequency vector (IDF) for that term.
All generated vectors should be normalized to eliminate the advantage given to the longer documents, as even if a term is repeated multiple times in longer documents, it should not be considered relevant to that document if it is flooded by other terms. The normalization of a vector is simply a process of dividing weights of each term stored in that vector by the length of that vector.
After the indexing process is completed the system is ready to generate responses to queries. In order to retrieve the search results for a specific query, a similarity between the user query and each of the documents has to be calculated.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.3 Example of VSM applicationThe example will consider four documents, and one query.During the indexing, all the terms were extracted from the documents to create representation of each of the document. In the process an Inverse Document Frequency vector has to be generated. To generate IDF vector the indexer first has to create Document Frequency vector (DF) that for every term counts the number of documents that contains the term. Subsequently, the total number of documents is divided by the number of document that contains a specific term, and the logarithm of that value is stored in the Inverse Document Frequency vector (IDF) for that term.All generated vectors should be normalized to eliminate the advantage given to the longer documents, as even if a term is repeated multiple times in longer documents, it should not be considered relevant to that document if it is flooded by other terms. The normalization of a vector is simply a process of dividing weights of each term stored in that vector by the length of that vector.After the indexing process is completed the system is ready to generate responses to queries. In order to retrieve the search results for a specific query, a similarity between the user query and each of the documents has to be calculated.

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.3 ตัวอย่างของการประยุกต์ใช้ VSM
ตัวอย่างจะพิจารณาเอกสารสี่และหนึ่งแบบสอบถาม.
ในระหว่างการจัดทำดัชนีเงื่อนไขทั้งหมดถูกสกัดจากเอกสารในการสร้างตัวแทนของแต่ละเอกสาร ในกระบวนการเอกสารผกผันเวกเตอร์ความถี่จะต้องมีการสร้าง เพื่อสร้าง IDF เวกเตอร์ทำดัชนีครั้งแรกที่มีการสร้างเอกสารความถี่เวกเตอร์ (DF) ที่ระยะทุกนับจำนวนเอกสารที่มีคำว่า ต่อมาจำนวนของเอกสารที่จะแบ่งตามจำนวนของเอกสารที่มีคำเฉพาะและลอการิทึมของค่าที่ถูกเก็บไว้ในความถี่เอกสารผกผันเวกเตอร์ (IDF) ระยะที่.
เวกเตอร์ที่สร้างทั้งหมดควรจะปกติที่จะกำจัด ประโยชน์ที่จะได้รับเอกสารอีกต่อไปในขณะที่แม้ว่าระยะซ้ำแล้วซ้ำอีกหลายครั้งในเอกสารอีกต่อไปก็ไม่ควรได้รับการพิจารณาที่เกี่ยวข้องกับเอกสารที่หากมีน้ำท่วมโดยเงื่อนไขอื่น ๆ ฟื้นฟูเวกเตอร์เป็นเพียงกระบวนการของการแบ่งน้ำหนักของแต่ละระยะที่เก็บไว้ในเวกเตอร์ที่โดยความยาวของเวกเตอร์ที่เป็น.
หลังจากขั้นตอนการจัดทำดัชนีเสร็จสมบูรณ์ระบบพร้อมที่จะสร้างการตอบสนองต่อคำสั่ง เพื่อดึงผลการค้นหาสำหรับแบบสอบถามเฉพาะความคล้ายคลึงกันระหว่างผู้ใช้และแบบสอบถามแต่ละเอกสารที่จะต้องมีการคำนวณ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

4.3 ตัวอย่างของ vsm โปรแกรม
ตัวอย่างจะพิจารณาเอกสาร 4 ฉบับ และแบบสอบถาม
ช่วงดัชนี เงื่อนไขทั้งหมดถูกสกัดจากเอกสารที่จะสร้างการแสดงของแต่ละเอกสาร ในกระบวนการเวกเตอร์ความถี่เอกสารผกผันได้ถูกสร้างขึ้นเพื่อสร้างดัชนีแรก IDF เวกเตอร์การสร้างเวกเตอร์ความถี่เอกสาร ( DF ) ที่ทุกระยะนับจํานวนเอกสารที่มีระยะ ต่อมาจำนวนของเอกสารจะแบ่งตามหมายเลขของเอกสารที่ประกอบด้วยระยะเวลาและค่าลอการิทึมของค่าที่ถูกเก็บไว้ในความถี่เอกสารผกผันเวกเตอร์ ( IDF ) สำหรับระยะที่ .
เวกเตอร์ที่สร้างขึ้นทั้งหมดควรจะปกติเพื่อขจัดความได้เปรียบให้กับเอกสารอีกต่อไป เป็นถึงระยะเป็นซ้ำหลายครั้งในเอกสารที่ยาว มันไม่ควรพิจารณาที่เกี่ยวข้องกับเอกสารนั้น ถ้ามันท่วม โดยเงื่อนไขอื่น ๆ บรรทัดฐานของเวกเตอร์เป็นเพียงกระบวนการของการแบ่งน้ำหนักของแต่ละเทอมเก็บไว้ในเวกเตอร์ โดยความยาวของเวกเตอร์
หลังจากขั้นตอนการทำดัชนีเสร็จสมบูรณ์ระบบพร้อมที่จะสร้างการตอบสนองการสอบถาม เพื่อเรียกดูผลการค้นหาสำหรับการค้นหาที่เฉพาะเจาะจง ความคล้ายคลึงกันระหว่างผู้ใช้ระบบแต่ละเอกสารต้องคํานวณ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.