5.1 Probabilistic Information Retri

5.1 Probabilistic Information Retrieval principles
The results retrieved by probabilistic information retrieval systems depend on estimations and probabilities. The first assumption is that terms are dispersed differently between relevant and non-relevant documents [3]. A PIR system ranks documents and sorts them in decreasing order of probability of relevance to the information need once the probability is calculated [3]. The results are as accurate as the calculated probability [9].
The classic probabilistic model returns documents in decreasing order of calculated probability of relevance to the information requirement. After the indexing process every term can have assigned a value that indicates the probability that a document containing this term is relevant to the concept described by the term. In the retrieval phase the documents have calculated a value which is the sum of probabilities from terms that exists in both a document and in the query. The documents are then retrieved in order according to this value (descending). The document representation for this version of Probabilistic Information Retrieval could be the same as in the Boolean model as it only need to store information if either document contains a term or not [9].
Similarly to the Inverse Document Vector in the VSM model, a vector has to be created that stores information about how important each term is. If ‘p’ is the probability that a document which contains a term and it is relevant to the query and ‘q’ is probability that the document contains the term but it is not relevant, then the weight of the term is calculated as:

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

5.1 Probabilistic Information Retrieval principlesThe results retrieved by probabilistic information retrieval systems depend on estimations and probabilities. The first assumption is that terms are dispersed differently between relevant and non-relevant documents [3]. A PIR system ranks documents and sorts them in decreasing order of probability of relevance to the information need once the probability is calculated [3]. The results are as accurate as the calculated probability [9].The classic probabilistic model returns documents in decreasing order of calculated probability of relevance to the information requirement. After the indexing process every term can have assigned a value that indicates the probability that a document containing this term is relevant to the concept described by the term. In the retrieval phase the documents have calculated a value which is the sum of probabilities from terms that exists in both a document and in the query. The documents are then retrieved in order according to this value (descending). The document representation for this version of Probabilistic Information Retrieval could be the same as in the Boolean model as it only need to store information if either document contains a term or not [9].ในทำนองเดียวกัน กับเวกเตอร์เอกสารผกผันในรุ่น VSM เวกเตอร์ได้สร้างที่เก็บข้อมูลเกี่ยวกับแต่ละคำมีความสำคัญ ถ้า 'p' คือ ความเป็นไปได้ว่า เอกสารที่ประกอบด้วยคำและจะเกี่ยวข้องกับการสอบถาม และ 'q' ความน่าเป็นเอกสารประกอบด้วยคำว่า แต่ไม่เกี่ยวข้อง แล้วน้ำหนักของคำถูกคำนวณเป็น:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

5.1
น่าจะดึงข้อมูลหลักการผลที่เรียกโดยระบบการดึงข้อมูลที่น่าจะขึ้นอยู่กับการประมาณการและความน่าจะเป็น สมมติฐานแรกคือคำที่มีการกระจายที่แตกต่างกันระหว่างเอกสารที่เกี่ยวข้องและไม่เกี่ยวข้อง [3] ระบบ PIR อันดับเอกสารและจัดเรียงไว้ในลำดับที่ลดลงน่าจะเป็นของความเกี่ยวข้องกับข้อมูลที่จำเป็นต้องน่าจะเป็นครั้งเดียวที่มีการคำนวณ [3] ผลลัพธ์ที่ได้จะเป็นที่ถูกต้องน่าจะคำนวณ [9].
รูปแบบคลาสสิกน่าจะแสดงเอกสารในการสั่งซื้อที่ลดลงของความน่าจะคำนวณความเกี่ยวข้องกับข้อมูลที่ต้องการ หลังจากขั้นตอนการจัดทำดัชนีในระยะทุกคนสามารถกำหนดค่าที่บ่งชี้ว่าน่าจะเป็นที่เอกสารที่มีคำนี้มีความเกี่ยวข้องกับแนวคิดที่อธิบายไว้โดยคำว่า ในขั้นตอนการดึงเอกสารที่มีการคำนวณค่าซึ่งเป็นผลรวมของความน่าจะมาจากคำที่มีอยู่ในทั้งเอกสารและในแบบสอบถาม เอกสารที่จะถูกดึงจากนั้นในการสั่งซื้อตามค่านี้ (น้อย) การแสดงเอกสารสำหรับรุ่นของน่าจะดึงข้อมูลนี้อาจเป็นเช่นเดียวกับในรูปแบบบูลีนในขณะที่มันจะต้องเก็บข้อมูลหากเอกสารอย่างใดอย่างหนึ่งที่มีระยะหรือไม่ [9].
ในทำนองเดียวกันกับเวกเตอร์เอกสารผกผันในรูปแบบ VSM เป็น เวกเตอร์จะต้องมีการสร้างที่เก็บข้อมูลเกี่ยวกับวิธีการที่สำคัญคือแต่ละเทอม หาก 'p' ความน่าจะเป็นที่เอกสารซึ่งมีระยะและมันเป็นเรื่องที่เกี่ยวข้องกับการค้นหาและ 'คิว' ความน่าจะเป็นว่าเอกสารที่มีคำว่า แต่มันไม่ได้เกี่ยวข้องแล้วน้ำหนักของคำที่มีการคำนวณเป็น:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

5.1 การค้นคืนสารสนเทศหลักการ
ผลการดึงข้อมูลโดยใช้ระบบค้นคืนสารสนเทศการพึ่งพาภาคและความน่าจะเป็น สมมุติฐานแรกคือมีการกระจายแตกต่างกันระหว่างที่เกี่ยวข้องและไม่เกี่ยวข้อง เอกสาร [ 3 ]ระบบเอกสารและประเภทตำแหน่ง PIR ในลําดับที่ลดลงของความน่าจะเป็นของความเกี่ยวข้องกับข้อมูลที่จำเป็นเมื่อคำนวณความน่าจะเป็น [ 3 ] ผลลัพธ์ที่ได้จะถูกต้องตามที่คำนวนความน่าจะเป็น [ 9 ] .
รูปแบบการลดลงของผลตอบแทนเอกสารคลาสสิกเพื่อคำนวณความน่าจะเป็นที่เกี่ยวข้องกับความต้องการข้อมูลหลังจากขั้นตอนการทุกระยะสามารถกำหนดมูลค่าที่แสดงถึงความน่าจะเป็นที่เอกสารที่บรรจุในเทอมนี้เกี่ยวข้องกับแนวคิดที่อธิบายโดยระยะ ขั้นตอนในการสืบค้นเอกสารคำนวณค่าซึ่งผลรวมของความน่าจะเป็นจากเงื่อนไขที่มีอยู่ทั้งเอกสารและแบบสอบถามเอกสารแล้วดึงเพื่อตามมูลค่า ( น้อย ) การแสดงเอกสารสำหรับรุ่นของการสืบค้นข้อมูลความน่าจะเป็นนี้สามารถเช่นเดียวกับในรูปแบบบูลีนเป็นเพียงต้องการที่จะเก็บข้อมูล ถ้าเอกสารมีระยะเวลาหรือไม่ [ 9 ] .
3 เวกเตอร์เอกสารผกผันใน vsm รุ่นเวกเตอร์ได้ถูกสร้างขึ้นที่เก็บข้อมูลเกี่ยวกับแต่ละระยะมันสำคัญมากแค่ไหน ถ้า ' P ' มีความเป็นไปได้ ที่เอกสารซึ่งประกอบด้วยระยะ และมันเกี่ยวข้องกับการค้นหาและ ' q ' คือความน่าจะเป็นที่เอกสารที่มีคำว่า แต่มันไม่เกี่ยวกัน แล้วน้ำหนักของระยะเวลาที่คำนวณ เช่น

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.