The left-hand side of this equation is known as the likelihood ratio.  การแปล - The left-hand side of this equation is known as the likelihood ratio.  ไทย วิธีการพูด

The left-hand side of this equation

The left-hand side of this equation is known as the likelihood ratio. In most classification applications, such as spam filtering, the system must decide which class the document belongs to in order to take the appropriate action. For information retrieval, a search engine only needs to rank documents, rather than make that decision (which is hard). If we use the likelihood ratio as a score, the highly ranked documents will be those that have a high likelihood of belonging to the relevant set.
To calculate the document scores, we still need to decide how to come up with values for P(D|R) and P(D|NR). The simplest approach is to make the same assumptions that we made in our earlier example; that is, we represent documents as a combination of words and the relevant and non-relevant sets using word probabilities. In this model, documents are represented as a vector of binary
features,D = (d1, d2, . . . , dt), where di = 1 if term i is present in the document, and 0 otherwise. The other major assumption we make is term independence (also known as the Naïve Bayes assumption). This means we can estimate P(D|R) by the product of the individual term probabilities
Πt
i=1 P(di|R) (and similarly for
P(D|NR)). Because this model makes the assumptions of term independence and binary features in documents, it is known as the binary independence model.
Words obviously do not occur independently in text. If the word “Microsoft” occurs in a document, it is very likely that the word “Windows” will also occur.
The assumption of term independence, however, is a common one since it usually simplifies the mathematics involved in the model. Models that allow some form of dependence between terms will be discussed later in this chapter.
Recall that a document in this model is a vector of 1s and 0s representing the presence and absence of terms. For example, if there were five terms indexed, one of the document representations might be (1, 0, 0, 1, 1), meaning that the document contains terms 1, 4, and 5. To calculate the probability of this document occurring in the relevant set, we need the probabilities that the terms are 1 or 0 in the relevant set. If pi is the probability that term i occurs (has the value 1) in a document from the relevant set, then the probability of our example document occurring in the relevant set is p1 × (1 − p2) × (1 − p3) × p4 × p5. The probability
(1 − p2) is the probability of term 2 not occurring in the relevant set. For the non-relevant set, we use si to represent the probability of term i occurring.
Going back to the likelihood ratio, using pi and si gives us a score of
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
ด้านซ้ายของสมการนี้เรียกว่าอัตราส่วนความเป็นไปได้ ในการใช้งานการจัดประเภทมากที่สุด เช่นการกรองสแปม ระบบต้องตัดสินใจคลาใดเอกสารเป็นการกระทำเหมาะสม สำหรับการเรียกข้อมูล เครื่องมือค้นหาเท่านั้นจำเป็นต้องจัดลำดับเอกสาร มากกว่าตัดสินใจที่ (ซึ่งยาก) ถ้าเราใช้อัตราส่วนโอกาสเป็นคะแนน เอกสารอันดับสูงจะเป็นผู้ที่มีโอกาสสูงของการตั้งค่าที่เกี่ยวข้องการคำนวณคะแนนเอกสาร เรายังคงต้องตัดสินใจว่า จะมากับค่าสำหรับ P(D| R) และ P(D| NR) วิธีที่ง่ายที่สุดคือการ ทำให้สมมติฐานเดียวกันกับที่เราทำในตัวอย่างก่อนหน้านี้ นั่นคือ เราเป็นตัวแทนเอกสารที่เป็นการรวมกันของคำ และที่เกี่ยวข้อง และไม่เกี่ยวข้องชุดใช้คำน่าจะ ในรุ่นนี้ เอกสารจะแสดงเป็นเวกเตอร์ของไบนารีห้อง D = (d1, d2,..., dt), ที่ di = 1 ถ้าระยะฉันมีอยู่ในเอกสาร และ 0 อื่น สมมติฐานอื่นที่สำคัญเราเป็นเอกราชระยะ (หรือที่เรียกว่าไร้เดียงสา Bayes อัสสัมชัญ) ซึ่งหมายความว่า เราสามารถประมาณ P(D| R) โดยผลิตภัณฑ์ของน่าจะแต่ละΠtฉัน = 1 P(di| R) (และในทำนองเดียวกันP(D| NR)) เพราะรุ่นนี้ทำให้สมมติฐานระยะอิสระและคุณสมบัติไบนารีในเอกสาร เป็นที่รู้จักกันแบบอิสระไบนารีคำชัดไม่เกิดขึ้นอย่างอิสระในข้อความ ถ้าคำว่า "Microsoft" เกิดขึ้นในเอกสาร มีโอกาสมากว่า "Windows" จะเกิดขึ้นสมมติฐานระยะเอกราช อย่างไรก็ตาม เป็นหนึ่งทั่วไปเนื่องจากมันมักง่ายคณิตศาสตร์ที่เกี่ยวข้องในรูปแบบ รุ่นที่ทำให้บางรูปแบบพึ่งพาอาศัยกันระหว่างเงื่อนไขจะกล่าวถึงในบทนี้เรียกว่า เอกสารในรูปแบบนี้เป็นเวกเตอร์ของ 1s และ 0s แสดงสถานะการออนไลน์และไม่มีเงื่อนไข ตัวอย่างเช่น ถ้ามี ห้าคำดัชนี รับรองเอกสารอย่างใดอย่างหนึ่งอาจ (1, 0, 0, 1, 1), หมายความ ว่า เอกสารประกอบด้วยข้อ 1, 4 และ 5 การคำนวณความน่าเป็นเอกสารที่เกิดขึ้นในการตั้งค่าที่เกี่ยวข้อง เราต้องการน่าจะมีเงื่อนไข 1 หรือ 0 ในชุดที่เกี่ยวข้อง ถ้า pi เป็นความน่าเป็นคำที่ เกิด (มีค่า 1) ในเอกสารจากชุดที่เกี่ยวข้อง แล้วน่าเป็นของเราตัวอย่างเอกสารที่เกิดขึ้นในการตั้งค่าที่เกี่ยวข้องคือ p1 (1 − p2) ×× (1 − p3) × p4 × p5 ความน่าเป็น(1 − p2) คือระยะ 2 ไม่เกิดขึ้นในชุดที่เกี่ยวข้อง สำหรับชุดไม่เกี่ยวข้อง เราใช้ศรีเพื่อเป็นตัวแทนความน่าเป็นระยะเวลาของผมเกิดขึ้นกลับไปที่อัตราส่วนโอกาส ใช้ pi และศรีให้คะแนน
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
ด้านซ้ายมือของสมการนี้เป็นที่รู้จักกันเป็นอัตราส่วนความเป็นไปได้ การจัดหมวดหมู่ในการใช้งานมากที่สุดเช่นการกรองสแปมระบบจะต้องตัดสินใจว่าชั้นเอกสารเป็นของเพื่อที่จะใช้ดำเนินการที่เหมาะสม สำหรับการดึงข้อมูลเป็นเครื่องมือค้นหาเพียงความต้องการในการจัดอันดับเอกสารมากกว่าการตัดสินใจที่ (ซึ่งเป็นเรื่องยาก) ถ้าเราใช้อัตราส่วนเป็นคะแนน, เอกสารการจัดอันดับสูงจะเป็นผู้ที่มีโอกาสสูงที่อยู่ในชุดที่เกี่ยวข้อง.
ในการคำนวณคะแนนเอกสารที่เรายังคงต้องตัดสินใจว่าจะเกิดขึ้นกับค่า P (D | R) และ P (D | NR) วิธีที่ง่ายที่สุดคือการทำให้สมมติฐานเดียวกับที่เราทำในตัวอย่างก่อนหน้านี้ของเรา นั่นก็คือเราเป็นตัวแทนของเอกสารการรวมกันของคำและชุดที่เกี่ยวข้องและไม่เกี่ยวข้องโดยใช้ความน่าจะเป็นคำ ในรูปแบบนี้เอกสารที่จะแสดงเป็นเวกเตอร์ของไบนารี
คุณสมบัติ, D = (D1, D2,..., DT) ซึ่ง di = 1 หากระยะเวลาที่ผมมีอยู่ในเอกสารและ 0 เป็นอย่างอื่น สมมติฐานที่สำคัญอื่น ๆ ที่เราทำคือความเป็นอิสระระยะ (ยังเป็นที่รู้จักกันเป็นสมมติฐานNaïve Bayes) ซึ่งหมายความว่าเราสามารถประมาณการ P (D | R) โดยผลิตภัณฑ์ที่มีความน่าจะเป็นระยะแต่ละ
Πt
i = 1 P (di | R) (และในทำนองเดียวกันสำหรับ
P (D | NR)) เพราะรุ่นนี้ทำให้สมมติฐานของความเป็นอิสระและคุณสมบัติระยะไบนารีในเอกสารที่เป็นที่รู้จักกันเป็นแบบอิสระไบนารี.
คำอย่างเห็นได้ชัดไม่ได้เกิดขึ้นอย่างอิสระในข้อความ ถ้าคำว่า "ไมโครซอฟท์" เกิดขึ้นในเอกสารก็มีโอกาสมากว่าคำว่า "Windows" นอกจากนี้ยังจะเกิดขึ้น.
สมมติฐานของความเป็นอิสระระยะ แต่เป็นหนึ่งที่พบบ่อยเพราะมันมักจะช่วยลดความยุ่งยากทางคณิตศาสตร์ที่เกี่ยวข้องในรูปแบบ รุ่นที่ช่วยให้รูปแบบของการพึ่งพาอาศัยกันระหว่างคำบางคำจะได้รับการกล่าวถึงในบทนี้.
จำได้ว่าเอกสารในรูปแบบนี้เป็นเวกเตอร์ของ 1 และ 0 เป็นตัวแทนของการแสดงตนและการขาดของข้อตกลง ตัวอย่างเช่นถ้ามีห้าข้อตกลงการจัดทำดัชนีหนึ่งในการแสดงเอกสารที่อาจจะ (1, 0, 0, 1, 1) ความหมายว่าเอกสารที่มีคำที่ 1, 4, และ 5 ในการคำนวณความน่าจะเป็นของเอกสารนี้เกิดขึ้น อยู่ในชุดที่เกี่ยวข้องที่เราต้องความน่าจะเป็นว่าคำที่มี 1 หรือ 0 อยู่ในชุดที่เกี่ยวข้อง ถ้าพี่น่าจะเป็นคำว่าฉันเกิดขึ้น (มีค่า 1) ในเอกสารจากชุดที่เกี่ยวข้องแล้วน่าจะเป็นของเอกสารตัวอย่างของเราที่เกิดขึ้นในชุดที่เกี่ยวข้องคือ P1 × (1 - P2) × (1 - P3) × P5 × P4 ความน่าจะเป็น
(1 - P2) เป็นความน่าจะเป็นระยะที่ 2 ไม่ได้เกิดขึ้นในชุดที่เกี่ยวข้อง สำหรับชุดที่ไม่เกี่ยวข้องเราจะใช้ si เพื่อเป็นตัวแทนของความน่าจะเป็นคำที่เกิดขึ้นผม.
จะกลับไปที่อัตราส่วนการใช้ปี่และศรีช่วยให้เรามีคะแนนของ
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
ด้านซ้ายของสมการนี้เรียกว่าอัตราส่วนความน่าจะเป็น หมวดหมู่ในการใช้งานมากที่สุด เช่น การกรองสแปม ระบบจะต้องตัดสินใจเรียนที่เอกสารเป็นของเพื่อรับการกระทำที่เหมาะสม สำหรับการสืบค้นข้อมูล เครื่องมือค้นหาต้องการเพียงตำแหน่งเอกสารมากกว่าการตัดสินใจ ( ซึ่งยาก ) ถ้าเราใช้อัตราส่วนความน่าจะเป็นเป็นคะแนน , จัดอันดับสูงเอกสารนั้นจะเป็นสิ่งที่มีความเป็นไปได้สูงที่การตั้งค่าที่เกี่ยวข้องหาเอกสารคะแนน เรายังต้องตัดสินใจว่าจะมากับค่า P ( D | R ) และ P ( D | NR ) วิธีที่ง่ายที่สุดคือ ให้สมมติฐานเดิมที่เราทำในตัวอย่างก่อนหน้านี้ นั่นคือ เราเป็นตัวแทนของเอกสาร การรวมกันของคำและไม่ใช้ความน่าจะเป็นที่เกี่ยวข้องกับชุดคำ ในรูปแบบนี้ เอกสารจะแสดงเป็นเวกเตอร์ของไบนารีคุณสมบัติ , D = ( D1 , D2 , . . . . . . . . DT ) , , = 1 ถ้าศัพท์ไหนที่ผมมีอยู่ในเอกสาร และ 0 เป็นอย่างอื่น หลักอื่น ๆเราให้สมมติฐานเป็นเงื่อนไขความเป็นอิสระ ( ที่รู้จักกันว่าสมมติฐาน na ไตได้ Bayes ) ซึ่งหมายความว่า เราสามารถประมาณค่า P ( D | R ) โดยผลิตภัณฑ์ของแต่ละระยะความน่าจะเป็นΠ Tฉัน = 1 P ( di | R ) ( และในทำนองเดียวกันสำหรับP ( D | NR ) ) เพราะรุ่นนี้ทำให้สมมติฐานของระยะอิสระและมีไบนารีในเอกสาร มันเป็นที่รู้จักกันเป็นแบบ อิสระ แบบไบนารีคำพูดก็ไม่ได้เกิดขึ้นอย่างอิสระในข้อความ ถ้าคำว่า " Microsoft " เกิดขึ้นในเอกสาร ก็มีแนวโน้มมากว่า คำว่า " Windows " ก็จะเกิดขึ้นสมมติฐานของระยะอิสระ อย่างไรก็ตาม การเป็นหนึ่งที่พบบ่อยเพราะมันมักจะช่วยคณิตศาสตร์ที่เกี่ยวข้องในรูปแบบ รุ่นที่ช่วยให้บางรูปแบบของการพึ่งพาอาศัยกันระหว่างเงื่อนไขจะกล่าวถึงในภายหลังในบทนี้จำได้ว่า เอกสารในรูปแบบนี้คือ เวกเตอร์ของ 1s และ 0s และเป็นตัวแทนของการขาดงานของเงื่อนไข ตัวอย่างเช่น หากมีห้าด้านดัชนีหนึ่งในเอกสารรับรองอาจจะ ( 1 , 0 , 0 , 1 , 1 ) หมายความว่า เอกสารประกอบด้วย รูป 1 , 4 , และ 5 เพื่อคำนวณความน่าจะเป็นของเอกสารนี้เกิดขึ้นในการตั้งค่าที่เราต้องการความน่าจะเป็นที่เทอม 1 หรือ 0 ในการตั้งค่าที่เกี่ยวข้อง ถ้าพีมีความเป็นไปได้ ที่ระยะผมเกิดขึ้น ( มี 1 ) ในเอกสารจากการตั้งค่าที่เกี่ยวข้องแล้ว ความน่าจะเป็นของเอกสารตัวอย่างของเราที่เกิดขึ้นในการตั้งค่าที่เกี่ยวข้อง ( 1 −× P1 P2 ) × ( 1 − P3 P4 ) ×× P5 . ความน่าจะเป็น1 − P2 ) ความน่าจะเป็นของเทอม 2 ไม่เกิดขึ้นในการตั้งค่าที่เกี่ยวข้อง สำหรับไม่ที่เกี่ยวข้องชุด เราจะใช้ชีแสดงความน่าจะเป็นของคำที่ฉันเกิดขึ้นกลับไปที่อัตราส่วนความน่าจะเป็นด้วย พี และ ซี จะช่วยให้เราให้คะแนน
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: