The connections in the inference ne

The connections in the inference network graph are defined by the query and
the representation nodes connected to every document in the collection. The
probabilities for the representation nodes are estimated using language models
for each document. Note that these nodes do not represent the occurrence of a
particular feature in a document, but instead capture the probability that the feature
is characteristic of the document, in the sense that the language model could
generate it. For example, a node for the word “lincoln” represents the binary event
that a document is about that topic (or not), and the language model for the document
is used to calculate the probability of that event being TRUE.
Since all the events in the inference network are binary, we cannot really use
a multinomial model of a document as a sequence of words. Instead, we use a
multiple-Bernoulli16 model, which is the basis for the binary independence model
in section 7.2.1. In that case, a document is represented as a binary feature vector,
which simply records whether a feature is present or not. In order to capture
term frequency information, a different multiple-Bernoulli model is used where
the document is represented by a multiset17 of vectors, with one vector for each
term occurrence (Metzler, Lavrenko, & Croft, 2004). It turns out that with the
appropriate choice of parameters, the probability estimate based on the multiple-
Bernoulli distribution is the same as the estimate for the multinomial distribution
with Dirichlet smoothing, which is

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การเชื่อมต่อในกราฟเครือข่ายข้อกำหนด โดยการสอบถาม และโหนดที่เป็นตัวแทนเชื่อมต่อกับเอกสารทุกฉบับในคอลเลกชัน การประมาณน่าจะสำหรับโหนดที่แสดงรุ่นภาษาสำหรับแต่ละเอกสาร โปรดสังเกตว่า โหนเหล่านี้แสดงถึงการเกิดขึ้นของการเฉพาะในเอกสาร แต่แทน จับน่าเป็นที่ลักษณะการทำงานเป็นลักษณะของเอกสาร ในแง่ที่ว่า แบบจำลองภาษาสามารถสร้างมัน ตัวอย่างเช่น โหนสำหรับคำว่า "ลินคอล์น" แสดงถึงเหตุการณ์ไบนารีว่า เอกสารเกี่ยวกับหัวข้อ (หรือไม่), และภาษารุ่นสำหรับเอกสารถูกใช้เพื่อคำนวณความน่าเป็นของเหตุการณ์ที่เป็นจริงเนื่องจากเหตุการณ์ทั้งหมดในเครือข่ายอนุมานเป็นไบนารี เราไม่สามารถใช้แบบจำลองก็ตามของเอกสารเป็นลำดับของคำ แทน เราใช้เป็นBernoulli16 หลายรุ่น ซึ่งเป็นพื้นฐานสำหรับแบบไบนารีเป็นอิสระในส่วน 7.2.1 ในกรณีที่ แสดงเอกสารเป็นเวกเตอร์คุณสมบัติไบนารีที่เพียงแค่บันทึกว่า คุณลักษณะเป็นปัจจุบัน หรือไม่ เพื่อจับภาพระยะความถี่ข้อมูล Bernoulli หลายรุ่นอื่นจะใช้ที่เอกสารจะถูกแสดง ด้วย multiset17 ของเวกเตอร์ เวกเตอร์หนึ่งสำหรับแต่ละระยะเวลาการเกิดขึ้น (Metzler, Lavrenko และ Croft, 2004) ปรากฎว่ามีการเหมาะสมเลือกพารามิเตอร์ การประเมินความน่าเป็นที่อิงหลาย-แจก bernoulli จะเหมือนกับการประเมินสำหรับการแจกจ่ายก็ตามมี Dirichlet เรียบ ซึ่งเป็น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การเชื่อมต่อในรูปแบบของกราฟเครือข่ายการอนุมานจะถูกกำหนดโดยการสอบถามและ
โหนดเป็นตัวแทนที่เชื่อมต่อกับเอกสารทุกคนในคอลเลกชัน
ความน่าจะเป็นสำหรับโหนดการแสดงจะมีการประเมินโดยใช้แบบจำลองภาษา
สำหรับเอกสารแต่ละ โปรดทราบว่าโหนดเหล่านี้ไม่ได้เป็นตัวแทนการเกิดขึ้นของการให้
คุณลักษณะเฉพาะในเอกสาร แต่แทนที่จะจับภาพน่าจะเป็นที่คุณลักษณะ
เป็นลักษณะของเอกสารในแง่ที่ว่ารูปแบบภาษาที่สามารถ
สร้างมัน ยกตัวอย่างเช่นโหนดสำหรับคำว่า "ลินคอล์น" หมายถึงเหตุการณ์ไบนารี
ว่าเอกสารเป็นเรื่องเกี่ยวกับหัวข้อที่ (หรือไม่) และรูปแบบภาษาสำหรับเอกสารที่
ใช้ในการคำนวณความน่าจะเป็นของเหตุการณ์ที่เป็นจริง.
นับตั้งแต่เหตุการณ์ทั้งหมด ในเครือข่ายของการอนุมานเป็นไบนารีเราไม่สามารถจริงๆใช้
รูปแบบพหุนามของเอกสารเป็นลำดับของคำ แต่เราจะใช้
รูปแบบหลาย Bernoulli16 ซึ่งเป็นพื้นฐานสำหรับรูปแบบอิสระไบนารี
ในส่วน 7.2.1 ในกรณีที่เอกสารจะแสดงเป็นเวกเตอร์คุณลักษณะไบนารี
ซึ่งก็บันทึกว่าคุณลักษณะที่เป็นปัจจุบันหรือไม่ เพื่อที่จะจับ
ข้อมูลความถี่ระยะที่แตกต่างกันแบบหลาย Bernoulli ที่จะใช้
เอกสารที่เป็นตัวแทนจาก multiset17 ของเวกเตอร์กับหนึ่งเวกเตอร์สำหรับแต่ละ
เกิดขึ้นในระยะ (Metzler, Lavrenko และ Croft, 2004) ปรากฎว่ามีการ
เลือกที่เหมาะสมของพารามิเตอร์ประมาณการน่าจะขึ้นอยู่กับ multiple-
กระจาย Bernoulli เป็นเช่นเดียวกับการประมาณการสำหรับการกระจายพหุนาม
กับ Dirichlet เรียบซึ่งเป็น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การเชื่อมต่อในเครือข่ายการอนุมานกราฟถูกกำหนดโดยแบบสอบถามและแทนโหนดที่เชื่อมต่อกับทุกเอกสารคอลเลกชัน ที่ความน่าจะเป็นสำหรับการประมาณการใช้โหนดแบบภาษาสำหรับเอกสารแต่ละ ทราบว่าโหนดเหล่านี้ไม่ได้แสดงถึงการเกิดของโดยเฉพาะคุณสมบัติในเอกสาร แต่แทนที่จะจับโอกาสที่คุณลักษณะเป็นลักษณะของเอกสาร ในความรู้สึกว่าเป็นภาษาแบบสามารถสร้างมัน ตัวอย่างเช่นโหนดสำหรับคำว่า " ลินคอล์น " เป็นกิจกรรมไบนารีว่า เอกสารที่เกี่ยวกับเรื่องนั้น ( หรือไม่ ) ภาษาและรูปแบบเอกสารถูกใช้เพื่อคำนวณค่าความน่าจะเป็นของเหตุการณ์ที่เป็นจริงตั้งแต่เหตุการณ์ทั้งหมดในเครือข่ายการอนุมานเป็นไบนารี เราไม่สามารถใช้โดยมีรูปแบบของเอกสารเป็นลำดับของคำ แทน ที่เราใช้multiple-bernoulli16 โมเดล ซึ่งเป็นพื้นฐานสำหรับแบบจำลองอิสระไบนารีในส่วน 7.2.1 . ในกรณีนั้น , เอกสารแสดงเป็นเวกเตอร์ลักษณะแบบไบนารีซึ่งก็มีประวัติว่าเป็นปัจจุบันหรือไม่ เพื่อที่จะจับข้อมูลความถี่ระยะยาวที่แตกต่างกันหลายรูปแบบ คือ ใช้ที่ แบร์นูลลีเอกสารจะถูกแสดง โดย multiset17 ของเวกเตอร์ เวกเตอร์หนึ่งแต่ละระยะเวลาการเกิด ( เม็ตสเลอร์ lavrenko & Croft , 2004 ) ปรากฎว่า กับทางเลือกที่เหมาะสมของค่าความน่าจะเป็นการประเมินตามแบบการแจกแจงเบอร์นูลีจะเหมือนกับประมาณการสำหรับการวิธีกับดีริชเลต์ ( ซึ่งเป็น

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.