We can generalize CCGs to weighted, or probabilistic,
models as follows. Our models are similar to
several other approaches (Ratnaparkhi et al., 1994;
Johnson et al., 1999; Lafferty et al., 2001; Collins,
2004; Taskar et al., 2004). We will write x to denote
a sentence, and y to denote a CCG parse for a
sentence. We use GEN(x; Λ) to refer to all possible
CCG parses for x under some CCG lexicon Λ.
We will define f(x, y) ∈ R
d
to be a d-dimensional
feature–vector that represents a parse tree y paired
with an input sentence x. In principle, f could include
features that are sensitive to arbitrary substructures
within the pair (x, y). We will define
w ∈ R
d
to be a parameter vector. The optimal parse
for a sentence x under parameters w and lexicon Λ
is then defined as
y
∗
(x) = arg max
y∈GEN(x;Λ)
w · f(x, y)
เราสามารถเม CCGs การถ่วงน้ำหนัก probabilisticรุ่นดังนี้ รูปแบบของเราจะคล้ายกับหลายอื่น ๆ วิธี (Ratnaparkhi et al., 1994Al. และ Johnson, 1999 Lafferty et al., 2001 คอลลินส์2004 Taskar et al., 2004) เราจะเขียน x แสดงประโยค และ y แสดง CCG การกระจายสำหรับการประโยค เราใช้ GEN (x Λ) ในการอ้างถึงทั้งหมดได้CCG วิเคราะห์สำหรับ x ภายใต้บาง CCG ปทานุกรมΛเราจะกำหนด f (x, y) ∈ Rdให้ d มิติคุณลักษณะ – เวกเตอร์ที่แทน y เป็นแผนภูมิแยกจับคู่กับประโยคที่อินพุต x หลัก f อาจรวมถึงคุณลักษณะที่สำคัญการกำหนด substructuresภายในคู่ (x, y) เราจะกำหนดw ∈ Rdเป็น เวกเตอร์ของพารามิเตอร์ ในการแยกวิเคราะห์ที่เหมาะสมสำหรับประโยค x ภายใต้พารามิเตอร์Λ w และปทานุกรมแล้วกำหนดเป็นy∗(x) =อาร์กิวเมนต์ของค่าสูงสุดy∈GEN(x;Λ)w · f (x, y)
การแปล กรุณารอสักครู่..
เราสามารถพูดคุย CCGS เพื่อถ่วงน้ำหนักหรือความน่าจะเป็น,
รุ่นดังต่อไปนี้ รุ่นของเรามีความคล้ายคลึงกับ
วิธีการอื่น ๆ หลายคน (Ratnaparkhi et al, 1994;.
จอห์นสัน, et al, 1999;. Lafferty et al, 2001. คอลลิน,
2004. Taskar, et al, 2004) เราจะเขียน x เพื่อแสดงถึง
ประโยคและ Y เพื่อแสดงถึงแยก CCG สำหรับ
ประโยค เราใช้ GEN (x; Λ) จะหมายถึงเป็นไปได้ทั้งหมด
CCG แยกวิเคราะห์สำหรับ x ภายใต้ CCG ศัพท์บางΛ.
เราจะกำหนด f (x, y) ∈ R
d
จะเป็น d มิติ
คุณลักษณะเวกเตอร์ที่แสดงถึงแยก y ที่ต้นไม้ จับคู่
กับประโยค x การป้อนข้อมูล ในหลักการฉอาจรวมถึง
คุณสมบัติที่มีความไวต่อ substructures พล
ภายในคู่ (x, y) เราจะกำหนด
น้ำหนัก∈ R
d
จะเป็นพารามิเตอร์เวกเตอร์ แจงที่ดีที่สุด
สำหรับประโยค x กว้างภายใต้พารามิเตอร์และพจนานุกรมΛ
ถูกกำหนดไว้แล้วเป็น
ปี
*
(x) = หาเรื่องสูงสุด
y∈GEN (x; Λ)
น้ำหนัก· f (x, y)
การแปล กรุณารอสักครู่..
เราสามารถอนุมาน ccgs เพื่อถ่วงน้ำหนัก หรือความน่าจะเป็น
, รุ่นดังนี้ รุ่นของเราก็คล้ายกับ
วิธีการอื่น ๆหลาย ๆ ( ratnaparkhi et al . , 1994 ;
จอห์นสัน et al . , 1999 ; ลาฟเฟอร์ตี้ et al . , 2001 ; Collins
2004 ; taskar et al . , 2004 ) เราจะเขียน x ไปจนถึง
ประโยคและ Y ไปจนถึง ccg แยกสำหรับ
ประโยค เราใช้ Gen ( x ; Λ ) อ้างถึง
เป็นไปได้ทั้งหมดccg วิเคราะห์สำหรับ x ในพจนานุกรม ccg Λ .
เราจะกำหนด f ( x , y ) ∈ R
D
เป็น d-dimensional
คุณสมบัติ–เวกเตอร์ที่แสดงถึง แยกต้นไม้คู่
Y กับ X ในประโยคหลัก F อาจรวมถึงคุณสมบัติที่ไวต่อ
substructures โดยพลการในคู่ ( x , y ) เราจะกำหนด
w ∈ R
D
เป็นพารามิเตอร์ของเวกเตอร์ การแยก
สำหรับประโยค X ภายใต้ตัวแปร W และพจนานุกรมΛ
จากนั้นกำหนด∗
Y
( ( X ) = ARG MAX
∈ Gen Y ( x ; Λ )
W ด้วย f ( x , y )
การแปล กรุณารอสักครู่..