From a linguistic aspect, causality in natural language is expressed either implicitly or explicitly. The difference is that implicit causal relation is expressed without obvious cue phrases. In order to identify causal relations from the web by the search engine, we use explicit connective markers as linguistic cues.
In Kim’s work (Kim, 2007), the syntactic tags of the cue phrase are: (1) Causal verb, e.g. allow, cause, lead to, or contribute to; (2) Prepositional, e.g. due to, or as a consequence; (3) Subordinate, e.g. because or as; (4) Adverbial, e.g. subsequently or consequently; and (5) Noun, e.g. the cause of or the effect of. There is a similar causal expression classification performed on Chinese text. The following examples show Chinese causal relations categorized according to part of speech of the cue phrases. a) Conjunction
― -, (
Because the player get hurt, (so) the organization postponed this play.
481
b) Causal Verb
― .)
The earthquake caused tidal waves.
c) Casual Noun
― &"*+
The cause of the boat accident is overloading.
According to the previous research experience, we focus on the most frequent and less ambiguous cue phrase conjunction, and incorporate specific causal verbs to improve the recall of the acquired knowledge. Note that a pair of causal conjunctions may co-occur in a Chinese sentence, such as the example in (a), while it is not allowed in English. In order to concentrate on our goal, we use the patterns to indicate the boundary of cause event and effect event, as well as to indicate the causal semantic relations.
Our lexico-syntactic patterns contain a pair of connective markers being correlated with each other and an end mark indicating the boundary of the causal expression, which are uniformly expressed as follows.
C_CON_Marker [*] E_CON_Marker [*]
In this pattern, C_CON_Marker is a causal conjunction, while E_CON_Marker is the corresponding conjunction or a causal verb. Event expressions connected by these two markers are generally short phrases or clauses. End_Marker indicates a punctuation or an empty word such as interjection, auxiliary word, etc. While “*”is a wildcard, “[*]” matches from one to N arbitrary words. N is used as a window of event expressions, and it is assigned an empirical value indicating the maximum number of words in a regular event mention. The parts of a sentence which match with these two slots are extracted as a cause event and its effect event.
When we perform the extraction process, this pattern is automatically instantiated with given word lists to generate query terms. Issuing these query terms, we take advantage of the search engine (such as Google) to retrieve potential causal relations from the Web. And subsequently, we extract pairs of event expressions from corresponding snippets matching with the event-slots
จากด้านภาษา ( ภาษาธรรมชาติแสดงออกอย่างใดอย่างหนึ่งหรือโดยปริยายให้ชัดเจน ความแตกต่างก็คือ ระบบความสัมพันธ์เชิงสาเหตุแสดงโดยไม่ต้องชัดเจนด้วยวลี เพื่อระบุความสัมพันธ์จากเว็บได้โดยการค้นหา เราใช้เครื่องหมายชัดเจนเชื่อมต่อเป็นคิวภาษาศาสตร์
คิมทำงาน ( คิม , 2007 ) , แท็กไวยากรณ์ของคิวข้อความมีดังนี้( 1 ) สาเหตุที่คำกริยา เช่น อนุญาตให้ ตะกั่ว หรือมีส่วนร่วม ( 2 ) บุพบท เช่น เกิดจากหรือเป็นผล ; ( 3 ) ผู้ใต้บังคับบัญชา เช่น เพราะ หรือ ( 4 ) หรือคำวิเศษณ์ เช่น ภายหลังจากนั้น และ ( 5 ) คำนาม เช่น สาเหตุ หรือ ผลของ มีสาเหตุคล้ายกันการแสดงออกหมวดหมู่แสดงบนข้อความภาษาจีนตัวอย่างต่อไปนี้แสดงความสัมพันธ์เชิงสาเหตุจีนแบ่งตามส่วนแห่งคำพูดของคิววลี )
-
ผมอยากร่วม ( เพราะผู้เล่นได้รับบาดเจ็บ , ( ดังนั้น ) องค์กรเลื่อนออกไปเล่นนี้
b ) สาเหตุคือกริยา
ผมอยาก ) ทำให้คลื่นแผ่นดินไหวคลื่น
c ) สบายๆ ผมอยาก&นาม
"
สาเหตุของอุบัติเหตุเรือจะเกินพิกัด
ตามประสบการณ์งานวิจัยที่ผ่านมาเรามุ่งเน้นที่พบบ่อยที่สุดและคลุมเครือน้อยคิววลีคำสันธาน , และรวมเฉพาะสาเหตุกริยาเพื่อปรับปรุงการเรียกคืนได้รับความรู้ โปรดทราบว่าคู่ของเหตุผลคำสันธานอาจ Co เกิดขึ้นในประโยคภาษาจีน เช่นตัวอย่างใน ( ) , ในขณะที่มันไม่ได้ในภาษาอังกฤษ เพื่อมุ่งเน้นเป้าหมายของเราเราใช้รูปแบบเพื่อระบุขอบเขตของเหตุการณ์ เหตุ และ ผลการแข่งขัน รวมทั้งเพื่อบ่งชี้ถึงสาเหตุทางด้านประชาสัมพันธ์
รูปแบบประโยค lexico ของเราประกอบด้วยคู่ของเครื่องหมายเกี่ยวการความสัมพันธ์กับแต่ละอื่น ๆและสิ้นสุดเครื่องหมายแสดงขอบเขตของการแสดงออก สาเหตุที่ขึ้นแสดงดังนี้
c_con_marker [ * ] e_con_marker [ * ] >
< end_markerในรูปแบบนี้ คือ การ c_con_marker สาเหตุ ในขณะที่ e_con_marker เป็นคำสันธานที่สอดคล้องกันหรือกริยาเชิงสาเหตุ เหตุการณ์ที่เชื่อมต่อการแสดงออกโดยทั้งสองเครื่องหมายโดยทั่วไปวลีสั้นๆหรือประโยค end_marker บ่งชี้ว่า เครื่องหมายวรรคตอน หรือคําว่าง เช่น คำอุทาน , เสริมคำ ฯลฯ ในขณะที่ " * " แทน " [ * ] " ไม้ขีดจาก n พลคำ- ใช้เป็นหน้าต่าง สีหน้าของเหตุการณ์ และเป็นการกำหนดเชิงประจักษ์ค่าแสดงจำนวนสูงสุดของคำ กล่าวถึงเหตุการณ์ปกติ ส่วนของประโยคซึ่งตรงกับทั้งสองสล็อตจะถูกแยกเป็นเหตุการณ์ที่เป็นสาเหตุและผลกระทบของเหตุการณ์
เมื่อเราดำเนินการขั้นตอนการสกัดรูปแบบนี้โดยอัตโนมัติ instantiated เพื่อสร้างเงื่อนไขให้กับรายการคําถาม .ขอสอบถามเงื่อนไขเหล่านี้ เราใช้ประโยชน์จากเครื่องมือค้นหา ( เช่น Google ) เพื่อดึงศักยภาพของความสัมพันธ์เชิงสาเหตุจากเว็บ และต่อมาเราแยกคู่ของการแสดงออกที่ตรงกับเหตุการณ์จากตัวอย่างเหตุการณ์สล็อต
การแปล กรุณารอสักครู่..
