The primitive information-based sem

The primitive information-based semantic similarity approach was introduced by Resnik
[23] in which the similarity of two concepts is the maximum of the information content
of the concept that subsumes them in the taxonomy hierarchy [Equation 24]. The
information content of a concept depends on the probability of encountering an instance
of that concept in a corpus, and the information content is calculated as negative the log
likelihood of the probability [Equation 28]. That is, the probability of a concept is
determined by the frequency of occurrence of the concept and its subconcepts in the
corpus [Equation 27]. As the information-based measures use corpus statistics, these
similarity measures can be adapted well to particular applications using suitable corpora.
For more information about the pure information-based approach, please refer to Resnik’
work [22]. Following Resnik’s work, some information-based measures were introduced
to improve the performance of pure information-based approach by considering the
weight/strength of edges/links between concept nodes in ontology. The links between
ontology nodes are not equal in term of strength/weight, and link strength can be
determined by local density, information content, and link type [9,26]. The measure of
Jiang and Conrath [9] determines the similarity of two concept nodes by calculate the
“weighted path” between them by summing up all weighted links between them
[Equation 25]. While the measure of Lin [Equation 26] is similar to the measure of Wu
and Palmer [Equation 5]. However, Lin measure uses information content of concept
nodes instead of depth of concept nodes. In fact, the depth is replaced by the “weighted
depth”. Followings are formulas of Resnik, Jiang and Conrath, and Lin measures. They
all use information content (IC) of individual concept nodes C1 and C2 or/and LCS (least
common subsumer) of C1 and C2:

The primitive information-based semantic similarity approach was introduced by Resnik 
[23] in which the similarity of two concepts is the maximum of the information content 
of the concept that subsumes them in the taxonomy hierarchy [Equation 24]. The 
information content of a concept depends on the probability of encountering an instance 
of that concept in a corpus, and the information content is calculated as negative the log 
likelihood of the probability [Equation 28]. That is, the probability of a concept is 
determined by the frequency of occurrence of the concept and its subconcepts in the 
corpus [Equation 27]. As the information-based measures use corpus statistics, these 
similarity measures can be adapted well to particular applications using suitable corpora. 
For more information about the pure information-based approach, please refer to Resnik’ 
work [22]. Following Resnik’s work, some information-based measures were introduced 
to improve the performance of pure information-based approach by considering the 
weight/strength of edges/links between concept nodes in ontology. The links between 
ontology nodes are not equal in term of strength/weight, and link strength can be 
determined by local density, information content, and link type [9,26]. The measure of 
Jiang and Conrath [9] determines the similarity of two concept nodes by calculate the 
“weighted path” between them by summing up all weighted links between them 
[Equation 25]. While the measure of Lin [Equation 26] is similar to the measure of Wu 
and Palmer [Equation 5]. However, Lin measure uses information content of concept 
nodes instead of depth of concept nodes. In fact, the depth is replaced by the “weighted 
depth”. Followings are formulas of Resnik, Jiang and Conrath, and Lin measures. They 
all use information content (IC) of individual concept nodes C1 and C2 or/and LCS (least 
common subsumer) of C1 and C2:

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ดั้งเดิมวิธีการคล้ายคลึงกันตามข้อมูลความหมายถูกนำโดย Resnik
[23] ที่คล้ายคลึงกันของสองแนวคิดคือสูงสุดของ
ข้อมูลเนื้อหาจากแนวคิดที่ subsumes พวกเขาในลำดับชั้นอนุกรมวิธาน [สม 24] ข้อมูลเนื้อหาที่
ของแนวความคิดขึ้นอยู่กับความน่าจะเป็นของการเผชิญหน้า
ตัวอย่างของแนวคิดที่ว่าในร่างกาย,และเนื้อหาข้อมูลที่มีการคำนวณในแง่ลบบันทึกความเป็นไปได้ของความน่าจะ
[สม 28] นั่นคือความน่าจะเป็นของแนวคิดคือ
กำหนดโดยความถี่ของการเกิดขึ้นของแนวคิดและ subconcepts ในคลังของ
[สม 27] เป็นมาตรการตามข้อมูลใช้สถิติคลัง
เหล่านี้มาตรการที่คล้ายคลึงกันสามารถปรับการใช้งานได้ดีโดยเฉพาะอย่างยิ่งการใช้ที่เหมาะสม corpora
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีการตามข้อมูลที่บริสุทธิ์โปรดดูที่การทำงาน
Resnik '[22] ต่อไปนี้การทำงาน Resnik บางคนมาตรการตามข้อมูลถูกนำ
เพื่อปรับปรุงประสิทธิภาพของวิธีการตามข้อมูลที่บริสุทธิ์โดยพิจารณา
/ น้ำหนักความแข็งแรงของขอบ / การเชื่อมโยงระหว่างโหนดแนวคิดในอภิปรัชญา การเชื่อมโยงระหว่างโหนด
อภิปรัชญาจะไม่เท่ากันในแง่ของความแข็งแรง / น้ำหนักและความแข็งแรงของการเชื่อมโยงสามารถ
กำหนดโดยความหนาแน่นของท้องถิ่นข้อมูลเนื้อหาและประเภทการเชื่อมโยง [9,26] วัด
เจียงและ conrath [9] กำหนดคล้ายคลึงกันของสองโหนดแนวคิดโดยคำนวณ
"เส้นทางถ่วงน้ำหนัก" ระหว่างพวกเขาได้จากข้อสรุปค่าการเชื่อมโยงทั้งหมดถ่วงน้ำหนักระหว่างพวกเขา
[สม 25] ในขณะที่ตัวชี้วัดของ lin [สม 26] คล้ายกับตัวชี้วัดของ wu
และพาลเมอร์ [สมการ 5] แต่วัด lin ใช้เนื้อหาข้อมูลของโหนด
แนวคิดแทนของความลึกของโหนดแนวคิด ในความเป็นจริงความลึกจะถูกแทนที่ด้วย "ความลึก
ถ่วงน้ำหนัก" ดังต่อไปนี้เป็นสูตรของ Resnik,เจียงและ conrath และมาตรการ lin พวกเขา
เนื้อหาทั้งหมดที่ใช้ข้อมูล (IC) ของแนวคิดแต่ละโหนด c1 และ c2 และ / หรือ LCS (น้อย
subsumer ร่วมกัน) ของ c1 และ c2:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

วิธีดั้งเดิมตามข้อมูลทางตรรกคล้ายถูกนำ โดย Resnik
[23] ซึ่ง ความคล้ายกันของสองแนวคิดถูก มากที่สุดเนื้อหาข้อมูล
แนวความคิดที่พวกเขา subsumes ในลำดับชั้นระบบ [สมการ 24] ใน
ข้อมูลเนื้อหาของแนวคิดที่ขึ้นอยู่กับความเป็นไปได้พบกับอินสแตนซ์
แนวคิดว่าในคอร์พัสคริ และเนื้อหาข้อมูลจะคำนวณเป็นค่าลบล็อก
โอกาสความน่าเป็น [สมการ 28] นั่นคือ ความน่าเป็นแนวคิดเป็น
ตามความถี่ของการเกิดขึ้นของแนวคิดของ subconcepts ในการ
คอร์พัสคริ [สมการ 27] เป็นหน่วยวัดที่ใช้ข้อมูลใช้สถิติคอร์พัสคริ เหล่านี้
คล้ายวัดสามารถดัดแปลงเพื่อใช้งานเฉพาะที่ใช้ corpora เหมาะดี
ข้อมูลเพิ่มเติมเกี่ยวกับวิธีใช้ข้อมูลบริสุทธิ์ โปรดดู Resnik'
[22] การทำงาน ต่อการทำงานของ Resnik วัดบางจากข้อมูลได้แนะนำ
เพื่อปรับปรุงประสิทธิภาพของการปฏิบัติตามข้อมูลบริสุทธิ์ โดยพิจารณาการ
น้ำหนัก/แรงขอบ/เชื่อมโยงระหว่างแนวคิดโหนดในภววิทยา การเชื่อมโยงระหว่าง
ภววิทยาโหนไม่เท่าในแง่ของความแข็งแรง/น้ำหนัก และความเชื่อมโยงสามารถ
ตามความหนาแน่นท้องถิ่น ข้อมูลเนื้อหา และชนิดของลิงค์ [9,26] การวัด
เจียงและ Conrath [9] กำหนดโดยคำนวณความคล้ายกันของสองแนวคิดโหน
"น้ำหนัก" เส้นทางระหว่างพวกเขาโดยการรวมค่าถ่วงน้ำหนักทั้งหมดที่เชื่อมโยงระหว่าง
[สมการ 25] ขณะวัดหลิน [สมการ 26] คล้ายกับวัดวู
และพาล์มเมอร์ [สมการ 5] อย่างไรก็ตาม วัดหลินใช้เนื้อหาข้อมูลของแนวคิด
โหนโหนแนวความลึกแทน ในความเป็นจริง ความลึกถูกแทนที่ด้วยการ "ถ่วงน้ำหนัก
ลึก" ต่อไปนี้เป็นสูตรของ Resnik วัดเจียง และ Conrath และหลิน พวกเขา
ทั้งหมดใช้เนื้อหาข้อมูล (IC) ของแนวคิดแต่ละโหน C1 และ C2 หรือ / และ LCS (น้อย
subsumer ทั่วไป) ของ C1 และ C2:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

วิธีการลักษณะคล้ายคลึงกันถึงข้อมูลเกี่ยวกับความหมายของคำตามแบบดั้งเดิมที่ได้รับการแนะนำโดย resnik
[ 23 ]ในซึ่งลักษณะคล้ายคลึงกันถึงแนวความคิดของคนสองคนคือสูงสุดของเนื้อหาข้อมูลที่
ของแนวความคิดที่กลบไว้ในลำดับชั้น Taxonomy [ 24 ]ที่สมการ เนื้อหา
ข้อมูลของแนวความคิดที่จะขึ้นอยู่กับความเป็นไปได้ของชาวไทยที่ตัวอย่างเช่น
ของแนวความคิดที่อยู่ในคลังข้อมูล ภาษาไทย ที่และเนื้อหาข้อมูลที่ได้รับจากการคำนวณเป็นค่าติดลบให้ล็อกอินเข้าสู่
โอกาสของความเป็นไปได้ของสมการ[ 28 ] ที่มีความเป็นไปได้ของแนวความคิดที่เป็น
ถูกกำหนดโดยความถี่ของการเกิดขึ้นของแนวความคิดและ subconcepts ใน
corpus [ 27 ]สมการนี้ มาตรการข้อมูล - ใช้สถิติที่ใช้ corpus เหล่านี้
มาตรการอย่างเดียวกันสามารถปรับเปลี่ยนได้อย่างดีเยี่ยมในแอปพลิเคชันเฉพาะการใช้ Corporation เหมาะสม
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีการข้อมูล - ใช้บริสุทธิ์โปรดดูที่' resnik
ทำงาน[ 22 ] ต่อไปนี้:งานของ resnik มาตรการข้อมูล - ใช้บางส่วนได้แนะนำ
เพื่อปรับปรุง ประสิทธิภาพ การทำงานของการเข้าถึงข้อมูล - ใช้บริสุทธิ์โดยการพิจารณาถึง
น้ำหนัก/ความแข็งแกร่งของ L ขอบ/ระหว่างแนวความคิดโหนดใน Capitalism ) L ระหว่างโหนด
Capitalism )จะไม่เท่ากันในระยะสั้นของความแข็งแกร่งของ/น้ำหนักและความแรงของสามารถ
ถูกกำหนดโดยความหนาแน่นในท้องถิ่นเนื้อหาข้อมูลและการเชื่อมโยง ประเภท [ 9,26 ] การวัด
เจียงและ conrath [ 9 ]จะเป็นตัวกำหนดความเหมือนของสองแนวความคิดโหนดโดยคำนวณ
"พาธถ่วงน้ำหนัก"ระหว่างนั้นโดยการสรุปเรื่องการเชื่อมโยงระหว่างถ่วงน้ำหนักทั้งหมดไว้
[สมการ 25 ] ในขณะที่การวัด Lin [สมการ 26 ]จะมีลักษณะคล้ายกันกับการวัด Wu
และ Palmer สมการ[ 5 ] อย่างไรก็ตามมาตรการ Lin ใช้เนื้อหาข้อมูลของแนวความคิด
โหนดแทนความลึกของโหนดตามแนวความคิด ในความเป็นจริงแล้วความลึกที่จะถูกแทนที่ด้วย"ถ่วงน้ำหนัก
ความลึก" ดังต่อไปนี้เป็นสูตรของ resnikนายเจียงและ conrath Lin Monastery และมาตรการ. พวกเขา
ทั้งหมดใช้เนื้อหาข้อมูล( IC )ของแนวความคิดแต่ละโหนด C 1 และ C 2 และ/หรือ LCS ( subsumer
ทั่วไปอย่างน้อย)ของ C 1 และ C 2

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.