In order to identify (discriminate)

In order to identify (discriminate) different subject domains within the documents found for each entity,
clustering techniques are used. Recall that the retrieval session is keyword-based (Step 1.2), consequently
the terms (entities) can be part of many domains. Clustering allows finding these domains. The Lingo
algorithm, from the Carrot2 API (Carrot2, 2009), is used since it performs well for both snippets and fulltext
documents. The result of this step is a set of clusters for each entity. In addition, for each cluster a
cluster feature vector (CLFV) is created. A CLFV is a combination of all the DFVs of a cluster. In the
following step, we deal with selecting the relevant cluster w.r.t. the domain of interest.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เพื่อระบุหัวข้อที่แตกต่างกัน (discriminate) โดเมนภายในเอกสารสำหรับแต่ละเอนทิตี,
ใช้เทคนิคระบบคลัสเตอร์ รอบเรียกว่าพื้นฐานสำคัญ (ขั้นตอนที่ 1.2) , ดังนั้นการเรียกคืน
(ตี) เงื่อนไขสามารถเป็นส่วนหนึ่งของโดเมนหลาย คลัสเตอร์ช่วยให้การค้นหาโดเมนเหล่านี้ Lingo การ
อัลกอริทึม จาก API Carrot2 (Carrot2, 2009), ใช้ตั้งแต่มันทำดีสำหรับโค้ดและแบบเต็มหน่วย
เอกสาร ผลลัพธ์ของขั้นตอนนี้คือ ชุดของคลัสเตอร์สำหรับแต่ละเอนทิตี นอกจากนี้ สำหรับคลัสเตอร์แต่ละตัว
สร้างเวกเตอร์ลักษณะคลัสเตอร์ (CLFV) CLFV เป็นชุดของ DFVs ทั้งหมดของคลัสเตอร์ ในการ
ตามขั้นตอน เราจัดการด้วย w.r.t. คลัสเตอร์ที่เกี่ยวข้องในโดเมน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เพื่อระบุ (แยกแยะ) โดเมนเรื่องที่แตกต่างกันภายในเอกสารที่พบในแต่ละนิติบุคคล
เทคนิคที่ใช้ในการจัดกลุ่ม จำได้ว่าเซสชั่นการดึงเป็นคำหลักที่ใช้ (ขั้นตอน 1.2) ดังนั้น
เงื่อนไข (หน่วยงาน) สามารถเป็นส่วนหนึ่งของหลายโดเมน การจัดกลุ่มจะช่วยให้การหาโดเมนเหล่านี้ Lingo
อัลกอริทึมจาก API Carrot2 (Carrot2, 2009) ถูกนำมาใช้เพราะมันทำงานได้ดีสำหรับทั้งเกร็ดเล็กเกร็ดน้อยและใช้บังคับ
เอกสาร ผลของขั้นตอนนี้คือชุดของกลุ่มสำหรับแต่ละองค์กร นอกจากนี้สำหรับแต่ละกลุ่ม
คลัสเตอร์คุณลักษณะเวกเตอร์ (CLFV) ถูกสร้างขึ้น CLFV คือการรวมกันของ DFVs ทั้งหมดของคลัสเตอร์ ใน
ขั้นตอนต่อไปนี้เราจะจัดการกับการเลือก WRT กลุ่มที่เกี่ยวข้องโดเมนที่น่าสนใจ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เพื่อระบุ ( แยกแยะ ) โดเมนเรื่องต่างๆ ในเอกสารที่พบในแต่ละเอนทิตี
การจัดกลุ่มเทคนิคที่ใช้ จำได้ว่าเรียกเซสชันเป็นคำหลักตาม ( ขั้นตอนที่ 1.2 ) จึง
เงื่อนไข ( นิติบุคคล ) สามารถเป็นส่วนหนึ่งของหลายโดเมน ช่วยให้การค้นหาสำหรับโดเมนเหล่านี้ ภาษา
ขั้นตอนวิธีจาก carrot2 API ( carrot2 , 2009 )ที่ใช้เพราะมันแสดงได้ดีทั้ง 2 ตัวอย่างและเอกสารเต็ม Query

ผลของขั้นตอนนี้คือชุดของกลุ่มสำหรับแต่ละระบบ นอกจากนี้ แต่ละกลุ่มมี
กลุ่มเวกเตอร์คุณลักษณะ ( clfv ) ถูกสร้างขึ้น เป็น clfv คือการรวมกันของทุก dfvs ของคลัสเตอร์ ใน
ขั้นตอนต่อไปนี้ เราจัดการกับการเลือกกลุ่มที่เกี่ยวข้อง w.r.t. โดเมนที่น่าสนใจ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.