We have introduced a new hybrid app

We have introduced a new hybrid approach
for finding abbreviations and their definitions in
unstructured texts. The problem of abbreviation
processing has attracted relatively little attention
in NLP field. However, technical documents use
a lot of abbreviations to represent domainspecific
knowledge. Thus, the ability to find
correct abbreviations and their definitions is
very important to being able to utilize the
information contained in those documents. It is
also very useful for many NLP applications such
as information retrieval [1] and glossary
extraction [4, 9, 11].
The proposed method has the following
advantages:
(1) It is simple and fast.
A small number of formation rules can
describe many abbreviations. By keeping
these rules in the rulebase, this system can
process most abbreviations by simple
pattern matches. Furthermore, the
abbreviation matcher consists of 5 simple
match routines and each routine is dedicated
to a certain type of abbreviations. Thus, it is
conceptually simple and fast.
(2) It shows high recall and precision rates.
(3) It provides for flexible user customization.
For example, users can specify rule
thresholds for updating the rulebase.
(4) It is trainable. The rulebase may be
automatically refined as the system
processes new documents.
(5) It is adaptable to new styles and editorial
conventions. It can process new types of
abbreviations by inserting appropriate rules
in the rulebase without modifying the
system. Rules are symbolic, so users can
easily add, modify, or delete the rules by
hand.
(6) It can be adapted to new technical domains.
The dictionary, set of replacement matches,
stopword list, and prefix list, can be tailored
for new domains.
In addition to the lacunae mentioned in
Section 5, we are aware that there are classes of
abbreviations which our current method does not
handle adequately. These are typically written
with all lower-case characters and are almost
never introduced with text markers or cue
words. Examples are :
· cu – customer
· hw – hardware
· mgr – manager
· pgm – program
· sw – software
Mechanisms for processing these abbreviations,
which tend to occur in informal text such as
email, chat rooms, or customer service call
records, are the subject of ongoing research in
our project

We have introduced a new hybrid approach
for finding abbreviations and their definitions in
unstructured texts. The problem of abbreviation
processing has attracted relatively little attention
in NLP field. However, technical documents use
a lot of abbreviations to represent domainspecific
 knowledge. Thus, the ability to find
correct abbreviations and their definitions is
very important to being able to utilize the
information contained in those documents. It is
also very useful for many NLP applications such
as information retrieval [1] and glossary
extraction [4, 9, 11].
The proposed method has the following
advantages:
(1) It is simple and fast.
A small number of formation rules can
describe many abbreviations. By keeping
these rules in the rulebase, this system can
process most abbreviations by simple
pattern matches. Furthermore, the
abbreviation matcher consists of 5 simple
match routines and each routine is dedicated
to a certain type of abbreviations. Thus, it is
conceptually simple and fast.
(2) It shows high recall and precision rates.
(3) It provides for flexible user customization.
For example, users can specify rule
thresholds for updating the rulebase.
(4) It is trainable. The rulebase may be
automatically refined as the system
processes new documents.
(5) It is adaptable to new styles and editorial
conventions. It can process new types of
abbreviations by inserting appropriate rules
in the rulebase without modifying the
system. Rules are symbolic, so users can
easily add, modify, or delete the rules by
hand.
(6) It can be adapted to new technical domains.
The dictionary, set of replacement matches,
stopword list, and prefix list, can be tailored
for new domains.
In addition to the lacunae mentioned in
Section 5, we are aware that there are classes of
abbreviations which our current method does not
handle adequately. These are typically written
with all lower-case characters and are almost
never introduced with text markers or cue
words. Examples are :
· cu – customer
· hw – hardware
· mgr – manager
· pgm – program
· sw – software
Mechanisms for processing these abbreviations,
which tend to occur in informal text such as
email, chat rooms, or customer service call
records, are the subject of ongoing research in
our project

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เราได้แนะนำวิธีการผสมแบบใหม่หาคำย่อและคำนิยามในข้อความที่ไม่มีโครงสร้าง ปัญหาของตัวย่อประมวลผลได้ดึงดูดความสนใจเล็กน้อยค่อนข้างในฟิลด์ NLP อย่างไรก็ตาม เอกสารทางเทคนิคที่ใช้คำย่อถึง domainspecific มาก ความรู้ ดังนั้น ความสามารถในการค้นหาเป็นคำย่อที่ถูกต้องและคำนิยามสำคัญมากเพื่อความสามารถในการใช้ข้อมูลที่อยู่ในนั้น มันเป็นนอกจากนี้ยังมีประโยชน์มากสำหรับ NLP โปรแกรมประยุกต์จำนวนมากดังกล่าวเรียกข้อมูล [1] และอภิธานศัพท์สกัด [4, 9, 11]วิธีการนำเสนอมีดังนี้ข้อดี:(1) ได้ง่าย และรวดเร็วจำนวนกฎก่อตัวเล็กสามารถอธิบายคำย่อมากมาย โดยรักษากฎเหล่านี้ใน rulebase ระบบนี้สามารถประมวลคำย่อส่วนใหญ่ โดยง่ายรูปแบบตรงกับ นอกจากนี้ การmatcher ย่อประกอบด้วยของ 5 อย่างคำสั่งจับคู่และแต่ละขั้นตอนมีความมุ่งมั่นบางชนิดของคำย่อ ดังนั้น จึงทางแนวคิดอย่างง่าย และรวดเร็ว(2) จะแสดงการเรียกคืนสูงและอัตราความแม่นยำ(3) อีกทั้งสำหรับผู้ใช้ที่มีความยืดหยุ่นตัวอย่าง การกำหนดกฎขีดจำกัดสำหรับการปรับปรุง rulebase(4) ได้ trainable Rulebase อาจกลั่นโดยอัตโนมัติเป็นระบบประมวลผลเอกสารใหม่(5) จึงสามารถปรับเปลี่ยนรูปแบบใหม่และกองแบบแผนการ มันสามารถประมวลผลชนิดใหม่คำย่อใส่กฎที่เหมาะสมใน rulebase โดยไม่มีการปรับเปลี่ยนการระบบ กฎเป็นสัญลักษณ์ ดังนั้นผู้ใช้สามารถง่าย ๆ เพิ่ม แก้ไข หรือลบกฎด้วยมือ(6) ก็สามารถดัดแปลงโดเมนเทคนิคใหม่พจนานุกรม ชุดเปลี่ยนตรงสามารถเส stopword และคำนำหน้าสำหรับโดเมนใหม่นอกจาก พ.ศ.2550 ที่ระบุไว้ในส่วน 5 เราจะทราบว่า มีชั้นของคำย่อซึ่งไม่มีวิธีของเราปัจจุบันจัดการอย่างเพียงพอ เหล่านี้มักจะเขียนมีตัวอักษรเล็กทั้งหมด และเกือบไม่เคยนำมาใช้กับข้อความเครื่องหมายหรือสัญลักษณ์คำ ตัวอย่างได้แก่:· cu – ลูกค้า· hw – ฮาร์ดแวร์· ผู้จัดการผู้จัดการ· pgm – โปรแกรม· sw – ซอฟต์แวร์กลไกสำหรับการประมวลผลคำย่อเหล่านี้ซึ่งมักจะเกิดขึ้นในข้อความที่ไม่เป็นทางการเช่นบริการอีเมล์ ห้องสนทนา หรือลูกค้าระเบียน มีเรื่องของการวิจัยอย่างต่อเนื่องในโครงการของเรา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เราได้แนะนำวิธีการไฮบริดใหม่
สำหรับการค้นหาตัวย่อและคำจำกัดความของพวกเขาใน
ตำราที่ไม่มีโครงสร้าง ปัญหาของการย่อ
การประมวลผลได้รับความสนใจค่อนข้างน้อย
ในด้าน NLP อย่างไรก็ตามเอกสารทางเทคนิคที่ใช้
จำนวนมากของตัวย่อที่จะเป็นตัวแทน domainspecific
ความรู้ ดังนั้นความสามารถในการหา
ตัวย่อที่ถูกต้องและคำจำกัดความของพวกเขาคือ
สิ่งที่สำคัญมากความสามารถในการใช้ประโยชน์จาก
ข้อมูลที่ปรากฏในเอกสารเหล่านั้น มันเป็น
ยังมีประโยชน์มากสำหรับการใช้งาน NLP หลายอย่าง
เช่นการดึงข้อมูล [1] และคำศัพท์
. สกัด [4, 9, 11]
วิธีที่นำเสนอมีดังต่อไปนี้
ข้อได้เปรียบ:
(1) มันเป็นเรื่องง่ายและรวดเร็ว.
ขนาดเล็กจำนวนมากของกฎการก่อตัว สามารถ
อธิบายตัวย่อหลาย โดยการรักษา
กฎระเบียบเหล่านี้ใน rulebase ระบบนี้สามารถ
ประมวลผลตัวย่อมากที่สุดโดยง่าย
รูปแบบตรง นอกจากนี้การ
จับคู่ย่อประกอบด้วย 5 ง่าย
ขั้นตอนการจับคู่และกิจวัตรประจำวันแต่ละคนจะทุ่มเท
เพื่อบางประเภทของตัวย่อ ดังนั้นจึงเป็น
แนวคิดที่ง่ายและรวดเร็ว.
(2) มันแสดงให้เห็นการเรียกคืนสูงและอัตราความแม่นยำ.
(3) จะให้สำหรับการปรับแต่งการใช้งานที่มีความยืดหยุ่น.
ตัวอย่างเช่นผู้ใช้สามารถระบุกฎ
เกณฑ์สำหรับการปรับปรุง rulebase.
(4) มันเป็นสุวินัย rulebase อาจจะ
กลั่นโดยอัตโนมัติเป็นระบบ
ประมวลผลเอกสารใหม่.
(5) มันสามารถปรับเปลี่ยนรูปแบบใหม่และบรรณาธิการ
ประชุม มันสามารถประมวลผลชนิดใหม่ของ
ตัวย่อโดยการใส่กฎระเบียบที่เหมาะสม
ใน rulebase โดยไม่ต้องแก้ไข
ระบบ กฎระเบียบที่มีสัญลักษณ์เพื่อให้ผู้ใช้สามารถ
ได้อย่างง่ายดายเพิ่มแก้ไขหรือลบกฎโดย
มือ.
(6) มันสามารถนำไปปรับใช้กับโดเมนทางเทคนิคใหม่.
พจนานุกรมชุดแข่งขันแทน
รายการ stopword และรายการคำนำหน้าสามารถปรับแต่ง
สำหรับ โดเมนใหม่.
นอกจาก lacunae ที่ระบุไว้ใน
มาตรา 5 เราจะทราบว่ามีชั้นเรียนของ
ตัวย่อซึ่งวิธีการของเราในปัจจุบันไม่ได้
จัดการอย่างเพียงพอ เหล่านี้จะเขียนโดยทั่วไป
กับทุกตัวอักษรกรณีที่ต่ำกว่าและเกือบจะ
ไม่เคยนำมาใช้กับเครื่องหมายข้อความหรือคิว
คำ ตัวอย่าง:
·ลูกบาศ์ก - ลูกค้า
· HW - ฮาร์ดแวร์
·จัดการ - ผู้จัดการ
· PGM - โปรแกรม
· sw - ซอฟต์แวร์
กลไกสำหรับการประมวลผลตัวย่อเหล่านี้
ซึ่งมีแนวโน้มที่จะเกิดขึ้นในข้อความที่เป็นทางการเช่น
อีเมลห้องสนทนาหรือการบริการลูกค้าโทร
บันทึกเป็น เรื่องของการวิจัยอย่างต่อเนื่องใน
โครงการของเรา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เราได้แนะนำวิธีการไฮบริดใหม่สำหรับการค้นหาคำย่อและคำนิยามของพวกเขา

ในข้อความใหม่ ปัญหาของการประมวลผลย่อ

ได้ดึงดูดความสนใจค่อนข้างน้อยใน NLP ในฟิลด์ อย่างไรก็ตาม เอกสารทางเทคนิค ใช้
มากอักษรย่อแสดงความรู้ domainspecific

ดังนั้น ความสามารถในการค้นหาที่ถูกต้องและความหมายของคำย่อ

ที่สำคัญสามารถใช้
ข้อมูลที่มีอยู่ในเอกสารเหล่านั้น มันก็มีประโยชน์มากมาก

เป็น NLP การค้นคืนสารสนเทศ [ 1 ] และอภิธานศัพท์
การสกัด [ 4 , 9 , 11 ] .
วิธีที่นำเสนอนี้มีข้อดีดังต่อไปนี้
:
( 1 ) เป็นเรื่องง่ายและรวดเร็ว .
จำนวนน้อยของกฎการพัฒนาสามารถ
อธิบายหลายตัวย่อ โดยการรักษา
กฎเหล่านี้ในกฎพื้นฐาน ,ระบบนี้สามารถดำเนินการส่วนใหญ่โดยตรง

ย่อรูปแบบง่ายๆ นอกจากนี้
ย่อรับประกอบด้วย 5 ง่าย
ราคาตามปกติและแต่ละขั้นตอนจะทุ่มเท
กับชนิดของคำย่อ จึงเป็นแนวคิดที่ง่ายและรวดเร็ว
.
( 2 ) มันแสดงราคาจำสูงและแม่นยำ .
( 3 ) และมีการปรับแต่งของผู้ใช้ยืดหยุ่น .
ตัวอย่างเช่นผู้ใช้สามารถระบุกฎ
เกณฑ์สำหรับการปรับปรุงกฎพื้นฐาน .
( 4 ) มันสามารถฝึกได้ . มีกฎพื้นฐานอาจจะกลั่นเป็นระบบ

โดยอัตโนมัติกระบวนการเอกสารใหม่ .
( 5 ) มันใช้กับรูปแบบใหม่และการประชุมบรรณาธิการ

มันสามารถประมวลผลชนิดใหม่ของ
คำย่อโดยการแทรกกฎที่เหมาะสม

ในกฎพื้นฐานโดยไม่ต้องปรับเปลี่ยนระบบ กฎเป็นสัญลักษณ์ เพื่อให้ผู้ใช้สามารถ
สามารถเพิ่ม , แก้ไขหรือลบกฎโดย
มือ
( 6 ) สามารถปรับให้เข้ากับโดเมนใหม่ทางเทคนิค .
พจนานุกรมชุดเปลี่ยนตรงกัน
stopword นำหน้ารายการ และรายการที่สามารถปรับแต่งสำหรับโดเมนใหม่
.
นอกจากที่กล่าวไว้ใน มาตรา 5 กรุงเทพมหานคร
เราจะทราบว่ามีคลาส
อักษรย่อซึ่งวิธี ปัจจุบันของเราไม่ได้
จัดการอย่างเพียงพอ เหล่านี้มักจะเขียนด้วยตัวอักษรกรณีที่ต่ำกว่าและ

เกือบไม่แนะนำกับเครื่องหมาย ข้อความ หรือคำพูด คิว

ตัวอย่าง :

ด้วยลูกค้าด้วยทองแดง–––อุปกรณ์ hw ด้วย

และผู้จัดการด้วย PGM ) โปรแกรมซอฟต์แวร์ (

ด้วย SW กลไกการประมวลผลคำย่อเหล่านี้ ซึ่งมักจะเกิดขึ้นในนอก

อีเมลข้อความ เช่น ห้องสนทนา หรือการบริการลูกค้าโทร
ประวัติ , เป็นเรื่องของการวิจัยอย่างต่อเนื่อง ใน
โครงการของเรา

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.