III. CONTROLLED LANGUAGE AND CONTROLLED SYNTAX
Controlled language is a subset of natural language that
contains a set of construction rules, syntax and semantics that
are constrained. Controlled language makes texts easier to
understand for humans and machine, normally used in a
specific domain such as government documents, financial
documents and technical documents.
Controlled syntax is a part of the controlled language
process, it defines the structure of the sentences and aids
towards easier parsing and generating text. It enforces simple
sentences. Therefore if a software requirements specification
is written according to the controlled language, it will contain
many short sentences.
Controlled language [12, 13] is used in various
applications such as using controlled language in ontologies
[15,16], using controlled language for semantic webs [17, 18],
machine translation [19, 20], knowledge representation
[21,22], industry [23], and other applications [24, 25].
Centre Tesnière, a research center in linguistics and in
natural language processing, has developed controlled
language research including controlled language for machine
translation [26, 27, 28, 29, 30, 31], controlled language for
global security including health care (LiSe Project [32, 33,
34]), multilingual emergency and alert messages (MESSAGE
project [35]), controlled language for security [36] and
controlled language for aeronautics [37].
Other research applying the controlled language concept
are as follows:
PENG (Processable ENGlish) is a machine-oriented
controlled natural language designed for writing unambiguous and precise specification text for knowledge representation
[21, 38].
CLCE (Common Logic Controlled English) is a formal
language with an English-like syntax [39].
KANT System [40, 41] is a knowledge-based translation
system for multi-lingual information dissemination in
predefined technical domains.
ACE (Attempt of Controlled English) is a controlled
natural language [42] and a rich subset of Standard English
designed to serve as knowledge representation language.
Controlled languages are generated in several languages
such as Danish or French as in [43, 44, 45]. Most of them are
controlled in the English language [42, 39, 46, 47, 48], but
there is no controlled language research for Thai software
requirements specifications.
In this study, we created the controlled syntax by using
Backus Naur Form (BNF). Backus Naur Form is a formal
notation for specifying the production rules of a syntax
devised by John Backus and Peter Naur. It is the technique
used for context-free grammar [49, 50]. It is a tool for syntax,
not semantics, often used to describe the syntax of the
languages used in computing such as computer programming
languages. For this study, it can be used for checking syntax
and generating texts.
iii ภาษาควบคุมและไวยากรณ์ภาษาควบคุม
ควบคุมเป็นส่วนหนึ่งของภาษาธรรมชาติที่
มีชุดของกฎการก่อสร้างไวยากรณ์และความหมายที่มีข้อ จำกัด
ภาษาควบคุมทำให้ข้อความที่ง่ายต่อการเข้าใจ
สำหรับมนุษย์และเครื่องใช้ตามปกติใน
โดเมนเฉพาะเช่นเอกสารรัฐบาลการเงิน
เอกสารและเอกสารทางเทคนิค
ไวยากรณ์ควบคุมเป็นส่วนหนึ่งของภาษา
ขั้นตอนการควบคุมจะกำหนดโครงสร้างของประโยคและช่วย
ต่อการแยกวิเคราะห์ได้ง่ายขึ้นและการสร้างข้อความ มันบังคับง่าย
ประโยค ดังนั้นหากต้องการซอฟต์แวร์ข้อกำหนด
เขียนตามภาษาที่ควบคุมก็จะมี
ประโยคสั้น ๆ
ภาษาควบคุม [12, 13] ที่ใช้ในการต่างๆ
การใช้งานเช่นการใช้ภาษาในการควบคุมจี
[15,16] การใช้ภาษาในการควบคุมความหมายใย [17, 18],
เครื่องแปล [19, 20] ความรู้เกี่ยวกับการเป็นตัวแทน
[21,22] อุตสาหกรรม [23], และโปรแกรมอื่น ๆ [24, 25]
tesnièreศูนย์ศูนย์การวิจัยในภาษาศาสตร์และใน
ประมวลผลภาษาธรรมชาติได้มีการพัฒนาควบคุม
การวิจัยภาษารวมทั้งภาษาควบคุมเครื่องแปล
[26, 27, 28, 29, 30, 31], ภาษาควบคุมการรักษาความปลอดภัยทั่วโลก
รวมถึงการดูแลสุขภาพ (โครงการ lise [32, 33, 34
]) ฉุกเฉินพูดได้หลายภาษาและข้อความแจ้งเตือน (ข้อความ
โครงการ [35]), ภาษาที่ควบคุมการรักษาความปลอดภัย [36] และภาษา
ควบคุมวิชาการ [37]
งานวิจัยอื่น ๆ การประยุกต์ใช้แนวคิดภาษาควบคุม
มีดังนี้:
peng (processable ภาษาอังกฤษ) เป็นเครื่องเชิง
ภาษาธรรมชาติที่ควบคุมการออกแบบสำหรับการเขียนข้อความระบุชัดเจนและแม่นยำสำหรับความรู้ตัวแทน
[21 38]
clce (ตรรกะทั่วไปควบคุมภาษาอังกฤษ) เป็นอย่างเป็นทางการ
ภาษาไวยากรณ์ภาษาอังกฤษเหมือน [39]
ระบบ kant [40,41] เป็นคำแปล
ระบบฐานความรู้สำหรับการเผยแพร่ข้อมูลหลายภาษาใน
โดเมนทางเทคนิคที่กำหนดไว้ล่วงหน้า
เอซ (ความพยายามในการควบคุมภาษาอังกฤษ) เป็นควบคุม
ภาษาธรรมชาติ [42] และย่อยอุดมไปด้วยภาษาอังกฤษมาตรฐาน
ออกแบบเพื่อใช้เป็นภาษาที่แทนความรู้ ภาษา
ควบคุมจะเกิดขึ้นในหลายภาษา
เช่นเดนมาร์กหรือฝรั่งเศสใน [43, 44, 45]ส่วนใหญ่ของพวกเขาจะควบคุม
ในภาษาอังกฤษ [42, 39, 46, 47, 48] แต่
ไม่มีการวิจัยภาษาควบคุมข้อกำหนดซอฟต์แวร์ไทย
ความต้องการ
ในการศึกษานี้เราได้สร้างรูปแบบการควบคุมโดยใช้รูปแบบคัส
Naur (BNF) รูปแบบคัส Naur เป็นทางการ
สัญกรณ์สำหรับการระบุกฎการผลิตของไวยากรณ์
วางแผนโดยจอห์นคัสและปีเตอร์ Naurมันเป็นเทคนิคที่ใช้สำหรับการ
ไวยากรณ์บริบทฟรี [49, 50] มันเป็นเครื่องมือสำหรับไวยากรณ์
ไม่ได้หมายมักจะใช้เพื่ออธิบายไวยากรณ์ของภาษาที่ใช้
ในการคำนวณเช่นการเขียนโปรแกรมคอมพิวเตอร์ภาษา
สำหรับการศึกษานี้จะสามารถนำมาใช้สำหรับการตรวจสอบไวยากรณ์
และสร้างข้อความ
การแปล กรุณารอสักครู่..
III. ควบคุมภาษาและควบคุมไวยากรณ์
ภาษาควบคุมเป็นเซตย่อยของภาษาที่
ประกอบด้วยชุดของกฎการก่อสร้าง ไวยากรณ์ และความหมายที่
มีจำกัด ภาษาควบคุมทำให้ข้อความง่าย
เข้าใจมนุษย์และเครื่องจักร โดยปกติใช้ในการ
โดเมนเฉพาะเช่นเอกสารรัฐบาล เงิน
เอกสารและเอกสารทางเทคนิค
ไวยากรณ์ควบคุมเป็นส่วนหนึ่งของภาษาควบคุม
กระบวนการ กำหนดโครงสร้างของประโยคและเอดส์
แยกวิเคราะห์ได้ง่ายขึ้น และสร้างข้อความ บังคับง่าย
ประโยค ดังนั้นถ้ามีการระบุข้อกำหนดซอฟต์แวร์
เขียนตามภาษาควบคุม จะประกอบด้วย
ประโยคสั้นมาก
ใช้ในหลากหลายภาษาควบคุม [12, 13]
ประยุกต์ใช้ควบคุมภาษาใน ontologies
[15,16], ใช้ภาษาควบคุมเว็บความหมาย [17, 18],
แสดงความรู้ การแปลภาษาด้วยเครื่อง [19, 20]
[21,22], [23] อุตสาหกรรม และโปรแกรมประยุกต์อื่น [24, 25]
Tesnière ศูนย์วิจัยภาษาศาสตร์ และในศูนย์
ได้พัฒนาควบคุมการประมวลผลภาษาธรรมชาติ
วิจัยภาษารวมถึงภาษาควบคุมเครื่อง
แปล [26, 27, 28, 29, 30, 31], ควบคุมภาษา
ปลอดภัยสุขภาพโลก (LiSe โครงการ [32, 33,
34]), ฉุกเฉิน และแจ้งเตือนข้อความหลายภาษา (ข้อความ
โครงการ [35]), ควบคุมภาษาเพื่อความปลอดภัย [36] และ
ควบคุมภาษาหลง [37]
อื่น ๆ งานวิจัยที่ใช้แนวคิดการควบคุมภาษา
จะเป็นดังนี้:
เป็ง (อังกฤษ Processable) คือ เครื่องมุ่งเน้น
ควบคุมภาษาที่ออกแบบมาสำหรับการเขียนข้อความระบุชัดเจน และแม่นยำสำหรับการนำเสนอความรู้
[21, 38]
CLCE (ทั่วไปตรรกะควบคุมอังกฤษ) จะเป็นทางการ
ภาษามีไวยากรณ์เหมือนภาษาอังกฤษ [39]
ระบบ KANT [40 41] เป็นการแปลความรู้
ระบบการเผยแพร่ข้อมูลหลายภาษาใน
โดเมนทางเทคนิคที่กำหนดล่วงหน้า
เอซ (ความพยายามของควบคุมอังกฤษ) เป็นการควบคุม
ภาษา [42] และย่อยรวยภาษาอังกฤษมาตรฐาน
เพื่อเป็นภาษาแสดงความรู้
สร้างขึ้นในภาษาหลายภาษาควบคุม
เช่นเดนมาร์กฝรั่งเศสใน [43, 44, 45] ส่วนใหญ่จะเป็น
ควบคุมในภาษาอังกฤษ [42, 39, 46, 47, 48], แต่
มีไม่วิจัยภาษาควบคุมซอฟต์แวร์ไทย
ข้อกำหนดความต้องการ
ในการศึกษานี้ เราสร้างไวยากรณ์ที่ควบคุมโดย
ฟอร์ม Naur แบกคัส (BNF) แบบฟอร์ม Naur แบกคัสจะเป็นทางการ
สัญกรณ์สำหรับการระบุกฎของไวยากรณ์การผลิต
คิดค้น โดยจอห์นแบกคัสและปีเตอร์ Naur เป็นเทคนิค
ใช้ไวยากรณ์ปราศจากบริบท [49, 50] เป็นเครื่องมือสำหรับไวยากรณ์,
ความไม่หมาย มักใช้ในการอธิบายไวยากรณ์ของการ
ภาษาที่ใช้ในการคำนวณเช่นการเขียนโปรแกรมคอมพิวเตอร์
ภาษา สำหรับการศึกษานี้ สามารถใช้สำหรับการตรวจสอบไวยากรณ์
และสร้างข้อความได้
การแปล กรุณารอสักครู่..