1 Introduction
One factor that has blocked the uptake of natural language interfaces (NLIs) to
databases has been the economics of configuring such systems [2, 5]. Typically
configuration requires high levels of knowledge and long time commitments. The
typical work environment has neither of these in great supply and thus when
presented with the choice of building a common forms based interface versus an
NLI, organizations typically opt for forms. Our work seeks to make NLIs a more
attractive option by reducing the time and expertise requirement necessary to
build them.
Given the limited linguistic knowledge possessed by most technical teams,
modern approaches to configuring NLIs to standard databases come down to
one of three approaches:
1 Let authors only lightly name database elements (e.g. relations, attributes,
join paths, etc.) and reduce query interpretation to graph match[3, 14].
2 Offer a GUI based authoring interface where one grunts out a semantic gram-
mar that interprets user queries over their database. Such approaches are
common in industrial products such as Microsoft’s EnglishQuery, Progress
Software’s EasyAsk, Elfsoft’s ELF, etc.
3 Use machine learning to induce a semantic grammar from a corpus of natural
language query/correct logical interpretation pairs [16, 8, 6, 17, 18].
Since the ultimate goal of our project is the delivery of a high impact NLI
to database tool, it should not be surprising that we primarily adopt an authoring
approach. The contribution of the present paper is to present our formally
rooted name-tailor-define authoring approach and to show that it may be effectively
employed by normal technical personnel. That said, aspects of the first
approach are deeply integrated into our work and we have laid the ground for an
integration of machine learning techniques to help achieve highly robust NLIs
‘in the limit’ after experiencing large volumes of user queries.
บทนำ 1ปัจจัยหนึ่งที่ถูดูดใช้อินเทอร์เฟซภาษาธรรมชาติ (NLIs) ของการฐานข้อมูลมีเศรษฐศาสตร์ของการกำหนดค่าระบบดังกล่าว [2, 5] โดยทั่วไปแบบต้องใช้ความรู้และผูกพันนาน การสภาพแวดล้อมการทำงานปกติได้ใช่เหล่านี้ในการจัดหาที่ดีและเมื่อแสดง ด้วยตัวเลือกการติดต่อแบบฟอร์มที่ใช้ทั่วไปเมื่อเทียบกับการNLI องค์กรจะเลือกใช้สำหรับแบบฟอร์ม เราพยายามทำให้ NLIs มากขึ้นตัวเลือกที่น่าสนใจ โดยการลดเวลาและความเชี่ยวชาญความต้องการจำเป็นในการสร้างเหล่านั้นรับรู้ทางภาษาจำกัดสิง โดยทีมเทคนิคสุดวิธีการตั้งค่าคอนฟิก NLIs ฐานข้อมูลมาตรฐานที่ทันสมัยมาลงหนึ่งในสามวิธี:1 ให้ผู้เขียนเพียงเบา ๆ องค์ประกอบฐานข้อมูลชื่อ (เช่นความสัมพันธ์ คุณลักษณะเข้าร่วมเส้นทาง ฯลฯ) และลดการตีความแบบสอบถามการแข่งขันกราฟ [3, 14]2 มี GUI ตามอินเทอร์เฟซเขียนที่หนึ่งเสียงคำรามกรัมตรรก-มี.ค.ที่แปลแบบสอบถามผู้ใช้บนฐานข้อมูลของพวกเขา มีแนวทางดังกล่าวในผลิตภัณฑ์อุตสาหกรรมเช่น Microsoft ของ EnglishQuery ความคืบหน้าซอฟต์แวร์ EasyAsk เอลฟ์ของ Elfsoft ฯลฯเครื่องใช้ที่ 3 เรียนรู้ไวยากรณ์ตรรกจากคอร์ปัสธรรมชาติก่อให้เกิดการสอบถาม/แก้ไขตรรกะตีคู่ภาษา [16, 8, 6, 17, 18]เป้าหมายสูงสุดของโครงการเป็น การส่งผลกระทบสูง NLIในการเครื่องมือฐานข้อมูล มันควรไม่น่าแปลกใจว่า เราเป็นหลักนำการเขียนแนวทางการ สัดส่วนของกระดาษอยู่คือการ นำเสนอของเราอย่างเป็นทางการรากชื่อเทเลอร์ที่กำหนดวิธีเขียน และการแสดงอาจจะมีประสิทธิภาพจ้าง โดยปกติบุคลากรทางเทคนิค ที่กล่าวว่า ด้านแรกวิธีจะลึกรวมงานของเรา และเราได้ปูพื้นสำหรับการรวมเทคนิคการเรียนรู้เครื่องจะช่วยให้บรรลุประสิทธิภาพสูง NLIs'ในการจำกัด' หลังจากประสบกับผู้ใช้แบบสอบถามจำนวนมาก
การแปล กรุณารอสักครู่..
1 บทนำ
ปัจจัยหนึ่งที่ได้ปิดกั้นการดูดซึมของอินเตอร์เฟซภาษาธรรมชาติ (NLIs) เพื่อ
ฐานข้อมูลที่ได้รับเศรษฐศาสตร์ของการกำหนดค่าระบบดังกล่าว [2, 5] โดยปกติ
การกำหนดค่าต้องมีระดับสูงของความรู้และภาระผูกพันนาน
สภาพแวดล้อมการทำงานทั่วไปมีค่าเหล่านี้ในการจัดหาที่ดีและทำให้เมื่อ
นำเสนอกับทางเลือกในการสร้างรูปแบบที่พบอินเตอร์เฟซตามนั้นเมื่อเทียบกับ
NLI องค์กรมักจะเลือกใช้รูปแบบ การทำงานของเราพยายามที่จะทำให้ NLIs อีก
ตัวเลือกที่น่าสนใจโดยการลดเวลาและความต้องการความเชี่ยวชาญที่จำเป็นในการ
สร้างพวกเขา.
ได้รับการ จำกัด ความรู้ทางภาษาครอบครองโดยทีมงานด้านเทคนิคมากที่สุด
วิธีการที่ทันสมัยเพื่อการกำหนดค่า NLIs ไปยังฐานข้อมูลมาตรฐานลงมา
หนึ่งในสามวิธี:
1 ให้เขียนเพียงนิดหน่อยชื่อองค์ประกอบฐานข้อมูล (เช่นความสัมพันธ์ระหว่างคุณลักษณะ
เข้าร่วมเส้นทาง, ฯลฯ ) และลดการตีความแบบสอบถามกราฟแข่งขัน [3, 14].
2 เสนอ GUI ที่อินเตอร์เฟซการเขียนตามที่หนึ่งคำรามออก gram- ความหมาย
Mar ที่ตีความ ค้นหาผู้ใช้มากกว่าฐานข้อมูลของพวกเขา วิธีการดังกล่าวเป็น
เรื่องธรรมดาในผลิตภัณฑ์อุตสาหกรรมเช่นไมโครซอฟท์ EnglishQuery ความคืบหน้า
ซอฟท์แว EasyAsk, Elfsoft ของเอลฟ์ ฯลฯ
3 ใช้เครื่องเรียนรู้ที่จะทำให้เกิดไวยากรณ์ความหมายจากคลังของธรรมชาติ
Query Language / ถูกต้องคู่ตรรกะตีความ [16, 8, 6, 17 18].
เนื่องจากเป้าหมายสูงสุดของโครงการของเราคือการส่งมอบผลกระทบสูง NLI
เครื่องมือฐานข้อมูลมันไม่ควรจะเป็นที่น่าแปลกใจที่เรานำมาใช้เป็นหลักในการเขียน
วิธีการ มีส่วนร่วมของกระดาษในปัจจุบันคือการนำเสนอของเราอย่างเป็นทางการ
ที่หยั่งรากชื่อตัดกำหนดวิธีการเขียนและแสดงให้เห็นว่ามันอาจจะมีประสิทธิภาพในการ
จ้างงานโดยบุคลากรทางเทคนิคปกติ ที่กล่าวว่าด้านแรก
วิธีการแบบบูรณาการอย่างลึกซึ้งในการทำงานของเราและเราได้วางพื้นสำหรับ
การบูรณาการเทคนิคการเรียนรู้ของเครื่องจะช่วยให้บรรลุ NLIs มีประสิทธิภาพสูง
ในขีด จำกัด 'หลังจากที่ประสบปริมาณมากของการค้นหาผู้ใช้
การแปล กรุณารอสักครู่..
1 แนะนำปัจจัยหนึ่งที่ปิดกั้นการดูดซึมของภาษาธรรมชาติ interfaces ( nlis )ฐานข้อมูลได้รับการเศรษฐศาสตร์ของระบบดังกล่าว [ 2 , 3 ] โดยทั่วไปการตั้งค่าต้องใช้ระดับสูงของความรู้และความผูกพันยาวนาน ที่สภาพแวดล้อมโดยทั่วไป มีทั้งของเหล่านี้ในอุปทานและดังนั้นเมื่อที่นำเสนอกับทางเลือกของการสร้างรูปแบบทั่วไปที่ใช้กับอินเตอร์เฟซnli องค์กร มักจะเลือกใช้รูปแบบ งานของเราพยายามที่จะทำให้ nlis มากขึ้นตัวเลือกที่น่าสนใจโดยการลดเวลาและความต้องการความเชี่ยวชาญเป็นสร้างพวกเขาให้ความรู้ทางภาษา โดยทีมงานด้านเทคนิคมี จำกัด มากที่สุดวิธีการที่ทันสมัยเพื่อการ nlis ฐานข้อมูลมาตรฐานลงมาหนึ่งใน 3 วิธี :1 ให้เขียนชื่อฐานข้อมูลองค์ประกอบเพียงเล็กน้อย ( เช่น ความสัมพันธ์ คุณสมบัติรวมเส้นทาง , ฯลฯ ) และลดการตีความข้อมูลกราฟราคา [ 14 ]2 ให้ใช้ GUI อินเตอร์เฟซการเขียนที่ออกทางกรัม .มี.ค. ที่แปลผู้ใช้แบบสอบถามผ่านฐานข้อมูลของพวกเขา วิธีการดังกล่าวเป็นที่พบในผลิตภัณฑ์อุตสาหกรรมเช่น Microsoft ของ englishquery ความคืบหน้าeasyask ซอฟต์แวร์ , elfsoft เอลฟ์ ฯลฯ3 ใช้เครื่องการเรียนรู้เพื่อให้เกิดความหมายทางไวยากรณ์จากคลังข้อมูลของธรรมชาติภาษาแบบสอบถาม / ถูกต้องตรรกะการแปลคู่ [ 16 , 8 , 6 , 17 , 18 )เนื่องจากเป้าหมายสูงสุดของโครงการของเราคือการส่งมอบ nli ผลกระทบสูงเครื่องมือฐานข้อมูล , มันไม่ควรจะแปลกใจว่าเราเป็นหลัก เช่น การเขียนวิธีการ ส่วนของกระดาษ ปัจจุบันคือปัจจุบันของเราอย่างเป็นทางการถอนชื่อช่างตัดเสื้อกำหนดแนวทางการเขียน และแสดงให้เห็นว่ามันอาจจะได้อย่างมีประสิทธิภาพที่ใช้โดยบุคลากรด้านเทคนิคปกติ ที่กล่าวว่าลักษณะของแรกวิธีการจะรวมอยู่ลึกเข้าไปในงานของเรา และเราได้วางพื้นสำหรับการบูรณาการการเรียนรู้เครื่องเทคนิคเพื่อช่วยให้บรรลุประสิทธิภาพสูง nlis" " หลังจากประสบในขอบเขตขนาดใหญ่ของปริมาณการใช้
การแปล กรุณารอสักครู่..