ONTO-GIS: A MULTILINGUAL GIS TOOL FOR
IMPROVED RECALL OF SPATIAL INFORMATION
Michael Brückner
Faculty of Science, Naresuan University
65000 Phitsanulok, Thailand
Chakkrit Snae
Faculty of Science, Naresuan University
65000 Phitsanulok, Thailand
Janjira Payakpate
Faculty of Science, Naresuan University
65000 Phitsanulok, Thailand
ABSTRACT
Many information systems contain geospatial references, for example addresses and toponyms, which tend to occur in
many variations. Database or web search will usually find only exact matches, so the set of records that contain
unconsidered toponym or address variations remain hidden; in terms of information retrieval, this leads to a probably
good precision with poor recall. In this paper, we report on an Ontology-based Name-matching TOol for Geographic
Information Systems (ONTO-GIS) that uses a multilingual ontology of toponyms, or geographical names, partly
populated by a name matching subsystem on the basis of a set of CAnonical Name-matching algorithms (CANN). This
population takes place after generating multilingual variations of toponyms by using four different algorithms
successively and an appropriate classification process of the variations. This tool is used in the knowledge acquisition
process for the spatial ontology applying natural language processing techniques. It eases (1) sharing toponyms across
language barriers, (2) augmenting spatial ontologies automatically, and (3) improving the recall of spatial information in
Geographic Information Systems (GIS).
KEYWORDS
Geographical Information System, information retrieval, multilingual name matching, spatial ontology, toponym
1. INTRODUCTION
With the advent of open Geographical Information Systems (GIS), with Google Earth and Google Maps
as examples, the issue of finding geographic information has gained more and more attention. Besides the
fact that geographic data are highly heterogeneous, they also rely significantly on the language and writing
system used. This is especially the case for geographic names, i. e. toponyms, which present a major obstacle
for the integration of multilanguage GIS. The Open Geospatial Consortium (http:// www.opengeospatial.org)
has introduced standards for GIS, which work reasonable well for syntactical problems of integration. The
semantical level of geospatial data is not addressed. For some of the problems of GIS interoperability the
service-based Enterprise Geographic Information System (E-GIS) approach has been initiated (Paul, Ghosh,
& Acharya 2006), which serves organizations with an integrated multi-user envrionment for geographical
data, their analysis and retrieval. This approach is also missing multilingual support and integration of
toponyms.
In the following, let us consider a simple use case. Customer A uses a GIS software in a multi-lingual
country, e. g. India. Many languages are spoken and various scripts are used to disseminate and search for
geographical information and data. Customer A wants to get specific information about Uttar Pradesh in the
onto-gis : เครื่องมือ GIS หลายภาษาปรับปรุงการเรียกคืนข้อมูลเชิงพื้นที่
ไมเคิล br üใต้
คณะวิทยาศาสตร์ มหาวิทยาลัยนเรศวร พิษณุโลก 65000 ไทย
, จักรกฤษณ์ snae
คณะวิทยาศาสตร์ มหาวิทยาลัยนเรศวร พิษณุโลก 65000 ไทย
, จันจิรา payakpate
คณะวิทยาศาสตร์ มหาวิทยาลัยนเรศวร
65000 พิษณุโลก
หลายเวกเตอร์ ข้อมูลระบบภูมิสารสนเทศประกอบด้วยการอ้างอิง ,สำหรับตัวอย่างและรายงานการวิจัยเรื่องที่อยู่ ซึ่งมักจะเกิดขึ้นใน
หลายรูปแบบ . ฐานข้อมูลหรือค้นหาเว็บ มักจะพบเพียงแมตช์ที่แน่นอน ดังนั้นชุดของระเบียนที่ประกอบด้วย
toponym ที่ไม่ได้ไตร่ตรองให้รอบคอบ หรือที่อยู่ในรูปแบบต่าง ๆ ยังคงซ่อน ; ในแง่ของการดึงข้อมูล นี้นำไปสู่อาจ
ดีความแม่นยำด้วยการเรียกคืนที่น่าสงสาร ในกระดาษนี้เรารายงานเกี่ยวกับอภิปรัชญาตามชื่อที่ตรงกับเครื่องมือสำหรับระบบสารสนเทศภูมิศาสตร์
( onto-gis ) ที่ใช้ภาษาของรายงานการวิจัยเรื่องอภิปรัชญา หรือชื่อทางภูมิศาสตร์ , ส่วนหนึ่ง
ประชากรโดยชื่อการจับคู่ระบบบนพื้นฐานของการตั้งค่าของ Canonical ชื่อขั้นตอนวิธีการจับคู่ ( แคน ) ประชากร
เกิดขึ้นหลังจากสร้างรูปแบบภาษาของรายงานการวิจัยเรื่องโดยใช้ขั้นตอนวิธี
สี่แตกต่างกันอย่างต่อเนื่องและกระบวนการหมวดหมู่ที่เหมาะสมของรูปแบบ เครื่องมือนี้ใช้ในการแสวงหาความรู้ กระบวนการอภิปรัชญา
ใช้เทคนิคการประมวลผลภาษาธรรมชาติ . มันช่วย ( 1 ) รายงานการวิจัยเรื่อง แชร์ข้าม
อุปสรรคของภาษา นโทโลจี ( 2 ) ยกระดับพื้นที่โดยอัตโนมัติและ ( 3 ) ปรับปรุงการเรียกคืนข้อมูลเชิงพื้นที่ใน
ระบบสารสนเทศทางภูมิศาสตร์ ( GIS )
.
, ระบบสารสนเทศทางภูมิศาสตร์ , การดึงข้อมูลหลายภาษาชื่อการจับคู่เชิงอภิปรัชญา toponym ,
1 บทนำ
กับแอดเวนต์ของระบบสารสนเทศทางภูมิศาสตร์ ( GIS ) เปิดกับ Google Earth และ Google Maps
เป็นตัวอย่างปัญหาของการหาข้อมูลทางภูมิศาสตร์ได้รับความสนใจมากขึ้นและมากขึ้น นอกจาก
ข้อมูลทางภูมิศาสตร์ที่เป็นอย่างสูงที่แตกต่างกัน พวกเขายังอาศัยอย่างมากในการเขียนภาษา
ระบบที่ใช้ เป็นกรณีนี้โดยเฉพาะอย่างยิ่งสำหรับชื่อทางภูมิศาสตร์ เช่น รายงานการวิจัยเรื่อง ซึ่งปัจจุบัน
อุปสรรคสำคัญสำหรับการรวมของ Multilanguage สารสนเทศภูมิศาสตร์ Geospatial เปิดสมาคม ( http : / / www.opengeospatial . org )
แนะนำมาตรฐานระบบสารสนเทศภูมิศาสตร์ซึ่งทำงานที่เหมาะสมสำหรับปัญหาประโยครวม
ข้อมูลภูมิสารสนเทศระดับ semantical ของไม่ระบุ สำหรับปัญหาของระบบสารสนเทศภูมิศาสตร์เอเชีย
บริการระบบสารสนเทศภูมิศาสตร์องค์กรตาม ( e-gis ) วิธีการได้รับริเริ่ม ( พอล ghosh
& Acharya , 2006 ) ที่ให้บริการองค์กรบูรณาการผู้ใช้หลายคน envrionment สำหรับข้อมูลทางภูมิศาสตร์
,ของการวิเคราะห์ และการแก้ไข . วิธีการนี้ยังขาดการสนับสนุนหลายภาษาและบูรณาการของรายงานการวิจัยเรื่อง
.
ในต่อไปนี้ ให้เราพิจารณากรณีที่ใช้ง่าย ลูกค้าที่ใช้โปรแกรมระบบสารสนเทศภูมิศาสตร์ใน multi lingual
ประเทศ เช่น อินเดีย หลายภาษาเป็นภาษาพูดและสคริปต์ต่าง ๆที่ใช้เพื่อเผยแพร่และค้นหา
ข้อมูลทางภูมิศาสตร์และข้อมูลลูกค้าต้องการได้รับข้อมูลเกี่ยวกับอินเดียใน
การแปล กรุณารอสักครู่..