IV.PROPOSED APPROACHThe proposed ap

IV.
PROPOSED APPROACH
The proposed approach to support semantic search in digital library includes semantic query processing and document annotation
A. Semantic Query Processing
The overall query process of ontology based information retrieval is illustrated in Figure 1. In order to facilitate the semantic search in the domain of digital library, an ontology based information retrieval framework is proposed.
SELECT ?supervisor ?name WHERE {:Studentl :superviseBy ?supervisor. ?supervisor rdfs:label ?name}
The result for the query will return the following tuples which shows that studentl, who is Arifah Alhadi is supervised by Supervisor 1 who is Prof Madya Dr Shahrul Azman Mohd Noah and PM Dr Shahrul Azman where it refers to the same person:

Once the list of documents is formed, a semantic similarity value between the query and each document is computed by the system. The ranking algorithm of the system combines two factors which are the concept weight specified in the user's query and its relevance to a document. All concept names (or instance names) returned by the inference engine form a query vector. In VSM, a document vector Xj in the extended Term Document Matrix (TDM) calculated is ranked according to the similarity between it and the query vector q. Then a vector of index term weights is calculated. These weights,พ are calculated by most often used tf-idf scheme as shown in the equation (1) below where t represent time, f represent frequency and id represent id of a document:

tfiix idfi

freq is the number of occurrences of term i t in document j d , N IS number of documents in collection, and i ท is the document frequency for term i t in the whole document collection. The similarity which is presented as sim, measure between a document d and the query q is computed as shown in equation (2) below:

Once the list of documents is formed, a semantic similarity value between the query and each document is computed by the system. The ranking algorithm of the system combines two factors which are the concept weight specified in the user's query and its relevance to a document. All concept names (or instance names) returned by the inference engine form a query vector. In VSM, a document vector Xj in the extended Term Document Matrix (TDM) calculated is ranked according to the similarity between it and the query vector q. Then a vector of index term weights is calculated. These weights,พ are calculated by most often used tf-idf scheme as shown in the equation (1) below where t represent time, f represent frequency and id represent id of a document:
 
tfiix idfi
 
freq is the number of occurrences of term i t in document j d , N IS number of documents in collection, and i ท is the document frequency for term i t in the whole document collection. The similarity which is presented as sim, measure between a document d and the query q is computed as shown in equation (2) below:

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

IVวิธีการนำเสนอวิธีนำเสนอเพื่อสนับสนุนการค้นหาความหมายในห้องสมุดดิจิทัลมีคำอธิบายการประมวลผลและเอกสารแบบสอบถามความหมายอ.การประมวลผลแบบสอบถามความหมายการสอบถามโดยรวมของภววิทยาที่ใช้เรียกข้อมูลจะแสดงในรูปที่ 1 เพื่ออำนวยความสะดวกในการค้นหาความหมายในโดเมนของห้องสมุดดิจิตอล มีเสนอเป็นภววิทยาเรียกข้อมูลตามกรอบเลือก? ผู้? ชื่อ {: Studentl: superviseBy ? หัวหน้างาน? ผู้ rdfs:label ? ชื่อ}ผลลัพธ์สำหรับการสอบถามจะส่งคืน tuples ดังต่อไปนี้ซึ่งแสดงว่า studentl, Arifah Alhadi ที่พาสปอร์ต 1 ผู้ที่เป็นศาสตราจารย์ Madya Dr Shahrul Azman Mohd โนอาห์และ PM Dr Shahrul Azman ที่มันอ้างอิงถึงบุคคลเดียวกัน:เมื่อรายการของเอกสารที่มีรูปแบบ มีคำนวณค่าความคล้ายคลึงกันทางตรรกระหว่างการสอบถามและเอกสารแต่ละระบบ อัลกอริทึมการจัดอันดับของระบบรวมสองปัจจัยซึ่งเป็นแนวคิดน้ำหนักที่ระบุในแบบสอบถามของผู้ใช้และความเกี่ยวข้องกับเอกสาร ทั้งหมดแนวคิดชื่อ (หรือชื่ออินสแตนซ์) ที่ได้จากแบบฟอร์มโปรแกรมข้อเวกเตอร์แบบสอบถาม ใน VSM เวกเตอร์เอกสารคำนวณ Xj ในการขยายระยะเวลาเอกสารเมทริกซ์ (แบบ TDM) เป็นการจัดอันดับตามความคล้ายคลึงกันระหว่างมันและ q เวกเตอร์แบบสอบถาม จากนั้น จะคำนวณเวกเตอร์ของดัชนีระยะน้ำหนัก มีคำนวณน้ำหนักเหล่านี้ พ โดยส่วนใหญ่มักจะใช้ tf-idf ร่างดังแสดงในสมการ (1) ด้านล่างที่ t แทนเวลา f แสดงถึงความถี่และรหัสแทนรหัสของเอกสาร: tfiix idfi freq เป็นจำนวนของระยะฉัน t ในเอกสาร j, N คือจำนวนเอกสารในการเรียกเก็บเงิน และ ทเป็นความถี่ของเอกสารสำหรับระยะฉัน t ในชุดเอกสารทั้งหมด คำนวณความคล้ายคลึงกันซึ่งแสดงเป็น sim วัดระหว่างเอกสาร d และ q ถาม ดังแสดงในสมการ (2) ด้านล่าง:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

IV.
วิธีการนำเสนอ
วิธีการที่นำเสนอในการสนับสนุนการค้นหาความหมายในห้องสมุดดิจิตอลรวมถึงการประมวลผลแบบสอบถามความหมายและคำอธิบายประกอบเอกสาร
A. ความหมายของคำที่จะประมวลผล
แบบสอบถามกระบวนการโดยรวมของอภิปรัชญาดึงข้อมูลพื้นฐานจะแสดงในรูปที่ 1 เพื่อที่จะอำนวยความสะดวกในการค้นหาความหมายโดเมนของห้องสมุดดิจิตอล, อภิปรัชญาตามกรอบการดึงข้อมูลจะถูกเสนอ.
เลือกหัวหน้าชื่อที่ {? Studentl : superviseBy บังคับบัญชา? ? ผู้บังคับบัญชา RDFS: ป้ายชื่อ}?
ผลสำหรับแบบสอบถามจะกลับ tuples ต่อไปนี้ซึ่งแสดงให้เห็นว่า studentl ซึ่งเป็น Arifah Alhadi เป็นผู้ดูแลโดย Supervisor 1 ที่เป็นศาสตราจารย์ดร Madya Shahrul Azman Mohd โนอาห์และ PM ดร Shahrul Azman ที่มันหมายถึง เป็นคนคนเดียวกัน: เมื่อรายการเอกสารประกอบค่าความหมายคล้ายคลึงกันระหว่างการสอบถามและแต่ละเอกสารที่มีการคำนวณโดยระบบ วิธีการจัดอันดับของระบบรวมสองปัจจัยที่มีน้ำหนักแนวคิดที่ระบุไว้ในแบบสอบถามของผู้ใช้และความเกี่ยวข้องกับเอกสาร ชื่อแนวคิด (หรือชื่อเป็นต้น) ส่งกลับโดยกลไกการอนุมานแบบฟอร์มแบบสอบถามเวกเตอร์ ใน VSM, เวกเตอร์เอกสาร Xj ในการขยายระยะเวลาเอกสารเมทริกซ์ (TDM) คำนวณอันดับตามความคล้ายคลึงกันระหว่างมันและแบบสอบถามเวกเตอร์คิว จากนั้นเวกเตอร์ของน้ำหนักระยะดัชนีมีการคำนวณ น้ำหนักเหล่านี้พคำนวณโดยส่วนใหญ่มักจะใช้รูปแบบ TF-IDF ดังแสดงในสมการที่ (1) ด้านล่างเมื่อ t แทนเวลาฉแทนความถี่และ id แทน id ของเอกสาร: tfiix idfi ความถี่คือจำนวนของการเกิดขึ้นของคำมัน ใน JD เอกสาร N คือจำนวนของเอกสารในการเก็บรวบรวมและผมทเป็นความถี่เอกสารวาระในการเก็บรวบรวมเอกสารทั้งหมด ความคล้ายคลึงกันซึ่งจะนำเสนอเป็นซิม, วัดระหว่างงเอกสารและ Q แบบสอบถามวณดังแสดงในสมการ (2) ด้านล่าง:

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

IV .

เสนอแนวทาง วิธีการที่เสนอเพื่อสนับสนุนระบบค้นหาในห้องสมุดดิจิตอลรวมถึงการประมวลผลแบบสอบถามกับกลุ่มหมายเหตุเอกสาร แบบสอบถามการประมวลผล

ความหมายกระบวนการสืบค้นสารสนเทศโดยรวมของอภิปรัชญาตามแสดงในรูปที่ 1 เพื่อความสะดวกในการค้นหาความหมายของโดเมนของห้องสมุดดิจิตอลการค้นคืนสารสนเทศอภิปรัชญาตามกรอบที่เสนอ
เลือก ? ท่านหัวหน้า ชื่อที่ { : studentl : superviseby ? หัวหน้า ? หัวหน้า rdfs : ป้าย ชื่อ }
ผลแบบสอบถามจะส่งกลับทูเปิลซึ่งแสดงให้เห็นว่า studentl ต่อไปนี้ผู้ที่ arifah alhadi จะควบคุมโดยผู้ควบคุม 1 ที่ ศ ดร shahrul madya azman Mohd โนอาห์ และ น. ดร. shahrul azman ซึ่งอ้างถึงบุคคลเดียว :

เมื่อรายการของเอกสารที่ถูกสร้างขึ้น ค่าความเหมือนทางระหว่างแบบสอบถามและเอกสารแต่ละคำนวณโดยระบบขั้นตอนวิธีการจัดอันดับของระบบรวมสองปัจจัยที่มีแนวคิดน้ำหนักที่ระบุในแบบสอบถามของผู้ใช้และความเกี่ยวข้องกับเอกสาร ชื่อแนวคิดทั้งหมด ( หรือชื่ออินสแตนซ์ ) กลับมาจากการค้นหาเครื่องยนต์ในรูปแบบเวกเตอร์ . ใน vsm , เวกเตอร์เอกสาร XJ ในระยะยาวเอกสารเมทริกซ์ ( TDM ) คำนวณถูกจัดอันดับตามความคล้ายคลึงระหว่างมันและแบบสอบถามเกี่ยวกับ Qเวกเตอร์ของจำนวนจริงแล้วน้ำหนักจะถูกคำนวณ น้ำหนักเหล่านี้ พได้ โดยส่วนใหญ่มักจะใช้รูปแบบ TF IDF ดังแสดงในสมการที่ ( 1 ) ด้านล่างที่ไม่แสดงเวลา , F แสดงความถี่และรหัสแสดง ID ของเอกสาร :

tfiix idfi ความถี่คือจำนวนของการเกิดขึ้นของเงื่อนไขผมไม่ได้เอกสาร J D , n คือหมายเลขของเอกสาร ในคอลเลกชันและฉันทเป็นความถี่เอกสารสำหรับผมในระยะ T ในการรวบรวมเอกสารทั้งหมด ความเหมือนที่นำเสนอเป็น ซิม วัดระหว่างเอกสารและแบบสอบถาม Q จะคำนวณดังแสดงในสมการที่ ( 2 ) :
ด้านล่าง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.