4. MAJOR CHALLENGES Legacy Web Data and Construction of the Seed Colle การแปล - 4. MAJOR CHALLENGES Legacy Web Data and Construction of the Seed Colle ไทย วิธีการพูด

4. MAJOR CHALLENGES Legacy Web Data

4. MAJOR CHALLENGES Legacy Web Data and Construction of the Seed Collection. To achieve its goal as the main source of information about the scientific production of the Brazilian CS community, BDBComp strongly relies on its self-archiving service. However, before making this service available it was necessary to collect some data to construct its “seed” collection. To start with, we decided to collect as much data as possible from previous major SBC events. A problem we found was that most of the legacy data about CS events was available only in static form through Web sites. To solve this problem, and based on our previous experience with the Web-DL environment [1], we generated wrappers for extracting data (paper titles, author names, events’ venues and dates, etc.) from more than 60 of these Web sites in order to produce the DC records required to create an OAI source file. DC records also have been generated from tables of contents provided (in textual format) by external contributors. In addition to that, we also collected DC records from the SIBGRAPI Digital Library Archive (iris.sid.inpe.br:1906), a DL that archives the collection of full text papers presented at the Brazilian Symposium on Computer Graphics and Image Processing - SIBGRAPI, since 1996. Table 1 summarizes the seed data collected for BDBComp. As we can see, of the 2638 records currently available in BDBComp, 748 include the work abstract and 675 a link to the work full text.
Information Integration. Since BDBComp is consolidating the Brazilian CS literature by including heterogeneous resources from a number of different archives, one important problem is how to identify similar objects or objects that can be integrated together
(e.g., papers derived from a specific dissertation). This is important to allow homogenous services and to solve problems such as deduping. Preliminary experiments with similarity functions to allow the identification of such objects based on complex structural information (e.g., as expressed by XML documents) combined with standard IR measures have shown good results [2]. A sub-problem that arises here is how to identify variants of names of authors [4]. This is particularly important because most of the data collected for BDBComp so far has come from Web sites where name normalization was not a issue, which, in many situations, leads to the generation of multiple answers for a same author when searching/browsing by author name.
Records Collected Sources Total With Abstract With FT Link Web Sites 2227 464 353 Other DLs 359 292 294 Contributors 52 28 28 Total 2638 748 675 Table 1: Seed Data Collected for BDBComp
Involvement of the CS community. Key to the success and sustainability of any DL is the involvement of the target community in its use and maintenance. The BDBComp team is working closely with SBC to galvanize its community around the project. Among the responsibilities of SBC are the adoption of policies to require the submission of full texts, at least for papers presented at its major events, the archiving and preservation of such collections, and the selection of specialists from its several special interest groups to serve as reviewers of submissions.
5. CONCLUSIONS AND FUTURE WORK We have briefly described the design and building of the current prototype of the Brazilian Digital Library of Computing BDBComp, including many of the challenges faced and proposed solutions. Use of standards (e.g., OAI, DC, SQL) as well as new technologies developed by the project team (e.g., Web data extraction tools) have allowed fast and easy prototyping: only five months, done mostly by graduate students as class projects. Besides continuation and refinement of the work in progress, we will move our monolithic prototype to a more model-oriented, componentized architecture to guarantee expandability and scalability [3,5], expand our models to include information specific to the Brazilian reality (e.g., funding agencies, links to official online curricula of researchers), and develop new services (e.g., full text search, personalization).
REFERENCES [1] Calado, P. et al. The Web-DL Environment for Building Digital Libraries from the Web. In Proc. JCDL 2003, Houston, Texas, USA, May 2003, pp. 346-357. [2] Carvalho, J.C.P. and Silva, A.S., Finding Similar Identities among Objects from Multiple Web Sources. In Proc. WIDM 2003, New Orleans, Louisiana, USA, Nov 2003, pp. 90-93. [3] Gonçalves, M.A., Fox, E.A., Watson, L.T., and Kipp, N.A. Streams, Structures, Spaces, Scenarios, Societies (5S): A Formal Model for Digital Libraries. ACM TOIS, 22(2):1-43, 2004. [4] Ley, M. The DBLP Computer Science Bibliography: Evolution, Research Issues, Perspectives. In Proc. SPIRE 2002, Lisbon, Portugal, Sept 2002, pp. 1-10. [5] Suleman, H. Open Digital Libraries. PhD Thesis, Dept. of Computer Science, Virginia Tech, Blacksburg, VA, 2002.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
4. มรดกความท้าทายวิชาเว็บข้อมูลและสร้างเก็บเมล็ด เพื่อให้บรรลุเป้าหมายเป็นแหล่งที่มาหลักของข้อมูลเกี่ยวกับการผลิตทางวิทยาศาสตร์ของ CS บราซิล BDBComp ขออาศัยบริการเก็บถาวรด้วยตนเอง อย่างไรก็ตาม ก่อนที่จะทำบริการนี้ใช้ ได้จำเป็นต้องเก็บข้อมูลบางอย่างเพื่อสร้างคอลเลกชันของ "เมล็ด" จะเริ่มต้นด้วย เราตัดสินใจที่จะเก็บข้อมูลมากที่สุดจาก SBC เหตุการณ์สำคัญก่อนหน้านี้ เราพบปัญหาคือการที่ข้อมูลเก่าเกี่ยวกับ CS เหตุการณ์ส่วนใหญ่มีเฉพาะในแบบฟอร์มผ่านเว็บไซต์ การแก้ไขปัญหานี้ปัญหา และตามประสบการณ์ของเราก่อนหน้านี้กับสภาพแวดล้อม DL เว็บ [1], เราสร้างห่อหุ้มสำหรับแยกข้อมูล (กระดาษชื่อเรื่อง ชื่อผู้เขียน สถานที่ของเหตุการณ์ และวัน ฯลฯ) จากกว่า 60 เว็บไซต์เหล่านี้เพื่อผลิตข้อมูล DC ที่ต้องสร้างแฟ้มต้นฉบับ OAI DC ระเบียนนอกจากนี้ยังมีการสร้างจากตารางของเนื้อหาที่มาจากภายนอกร่วมสมทบ (ในรูปแบบข้อความ) นอกจากนั้นที่ เรายังเก็บระเบียน DC จาก SIBGRAPI ดิจิตอลไลบรารีเก็บถาวร (iris.sid.inpe.br:1906), DL ที่เก็บชุดของเอกสารเต็มนำวิชาการบราซิลกราฟิกคอมพิวเตอร์และการประมวลผลภาพ - SIBGRAPI พ.ศ. 2539 ตารางที่ 1 สรุปข้อมูลเบื้องต้นที่รวบรวมสำหรับ BDBComp เราสามารถดู 2638 ระเบียนอยู่ใน BDBComp, 748 รวมงานนามธรรม และ 675 การเชื่อมโยงการทำงานเต็ม รวมข้อมูล BDBComp รวมวรรณคดี CS บราซิล โดยการรวมจำนวนต่าง ๆ เก็บทรัพยากรแตกต่างกัน ปัญหาหนึ่งที่สำคัญเป็นวิธีการระบุวัตถุหรือวัตถุที่สามารถรวมเข้าด้วยกันคล้าย (เช่น เอกสารมาจากวิทยานิพนธ์เฉพาะ) ซึ่งเป็นสิ่งสำคัญ เพื่อให้การให้บริการ และ การแก้ปัญหาเช่น deduping เบื้องต้นทดลองกับฟังก์ชันคล้ายให้รหัสของวัตถุดังกล่าวตามข้อมูลโครงสร้างที่ซับซ้อน (เช่น ตาม ด้วยเอกสาร XML) รวมกับสัญญาณมาตรฐานวัดได้แสดงผลลัพธ์ที่ดี [2] ปัญหาย่อยที่เกิดขึ้นที่นี่เป็นวิธีการระบุตัวแปรชื่อของผู้เขียน [4] นี้มีความสำคัญอย่างยิ่งเนื่องจากส่วนใหญ่ของข้อมูลที่เก็บใน BDBComp จนได้มาจากเว็บไซต์ที่ชื่อฟื้นฟูไม่ปัญหา ซึ่ง ในหลายสถานการณ์ การสร้างคำตอบหลายสำหรับผู้เขียนเดียวกันเมื่อค้น/เรียกดูตามชื่อผู้เขียน ระเบียนที่รวบรวมแหล่งรวมกับนามธรรมฟุตเชื่อมโยงเว็บไซต์ 2227 464 353 อื่น ๆ ร่วมสมทบ DLs 359 292 294 52 28 28 รวม 2638 748 675 ตาราง 1: ข้อมูลที่เก็บรวบรวมสำหรับ BDBComp เมล็ด มีส่วนร่วมของชุมชน CS กุญแจสู่ความสำเร็จและความยั่งยืนของการ DL ได้มีส่วนร่วมของชุมชนเป้าหมายในการใช้และการบำรุงรักษา ทีมงาน BDBComp จะทำงานอย่างใกล้ชิดกับ SBC ชุบของชุมชนรอบโครงการ ระหว่างความรับผิดชอบของ SBC จะยอมรับนโยบายที่ต้องการส่งข้อความแบบเต็ม น้อยสำหรับเอกสารที่แสดงเหตุการณ์สำคัญของ เก็บถาวร และเก็บรักษาคอลเลกชันดังกล่าว และการเลือกผู้เชี่ยวชาญจากกลุ่มความสนใจพิเศษของหลายเป็นผู้ส่ง5. บทสรุปและอนาคตทำงานเราจึงได้อธิบายแบบสั้น ๆ และอาคารต้นแบบปัจจุบันของบราซิลดิจิตอลไลบรารีของคอมพิวเตอร์ BDBComp รวมถึงความท้าทายมากมายต้องเผชิญ และนำเสนอโซลูชั่น ใช้มาตรฐาน (เช่น OAI, DC, SQL) เป็นเทคโนโลยีใหม่ที่พัฒนา โดยทีมงานโครงการ (เช่น เว็บข้อมูลแยกเครื่องมือ) ได้รับอนุญาตให้ต้นแบบที่ง่าย และรวดเร็ว: เพียงห้าเดือน โดยส่วนใหญ่นักศึกษาเป็นชั้น นอกจากความต่อเนื่องและการงานในระหว่างผลิต เราจะย้ายต้นเสาหินของเราไปเป็นสถาปัตยกรรมขึ้นรูปแปลก componentized รับประกัน expandability และขนาด [3,5], ขยายรูปแบบของ การรวมข้อมูลเฉพาะของความเป็นจริง (เช่น ทุนหน่วยงาน เชื่อมโยงไปยังหลักสูตรออนไลน์อย่างเป็นทางการของนักวิจัย) บราซิล พัฒนาบริการใหม่ (เช่น ค้นหาข้อความเต็มรูปแบบ ตั้งค่าส่วนบุคคล) อ้างอิง [1] Calado, P. et al สิ่งแวดล้อมเว็บ DL สำหรับอาคารดิจิตอลไลบรารีจากเว็บ ใน Proc. JCDL 2003 ฮุสตัน เท็กซัส สหรัฐอเมริกา พฤษภาคม 2003 นำ 346-357 [2] Carvalho, J.C.P. และ Silva, A.S. ค้นหาข้อมูลคล้ายคลึงกันระหว่างวัตถุจากหลายแหล่งที่มาเว็บ ใน Proc. WIDM 2003 นิวออร์ลีนส์ หลุยเซียน่า สหรัฐอเมริกา 2546 พฤศจิกายน นำ 90-93 [3] Gonçalves, M.A. สุนัขจิ้งจอก E.A. วัต สัน บริษัทแอลทีเวอค และ Kipp, N.A. กระแส โครงสร้าง ช่องว่าง สถานการณ์ สังคม (5S): แบบจำลองทางดิจิตอลไลบรารี พลอากาศ TOIS, 22 (2): 1-43, 2004 [4] ระเบียง M DBLP คอมพิวเตอร์วิทยาศาสตร์บรรณานุกรม: วิวัฒนาการ วิจัยปัญหา มุมมอง ใน Proc. สไปร์ 2002 ลิสบอน โปรตุเกส 2002 ก.ย. 1-10 พีพีอ่าวมาหยา [5] Suleman, H. เปิดดิจิตอลไลบรารี ปริญญาเอกวิทยานิพนธ์ แผนกคอมพิวเตอร์วิทยาศาสตร์ เวอร์จิเนียเทค Blacksburg, VA, 2002
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
4. MAJOR ท้าทายมรดกข้อมูลเว็บและการก่อสร้างของการเก็บเมล็ดพันธุ์ เพื่อให้บรรลุเป้าหมายของการเป็นแหล่งที่มาของข้อมูลเกี่ยวกับการผลิตทางวิทยาศาสตร์ของชุมชนชาวบราซิล CS, BDBComp อย่างยิ่งต้องอาศัยการบริการตนเองเก็บของ อย่างไรก็ตามก่อนที่จะทำให้บริการนี้มันเป็นสิ่งจำเป็นในการเก็บรวบรวมข้อมูลบางอย่างที่จะสร้าง "เมล็ดพันธุ์" คอลเลกชัน เริ่มต้นด้วยเราตัดสินใจที่จะเก็บรวบรวมข้อมูลมากที่สุดเท่าที่เป็นไปได้จากที่ก่อนหน้านี้เหตุการณ์ SBC ที่สำคัญ ปัญหาที่เราพบคือว่าส่วนใหญ่ของข้อมูลเดิมเกี่ยวกับเหตุการณ์ที่ลูกค้าที่มีอยู่เฉพาะในรูปแบบคงผ่านเว็บไซต์ เพื่อแก้ปัญหานี้และขึ้นอยู่กับประสบการณ์ที่ผ่านมาของเรามีสภาพแวดล้อมที่เว็บ DL [1] เราสร้างห่อสำหรับการสกัดข้อมูล (ชื่อกระดาษชื่อผู้เขียนเหตุการณ์สถานที่และวันอื่น ๆ ) จากกว่า 60 เว็บเหล่านี้ เว็บไซต์เพื่อผลิตบันทึกซีจำเป็นในการสร้างแฟ้มแหล่งที่มา OAI บันทึกซียังได้รับการสร้างขึ้นจากตารางของเนื้อหาให้ (ในรูปแบบต้นฉบับเดิม) โดยร่วมสมทบภายนอก นอกจากนั้นเรายังได้รวบรวมบันทึกซีจากห้องสมุดดิจิตอล SIBGRAPI คลัง (iris.sid.inpe.br:1906) DL ว่าคอลเลกชันที่เก็บของเอกสารข้อความเต็มรูปแบบที่นำเสนอในการประชุมทางวิชาการของบราซิลในคอมพิวเตอร์กราฟิกและการประมวลผลภาพ - SIBGRAPI ตั้งแต่ปี 1996 ตารางที่ 1 สรุปข้อมูลที่เก็บรวบรวมเมล็ดพันธุ์สำหรับ BDBComp ในฐานะที่เราสามารถมองเห็นของ 2638 บันทึกอยู่ในปัจจุบันใน BDBComp 748 รวมถึงนามธรรมทำงานและ 675 เชื่อมโยงไปยังการทำงานของข้อความเต็ม.
บูรณาการข้อมูล นับตั้งแต่มีการรวม BDBComp วรรณกรรม CS บราซิลโดยรวมทั้งทรัพยากรที่แตกต่างจากจำนวนของที่เก็บที่แตกต่างกันหนึ่งปัญหาที่สำคัญคือวิธีการระบุวัตถุที่คล้ายกันหรือวัตถุที่สามารถบูรณาการเข้าด้วยกัน
(เช่นเอกสารที่ได้มาจากวิทยานิพนธ์ที่เฉพาะเจาะจง) นี้เป็นสิ่งสำคัญที่จะช่วยให้การบริการและคุณสมบัติเหมือนกันในการแก้ปัญหาเช่น deduping การทดลองเบื้องต้นที่มีฟังก์ชั่นที่คล้ายคลึงกันที่จะอนุญาตให้บัตรประจำตัวของวัตถุดังกล่าวขึ้นอยู่กับข้อมูลที่มีโครงสร้างซับซ้อน (เช่นแสดงเป็นเอกสาร XML) รวมกับมาตรการ IR มาตรฐานได้แสดงให้เห็นผลลัพธ์ที่ดี [2] ปัญหาย่อยที่เกิดขึ้นที่นี่เป็นวิธีการระบุสายพันธุ์ของชื่อของผู้เขียน [4] นี้เป็นสิ่งสำคัญโดยเฉพาะอย่างยิ่งเพราะส่วนใหญ่ของข้อมูลที่รวบรวมสำหรับ BDBComp จนถึงขณะนี้ได้มาจากเว็บไซต์ที่ฟื้นฟูชื่อไม่เป็นปัญหาซึ่งในหลาย ๆ สถานการณ์ที่นำไปสู่การสร้างหลายคำตอบสำหรับนักเขียนคนเดียวกันเมื่อค้นหา / เรียกดูโดยผู้เขียน . ชื่อ
ประวัติแหล่งรวบรวมทั้งหมดด้วยบทคัดย่อ FT ด้วยการเชื่อมโยงเว็บไซต์ 2227 464 353 อื่น ๆ DLs 359 292 294 ร่วม 52 28 28 รวม 2,638 748 675 ตารางที่ 1: ข้อมูลที่เก็บรวบรวมเมล็ดพันธุ์สำหรับ BDBComp
การมีส่วนร่วมของชุมชน CS กุญแจสู่ความสำเร็จและความยั่งยืนของ DL ใด ๆ ที่มีส่วนร่วมของชุมชนเป้าหมายในการใช้งานและการบำรุงรักษา ทีม BDBComp จะทำงานอย่างใกล้ชิดกับเอสบีซีที่จะกระตุ้นชุมชนรอบโครงการ ในบรรดาความรับผิดชอบของเอสบีซีที่มีการยอมรับของนโยบายที่จะต้องส่งข้อความเต็มอย่างน้อยสำหรับเอกสารที่นำเสนอในเหตุการณ์สำคัญของการเก็บข้อมูลและการเก็บรักษาคอลเลกชันดังกล่าวและการเลือกของผู้เชี่ยวชาญจากกลุ่มผลประโยชน์พิเศษหลายประการที่จะทำหน้าที่เป็น ความคิดเห็นของการส่ง.
5 ข้อสรุปและการทำงานในอนาคตเราได้อธิบายสั้น ๆ การออกแบบและสร้างต้นแบบปัจจุบันของห้องสมุดดิจิตอลของบราซิลคอมพิวเตอร์ BDBComp รวมถึงหลายความท้าทายที่ต้องเผชิญกับการแก้ปัญหาและนำเสนอ ใช้มาตรฐาน (เช่นโอเอไอดีซี SQL) เช่นเดียวกับเทคโนโลยีใหม่ที่พัฒนาโดยทีมงานโครงการ (เช่นข้อมูลบนเว็บเครื่องมือสกัด) ได้รับอนุญาตให้สร้างต้นแบบง่ายและรวดเร็วเพียงห้าเดือนทำโดยส่วนใหญ่เป็นนักศึกษาระดับบัณฑิตศึกษาเป็นโครงการระดับ นอกจากความต่อเนื่องและการปรับแต่งการทำงานของความคืบหน้าในการที่เราจะย้ายเสาหินต้นแบบของเราที่จะขึ้นรูปแบบเชิงสถาปัตยกรรม componentized ที่จะรับประกันการขยายและ scalability [3,5] ขยายรูปแบบของเราที่จะมีข้อมูลที่เฉพาะเจาะจงกับความเป็นจริงของบราซิล (เช่น หน่วยงานระดมทุนเชื่อมโยงกับหลักสูตรออนไลน์อย่างเป็นทางการของนักวิจัย) และการพัฒนาบริการใหม่ ๆ (เช่นการค้นหาข้อความเต็มรูปแบบส่วนบุคคล).
อ้างอิง [1] Calado พี et al, เว็บ DL สิ่งแวดล้อมสำหรับการก่อสร้างอาคารห้องสมุดดิจิตอลจากเว็บ ในพร JCDL 2003, ฮูสตัน, เท็กซัสประเทศสหรัฐอเมริกาพฤษภาคม 2003 ได้ pp. 346-357 [2] ร์วัลโญ่, JCP และซิลวา, AS, หาอัตลักษณ์ที่คล้ายกันในหมู่วัตถุจากแหล่งที่มาหลายเว็บ ในพร WIDM 2003 New Orleans, Louisiana, สหรัฐอเมริกา, พฤศจิกายน 2003, หน้า. 90-93 [3] Gonçalves, MA, ฟ็อกซ์, EA, วัตสัน, LT และคิปป์, ลำธาร NA, โครงสร้าง, ช่องว่าง, สถานการณ์, สังคม (5): รุ่นอย่างเป็นทางการสำหรับห้องสมุดดิจิตอล ACM Tois 22 (2): 1-43 2004 [4] เลย์, M. DBLP วิทยาการคอมพิวเตอร์บรรณานุกรม: วิวัฒนาการวิจัยประเด็นมุมมอง ในพร SPIRE 2002, ลิสบอน, โปรตุเกส, กันยายน 2002, หน้า. 1-10 [5] Suleman เอชเปิดห้องสมุดดิจิตอล วิทยานิพนธ์ปริญญาเอกภาควิชาวิทยาการคอมพิวเตอร์มหาวิทยาลัยเวอร์จิเนียเทคแบล็ก, VA, 2002
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
4 . ความท้าทายหลักมรดกเว็บข้อมูลและสร้างเมล็ดพันธุ์ คอลเลกชัน เพื่อให้บรรลุเป้าหมายของตนเป็นแหล่งหลักของข้อมูลที่เกี่ยวกับการผลิตทางวิทยาศาสตร์ของชุมชน CS ที่บราซิล bdbcomp ขออาศัยตนเองเก็บบริการ อย่างไรก็ตาม ก่อนที่จะทำให้มันใช้ได้ มันเป็นบริการเก็บข้อมูลบางอย่างเพื่อสร้าง " เมล็ดพันธุ์ " คอลเลกชัน เริ่มต้นด้วยเราตัดสินใจที่จะเก็บรวบรวมข้อมูลมากที่สุดเท่าที่เป็นไปได้จากเหตุการณ์ในภาคหลักก่อน ปัญหาที่เราพบคือว่าส่วนใหญ่ของมรดกข้อมูลเกี่ยวกับเหตุการณ์ CS คือใช้ได้เฉพาะในรูปแบบคงที่ผ่านเว็บไซต์ เพื่อแก้ปัญหานี้ และขึ้นอยู่กับประสบการณ์ของเรากับสิ่งแวดล้อม dl เว็บ [ 1 ] เราสร้าง Wrappers เพื่อแยกข้อมูล ( ชื่อ , กระดาษเขียนชื่อของเหตุการณ์สถานที่และวันที่ ฯลฯ) จากกว่า 60 ของเว็บไซต์เหล่านี้เพื่อผลิต DC บันทึกต้องสร้างแหล่งพ. ไฟล์ ระเบียน DC ยังได้รับการสร้างขึ้นจากตารางของเนื้อหาให้ ( ในรูปแบบข้อความ ) โดยผู้ใช้ภายนอก นอกจากนั้นเรายังเก็บระเบียน DC จาก sibgrapi ห้องสมุดดิจิตอลถาวร ( ไอริส ซิด inpe BR : 1906 )เป็น DL ที่เก็บคอลเลกชันของรูปแบบข้อความเอกสารนำเสนอในการประชุมที่บราซิลในคอมพิวเตอร์กราฟฟิคและการประมวลผล - sibgrapi ภาพตั้งแต่ปี 1996 ตารางที่ 1 สรุปข้อมูลสำหรับเมล็ด bdbcomp . ดังจะเห็นได้จากปัจจุบันที่มีอยู่ใน bdbcomp 2398 ประวัติ , รวมงาน และนามธรรมและคุณเชื่อมโยงไปยังงานเต็มรูปแบบข้อความ
รวมข้อมูลตั้งแต่ bdbcomp คือรวบรวมวรรณกรรม CS ของบราซิล โดยรวมถึงข้อมูลทรัพยากรจากหมายเลขของเอกสารที่แตกต่างกัน ปัญหาหนึ่งที่สำคัญคือการระบุที่คล้ายกันวัตถุหรือวัตถุที่สามารถบูรณาการเข้าด้วยกัน
( เช่น เอกสารที่ได้จากวิทยานิพนธ์ที่เฉพาะเจาะจง ) นี้เป็นสิ่งสำคัญเพื่อให้บริการ homogenous และแก้ปัญหา เช่น deduping .การทดลองเบื้องต้น ด้วยฟังก์ชันที่คล้ายคลึง กับให้ตัวของวัตถุดังกล่าวบนพื้นฐานของข้อมูลที่มีโครงสร้างซับซ้อน ( เช่น ตามทัศนะของเอกสาร XML ) รวมกับมาตรการและมาตรฐานที่ได้แสดงผลที่ดี [ 2 ] ปัญหาที่เกิดขึ้นที่นี่คือย่อยวิธีการระบุตัวแปรที่ชื่อของผู้เขียน [ 4 ]นี้เป็นสิ่งสำคัญโดยเฉพาะอย่างยิ่งเนื่องจากส่วนใหญ่ของข้อมูลสำหรับ bdbcomp ไปได้มาจากเว็บไซต์ที่ชื่อนไม่ใช่ปัญหา ซึ่งในหลาย ๆสถานการณ์ นำไปสู่การสร้างเป็นผู้เขียนตอบแบบเดียวกันเมื่อค้นหา / เรียกดูชื่อผู้เขียน
ประวัติที่รวบรวมแหล่งรวมกับนามธรรมกับเว็บไซต์ 1848 464 353 dls อื่นๆ 359 292 294 ผู้สนับสนุนรวม 52 28 28 2398 และตอนนี้ตารางที่ 1 การเชื่อมโยงเว็บฟุต : เมล็ดรวบรวมข้อมูล bdbcomp
มีส่วนร่วมของ CS ชุมชน กุญแจสู่ความสำเร็จและความยั่งยืนของ DL คือการมีส่วนร่วมของชุมชนในการใช้เป้าหมายและการบํารุงรักษาทีม bdbcomp ทำงานอย่างใกล้ชิดกับ SBC เพื่อกระตุ้นชุมชนรอบโครงการ ในความรับผิดชอบของ SBC มีการยอมรับนโยบาย จะต้องส่ง ข้อความเต็ม อย่างน้อยเอกสารนำเสนอที่เหตุการณ์สำคัญของการเก็บรักษา เช่น คอลเลกชันและการเลือกของผู้เชี่ยวชาญจากหลายกลุ่มความสนใจพิเศษ เพื่อทำหน้าที่เป็นผู้ตรวจทานของส่ง .
5 ข้อสรุปและการทำงานในอนาคตเราได้สั้น ๆอธิบายการออกแบบและสร้างต้นแบบปัจจุบันของห้องสมุดดิจิตอลของบราซิล bdbcomp คอมพิวเตอร์ รวมถึงหลายของความท้าทายที่เผชิญ และเสนอแนวทางแก้ไข ใช้มาตรฐาน ( เช่น พ. , DC ,SQL ) เป็นเทคโนโลยีใหม่ที่พัฒนาโดยทีมงานโครงการ ( เช่น การสกัดข้อมูลเว็บ เครื่องมือ ) ได้รับอนุญาตให้รวดเร็ว และสร้างต้นแบบง่าย : เพียงห้าเดือน ทำโดยนักศึกษา เป็นโครงการระดับ อีกอย่าง ต่อเนื่องและการปรับแต่งของความก้าวหน้าในงาน เราจะย้ายต้นแบบเสาหินของเราให้มากขึ้นแบบมุ่งเน้นcomponentized สถาปัตยกรรมรับประกันขยายและ scalability [ 3.5 ] ขยายโมเดลของเราที่จะรวมข้อมูลที่เฉพาะเจาะจงกับความเป็นจริงของบราซิล ( เช่น หน่วยงาน การระดมทุน การเชื่อมโยงหลักสูตรออนไลน์อย่างเป็นทางการของนักวิจัย และพัฒนาบริการใหม่ ( เช่น การค้นหาข้อความเต็ม , Personalization )
เอกสารอ้างอิง [ 1 ] calado , หน้า et al . สิ่งแวดล้อม dl เว็บสำหรับการสร้างห้องสมุดดิจิตอลจากเว็บใน proc . jcdl 2003 , Houston , Texas , สหรัฐอเมริกา , 2003 , pp . 346-357 . [ 2 ] และ คาร์วัลโญ่ j.c.p. , ซิลวา , AS , การหาเอกลักษณ์ที่คล้ายคลึงกันของวัตถุจากหลายเว็บแหล่ง ใน proc . widm 2003 , นิวออร์ลีนส์ รัฐหลุยเซียนา สหรัฐอเมริกา พ.ย. 2003 , pp . 90-93 . [ 3 ] กอนทา Alves , ศศ . ม. , ฟ็อกซ์ , EA , วัตสัน , แอล. ที. และหน้าเครดิต กระแส โครงสร้าง เป็นสถานการณ์ สังคม ( 5s ) : รูปแบบอย่างเป็นทางการสำหรับห้องสมุดดิจิตอลพลอากาศเอก tois 22 ( 2 ) : 1-43 2004 [ 4 ] เลย์ เมตร dblp วิทยาการคอมพิวเตอร์บรรณานุกรม : วิวัฒนาการ , ปัญหาการวิจัย , มุมมอง ใน proc . ศิขร 2002 , ลิสบอน , โปรตุเกส , กันยายน 2002 , pp . 1-10 . [ 5 ] เลมานเอช เปิดห้องสมุดดิจิตอล . ปริญญาเอกวิทยานิพนธ์ , ภาควิชาวิทยาศาสตร์คอมพิวเตอร์ , Virginia Tech blacksburg va
, 2545
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: