BDBComp: Building a Digital Library for the Brazilian Computer Science Community*
Alberto H. F. Laender1 Marcos André Gonçalves2 Pablo A. Roberto1
1Department of Computer Science Federal University of Minas Gerais 31270-901 - Belo Horizonte - MG Brazil {laender,pabloa}@dcc.ufmg.br
ABSTRACT
This paper reports initial efforts towards building BDBComp, a digital library for the Brazilian computer science community. BDBComp is based on a number of standards (e.g., OAI, Dublin Core, SQL) as well as on new technologies (e.g., Web data extraction tools), which allowed fast and easy prototyping. The paper focuses on architectural issues and specific challenges faced during the construction of this digital library as well as on proposed solutions.
Categories and Subject Descriptors
D.3.7 [Information Systems]: Information Storage and Retrieval – Digital Libraries General Terms
Design, Economics. Keywords
Computing Digital Libraries, OAI, DL Modeling, National DLs.
1. INTRODUCTION
The last two decades has witnessed the consolidation of the Brazilian computer science (CS) community as the largest and most active one in Latin America. According to a recent census conducted by the Ministry of Education (www.inep.gov.br), the number of undergraduate programs in computer science and computer engineering in Brazil has grown from less than 20 in the early 80’s to more than 360 in 2002. The number of graduate programs also has grown at approximately the same rate and today, considering only those whose main core is computer science, there are 29 programs in the country. As a result, there has been a considerable increase in the number of theses and dissertations concluded in these programs as well in the number of papers published in international conference proceedings and journals. In addition, the Brazilian Computing Society - SBC (www.sbc.org.br) promotes and organizes about 30 events every year, most of which have official proceedings that collect a substantial part of the community’s scientific production.
Therefore, there exists a strong need for mechanisms for archiving, preserving, indexing, and disseminating the wealth of scientific knowledge produced by the Brazilian CS community. This paper reports initial efforts towards this goal, by describing the design and building of the Brazilian Digital Library of
*This work is partially supported by the I3DL Project (MCT/CNPq/ProTeM-CC grant 680154/01-9).
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. JCDL’04, June 7–11, 2004, Tucson, Arizona, USA. Copyright 2004 ACM 1-58113-832-6/04/0006…$5.00.
23 Proceedings of the 2004 Joint ACM/IEEE Conference on Digital Libraries (JCDL’04) 1-58113-832-6/04 $ 20.00 © 2004 ACM
2 Department of Computer Science
Virginia Tech Blacksburg, VA 24061USA mgoncalv@vt.edu
Computing - BDBComp (www.lbd.dcc.ufmg.br/bdbcomp/). Our focus is on architectural issues and specific challenges faced during the construction of this DL as well as on proposed solutions. BDBComp has been designed to be OAI compliant and adopts Dublin Core (DC) as its metadata standard.
2. THE BDBCOMP ARCHITECTURE
The BDBComp architecture comprises three major layers (Figure
1). The user interfaces serve as a “glue” that binds all provided services together. These are diverse interfaces specially tailored to the needs of different communities of users, among them: general users (e.g., educators, apprentices, researchers), contributors, and administrators. The services we expect to provide for general users are those usually available in any DL, such as searching and browsing, as well as more advanced ones such as filtering, recommendation, automatic linking, etc. Currently, BDBComp provides only searching, browsing, and limited linking facilities, similar to the services provided by DBLP [4].
Users Contributors A dm inistrators Interfaces Reviewers
Searching Filtering Linking S elf-A rch iv in g
Browsing
O A I P rotoco l Web-DL
W eb Sites
BDBComp (m etadata)
A d m inistratio n O AI P r otocol
Other R epositories (eg, CITIDEL, DBLP)
Figure 1: The BDBComp Architecture
Services
Repositories
In addition to general purpose services, BDBComp will provide a self-archiving service, for allowing contributors to submit metadata to the main repository, including facilities to import such data for complete conference proceedings and books in a batch mode. Reviewers will play an important role in this service since they will be responsible for approving the metadata submissions. There will also be special purpose administration services. Finally, at the bottom level we find the main repository that stores the metadata describing available resources. In addition to the self-archiving service, we envisage two other ways to collect metadata for the repository: (1) by extracting them from existing Web sites, for instance, by using tools such as the Web- DL environment [1], and (2) by harvesting other OAI complaint repositories. The former deals with a large number of sources of legacy data (e.g., conference and institutional Web sites) already existing in the Web, while the latter supplements the BDBComp information, for example, by including data from works of Brazilian authors published in international conferences and journals (e.g., harvested from DLs such as CITIDEL
bdbcomp : สร้างห้องสมุดดิจิตอลสำหรับบราซิลวิทยาศาสตร์คอมพิวเตอร์ชุมชน
ล H . F . laender1 มาร์ค อังเดร กอนทา alves2 พาโบล A roberto1
สาขาวิทยาศาสตร์คอมพิวเตอร์ มหาวิทยาลัยสหพันธ์รัฐมีนัสเชไรส์ 31270-901 - เบโลโฮริซอนตี - มก. บราซิล laender pabloa } { , @ DCC . ufmg BR
บทความนี้บทคัดย่อรายงานความพยายามต่อ bdbcomp อาคารห้องสมุดดิจิตอลสำหรับชาวชุมชนวิทยาศาสตร์คอมพิวเตอร์ bdbcomp จะขึ้นอยู่กับจำนวนของมาตรฐาน ( เช่น พ. ดับลินคอร์ , SQL ) เป็นเทคโนโลยีใหม่ เช่น การสกัดข้อมูลเว็บ เครื่องมือ ) , ซึ่งได้รับอนุญาตให้สร้างได้ง่ายและรวดเร็ว กระดาษที่เน้นประเด็นด้านสถาปัตยกรรมและความท้าทายที่เฉพาะเจาะจงต้องเผชิญในระหว่างการก่อสร้างนี้ ห้องสมุดดิจิตอล ตลอดจนการนำเสนอโซลูชั่น
หมวดหมู่และหัวเรื่องใน
d.3.7 [ ข้อมูล ] : ระบบการจัดเก็บและค้นข้อสนเทศและห้องสมุดดิจิตอลทั่วไปแง่
ออกแบบ , เศรษฐศาสตร์ คำสำคัญ
คอมพิวเตอร์ห้องสมุด พ. , DL แบบดิจิตอล dls แห่งชาติ .
1 บทนำ
2 ทศวรรษที่ผ่านมาได้เห็นการรวมของวิทยาศาสตร์คอมพิวเตอร์บราซิล ( CS ) ชุมชนที่ใหญ่ที่สุดและใช้งานมากที่สุดในละตินอเมริกาตามการสำรวจสำมะโนประชากรล่าสุดที่จัดทำโดยกระทรวงศึกษาธิการ ( www.inep . gov.br ) , หมายเลขของโปรแกรมปริญญาตรีในสาขาคอมพิวเตอร์และวิศวกรรมคอมพิวเตอร์ในบราซิลมีการเติบโตจาก 20 ในต้นปี 80 กว่า 360 ในปี 2002 จำนวนหลักสูตรบัณฑิตศึกษายังเติบโตในอัตราประมาณเดียวกัน และในวันนี้พิจารณาเฉพาะผู้ที่มีหลัก คือ วิทยาศาสตร์ คอมพิวเตอร์ มีโปรแกรมใน 29 ประเทศ เป็นผลให้มีการเพิ่มขึ้นมากในจำนวนของวิทยานิพนธ์และดุษฎีนิพนธ์ สรุปในโปรแกรมเหล่านี้เป็นหมายเลขของเอกสารตีพิมพ์ในการประชุมตามกฎหมายระหว่างประเทศ และวารสาร นอกจากนี้ สมาคมคอมพิวเตอร์บราซิล - SBC ( www.sbc.org .BR ) ส่งเสริมและจัดกิจกรรมทุก ๆ 30 ปี ซึ่งส่วนใหญ่มีเจ้าหน้าที่ดำเนินการรวบรวมส่วนอย่างมากของการผลิตทางวิทยาศาสตร์ของชุมชน .
จึงมีความต้องการที่แข็งแกร่งสำหรับกลไกในการเก็บรักษา , การสร้างดัชนีและกระจายความมั่งคั่งของความรู้ทางวิทยาศาสตร์ที่ผลิตโดยชาว CS ชุมชนบทความนี้รายงานเบื้องต้น ความพยายามไปสู่เป้าหมายนี้ โดยอธิบายถึงการออกแบบและสร้างห้องสมุดดิจิตอลของบราซิล
* งานนี้เป็นบางส่วนที่สนับสนุนโดยโครงการ i3dl ( ที / cnpq / protem CC ให้ 680154 /
01-9 )อนุญาตให้สำเนาดิจิตอลหรือฮาร์ดดิสก์ทั้งหมดหรือบางส่วนของงานนี้สำหรับใช้ส่วนบุคคลหรือในชั้นเรียนจะได้รับโดยไม่เสียค่าธรรมเนียมให้สำเนาไม่ทำหรือจำหน่ายกำไรหรือประโยชน์เชิงพาณิชย์และชุดหมีตัวนี้แจ้งให้ทราบและการเต็มรูปแบบในหน้าแรก เพื่อคัดลอกอื่น หรือพิมพ์เพื่อโพสต์บนเซิร์ฟเวอร์หรือเพื่อแจกจ่ายไปยังรายการต้องใช้ก่อนได้รับอนุญาตเฉพาะเจาะจง และ / หรือ ค่าธรรมเนียม jcdl '04 วันที่ 7 – 11 , 2004 , Tucson , Arizona , สหรัฐอเมริกา จาก 1-58113-832-6 ลิขสิทธิ์ 2004 / 04 / 0006 . . . $ 5.00 .
23 เรื่องการสำรวจร่วมกัน ACM / IEEE การประชุมห้องสมุดดิจิตอล ( jcdl '04 ) 1-58113-832-6 / 04 $ 20.00 สงวนลิขสิทธิ์ 2004 ACM
2 ภาควิชาวิทยาศาสตร์คอมพิวเตอร์ blacksburg เวอร์จิเนียเทค , และ 24061usa mgoncalv @ vt.edu
คอมพิวเตอร์ - bdbcomp ( www.lbd.dcc.ufmg .br / bdbcomp / ) โดยมุ่งเน้นในเรื่องสถาปัตยกรรม และความท้าทายที่เฉพาะเจาะจงต้องเผชิญในระหว่างการก่อสร้างของ DL นี้ รวมทั้งเสนอแนวทางแก้ไข bdbcomp ได้รับการออกแบบให้สอดคล้อง และ adopts พ. ดับลินคอร์ ( DC ) เป็นมาตรฐานเมตาดาต้าของมัน .
2 สถาปัตยกรรม bdbcomp
bdbcomp สถาปัตยกรรมประกอบด้วย 3 ชั้นหลัก ( รูป
1 )อินเทอร์เฟซผู้ใช้ ทำหน้าที่เป็น " กาว " ที่ผนึกทั้งหมดให้บริการด้วยกัน เหล่านี้มีอินเตอร์เฟซที่ออกแบบพิเศษเพื่อตอบสนองความต้องการของชุมชนต่าง ๆ ของผู้ใช้ ในหมู่พวกเขา : ผู้ใช้ทั่วไป ( เช่น อาจารย์ ลูกศิษย์ นักวิจัย ) , ร่วมสมทบ และผู้บริหาร เราคาดหวังที่จะให้บริการสำหรับผู้ใช้ทั่วไปที่มักจะใช้ได้ใน DLเช่นการค้นหาและการเรียกดู , คนที่เป็นขั้นสูงมากขึ้นเช่นการกรอง , แนะนำ , อัตโนมัติเชื่อมโยง ฯลฯ ในปัจจุบัน มีเพียง bdbcomp ค้นหา เรียกดู และจำกัดการเชื่อมโยงเครื่อง คล้ายกับการให้บริการ dblp [ 4 ] .
ผู้ใช้ผู้สนับสนุนเป็น DM inistrators interfaces ตรวจสอบ
ค้นหากรองการเชื่อมโยงของ elf-a rch IV ใน การเรียกดู
o
L
ผม P rotoco DL เว็บเว็บไซต์
bdbcomp W EB ( M etadata )
D M N O P R inistratio AI otocol
อื่น ๆ ( เช่น citidel epositories r ,
dblp ) รูปที่ 1 : bdbcomp สถาปัตยกรรม
บริการขั้นตอนนอกเหนือจากวัตถุประสงค์ทั่วไป บริการ bdbcomp จะให้ตนเองเก็บบริการ เพื่อช่วยให้ผู้ที่จะส่งข้อมูลเพื่อเก็บข้อมูลหลักรวมทั้งเครื่องเพื่อนำเข้าข้อมูลเช่นการประชุมตามกฎหมายที่สมบูรณ์และหนังสือในโหมดแบทช์ . ผู้แสดงความคิดเห็นจะมีบทบาทสำคัญในการให้บริการนี้เนื่องจากพวกเขาจะรับผิดชอบในการอนุมัติข้อมูลส่ง นอกจากนี้ยังมีวัตถุประสงค์พิเศษ การบริการ การบริหาร ในที่สุดที่ระดับล่าง เราหาข้อมูลที่จัดเก็บข้อมูลหลักเกี่ยวกับทรัพยากรที่มีอยู่ นอกจากตนเองเก็บบริการเราอีกสองวิธีอื่น ๆเพื่อเก็บข้อมูลสำหรับเก็บข้อมูล ( 1 ) โดยแยกพวกเขาจากเว็บไซต์ที่มีอยู่ เช่น การใช้เครื่องมือ เช่น เว็บ - DL สิ่งแวดล้อม [ 1 ] และ ( 2 ) โดยการเก็บเกี่ยวที่เก็บร้องเรียนพ. อื่นข้อเสนอเดิมกับจำนวนมากของแหล่งที่มาของข้อมูลเดิม ( เช่น การประชุมและสถาบันเว็บไซต์ ) ที่มีอยู่ในเว็บ ในขณะที่หลัง อาหารเสริมข้อมูล bdbcomp ตัวอย่างเช่น รวมทั้งข้อมูลจากผลงานของบราซิล ผู้เขียนได้รับการตีพิมพ์ในการประชุมนานาชาติและวารสาร ( เช่นจากการเก็บเกี่ยว dls เช่น citidel
การแปล กรุณารอสักครู่..
