Paper
In any case, the Web and the SEs do not substitute the classical, loved libraries.
Looking backwards, libraries can be classified into 3 types:
1. Analog/Paper Library (PL) the classical paper library with its card
catalog.
2. Automated/Hybrid Library (AL) - an analog library with a computerizedcatalog.
http://www.ifla.org/IV/ifla66/papers/029-142e.htm
3. Digital Library (DL) - a computerized library in which most of the
information is digital.
The problems of our regular libraries are well known and need not be detailed
here. On the other hand, it is less clear to us what a digital library is and what
are its various characteristics.
First, we classify the digital libraries into three categories:
1. Single Digital Library (SDL) the regular classical library implemented in
a fully computerized fashion.
2. Federated Digital Library (FDL) - this is a federation of several
independent libraries, centered on a common theme, on the network.
3. Harvested Digital Library (HDL) - this is a virtual library providing
summarized access to related material scattered over the network.
Consequently, we compare the various types of libraries and focus on a
comprehensive comparison between HDLs and SEs on the Web. To
demonstrate, we show exemplary digital libraries. In particular, we mention the
Katsir HDL, based on the Harvest system, which is currently being developed
in Bar-Ilan University.
1 Introduction
The Internet and the Web have been growing in leaps and bounds over the past
few years, accelerating the problem of information explosion, a well-known
phenomena to all of us. According to Nature 1, the publicly indexable Web
contains an estimated 800 million pages as of February 1999. Indeed, the
growing amount of Search Engines (SEs) that have popped up everywhere,
reaching more than 2400 different SEs, enable us to access the cyberspace, but
they also flood us with vast amounts of irrelevant information. Search engine
coverage, relative to the estimated size of the publicly indexable Web, has
recently decreased substantially, with no engine indexing more than about 16%
of the estimated size of the publicly indexable Web 1.
The article is structured as follows. This section presents the resource repository
hierarchy, defines the notion of a library and the development from paper to
digital libraries. The following section classifies digital libraries, compares
between the different types and introduces the logical harvesting model. We
conclude with a discussion.
1.1 Resource Repositories Hierarchy
Both SEs and Digital Libraries (DLs) are Internet Resource Discovery (IRD)
Tools. We introduce a resource repositories hierarchy with two major
paradigms: search engines and digital libraries, where each branches to
categories. SEs can be classified into three categories: Basic-SE, Directory, and
Meta-SE. All the categories support search user interfaces, but with significant
differences in their construction method:
1. Basic-SE/Index a tool that uses an automatic robot/crawler to gather
metadata on items.
2 of 8 3 2/12/01 4:15 PM
Digital libraries on the Internet ...nference Programme and Proceedings http://www.ifla.org/IV/ifla66/papers/029-142e.htm
.1
3 of 8
2. Directory/Catalog/Guide - a tool that uses human judgement to collect and
catalog items.
3. Meta-SE a tool that holds no database of its own, but rather queries
Basic-SEs upon a user request.
A detailed discussion about digital libraries, including DL categories, will be
presented in section 2.
1.2 What is a library
Before we delve into digital libraries, we define the notion of a library in
general and of a digital library specifically. We define a library as having six
major characteristics:
1. Collection of data objects - A library holds a collection of data objects,
also called holdings, items, resources, or just material. The items can be:
books and journals, documents (e.g., HTML pages), and multimedia
objects (such as pictures or images, tapes or video files, etc.). The library
objects can be available locally in the library, or indirectly, by using a
network to access them.
2. Collection of metadata structures A library contains a collection of
metadata structures, such as catalogs, guides, dictionaries, thesauri,
indices, summaries, annotations, glossaries, etc.
3. Collection of services - A library provides a collection of services, such as:
various access methods (search, browse, etc.) for different users,
management of the library, logging/statistics and Performance
Measurement Evaluation (PME) and Selective Dissemination of
Information (SDI) or as called Push mode.
4. Domain focus - A library has a domain focus and its collection has a
purpose. For example: art, science, or literature. Also, it is usually created
to serve a community of users, and therefore is finely grained. For
example: academic, public, special, school, national, or state library.
5. Quality control - A library uses quality control in the sense that all its
material is
กระดาษในกรณีใด ๆ เว็บและ บริษัท ไม่แทน คลาสสิก รักห้องสมุดมองย้อนกลับไป ห้องสมุดสามารถแบ่งออกเป็น 3 ประเภท ได้แก่1 . อะนาล็อก / กระดาษสมุด ( PL ) กระดาษคลาสสิกกับการ์ดของห้องสมุดแคตตาล็อก2 . ห้องสมุดอัตโนมัติ / ไฮบริด ( AL ) - ห้องสมุดอะนาล็อกกับ computerizedcatalog .http://www.ifla.org/iv/ifla66/papers/029-142e.htm3 . ห้องสมุดดิจิทัล ( DL ) - ห้องสมุดคอมพิวเตอร์ซึ่งในส่วนใหญ่ของข้อมูลเป็นดิจิตอลปัญหาของห้องสมุดปกติของเราเป็นที่รู้จักกันเป็นอย่างดี ไม่ต้องละเอียดที่นี่ บนมืออื่น ๆที่เป็นที่ชัดเจนน้อยเราว่าห้องสมุดดิจิตอลแล้วเป็นลักษณะต่าง ๆก่อนอื่น เราแบ่งออกเป็นสามประเภท : ห้องสมุดดิจิตอล1 . ห้องสมุดดิจิตอล ( SDL ) ประจำห้องสมุดที่ใช้ในคลาสสิกแฟชั่นคอมพิวเตอร์อย่างเต็มที่2 . ห้องสมุดดิจิตอล ( สหพันธ์ FDL ) - เป็นสหพันธ์หลายห้องสมุดอิสระ เป็นศูนย์กลางในเรื่องทั่วไปบนเครือข่าย3 . เก็บห้องสมุดดิจิตอล ( HDL ) - เป็นเสมือนห้องสมุดให้สรุปการเข้าถึงวัสดุที่เกี่ยวข้องกระจายไปทั่วเครือข่ายจากนั้น เราเปรียบเทียบประเภทต่างๆของห้องสมุด และมุ่งเน้นเป็นที่ครอบคลุมการเปรียบเทียบและ hdls การจราจรบนเว็บ เพื่อให้เราแสดงห้องสมุดดิจิตอลที่เป็นแบบอย่าง โดยเฉพาะ เราพูดถึงkatsir HDL ตามระบบการเก็บเกี่ยว ซึ่งกำลังถูกพัฒนาในบาร์ Ilan มหาวิทยาลัย1 แนะนำอินเทอร์เน็ตและเว็บมีการเติบโตใน leaps และขอบเขตกว่าอดีตไม่กี่ปี รวมถึงปัญหาของข้อมูลการระเบิด เป็น ที่รู้จักกันดีปรากฏการณ์ทั้งหมดของเรา ตามเว็บสาธารณะ indexable ธรรมชาติ 1มีประมาณ 800 ล้านหน้าเว็บเป็นกุมภาพันธ์ 1999 แน่นอนปริมาณการเติบโตของเครื่องมือค้นหา ( SES ) ที่ผุดขึ้นทุกถึงกว่า 2400 SES ที่แตกต่างกันช่วยให้เราเข้าถึงอินเตอร์เน็ต แต่พวกเขายังท่วมเรา มีจำนวนมากมายของข้อมูลที่ไม่เกี่ยวข้อง เครื่องมือค้นหาความคุ้มครอง , เมื่อเทียบกับประมาณขนาดของเว็บสาธารณะ indexable ,เมื่อเร็ว ๆนี้ลดลงอย่างมาก ไม่มีเครื่องยนต์ดัชนีมากกว่า 16 %ของการประมาณการขนาดของสาธารณชน indexable เว็บ 1บทความมีโครงสร้างดังนี้ ส่วนนี้นำเสนอทรัพยากรข้อมูลลำดับ กำหนดแนวคิดของห้องสมุดและการพัฒนาจากกระดาษห้องสมุดดิจิตอล ส่วนต่อไปนี้คือห้องสมุดดิจิตอล , เปรียบเทียบระหว่างชนิดที่แตกต่างกันและแนะนำรูปแบบการเก็บเกี่ยวตรรกะ เราสรุปการสนทนา1.1 ทรัพยากรที่เก็บลำดับชั้นทั้ง SES และห้องสมุดดิจิตอล ( dls ) เป็นทรัพยากรอินเทอร์เน็ต ( IRD ) การค้นพบเครื่องมือ เราแนะนำทรัพยากรที่เก็บลำดับสองหลักกระบวนทัศน์ : เครื่องมือค้นหาและห้องสมุดดิจิตอล ซึ่งแต่ละแห่งหมวดหมู่ บริษัท สามารถแบ่งออกเป็นสามประเภท : พื้นฐานและเซ ไดเรกทอรีเมเซ ทุกประเภท สนับสนุนการค้นหาส่วนติดต่อผู้ใช้ แต่อย่างมีนัยสำคัญความแตกต่างในวิธีการก่อสร้างของพวกเขา :1 . พื้นฐานดัชนีเซ / เครื่องมือที่ใช้รวบรวมข้อมูลเพื่อรวบรวมหุ่นยนต์อัตโนมัติเมตาดาต้าที่รายการ2 8 3 2 / 12 / 01 4 : 15 น.ห้องสมุดดิจิตอลบนอินเทอร์เน็ต . . . . . . . nference ตามกฎหมาย และ http://www.ifla.org/iv/ifla66/papers/029-142e.htm รายการ1 .3 82 . ไดเรกทอรี / แค็ตตาล็อก / คู่มือ - เครื่องมือที่ใช้ในการเก็บรวบรวมและการตัดสินใจของมนุษย์รายการแคตตาล็อก3 . เมตา SE เครื่องมือที่ถือไม่มีฐานข้อมูลของตนเอง แต่แบบสอบถามศึกษาพื้นฐานเมื่อผู้ใช้ร้องขอการอภิปรายรายละเอียดเกี่ยวกับห้องสมุดดิจิทัล รวมทั้งประเภท DL จะนำเสนอในส่วนที่ 21.2 ห้องสมุดคืออะไรก่อนที่เราจะเจาะลึกห้องสมุดดิจิตอล เรากำหนดความคิดของห้องสมุดในทั่วไปและห้องสมุดดิจิตอลโดยเฉพาะ เรานิยามห้องสมุดมีหกลักษณะสำคัญ :1 . คอลเลกชันของวัตถุ - ข้อมูลห้องสมุดเป็นคอลเลกชันของวัตถุข้อมูลเรียกว่า Holdings , รายการ , ทรัพยากรหรือวัสดุ รายการที่สามารถ :หนังสือและวารสาร เอกสาร ( เช่นหน้าเว็บ HTML ) และ มัลติมีเดียวัตถุ ( เช่น รูปภาพ หรือ ภาพ เทป หรือไฟล์วิดีโอ ฯลฯ ) ห้องสมุดวัตถุที่สามารถใช้ได้ภายในห้องสมุด หรือโดยอ้อมโดยเครือข่ายเพื่อเข้าถึงพวกเขา2 . คอลเลกชันของโครงสร้าง metadata ห้องสมุดมีคอลเลกชันของโครงสร้าง metadata เช่นแคตตาล็อก , คู่มือ , พจนานุกรม , thesauri ,ดัชนี , สรุปบันทึกย่อ อภิธาน ฯลฯ3 . คอลเลกชันของบริการห้องสมุด มีคอลเลกชันของการบริการต่างๆ เช่นวิธีเข้าถึงต่าง ๆ ( ค้นหาเรียกดู , ฯลฯ ) สำหรับผู้ใช้ที่แตกต่างกันการจัดการห้องสมุดเข้าสู่ระบบ / สถิติ และประสิทธิภาพการประเมินการวัด ( PME ) และงานเผยแพร่ข้อมูล ( SDI ) หรือที่เรียกว่าโหมดกด4 . ห้องสมุดโดเมนโฟกัส - มีความสนใจและมีคอลเลกชันของโดเมนวัตถุประสงค์ ตัวอย่าง : ศิลปะ วิทยาศาสตร์ หรือที่เกี่ยวข้อง นอกจากนี้ยังมักจะสร้างที่จะให้บริการชุมชนของผู้ใช้และดังนั้นจึงเป็นเม็ดเล็กละเอียด สำหรับตัวอย่าง : วิชาการ , งาน , พิเศษ , โรงเรียน , ประเทศ , รัฐหรือห้องสมุด5 . ควบคุม - ห้องสมุดคุณภาพใช้ควบคุมคุณภาพในความรู้สึกที่ทั้งหมดวัสดุคือ
การแปล กรุณารอสักครู่..
