1. Introduction
The effective use of library loan records for generating recommendations has been actively discussed among librarians and library and information science researchers. One method is to recommend books to users based on loan records. Some studies have proposed approaches for implementing this method. However, most of these methods use only the information from loan records. Book titles and the Nippon Decimal Classification (NDC) categories that have been assigned to the books have not been used. We contend that book titles, NDC categories,
and the outlines of books from the BOOK Database are important additional clues that can be used for the purpose of formulating effective book recommendations and that the optimum combination and weighting of these additional clues can be determined through machine learning. In particular, the similarities between titles, matches on the NDC category, similarities between the outlines in the BOOK Database, and association rules that are based on the loan records can be used as “features” of learning data. Support vector machines (SVM) can use this data to determine the weights of the features, perform automatic classifications, and generate recommendations.
In our experiment, subjects were asked to provide the name of “one book that currently interests the subject” and a recommendation was made by the SVM based on the following information: (1) the confidence and support from an association rule, (2) similarities between titles, (3) matches/mismatches between NDC categories, and (4) similarities between the outlines in the BOOK Database. Tsuji et al. (2011) (2012) found that Amazon’s book recommendation system had better results than a recommendation system that was based only on an association rule that used library loan records. In our experiment, book recommendations were conducted and comparisons
with Amazon were included.
In this study, the books that we recommended were books from the T University Library and the library loan records were also from the T University Library. We recommended books to test subjects non-graphically (i.e., by showing only the bibliographic data, such as the title, author, publisher, and publication year of the book).
2. Related Studies
There have only been a few studies of book recommendations based on library loan records. Harada (2009) and
Harada & Masuda (2010) used collaborative filtering. Tsuji et al. (2011) (2012) used 1,854,345 loan records from
39,442 users of the T University Library and recommended books to 33 undergraduate and graduate students based
on (1) the collaborative filtering method that was proposed by Harada & Masuda (2010), (2) an association rule,
and (3) Amazon. They found that the evaluations of these methods were ranked from best to worst as Amazon,
association rules, and then collaborative filtering.
Whitney & Schiff (2006) proposed a recommendation method that used a weighted graph model that is similar
to the association rule method. Chen & Chen (2007), Luo et al. (2009), and Shirgaonkar et al. (2010) proposed
various recommendation methods, but did not conduct experiments in order to evaluate their effectiveness.
3. Data
3.1. Library Loan Records and Bibliographic Data of T University Library
We obtained 2,324,418 loan records from the T University library. The checkout dates ranged from January 2,
2006 to March 31, 2012. Of these records, 999,630 were for books that were checked out by undergraduate
students. 1,294,012 books were checked out by graduate students and faculty members. 30,776 books were
checked by other types of patrons. We used 2,293,642 loan records from undergraduate students, graduate
students, and faculty members for this study. The number of types of books that were borrowed was 477,668 and
the number of users was 44,571. The number of baskets (i.e., sets of books that were borrowed together) was
821,771.
For recommendation, we chose books to which the NDC categories were assigned in the T University Library.
The number of these books was 643,676. NDC categories have not been assigned to many of the books in the T
University Library collection that are written in English or other non-Japanese languages. As a result, the number
643,676 is much smaller than the total number of books that the T University Library holds.
1. บทนำอธิบายการใช้ประสิทธิภาพของเรกคอร์ดไลบรารีเงินกู้สำหรับการสร้างคำแนะนำ librarians และนักวิจัยของห้องสมุดและข้อมูลวิทยาศาสตร์อย่างแข็งขัน วิธีการหนึ่งคือการ แนะนำหนังสือให้ผู้ใช้ตามเรกคอร์ดเงินกู้ บางการศึกษาได้เสนอแนวทางการใช้วิธีนี้ อย่างไรก็ตาม ที่สุดของวิธีการเหล่านี้ใช้เฉพาะข้อมูลจากบันทึกสินเชื่อ ไม่ได้ใช้องค์ประกอบและประเภทประเภททศนิยมของนิปปอน (ว.) ที่ได้ถูกกำหนดให้กับสมุดบัญชี เราขอยืนยันว่า หนังสือชื่อเรื่อง ประเภทแสงแดดและเค้าร่างของหนังสือจากฐานข้อมูลหนังสือมีเบาะแสเพิ่มเติมสำคัญที่สามารถใช้เพื่อ formulating แนะนำหนังสือที่มีประสิทธิภาพและให้ชุดเหมาะสมกับน้ำหนักของปมเหล่านี้เพิ่มเติมสามารถระบุผ่านการเรียนรู้ของเครื่อง โดยเฉพาะอย่างยิ่ง ความคล้ายคลึงระหว่างชื่อเรื่อง ความคล้ายคลึงระหว่างเค้าร่างในฐานข้อมูลการจอง และสมาคมที่มีเรกคอร์ดเงินกู้ แข่งขันในประเภทแสงแดดสามารถใช้เป็น "คุณลักษณะ" การเรียนรู้ข้อมูล สนับสนุนเครื่องแบบเวกเตอร์ (SVM) สามารถใช้ข้อมูลนี้ เพื่อพิจารณาน้ำหนักของคุณลักษณะ การจัดประเภทอัตโนมัติ สร้างคำแนะนำในการทดลองของเรา เรื่องที่ขอให้ชื่อของ "เล่มที่กำลังสนใจเรื่อง" และทำการแนะนำ โดย SVM ตามข้อมูลต่อไปนี้: (1)ความเชื่อมั่นและการสนับสนุนจากสมาคมการปกครอง, (2) ความคล้ายคลึงระหว่างชื่อ, (3) ตรง/mismatches ระหว่างประเภทแสงแดด และ (4) ความคล้ายคลึงระหว่างเค้าร่างในฐานข้อมูลของสมุดงาน Al. ร้อยเอ็ด Tsuji (2011) (2012) พบว่า ระบบแนะนำหนังสือของ Amazon มีผลดีกว่าระบบคำแนะนำที่ถูกยึดตามกฎการเชื่อมโยงที่ใช้ไลบรารีเรกคอร์ดเงินกู้เท่า นั้น ในการทดลองของเรา แนะนำหนังสือได้ดำเนินการเปรียบเทียบและกับ Amazon ได้รวม ในการศึกษานี้ ว่าเราขอแนะนำหนังสือได้หนังสือจากห้องสมุดมหาวิทยาลัย T และข้อมูลสินเชื่อของไลบรารีมีจากห้องสมุดมหาวิทยาลัย T เราขอแนะนำหนังสือเพื่อทดสอบวิชาไม่ภาพ (เช่น โดยแสดงเฉพาะบรรณานุกรมข้อมูล เช่นปีชื่อเรื่อง ผู้เขียน ผู้เผยแพร่ และสิ่งพิมพ์ของหนังสือ)2. ที่เกี่ยวข้องกับการศึกษาเฉพาะมีกี่ศึกษาคำแนะนำหนังสือตามเรกคอร์ดไลบรารีเงินกู้ Harada (2009) และHarada และสึดะ (2010) ใช้กรองร่วมกัน Al. ร้อยเอ็ด Tsuji (2011) (2012) ใช้ 1,854,345 เรกคอร์ดเงินกู้จากผู้ใช้ห้องสมุดมหาวิทยาลัย T และแนะนำหนังสือการ 33 ระดับปริญญาตรี และบัณฑิตศึกษาโดย 39,442บนวิธีกรอง (1)ร่วมกันที่ถูกนำเสนอ โดย Harada และสึดะ (2010), (2) การเชื่อมโยงกฎและอเมซอน (3) พวกเขาพบว่า การประเมินวิธีการเหล่านี้ถูกจัดอันดับจากดีที่สุดเลวเป็น Amazonสมาคม และกรองแล้วร่วมกันวิทนีย์และองท์ชิฟฟ์ (2006) เสนอคำแนะนำวิธีที่ใช้แบบจำลองกราฟถ่วงน้ำหนักได้การวิธีการกฎความสัมพันธ์ นำเสนอเฉิน และเฉิน (2007), Luo et al. (2009), และ Shirgaonkar et al. (2010)วิธีการคำแนะนำต่าง ๆ แต่ไม่ได้ทำการทดลองเพื่อประเมินประสิทธิผลของการ3. ข้อมูล3.1 การไลบรารีเรกคอร์ดเงินกู้และข้อมูลบรรณานุกรมของห้องสมุดมหาวิทยาลัย Tเรารับเรกคอร์ดเงินกู้ 2,324,418 จากห้องสมุดมหาวิทยาลัย T วันเช็คเอาท์มา 2 มกราคม2006 ถึง 31 มีนาคม 2012 คอร์ด 999,630 มีในหนังสือที่ถูกเช็คเอาท์ โดยระดับปริญญาตรีนักเรียน หนังสือ 1,294,012 ถูกเช็คเอาท์ โดยอาจารย์และนักศึกษา มีหนังสือที่ 30,776ตรวจสอบ โดยลูกค้าชนิดอื่น ๆ เราใช้เรกคอร์ดเงินกู้ 2,293,642 จากระดับปริญญาตรี บัณฑิตวิทยาลัยอาจารย์และนักศึกษาสำหรับการศึกษานี้ จำนวนชนิดของหนังสือที่ถูกยืมมาเป็น 477,668 และจำนวนผู้ใช้ 44,571 มีจำนวนตะกร้า (เช่น ชุดของหนังสือที่ถูกยืมใช้กัน)821,771สำหรับคำแนะนำ เราเลือกหนังสือซึ่งมีกำหนดประเภทแสงแดดในห้องสมุดมหาวิทยาลัย Tจำนวนหนังสือเหล่านี้ถูก 643,676 ไม่ได้ถูกกำหนดประเภทว.หลายเล่มใน Tชุดห้องสมุดมหาวิทยาลัยที่เขียนภาษาอังกฤษหรือภาษา-ญี่ปุ่น เป็นผล จำนวน643,676 มีขนาดเล็กกว่าจำนวนหนังสือที่ห้องสมุดมหาวิทยาลัย T มี
การแปล กรุณารอสักครู่..

1. บทนำ
การใช้งานที่มีประสิทธิภาพของการบันทึกเงินกู้ยืมห้องสมุดสำหรับการสร้างข้อเสนอแนะที่ได้รับการกล่าวถึงอย่างแข็งขันในหมู่บรรณารักษ์และห้องสมุดและนักวิจัยวิทยาการสารสนเทศ วิธีหนึ่งคือการแนะนำหนังสือให้ผู้ใช้ตามบันทึกเงินกู้ บางการศึกษาได้เสนอแนวทางในการดำเนินการวิธีการนี้ แต่ส่วนใหญ่ของวิธีการเหล่านี้ใช้เพียงข้อมูลจากการบันทึกเงินกู้ยืม ชื่อหนังสือและ Nippon ทศนิยมจำแนก (NDC) ประเภทที่ได้รับมอบหมายให้หนังสือที่ยังไม่ได้ถูกนำมาใช้ เรายืนยันว่าชื่อหนังสือประเภท NDC,
และโครงร่างของหนังสือจากฐานข้อมูลหนังสือที่มีเบาะแสเพิ่มเติมที่สำคัญที่สามารถนำมาใช้เพื่อวัตถุประสงค์ในการกำหนดคำแนะนำหนังสือที่มีประสิทธิภาพและการรวมกันที่เหมาะสมและน้ำหนักของเบาะแสเพิ่มเติมเหล่านี้สามารถตรวจสอบได้ผ่านเครื่อง การเรียนรู้ โดยเฉพาะอย่างยิ่งความคล้ายคลึงกันระหว่างชื่อตรงกับประเภท NDC, ความคล้ายคลึงกันระหว่างโครงร่างในฐานข้อมูลหนังสือและกฎสมาคมที่อยู่บนพื้นฐานของบันทึกสินเชื่อสามารถใช้เป็น "คุณสมบัติ" ของข้อมูลการเรียนรู้ เครื่องเวกเตอร์สนับสนุน (SVM) สามารถใช้ข้อมูลนี้เพื่อกำหนดน้ำหนักของคุณลักษณะดำเนินการจัดอัตโนมัติและสร้างข้อแนะนำ
ในการทดลองของเราถูกถามเรื่องที่จะให้ชื่อของ "หนังสือเล่มหนึ่งที่กำลังสนใจเรื่องนี้" และข้อเสนอแนะ ถูกสร้างขึ้นมาโดย SVM อยู่บนพื้นฐานของข้อมูลดังต่อไปนี้ (1) ความเชื่อมั่นและการสนับสนุนจากการปกครองของสมาคม (2) ความคล้ายคลึงกันระหว่างชื่อ (3) ตรง / ไม่ตรงกันระหว่างประเภท NDC และ (4) ความคล้ายคลึงกันระหว่างการแสดงใน ฐานข้อมูลหนังสือ ซูจิและคณะ (2011) (2012) พบว่าระบบแนะนำหนังสือของ Amazon มีผลลัพธ์ที่ดีกว่าระบบแนะนำที่ถูกใช้เฉพาะในกฎของสมาคมที่ใช้ในการบันทึกเงินกู้ยืมห้องสมุด ในการทดลองของเราคำแนะนำหนังสือกำลังดำเนินการและการเปรียบเทียบ
กับ Amazon ถูกรวมอยู่
ในการศึกษานี้หนังสือที่เราแนะนำเป็นหนังสือจากห้องสมุดมหาวิทยาลัยทีและบันทึกเงินกู้ยืมห้องสมุดนั้นยังมีจากห้องสมุดมหาวิทยาลัย T เราขอแนะนำหนังสือที่จะทดสอบวิชาที่ไม่ชัดเจน (เช่นโดยการแสดงเฉพาะข้อมูลบรรณานุกรมเช่นชื่อผู้เขียนสำนักพิมพ์และปีการตีพิมพ์หนังสือ)
2 สาขาวิชาที่เกี่ยวข้อง
มีเพียงการศึกษาน้อยของคำแนะนำหนังสืออยู่บนพื้นฐานของบันทึกสินเชื่อห้องสมุด ฮาราดะ (2009) และ
ฮาราดะและมาสุดะ (2010) ที่ใช้ในการกรองการทำงานร่วมกัน ซูจิและคณะ (2011) (2012) ที่ใช้บันทึก 1,854,345 เงินกู้ยืมจาก
39,442 ผู้ใช้ของห้องสมุด T มหาวิทยาลัยและแนะนำหนังสือถึง 33 นักศึกษาระดับปริญญาตรีและระดับบัณฑิตศึกษาตาม
ที่ (1) วิธีการกรองการทำงานร่วมกันที่ได้รับการเสนอโดยฮาราดะและมาสุดะ (2010), (2) กฎสมาคม,
และ (3) อเมซอน พวกเขาพบว่าการประเมินผลของวิธีการเหล่านี้ได้รับการจัดอันดับจากที่ดีที่สุดเพื่อที่เลวร้ายที่สุด Amazon,
กฎสมาคมและจากนั้นกรองการทำงานร่วมกัน
และวิทนีย์ชิฟฟ์ (2006) เสนอวิธีการคำแนะนำที่ใช้รูปแบบของกราฟถ่วงน้ำหนักที่คล้าย
กับวิธีการปกครองของสมาคม เฉินและเฉิน (2007), Luo et al, (2009) และ Shirgaonkar และคณะ (2010) เสนอ
วิธีการข้อเสนอแนะต่าง ๆ แต่ไม่ได้ทำการทดลองเพื่อประเมินประสิทธิภาพของพวกเขา
3 ข้อมูล
3.1 ห้องสมุดสินเชื่อประวัติและบรรณานุกรมข้อมูลของ T ห้องสมุดมหาวิทยาลัย
เราได้รับ 2,324,418 บันทึกเงินกู้ยืมจากห้องสมุด T มหาวิทยาลัย วันที่เช็คเอาท์ตั้งแต่วันที่ 2 มกราคม
2006 ถึงวันที่ 31 มีนาคมปี 2012 ของบันทึกเหล่านี้ 999,630 เป็นหนังสือที่ได้รับการตรวจสอบโดยระดับปริญญาตรี
นักเรียน 1294012 หนังสือที่ถูกตรวจสอบโดยนักศึกษาปริญญาโทและอาจารย์ 30,776 หนังสือที่ได้รับการ
ตรวจสอบโดยประเภทอื่น ๆ ของลูกค้า เราใช้บันทึก 2,293,642 เงินกู้ยืมจากนักศึกษาระดับปริญญาตรี, ปริญญาโท
นักศึกษาและอาจารย์ในการศึกษานี้ จำนวนชนิดของหนังสือที่ถูกยืมมาเป็น 477,668 และ
จำนวนของผู้ใช้เป็น 44,571 จำนวนของตะกร้า (คือชุดของหนังสือที่ถูกยืมมาด้วยกัน) เป็น
821,771
สำหรับคำแนะนำของเราเลือกหนังสือที่ประเภท NDC ได้รับมอบหมายในห้องสมุดมหาวิทยาลัย T
จำนวนของหนังสือเหล่านี้คือ 643676 ประเภท NDC ยังไม่ได้รับมอบหมายให้หลายเล่มใน T
เก็บห้องสมุดมหาวิทยาลัยที่เขียนในภาษาอังกฤษหรือภาษาที่ไม่ใช่ชาวญี่ปุ่นอื่น ๆ เป็นผลให้จำนวน
643,676 มีขนาดเล็กกว่าจำนวนรวมของหนังสือที่ห้องสมุดมหาวิทยาลัย T ถือ
การแปล กรุณารอสักครู่..
