metrics [18, 3], based on the distribution of user ratings (see also Chapter 4 of this
book).
Eq. (22.1) can also be considered within the framework of a k-nearest-neighbors
(kNN) approach. Aggregation functions have been used to enhance the accuracy and
efficiency of nearest-neighbor rules, with the OWA and Choquet integral providing
the framework to model decaying weights and neighbor interaction [45, 12]. In the
nearest-neighbor setting, similarity is tantamount to multi-dimensional proximity
or distance. Euclidean distance was considered for measuring similarity for recommenders that use both ratings and personal information as inputs in [42]. Euclidean
distance is just one type of metric, and may not capture the concept of distance well
- for instance, where the data dimensions are correlated to some degree or even incommensurable. Metrics defined with the help of certain aggregation functions, including the OWA operator and Choquet integral, have been investigated in [41, 13]
and could potentially prove useful for measuring similarity in some RS.
If we regard each value sim(u, u j) in (22.1) as a weight rather than a similarity, we
can keep in mind that the problem of weight identification for various aggregation
functions has been studied extensively. One method is to learn the weights from
a data subset by using least-squares fitting techniques. For instance, given a set of
mutually rated items D = {d1, ..., dq}, the weights of a WAM can be fitted using the
following program:
วัด [18, 3], ตามการกระจายของการจัดอันดับผู้ใช้ (โปรดดูบทที่ 4 นี้สมุด)Eq. (22.1) พิจารณาภายในกรอบของแบบ k-ใกล้เพื่อนบ้าน(kNN) วิธีการ การใช้ฟังก์ชันการรวมเพื่อเพิ่มความถูกต้อง และefficiency ของเพื่อนบ้านที่ใกล้ที่สุดกฎ ทใน OWA และ Choquet เป็นกรอบแบบน้ำหนักสลายและโต้ตอบเพื่อนบ้าน [45, 12] ในใกล้ใกล้เคียงตั้ง ความคล้ายคลึงกันคือ tantamount to 547 แห่งหรือระยะทาง ยุคลิดได้ถือว่าวัดความคล้ายคลึงกันสำหรับ recommenders ที่ใช้จัดอันดับและข้อมูลส่วนบุคคลเป็นอินพุตใน [42] Euclideanระยะทางเป็นชนิดเดียวของวัด และอาจไม่จับแนวคิดของระยะดี-ตัวอย่าง ขนาดข้อมูลที่ correlated กับ หรือแม้แต่ incommensurable วัด defined ช่วยบางฟังก์ชันรวม รวมทั้งดำเนินการ OWA และทฤษฎีบูรณาการ Choquet มีการสอบสวนใน [41, 13]และอาจพิสูจน์ประโยชน์สำหรับวัดความคล้ายคลึงกันในบาง RSถ้าเราถือ sim แต่ละค่า (u, u j) ได้ใน (22.1) น้ำหนักมากกว่ามีความคล้ายคลึงกัน เราสามารถให้ใจที่ปัญหาของ identification น้ำหนักสำหรับต่าง ๆ รวมฟังก์ชันมีการศึกษาอย่างกว้างขวาง วิธีการหนึ่งคือการ เรียนรู้น้ำหนักจากย่อยข้อมูล โดยใช้เทคนิค fitting กำลังสองน้อยสุด กำหนดชุดของตัวอย่างร่วมกันจัดรายการ D = {ง 1,..., dq }, น้ำหนักของ WAM สามารถ fitted โดยใช้การโปรแกรมต่อไปนี้:
การแปล กรุณารอสักครู่..

ตัวชี้วัดที่ 18 [ 3 ] จากการจัดอันดับของผู้ใช้ ( ดูบทที่ 4 ของหนังสือเล่มนี้
) อีคิว ( 22.1 ) ก็ยังถือว่าอยู่ในกรอบของ k-nearest-neighbors
( knn ) วิธีการ ฟังก์ชันการรวมจะถูกใช้เพื่อเพิ่มความถูกต้องและประสิทธิภาพของ EF
จึงมีเพื่อนบ้านที่ใกล้ที่สุด กฎ ระเบียบ และบูรณาการให้
choquet โอว่ากรอบแบบเนื้อที่และน้ำหนัก 45 เพื่อนบ้านปฏิสัมพันธ์ [ 12 ] ในการตั้งค่าเพื่อนบ้านที่ใกล้ที่สุด
,
ความเหมือนจะเท่ากับแบบหลายมิติหรือระยะทาง ระยะทางแบบยุคลิดถือว่าสำหรับการวัดความคล้ายคลึงกันสำหรับ recommenders ที่ใช้ทั้งคะแนนและข้อมูลส่วนบุคคลเป็นปัจจัยการผลิตใน [ 42 ]
ใช้ระยะทางเป็นเพียงหนึ่งชนิดของตัวชี้วัด ,และไม่อาจยึดแนวคิดของระยะห่างดี
- ตัวอย่าง ซึ่งข้อมูลมีขนาดความสัมพันธ์ในระดับหนึ่ง หรือแม้แต่ที่เปรียบเทียบกันไม่ได้ . วัดเด จึงลงด้วยความช่วยเหลือของฟังก์ชันการรวมบาง รวมทั้งโอว่าผู้ประกอบการและ choquet หนึ่งได้รับการสอบสวน [ 41 ]
13 และอาจพิสูจน์ประโยชน์สำหรับการวัดความคล้ายคลึงกันในบาง .
ถ้าเราพิจารณาแต่ละค่าซิม ( U ,J ) U ( 22.1 ) น้ำหนักมากกว่าความเหมือน เรา
สามารถระลึกว่า ปัญหาการถ่ายทอดน้ำหนัก identi สำหรับฟังก์ชันการรวม
ต่างๆได้ถูกศึกษาอย่างกว้างขวาง วิธีหนึ่งคือการ เรียนหนัก
ข้อมูลย่อยโดยใช้วิธีจึงตัดเทคนิค ตัวอย่างเช่นได้รับชุดของ
ร่วมกันในรายการ D = { D1 , . . . , DQ } , น้ำหนักของแวมสามารถถ่ายทอด tted ใช้
โปรแกรม :
ต่อไปนี้
การแปล กรุณารอสักครู่..
