Figure 3 gives an example of RecCatalog, where it has four entries for four recommenders, AgeRec, AgeGenderRec, AgeCityGenderRec, and GeneralRec. With each recommender, the corresponding attributes are listed. Notice that in the case of GeneralRec, Attributes is empty, which corresponds to a general recommender system regardless of any attributes.
B. Multi-dimensional Grid
For each created recommender, RECATHON maintains a Multi-dimensional Grid G, where each dimension corresponds to one of the recommender attributes. A grid cell C in G represents a subdomain of the space created by the multiple attributes. The subdomain could be a certain value for categorical attributes or range of values for continuous domain attributes. For example, as AgeRec recommender in Figure 3 is defined based on only one attribute (age), its index is a onedimensional grid based on the age attribute. As this is a continuous domain attribute, each cell represents a range of age values, i.e., [18-24], [25-34], and [35-60]. In the meantime, the AgeCityGenderRec recommender index is a three-dimensional grid based on three attributes (age, city, and gender). The age dimension is divided into three categories based on range of values. The city attribute has three values as {Minneapolis, St. Paul, Edina}, while the gender attribute is divided into two categorical values as {Male, Female}. The top left outer cell (check marked in Figure 3) in AgeCityGenderRec represents the values h18-24, Minneapolis, Femalei that correspond to its values of the hage, city, genderi dimensions.
Each cell in the multi-dimensional grid points to a table, RecModel, that maintains auxiliary precomputed information to speed up the generation of the recommendation query result. The precomputed information may have different schema based on the underlying recommendation algorithm. For example, for the Item-Item collaborative filtering algorithm, RecModel represents an items similarity list with the schema (ItemID1, ItemID2, SimScore), where SimScore is computed per equation 1 (Section II).
Initialization. The multi-dimensional grid G is initialized upon issuing a CREATE RECOMMENDER statement, through two main steps: (1) Grid Construction, where we allocate the memory space for the grid, and decide on each cell size in terms of the values it represents. In case of categorical attributes (e.g., Gender, Job, and City), we allocate one cell per attribute. For continuous domain attributes (e.g., age and salary), we divide the space into N parts, where parts have almost equal number of ratings. More sophisticated techniques can be used to divide the space. Yet, we opt for a simple division here as a proof of concept for RECATHON functionality. (2) RecModel Building, where the RecModel table for each cell C in G is built by running the specified recommender algorithm in the CREATE RECOMMENDER statement on the set of users U whose attributes correspond to the subdomain covered by C. For instance, in case of ItemCosCF recommendation algorithm, we scan the ratings table and run a nested loop algorithm over all items to calculate the cosine similarity score between every item pair in each cell C using equation 1. After the initialization procedure terminates, a pointer to the newly created grid structure G is added to the RecIndex field corresponding to the appropriate recommender entry in RecCatalog.
รูปที่ 3 แสดงตัวอย่างของ RecCatalog ซึ่งมีรายการสี่สี่ recommenders, AgeRec, AgeGenderRec, AgeCityGenderRec และ GeneralRec มีผู้แนะนำ แต่ละแอตทริบิวต์ที่สอดคล้องกันอยู่ สังเกตว่า ในกรณีของ GeneralRec แอตทริบิวต์ว่างเปล่า ที่สอดคล้องกับระบบผู้แนะนำทั่วไปโดยไม่คำนึงถึงแอตทริบิวต์ใด ๆข.ตารางที่หลายมิติสำหรับแต่ละผู้แนะนำที่สร้างขึ้น RECATHON รักษา G ตารางแบบหลายมิติ ที่แต่ละมิติที่สอดคล้องกับแอตทริบิวต์ของผู้แนะนำอย่างใดอย่างหนึ่ง เซลล์ตาราง C ใน G แทนโดเมนย่อยของพื้นที่ที่สร้าง โดยแอตทริบิวต์หลาย โดเมนย่อยอาจจะมีค่าสำหรับแอตทริบิวต์ที่แน่ชัดหรือช่วงของค่าสำหรับแอตทริบิวต์โดเมนต่อเนื่อง ตัวอย่างเช่น เป็น AgeRec ผู้แนะนำในรูปที่ 3 กำหนดแอตทริบิวต์เดียวเท่านั้น (อายุ), ดัชนีของเป็นกริด onedimensional ตามแอตทริบิวต์อายุ เช่นนี้มีแอตทริบิวต์โดเมนต่อเนื่อง แต่ละเซลล์แสดงช่วงของค่าของอายุ เช่น, [18-24], [25-34], และ [35-60] ในระหว่าง ดัชนีผู้แนะนำ AgeCityGenderRec เป็นตารางสามมิติตามแอตทริบิวต์สาม (อายุ เมือง และเพศ) ขนาดอายุจะแบ่งออกเป็นสามประเภทตามช่วงของค่า แอตทริบิวต์เมืองมีค่าสามเป็น {นนี เซนต์ปอล Edina }, ในขณะที่เพศแอตทริบิวต์ถูกแบ่งออกเป็นสองค่าที่แน่ชัดเป็น {เพศชาย หญิง} ด้านบนซ้ายด้านนอกเซลล์ (ทำเครื่องหมายเลือกในรูปที่ 3) ใน AgeCityGenderRec แทนค่า h18-24 นนี Femalei ที่สอดคล้องกับค่าของ hage เมือง มิติ genderi แต่ละเซลล์ในตารางหลายมิติที่ชี้ไปยังตาราง RecModel ที่เก็บรักษาข้อมูล precomputed เสริมเพื่อเร่งการสร้างผลลัพธ์การสอบถามแนะนำ ข้อมูล precomputed อาจมี schema แตกต่างกันตามอัลกอริทึมคำแนะนำพื้นฐาน เช่น สำหรับรายการสินค้าร่วมกันกรองขั้นตอนวิธี RecModel แทนรายการรายการคล้ายคลึงกับ schema (ItemID1, ItemID2, SimScore), ซึ่งคำนวณ SimScore ต่อสมการ 1 (ส่วน II) การเริ่มต้น ตารางหลายมิติ G ถูกเตรียมใช้งานเมื่อออกงบสร้างผู้แนะนำ ขั้นตอนหลักที่สอง: (1) ตารางการก่อสร้าง ที่เราจัดสรรเนื้อที่หน่วยความจำสำหรับตาราง และตัดสินใจในแต่ละเซลล์ขนาดในแง่ของค่าแทน ในกรณีที่แน่ชัดแอตทริบิวต์ (เช่น เพศ งาน และการเมือง), เราจัดสรรเซลล์หนึ่งต่อแอตทริบิวต์ สำหรับแอตทริบิวต์โดเมนต่อเนื่อง (เช่น อายุและเงินเดือน), เราแบ่งพื้นที่ N ที่ชิ้นส่วนที่มีจำนวนคะแนนเกือบเท่ากัน สามารถใช้เทคนิคที่ซับซ้อนมากขึ้นเพื่อแบ่งพื้นที่ ยัง เราเลือกส่วนที่เรียบง่ายที่นี่เป็นหลักฐานของแนวคิดสำหรับการทำงาน RECATHON (2) อาคาร RecModel ที่สร้างตาราง RecModel สำหรับแต่ละเซลล์ C G โดยใช้อัลกอริทึมระบุผู้แนะนำในงบสร้างผู้แนะนำบนการตั้งค่าของผู้ใช้ U ที่มีแอตทริบิวต์ที่สอดคล้องกับโดเมนย่อยที่ครอบคลุม โดยค เช่น ในกรณีของอัลกอริทึมคำแนะนำของ ItemCosCF เราสแกนตารางการจัดอันดับ และเรียกใช้อัลกอริทึมแบบวนซ้ำซ้อนผ่านทุกรายการเพื่อคำนวณคะแนนคล้ายโคไซน์ระหว่างทุก ๆ คู่สินค้าในแต่ละ เซลล์ C ใช้สมการ 1 หลังจากสิ้นสุดขั้นตอนการเตรียมใช้งาน ตัวชี้ไปยังโครงสร้างตารางที่สร้างขึ้นใหม่ G ถูกเพิ่มเข้าไป RecIndex ฟิลด์ที่สอดคล้องกับรายการใน RecCatalog ผู้แนะนำที่เหมาะสม
การแปล กรุณารอสักครู่..

รูปที่ 3 แสดงให้เห็นตัวอย่างของ RecCatalog ที่มันมีสี่รายการสำหรับสี่ recommenders, AgeRec, AgeGenderRec, AgeCityGenderRec และ GeneralRec กับแต่ละ recommender ลักษณะที่สอดคล้องกันมีการระบุไว้ ขอให้สังเกตว่าในกรณีของ GeneralRec แอตทริบิวต์เป็นที่ว่างเปล่าซึ่งสอดคล้องกับระบบ recommender ทั่วไปโดยไม่คำนึงถึงคุณลักษณะใด ๆ .
บี หลายมิติกริด
สำหรับแต่ละ recommender สร้าง RECATHON รักษาหลายมิติกริด G ซึ่งแต่ละมิติสอดคล้องกับหนึ่งในลักษณะ recommender เซลล์ตารางซีใน G หมายถึงโดเมนย่อยของพื้นที่ที่สร้างขึ้นโดยคุณลักษณะหลาย โดเมนย่อยอาจจะมีค่าบางอย่างสำหรับแอตทริบิวต์เด็ดขาดหรือช่วงของค่าสำหรับแอตทริบิวต์โดเมนอย่างต่อเนื่อง ยกตัวอย่างเช่น AgeRec recommender ในรูปที่ 3 จะถูกกำหนดขึ้นอยู่กับเพียงหนึ่งแอตทริบิวต์ (อายุ) ดัชนีเป็นตาราง onedimensional ตามแอตทริบิวต์อายุ เช่นนี้เป็นแอตทริบิวต์โดเมนต่อเนื่องแต่ละเซลล์หมายถึงช่วงของค่าอายุเป็นเช่น [18-24], [25-34] และ [35-60] ในขณะเดียวกันดัชนี recommender AgeCityGenderRec เป็นตารางสามมิติขึ้นอยู่กับสามคุณลักษณะ (อายุเมืองและเพศ) มิติอายุแบ่งออกเป็นสามประเภทตามช่วงของค่า แอตทริบิวต์เมืองที่มีสามค่าเป็น {มินนิอาเซนต์ปอล, ดิ} ขณะแอตทริบิวต์เพศจะแบ่งออกเป็นสองค่าเด็ดขาดเป็น {ชาย, หญิง} ด้านซ้ายบนมือถือนอก (ตรวจสอบการทำเครื่องหมายในรูปที่ 3) ใน AgeCityGenderRec แสดงให้เห็นถึงค่า h18-24, มินนิอา Femalei ที่สอดคล้องกับค่านิยมของ Hage เมืองขนาด genderi.
เซลล์ในจุดกริดหลายมิติแต่ละตาราง , RecModel ที่เก็บรักษาข้อมูล precomputed เสริมเพื่อเพิ่มความเร็วในการสร้างผลแบบสอบถามข้อเสนอแนะที่ ข้อมูล precomputed อาจมีสคีมาที่แตกต่างกันขึ้นอยู่กับขั้นตอนวิธีการคำแนะนำพื้นฐาน ตัวอย่างเช่นสำหรับขั้นตอนวิธีการกรองร่วมกันรายการรายการ RecModel แสดงให้เห็นถึงความคล้ายคลึงกันในรายการรายการที่มีสคี (ItemID1, ItemID2, SimScore) ซึ่ง SimScore คำนวณต่อสมการที่ 1 (ส่วนที่สอง).
การเริ่มต้น ตารางหลายมิติ G จะเริ่มต้นได้เมื่อออกคำสั่ง Recommender สร้างผ่านสองขั้นตอนหลักคือ (1) ตารางงานก่อสร้างที่เราจัดสรรพื้นที่หน่วยความจำสำหรับตารางและตัดสินใจเกี่ยวกับขนาดของแต่ละเซลล์ในแง่ของค่าที่มันหมายถึง ในกรณีของคุณลักษณะเด็ดขาด (เช่นเพศอาชีพและเมือง), เราจัดสรรหนึ่งเซลล์ต่อแอตทริบิวต์ สำหรับแอตทริบิวต์โดเมนอย่างต่อเนื่อง (เช่นอายุและเงินเดือน) เราแบ่งพื้นที่ออกเป็นส่วนไม่มีส่วนไหนมีจำนวนเกือบเท่ากับของการจัดอันดับ เทคนิคที่ซับซ้อนมากขึ้นสามารถใช้ในการแบ่งพื้นที่ แต่เราเลือกสำหรับส่วนที่เรียบง่ายที่นี่เป็นข้อพิสูจน์ของแนวคิดสำหรับการทำงาน RECATHON (2) อาคาร RecModel ที่ตาราง RecModel สำหรับแต่ละเซลล์ซีจีที่ถูกสร้างขึ้นโดยการเรียกใช้อัลกอริทึม recommender ที่ระบุไว้ในคำสั่งสร้าง Recommender ในชุดของผู้ใช้ U ที่มีคุณลักษณะตรงกับโดเมนย่อยที่ครอบคลุมโดยซียกตัวอย่างเช่นในกรณีที่ ขั้นตอนวิธีการคำแนะนำ ItemCosCF เราสแกนตารางการจัดอันดับและเรียกใช้อัลกอริทึมวงซ้อนกันมากกว่ารายการทั้งหมดในการคำนวณคะแนนโคไซน์ความคล้ายคลึงกันระหว่างคู่ทุกรายการในแต่ละเซลล์ C โดยใช้สมการ 1. หลังจากขั้นตอนการเริ่มต้นยุติตัวชี้ไปยังตารางที่สร้างขึ้นใหม่ โครงสร้าง G จะถูกเพิ่มลงสนาม RecIndex สอดคล้องกับรายการ recommender ที่เหมาะสมใน RecCatalog
การแปล กรุณารอสักครู่..

รูปที่ 3 ให้ตัวอย่างของ reccatalog ที่มันมี 4 รายการ 4 recommenders agerec agegenderrec agecitygenderrec , , , , และ generalrec . กับแต่ละฝ่าย คุณสมบัติที่สอดคล้องกันจะปรากฏขึ้น สังเกตว่า ในกรณีของ generalrec ลักษณะว่างเปล่า ซึ่งสอดคล้องกับระบบการแนะนำทั่วไปไม่ว่าคุณลักษณะหลายมิติตาราง Bแนะนำ recathon แต่ละสร้าง , รักษาหลายมิติตารางกรัม ซึ่งแต่ละมิติที่สอดคล้องกับหนึ่งในการแนะนำคุณลักษณะของ ตารางเซลล์ C G เป็นโดเมนย่อยของพื้นที่ที่สร้างโดยคุณลักษณะหลาย โดเมนย่อยอาจจะมีค่าสำหรับคุณลักษณะอย่างแท้จริงหรือช่วงของค่าสำหรับคุณสมบัติโดเมนอย่างต่อเนื่อง ตัวอย่าง เช่น agerec แนะนำในรูปที่ 3 ถูกกำหนดขึ้นอยู่กับแอตทริบิวต์เดียวเท่านั้น ( อายุ ) , ดัชนีของตาราง onedimensional ขึ้นอยู่กับอายุคุณลักษณะ นี้เป็นคุณลักษณะโดเมนอย่างต่อเนื่อง แต่ละเซลล์ที่แสดงถึงช่วงของค่าอายุ 18-24 ) [ ] [ ] และ [ 25-34 , 35-60 ] ในขณะเดียวกัน agecitygenderrec แนะนำดัชนีตารางสามมิติจากสามคุณลักษณะ ( อายุ , เมือง , และเพศ ) อายุขนาดจะแบ่งออกเป็นสามประเภทขึ้นอยู่กับช่วงของค่า เมืองแอตทริบิวต์ที่มีค่า 3 เป็น { Minneapolis , St . Paul , ไดน่า } ในขณะที่เพศคุณลักษณะจะถูกแบ่งออกเป็นสองเด็ดขาดค่า เป็นหญิง { ชาย } ด้านบนซ้ายนอกเซลล์ ( ตรวจสอบเครื่องหมายในรูปที่ 3 ) ใน agecitygenderrec เป็นค่า h18-24 , มินนิอาโพลิส femalei ที่สอดคล้องกับคุณค่าของแบ่งกัน , เมือง , มิติ genderi .เซลล์แต่ละเซลล์ในมิติตารางคะแนนตาราง recmodel ที่เก็บรักษาข้อมูล precomputed เสริมเพื่อเพิ่มความเร็วในการสร้างผล แนะนำ สอบถาม ข้อมูล precomputed อาจแตกต่างกันขึ้นอยู่กับพื้นฐานของคำแนะนำขั้นตอนวิธีการ ตัวอย่างเช่น ในรายการกรองร่วมกันและแสดงรายการ recmodel ความเหมือนรายการกับสคีมา ( itemid1 itemid2 simscore , , ) ที่ simscore จะคำนวณตามสมการที่ 1 ( ส่วนที่ 2 )เริ่มต้นที่ . มีหลายมิติตารางกรัมจะเริ่มต้นเมื่อออกสร้างแนะนำงบผ่านสองขั้นตอนหลัก ได้แก่ ( 1 ) การสร้างตารางที่เราจัดสรรหน่วยความจำสำหรับตารางและตัดสินใจในแต่ละเซลล์ขนาดในแง่ของค่าที่แสดงถึง ในกรณีของแอตทริบิวต์อย่างแท้จริง ( เช่น เพศ อาชีพ และเมือง ) เราจัดสรรหนึ่งเซลล์ต่อคุณลักษณะ สำหรับโดเมนอย่างต่อเนื่องคุณลักษณะ ( เช่น อายุ เงินเดือน และสวัสดิการ ) เราแบ่งพื้นที่เป็น N ส่วนที่ส่วนมีจำนวนเกือบเท่ากัน อันดับเครดิต เทคนิคที่ซับซ้อนมากขึ้น สามารถใช้ในการแบ่งพื้นที่ แต่เราเลือกแบบง่าย ๆ ส่วนมาเป็นหลักฐานของแนวคิด recathon การทํางาน ( 2 ) อาคาร recmodel ที่ recmodel ตารางสำหรับแต่ละเซลล์ C G ที่ถูกสร้างขึ้นโดยใช้วิธีที่แนะนำในการ สร้าง แนะนำงบในชุดของผู้ใช้ U ที่มีคุณลักษณะสอดคล้องกับโดเมนย่อยที่ครอบคลุมโดย ตัวอย่างเช่นในกรณีของขั้นตอนวิธีการแนะนำ itemcoscf เราสแกนตารางคะแนนและวิ่งเป็นวงซ้อนกันวิธีผ่านรายการทั้งหมดเพื่อคำนวณค่าโคไซน์ความเหมือนคะแนนระหว่างสินค้าทุกคู่ในแต่ละเซลล์ C ใช้สมการที่ 1 หลังจากขั้นตอนการเริ่มต้นสิ้นสุดลง , ตัวชี้ไปยังโครงสร้างของตารางที่สร้างขึ้นใหม่จะถูกเพิ่มไปยังสนาม recindex G สอดคล้องกับรายการแนะนำที่เหมาะสมใน reccatalog .
การแปล กรุณารอสักครู่..
