in Section 3, is based on the standard practices in information
retrieval including idf term weighting [23] and stopword
removal [19] applied to the topical video representations.
The second retrieval method, described in Section 4, is
based on learning the optimal transition weights between
the watch video and the related video topics. To learn the
weights, we use a pairwise classification approach, as proposed
by e.g., Burges et al. [9] and Joachims [17], which is
common in learning-to-rank applications [18].
The novelty of our approach is due to the fact that we are
able to leverage the rich user feedback available in the online
setting to learn a large scale model of topic transitions. To
this end, we use a parallel-update algorithm, first proposed
by Collins et al. [12], which allows continuous and scalable
weight learning (see Section 4.3 for details).
Our approach to related video suggestion complements
previous work by Baluja et al. [7] that uses co-view information
to suggest related videos. As we show in Section 7,
our approach can be used to augment the information from a
co-view graph, which is especially beneficial for videos with
sparse co-view data or rich topical content.
It is important to note the connection between this work
and the ongoing research on hybrid recommender systems
[4, 10, 15, 31]. Similar to the hybrid recommender systems,
the related video suggestion system described in Section 5
combines collaborative information (retrieval from the coview
graph) with content information (topic retrieval) to
improve the system performance, especially for the “coldstart”
videos with sparse co-view data, or videos with rich
topical representations.
Finally our work is also related to some of the current
work on supervised topic weighting for video [31] and text
[5] retrieval. However, this related work focuses on offline
evaluation of the proposed methods. In contrast, we address
the challenge of performing evaluation of our methods on live
traffic, and demonstrate that our system can be successfully
deployed on global scale.
7. EVALUATION
In this section, we empirically evaluate the benefits of the
integration of the topic video retrieval methods into the experimental
video suggestion system described in Figure 4.
To this end, we first describe the methodology and the metrics
used in our experiments (Section 7.1). Then, in Section
7.2 we use a simulation method to estimate the effect of the
topic-based retrieval on the overall performance of our experimental
video suggestion system. Finally, in Section 7.3
we describe the results of a large scale live traffic experiment.
7.1 Experimental Methods
7.1.1 Evaluation Methodology
There are several possible options for evaluating a large
scale recommendation system such as the one described in
this paper. These options include user simulation based on
historical data, user studies and online evaluation [24]. Each
of these options has its advantages and limitations, however
one important consideration in the choice of the evaluation
method is that the test subjects must represent as closely
as possible the population of the users in the actual system
[24].
This is especially true in the case of large scale web applications
that are used by millions of users. In this case,
ในส่วนที่ 3
จะขึ้นอยู่กับการปฏิบัติที่เป็นมาตรฐานในข้อมูลการเรียกรวมทั้งน้ำหนักระยะIDF [23] และ stopword
กำจัด [19] นำไปใช้กับการแสดงวิดีโอเฉพาะ.
วิธีการดึงสองที่อธิบายไว้ในมาตรา 4
จะขึ้นอยู่กับการเรียนรู้การเปลี่ยนแปลงที่ดีที่สุด
น้ำหนักระหว่างวิดีโอนาฬิกาและหัวข้อที่เกี่ยวข้องกับวิดีโอ ที่จะเรียนรู้น้ำหนักที่เราใช้วิธีการจัดหมวดหมู่จากจำนวนที่เสนอโดยเช่นBurges et al, [9] และ Joachims [17] ซึ่งเป็นเรื่องธรรมดาในโปรแกรมการเรียนรู้เพื่อการจัดอันดับ[18]. ความแปลกใหม่ของวิธีการของเราคือความจริงที่ว่าเรามีความสามารถที่จะใช้ประโยชน์จากความคิดเห็นของผู้ที่อุดมไปด้วยที่มีอยู่ในออนไลน์การตั้งค่าที่จะเรียนรู้รูปแบบขนาดใหญ่ของการเปลี่ยนหัวข้อ เพื่อเหตุนี้เราใช้อัลกอริทึมแบบขนานอัพเดทเสนอครั้งแรกโดยคอลลินและอัล [12] ซึ่งจะช่วยให้สามารถปรับขนาดได้อย่างต่อเนื่องและน้ำหนักการเรียนรู้(ดูมาตรา 4.3 สำหรับรายละเอียด). วิธีการของเราเพื่อให้คำแนะนำวิดีโอที่เกี่ยวข้องกับการเติมเต็มการทำงานก่อนหน้าโดย Baluja et al, [7] ที่ใช้ข้อมูลร่วมมุมมองที่จะแนะนำวิดีโอที่เกี่ยวข้อง ในขณะที่เราแสดงให้เห็นในมาตรา 7 วิธีการของเราสามารถนำมาใช้เพื่อเพิ่มข้อมูลจากกราฟร่วมมุมมองที่เป็นประโยชน์อย่างยิ่งสำหรับวิดีโอที่มีข้อมูลร่วมมุมมองเบาบางหรือเนื้อหาเฉพาะที่อุดมไปด้วย. มันเป็นสิ่งสำคัญที่จะต้องทราบการเชื่อมต่อระหว่างการทำงานนี้และวิจัยอย่างต่อเนื่องในระบบไฮบริด recommender [4, 10, 15, 31] คล้ายกับระบบ recommender ไฮบริดระบบวิดีโอที่เกี่ยวข้องกับข้อเสนอแนะที่อธิบายไว้ในมาตรา5 รวมข้อมูลการทำงานร่วมกัน (จากการดึง coview กราฟ) กับข้อมูลเนื้อหา (ดึงหัวข้อ) เพื่อปรับปรุงประสิทธิภาพของระบบโดยเฉพาะอย่างยิ่งสำหรับ"coldstart" วิดีโอที่มีความเบาบางร่วม ดูข้อมูลหรือวิดีโอที่มีอุดมไปด้วยการแสดงเฉพาะ. ในที่สุดการทำงานของเราจะยังเกี่ยวข้องกับบางส่วนของปัจจุบันทำงานในหัวข้อภายใต้การดูแลน้ำหนักสำหรับวิดีโอ [31] และข้อความ [5] การดึง แต่นี้การทำงานที่เกี่ยวข้องกับการมุ่งเน้นไปที่ออฟไลน์ประเมินผลของวิธีการที่นำเสนอ ในทางตรงกันข้ามเราอยู่ที่ความท้าทายในการดำเนินการประเมินผลของวิธีการของเราในการถ่ายทอดสดการจราจรและแสดงให้เห็นว่าระบบของเราประสบความสำเร็จสามารถนำไปใช้ในระดับโลก. 7 การประเมินผลในส่วนนี้เราสังเกตุประเมินผลประโยชน์ของการบูรณาการวิธีการดึงวิดีโอหัวข้อเข้าไปในการทดลองระบบข้อเสนอแนะของวิดีโอที่อธิบายไว้ในรูปที่4 ด้วยเหตุนี้เราอธิบายวิธีการและตัวชี้วัดที่ใช้ในการทดลองของเรา (ข้อ 7.1) . จากนั้นในมาตรา7.2 เราใช้วิธีการจำลองเพื่อประเมินผลกระทบจากการดึงหัวข้อบนพื้นฐานของประสิทธิภาพโดยรวมของการทดลองของเราระบบข้อเสนอแนะวิดีโอ สุดท้ายในมาตรา 7.3 เราจะอธิบายผลของการจราจรสดขนาดใหญ่การทดลอง. 7.1 วิธีการทดลอง7.1.1 การประเมินวิธีการมีตัวเลือกที่เป็นไปได้หลายอย่างสำหรับการประเมินผลที่มีขนาดใหญ่มีระบบแนะนำระดับดังกล่าวเป็นหนึ่งที่อธิบายไว้ในบทความนี้ ตัวเลือกเหล่านี้รวมถึงการจำลองการใช้งานอยู่บนพื้นฐานของข้อมูลทางประวัติศาสตร์การศึกษาผู้ใช้และการประเมินผลออนไลน์ [24] แต่ละตัวเลือกเหล่านี้มีข้อดีและข้อ จำกัด ของมัน แต่หนึ่งในการพิจารณาที่สำคัญในการเลือกการประเมินวิธีการก็คือการทดสอบวิชาต้องแสดงอย่างใกล้ชิดที่เป็นไปได้ประชากรของผู้ใช้ในระบบที่เกิดขึ้นจริง[24]. นี้จะเป็นจริงโดยเฉพาะอย่างยิ่งใน กรณีที่มีการใช้งานเว็บขนาดใหญ่ที่ใช้โดยผู้ใช้นับล้าน ในกรณีนี้,
การแปล กรุณารอสักครู่..