ApproachesMany different approaches

Approaches
Many different approaches have been applied to the basic problem of making accurate and efficient recommender and data mining
systems. Many of the technologies used in the actual recommender systems studied are fairly simple database queries. Automatic
recommender systems, however, use a wide range of techniques, ranging from nearest neighbor algorithms to Bayesian analysis. The
worst-case performance of many of these algorithms is known to be poor. However, many of the algorithms have been tuned to use
heuristics that are particularly efficient on the types of data that occur in practice.
The earliest recommenders used nearest-neighbor collaborative filtering algorithms (Resnick et al. 1994, Shardanand et al. 1995).
Nearest neighbor algorithms are based on computing the distance between consumers based on their preference history. Predictions
of how much a consumer will like a product are computed by taking the weighted average of the opinions of a set of nearest
neighbors for that product. Neighbors who have expressed no opinion on the product in question are ignored. Opinions should be
scaled to adjust for differences in ratings tendencies between users (Herlocker et al., 1999). Nearest neighbor algorithms have the
advantage of being able to rapidly incorporate the most up-to-date information, but the search for neighbors is slow in large
databases. Practical algorithms use heuristics to search for good neighbors and may use opportunistic sampling when faced with very
large populations.
Bayesian networks create a model based on a training set with a decision tree at each node and edges representing consumer
information. The model can be built off-line over a matter of hours or days. The resulting model is very small, very fast, and
essentially as accurate as nearest neighbor methods (Breese et al., 1998). Bayesian networks may prove practical for environments in
which knowledge of consumer preferences changes slowly with respect to the time needed to build the model but are not suitable for
environments in which consumer preference models must be updated rapidly or frequently.
Clustering techniques work by identifying groups of consumers who appear to have similar preferences. Once the clusters are
created, predictions for an individual can be made by averaging the opinions of the other consumers in that cluster. Some clustering
techniques represent each consumer with partial participation in several clusters. The prediction is then an average across the
clusters, weighted by degree of participation. Clustering techniques usually produce less-personal recommendations than other
methods, and in some cases, the clusters have worse accuracy than nearest neighbor algorithms (Breese et al., 1998). Once the
clustering is complete, however, performance can be very good, since the size of the group that must be analyzed is much smaller.
Clustering techniques can also be applied as a “first step” for shrinking the candidate set in a nearest neighbor algorithm or for
distributing nearest-neighbor computation across several recommender engines. While dividing the population into clusters may hurt
the accuracy or recommendations to users near the fringes of their assigned cluster, pre-clustering may be a worthwhile trade-off

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

แนวทางได้ใช้วิธีแตกต่างกันในปัญหาพื้นฐานของผู้แนะนำที่ถูกต้อง และมีประสิทธิภาพและการทำเหมืองข้อมูลระบบ ของเทคโนโลยีที่ใช้ในระบบผู้แนะนำจริงที่ศึกษาเป็นแบบสอบถามฐานข้อมูลที่ค่อนข้างง่าย อัตโนมัติผู้แนะนำระบบ ไร ใช้เทคนิค ตั้งแต่ใกล้บ้านอัลกอริทึมการวิเคราะห์ทฤษฎีที่หลากหลาย ที่worst-case ประสิทธิภาพการทำงานของอัลกอริทึมเหล่านี้เป็นที่รู้จักกันจะไม่ดี อย่างไรก็ตาม หลายอัลกอริทึมมีการปรับใช้รุกที่มีประสิทธิภาพโดยเฉพาะอย่างยิ่งชนิดของข้อมูลที่เกิดขึ้นในทางปฏิบัติRecommenders แรกสุดใช้ใกล้บ้านร่วมกรองอัลกอริทึม (Resnick et al. 1994, Shardanand et al. 1995)อัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุดขึ้นอยู่กับการคำนวณระยะห่างระหว่างผู้บริโภคตามประวัติของพวกเขาชื่นชอบ คาดคะเนของจำนวนผู้บริโภคจะต้องผลิตภัณฑ์จะคำนวณ โดยคิดเป็นค่าเฉลี่ยถ่วงน้ำหนักของความเห็นของชุดบ้านสำหรับผลิตภัณฑ์นั้น ซึ่งมีความเห็นไม่แสดงบนผลิตภัณฑ์ถูกละเว้น ความคิดเห็นควรปรับให้ปรับความแตกต่างในการจัดอันดับแนวโน้มระหว่างผู้ใช้ (Herlocker et al., 1999) ใกล้บ้านอัลกอริทึมมีการประโยชน์จากความสามารถในการรวบรวมข้อมูลล่าสุด แต่หาเพื่อนบ้านอย่างรวดเร็วเป็นช้าขนาดใหญ่ฐานข้อมูล อัลกอริทึมที่ปฏิบัติการลองผิดลองถูกค้นหาบ้านที่ดี และอาจใช้การสุ่มตัวอย่างที่ยกเมื่อประสบกับมากประชากรขนาดใหญ่เครือข่ายทฤษฎีสร้างแบบจำลองฝึกการตั้งต้นไม้การตัดสินใจที่แต่ละโหนดและขอบแทนผู้บริโภคข้อมูล สามารถสร้างแบบ off-line มากกว่าเรื่องของชั่วโมงหรือวัน รูปแบบผลลัพธ์มีขนาดเล็กมาก อย่างรวด เร็ว และหลักถูกต้องเป็นใกล้บ้านวิธี (Breese et al., 1998) ทฤษฎีเครือข่ายอาจพิสูจน์สำหรับสภาพแวดล้อมในการปฏิบัติซึ่งความรู้ของผู้บริโภคลักษณะเปลี่ยนแปลงช้าเกี่ยวกับเวลาจำเป็นในการสร้างแบบจำลอง แต่ไม่เหมาะสำหรับสภาพแวดล้อมในผู้บริโภคที่ชื่นชอบรูปแบบต้องปรับปรุงอย่างรวดเร็ว หรือบ่อยเทคนิคระบบคลัสเตอร์ทำงาน โดยระบุกลุ่มผู้บริโภคที่จะมีลักษณะคล้ายกัน เมื่อคลัสเตอร์สร้าง คาดการณ์สำหรับแต่ละสามารถทำ โดยการหาค่าเฉลี่ยความคิดเห็นของผู้บริโภคอื่น ๆ ในคลัสเตอร์ บางคลัสเตอร์เทคนิคหมายถึงผู้บริโภคแต่ละที่ มีบางส่วนเข้าร่วมในคลัสเตอร์ต่าง ๆ คำทำนายจะเฉลี่ยในการคลัสเตอร์ ถ่วงน้ำหนัก โดยระดับการมีส่วนร่วม เทคนิคระบบคลัสเตอร์ผลิตมักจะแนะนำส่วนบุคคลน้อยกว่ากันวิธีการ และในบางกรณี คลัสเตอร์มีความเลวร้ายยิ่งกว่าอัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุด (Breese et al., 1998) ครั้งคลัสเตอร์เสร็จสมบูรณ์ อย่างไรก็ตาม ประสิทธิภาพการทำงานได้ดีมาก เนื่องจากขนาดของกลุ่มที่ต้องวิเคราะห์มีขนาดเล็กมากเทคนิคคลัสเตอร์ยังใช้ "ก้าวแรก" สำหรับผู้สมัคร ในอัลกอริทึมเป็นเพื่อนบ้านที่ใกล้ที่สุด หรือสำหรับการหดตัวกระจายใกล้บ้านคำนวณในเครื่องยนต์หลายผู้แนะนำ ในขณะแบ่ง ประชากรเป็นกลุ่มอาจทำร้ายความถูกต้องหรือแนะนำผู้ใกล้ชานของคลัสเตอร์ที่กำหนดของพวกเขา คลัสเตอร์ก่อนอาจ trade-off คุ้มค่า

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

วิธีการหลายวิธีที่แตกต่างกันได้นำไปใช้กับปัญหาพื้นฐานของการแนะนำและข้อมูลที่ถูกต้องและมีประสิทธิภาพระบบเหมือง

จำนวนมากของเทคโนโลยีที่ใช้ในการแนะนำระบบการศึกษาเป็นแบบสอบถามฐานข้อมูลจริงค่อนข้างง่าย อัตโนมัติ
แนะนำระบบ อย่างไรก็ตาม ใช้ความหลากหลายของเทคนิค จากเพื่อนบ้านที่ใกล้ที่สุดขั้นตอนวิธีการวิเคราะห์คชกรรม .
ประสิทธิภาพพลังงานของหลายขั้นตอนวิธีเหล่านี้เป็นที่รู้จักกันจะแย่ อย่างไรก็ตาม หลายของอัลกอริทึมได้ถูกติดตามโดยวิธีฮิวริสติกที่ใช้
มีประสิทธิภาพในประเภทของข้อมูลที่เกิดขึ้นในการปฏิบัติงาน recommenders
แรกสุดที่ใช้ร่วมกันขั้นตอนวิธีการกรองเพื่อนบ้านที่ใกล้ที่สุด ( เรสนิค et al . 1994 shardanand et al .
1995 )เพื่อนบ้านที่ใกล้ที่สุดขั้นตอนวิธีจะขึ้นอยู่กับการคำนวณระยะทางระหว่างผู้บริโภคตามประวัติความชอบของพวกเขา คาดคะเน
เท่าใดผู้บริโภคจะชอบผลิตภัณฑ์ที่ถูกคำนวณโดยการใช้ค่าเฉลี่ยถ่วงน้ำหนักของความคิดเห็นของชุดใกล้
เพื่อนบ้านสำหรับผลิตภัณฑ์ที่ เพื่อนบ้านที่ได้แสดงความเห็นเกี่ยวกับสินค้าไม่มีในคำถามจะถูกละเว้น ความคิดเห็นที่ควรจะ
ปรับขนาดปรับสำหรับความแตกต่างในการจัดอันดับแนวโน้มระหว่างผู้ใช้ ( herlocker et al . , 1999 ) เพื่อนบ้านที่ใกล้ที่สุดขั้นตอนวิธีมี
ประโยชน์ได้อย่างรวดเร็วรวมข้อมูลที่ทันสมัยมากที่สุด แต่การค้นหาเพื่อนบ้านจะช้าในฐานข้อมูลขนาดใหญ่

ขั้นตอนวิธีปฏิบัติใช้ฮิวริสติกเพื่อค้นหาเพื่อนบ้านที่ดี และอาจจะใช้สำหรับการสุ่มตัวอย่างเมื่อเผชิญกับ
มากๆประชากรขนาดใหญ่ .
เครือข่ายคชกรรมสร้างแบบตามชุดฝึกกับโครงสร้างการตัดสินใจในแต่ละโหนดและขอบของผู้บริโภคข้อมูล

รุ่นที่สามารถสร้างประเทศมากกว่าเรื่องของการชั่วโมงหรือวัน ทำให้โมเดลมีขนาดเล็กมากอย่างรวดเร็วและ
เป็นหลักที่ถูกต้องตามที่เพื่อนบ้านที่ใกล้ที่สุดวิธี ( บรีส et al . , 1998 )เครือข่ายแบบเบย์อาจพิสูจน์ประโยชน์สำหรับสภาพแวดล้อมใน
ความรู้ที่ความชอบของผู้บริโภคเปลี่ยนแปลงอย่างช้าๆ ด้วยความเคารพในเวลาที่จำเป็นในการสร้างรูปแบบแต่ไม่เหมาะ
สภาพแวดล้อมในที่รุ่นของผู้บริโภคจะต้องได้รับการปรับปรุงอย่างรวดเร็ว หรือบ่อย .
ข้อมูลเทคนิคงานโดยการระบุกลุ่มผู้บริโภคที่ปรากฏมีลักษณะคล้ายกันเมื่อกลุ่มมี
สร้างคำทำนายสำหรับแต่ละบุคคลสามารถทำโดยเฉลี่ยความคิดเห็นของผู้บริโภคในกลุ่มนั้น บางเทคนิคการจัดกลุ่ม
เป็นตัวแทนผู้บริโภคแต่ละกับการมีส่วนร่วมบางส่วนในหลายกลุ่ม การทำนายแล้วเฉลี่ยทั่วประเทศ
กลุ่มถ่วงน้ำหนัก โดยระดับของการมีส่วนร่วมข้อมูลเทคนิคมักจะผลิตข้อเสนอแนะส่วนบุคคลน้อยกว่าวิธีการอื่น ๆ
, และในบางกรณี กลุ่มมีความถูกต้องมากกว่าขั้นตอนวิธีการเพื่อนบ้านที่ใกล้ที่สุด ( บรีส et al . , 1998 ) เมื่อ
แบ่งกลุ่มเสร็จ แต่ประสิทธิภาพจะดีมาก เนื่องจากขนาดของกลุ่มที่ต้องวิเคราะห์ คือ มีขนาดเล็กมาก .
สำหรับเทคนิคที่ยังสามารถใช้เป็น " ขั้นตอน " ครั้งแรกสำหรับการหดตัวผู้สมัครชุดในขั้นตอนวิธีการเพื่อนบ้านที่ใกล้ที่สุดหรือ
แจกเพื่อนบ้านที่ใกล้ที่สุดการคำนวณผ่านเครื่องมือการแนะนำหลาย ในขณะที่การแบ่งประชากรในกลุ่มอาจทำร้าย
ความถูกต้องหรือข้อเสนอแนะแก่ผู้ใช้ใกล้ขอบของพวกเขาได้รับมอบหมายกลุ่มคลัสเตอร์อาจจะแลกเปลี่ยนที่คุ้มค่า ก่อน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.