1. Sampling the datasets and extracting the training sets u, {u1,u2,u3…,un},which contains totally n users;Corresponding time sets { t1,t2,t3…,tn } could also be extracted. Combining the two sets, the joint probability distribution {p(ti|ui),1≤i≤n} is computed.
2. For every region r=1,…,R: ① a region r is extracted by standardized Gaussian distribution; ② the sets of GPS coordinates L={ {li,0, li,1}, 1≤i≤n } is obtained in a region r; ③ Through (1), joint probability distribution of every region R is computed by
3. Matching GPS coordinates with nearby POIs. The rule is that comparing p(R | L) with the number of POIs in region r. If p(R | L) is greater than the number of points, the GPS coordinates in region are as a point matching with the nearest POI; On the contrary, the GPS coordinate which is closest to central point of a region would be matched with the nearest POI;
4. Through weight α, p(t|u) and p(R|L) could be tuned. Referring to aforementioned procedures, the joint probability distribution of context-aware model is built.
parameters of context-aware model is estimated. Latent variable of the model is zumv, whose posterior probability distribution could be computed by (2).
Where m u shows that tweet m posted by user u; i m indicates that a clause i in tweet m; v i manifests a word in clause I; f v describes word frequency of a word v.
( | , , , , , ) umv P z u t l m i v represents joint probability distribution of umv z expressed by some words v included in i clauses. These clauses comprise tweet m posted by user u at time t and in a position point l. ( | , , , ) umv P z u t l m describes that joint probability distribution of umv z expressed by tweet m posted by user u at time t and in a position point l. So (3) and (4) could be computed by (2),
Where , ( , , ) m t l ivf p z u m presents distribution probability of topic z generated by tweet m which is posted by user u at time t in location l. m contains i clauses that include v words whose word frequency is f. p(u, t , l , m, i, v) is joint probability distribution of i clauses and v words which include in tweet m posted by user at time t in location l. ( , ) m tl p z u is distribution probability of topic z generated by tweet m which is posted by user u at time t in location l, but clause number and word number of m is unknown. p(u, t , l , m) is probability of tweet m posted by user u at time t in location l. zm represents topic z that included in tweet m; t ,l u represents user u at time t may be in location l; ivf m represents word frequency f of word v which included in i clauses that those words comprise tweet m.
Based on aforementioned parameters, the purpose of perceiving context data could be attained. Next, posterior probability of (2) is ranked for POIs recommendation. In fact, greater posterior probability is, more ability of context-awareness is.
The relationship of user group and marked tweet number shows in Table 1. Due to recommendation results completed by users, so the results inevitably have highly subjective. Thus Cohen’ Kappa coefficient is adopted for agreement to show reasonability of the results. The formula for calculating is Pr( ) Pr( )
1 Pr( ) a e e k. In figure 2, most of K value is between 0.6 and 0.8, and k (2, 3) =0.821 is between 0.8 and 1. Because k (0.6, 0.8] achieves medium consistency and k (0.8,1] achieves perfect consistency, so evaluation result of the four users is professional and precise.
1. การสุ่มตัวอย่างการ datasets และแยกการฝึกอบรมชุด u, {u1, u2, u3... un }, ซึ่งประกอบด้วยผู้ใช้ทั้งหมด n ยังแยกชุดเวลาได่ {t1, t2, t3... tn } รวมสองชุด การกระจายความน่าเป็นร่วม { p(ti|ui), 1≤i≤n } คำนวณ2. สำหรับทุกภูมิภาค r = 1,..., R: ① r ภูมิภาคที่สกัด ด้วยมาตรฐาน Gaussian กระจาย ②ชุดของพิกัด GPS L = { { li, li 0 1 }, 1≤i≤n } มายังภูมิภาค r ③ผ่าน (1), การกระจายความน่าเป็นร่วมของทุกภาค R คำนวณโดย3. จับคู่พิกัด GPS ด้วยจุดที่น่าสนใจใกล้เคียงกัน กฎคือ p(R | ที่เปรียบเทียบ L) ที่ มีจำนวนของจุดที่น่าสนใจในภาค r ถ้า p(R | L) เป็นมากกว่าคะแนน พิกัด GPS ในภูมิภาคเป็นจุดตรงกับ POI ที่ใกล้ที่สุด การ์ตูน พิกัดจีพีเอสซึ่งเป็นที่ใกล้เคียงกับจุดศูนย์กลางของภูมิภาคจะจับคู่กับ POI ที่ใกล้ที่สุด4. ผ่านน้ำหนักα p(t|u) และ p(R| L) สามารถปรับ การกระจายความน่าเป็นร่วมของรุ่นทราบบริบทหมายถึงกระบวนการดังกล่าวข้างต้น ถูกสร้างขึ้นพารามิเตอร์ของรูปแบบบริบทคือประมาณ ตัวแปรแฝงของรุ่นคือ zumv สามารถคำนวณการแจกแจงความน่าเป็นหลัง (2)ที่ม u แสดงมทวีที่โพสต์ โดยผู้ใช้ u ผมมแสดงว่า อนุประโยคฉันในทวี m v ผมปรากฏคำในประโยคผม f v อธิบายคำความถี่ของ v ใน word(กรุนด์ฟอส,,,,) umv P z u t l m ผม v แสดงการกระจายความน่าเป็นร่วมของ umv z แสดง โดย v บางคำที่อยู่ในฉันประโยค ประโยคเหล่านี้ประกอบด้วยมทวีโพสต์ โดยผู้ใช้ u ที่เวลา t และในตำแหน่งที่ชี้ l. (กรุนด์ฟอส,,,) umv P z u ม l t อธิบายที่การกระจายความน่าเป็นร่วมของ umv z แสดง โดยทวี m โพสต์ โดยผู้ใช้ u ที่เวลา t และ l เป็นจุดตำแหน่ง ดังนั้น (3) และ (4) สามารถคำนวณได้ โดย (2),, () T l ivf p z u มนำเสนอน่าเป็นการกระจายของ z หัวข้อที่สร้างขึ้น โดยทวีม ซึ่งถูกโพสต์ โดยผู้ใช้ u ที่เวลา t ในตำแหน่ง m l. ประกอบด้วยฉันประโยคที่มีคำ v ที่มีความถี่ของคำคือ f. p (u, t, l, m, i, v) คือการกระจายความน่าเป็นร่วมของฉัน ประโยคและคำ v รวมถึงในการโพสต์ โดยผู้ใช้ที่เวลา t ในตำแหน่ง l มทวี . ( ม,) tl p z u เป็นกระจายน่าเป็นของสร้างขึ้น โดยทวีมซึ่งถูกโพสต์ โดยผู้ใช้ u ที่เวลา t ในตำแหน่ง l แต่หมายเลขอนุประโยค และคำจำนวน m z หัวข้อไม่รู้จัก p (u, t, l, m) คือ ความน่าเป็นม.ทวีโพสต์ โดยผู้ใช้ u ที่เวลา t ในตำแหน่ง l. zm แทน z หัวข้อที่รวมอยู่ในทวี m t, l u แทน u ผู้ใช้เวลา t อาจจะอยู่ในตำแหน่ง l ivf เมตรหมายถึงคำความถี่ f ของ v คำซึ่งรวมอยู่ในฉันประโยคว่า คำเหล่านั้นประกอบด้วยมทวีอิงจากพารามิเตอร์ดังกล่าว วัตถุประสงค์ของการรับรู้ข้อมูลบริบทอาจบรรลุ อันดับถัดไป หลังน่าเป็นของ (2) สำหรับคำแนะนำจุดที่น่าสนใจ ในความเป็นจริง ความน่าเป็นมากขึ้นหลัง เพิ่มเติมความสามารถของการรับรู้บริบทความสัมพันธ์ของกลุ่มผู้ใช้และตารางที่ 1 แสดงหมายเลขเครื่องหมายทวี เนื่องจากผลลัพธ์ที่แนะนำเสร็จสมบูรณ์ โดยผู้ใช้ ดังนั้นผลลัพธ์ย่อมมีสูงอัตนัย โคเฮนจึง ' สัมประสิทธิ์ Kappa ถูกนำมาใช้สำหรับข้อตกลงเพื่อแสดงองรายการผลลัพธ์ สูตรการคำนวณคือ ()ประชาสัมพันธ์(Pr)1 ประชาสัมพันธ์() e e k ในรูปที่ 2 ส่วนใหญ่ของค่า K อยู่ระหว่าง 0.6 และ 0.8 และ k (2, 3) = 0.821 อยู่ระหว่าง 0.8 ถึง 1 เนื่องจาก k (0.6, 0.8] สอดคล้องปานกลางและ k (0.8,1] บรรลุความสอดคล้องสมบูรณ์ ดังนั้นผลการประเมินของผู้ใช้ที่สี่เป็นมืออาชีพ และแม่นยำ
การแปล กรุณารอสักครู่..

1. การเก็บตัวอย่างชุดข้อมูลและการสกัดการฝึกอบรมชุด U, {U1, U2, U3 ... สหประชาชาติ} ซึ่งมีทั้งหมด n ผู้ใช้; ชุดที่สอดคล้องกันเวลา {T1, T2, T3 ... , TN} อาจจะมีการสกัด รวมทั้งสองชุดคือกระจายความน่าจะร่วมกัน. {p (TI | UI), 1≤i≤n} คำนวณ
2 ทุกภูมิภาค r = 1, ... , R: ①ภูมิภาค R คือสกัดโดยเสียนกระจายมาตรฐาน; ②ชุดพิกัด GPS L = {{Li, 0, Li, 1}} 1≤i≤nจะได้รับในภูมิภาค R; ③ผ่าน (1) การกระจายความน่าจะเป็นร่วมกันของทุกภาค R คำนวณโดย
3 ที่ตรงกับพิกัด GPS ที่มีอยู่บริเวณใกล้เคียงจุดที่น่าสนใจ กฎก็คือว่าเมื่อเปรียบเทียบ P (R | L) ที่มีจำนวนของจุดที่น่าสนใจในภูมิภาคอาร์ ถ้า P (R | L) มากกว่าจำนวนของจุดที่พิกัด GPS ในภูมิภาคจะเป็นตรงกับจุดที่มีจุดที่น่าสนใจใกล้ที่สุด; ในทางตรงกันข้าม, จีพีเอสประสานงานซึ่งเป็นที่อยู่ใกล้จุดศูนย์กลางของภูมิภาคจะได้รับการจับคู่กับ POI ที่ใกล้ที่สุด;
4 ผ่านαน้ำหนัก P (T | U) และ P (R | L) อาจจะมีการปรับ หมายถึงขั้นตอนดังกล่าวข้างต้นการกระจายความน่าจะเป็นร่วมกันของรูปแบบตามบริบทที่ถูกสร้างขึ้น.
พารามิเตอร์ของแบบจำลองตามบริบทเป็นที่คาด ตัวแปรแฝงของรูปแบบเป็น zumv ซึ่งน่าจะเป็นหลังการจัดจำหน่ายจะได้รับการคำนวณโดยการ (2).
ที่ไหน MU แสดงให้เห็นว่าทวีตม. โพสต์โดยผู้ใช้ U; IM ข้อบ่งชี้ว่าฉันในทวีเมตร; vi ปรากฏคำในประโยคฉัน; FV อธิบายความถี่ของคำของคำ v.
(|,,,,,) umv P zutlmiv หมายถึงการกระจายความน่าจะร่วมกันของ Z umv แสดงโดยคำบางคำ v รวมอยู่ในคำสั่งฉัน คำสั่งเหล่านี้ประกอบด้วยทวีตม. โพสต์โดยผู้ใช้ U ที่เวลา t และอยู่ในตำแหน่งที่จุด L (|,,) umv P zutlm อธิบายว่าการกระจายความน่าจะเป็นร่วมกันของ umv Z แสดงออกโดยทวีตมโพสต์โดยผู้ใช้ U ที่เวลา t และอยู่ในตำแหน่งที่จุด L ดังนั้น (3) และ (4) อาจจะมีการคำนวณโดยการ (2)
ในกรณีที่ (,) MTL ผสมเทียม pzum นำเสนอความน่าจะเป็นการกระจายของ Z หัวข้อสร้างโดยทวีตม. ซึ่งถูกโพสต์โดยผู้ใช้ U ที่เวลา t ใน l สถานที่ตั้ง ม. มีคำสั่งฉันที่มี V คำที่มีคำความถี่ F P (U, T, L, M, I, V) คือการกระจายความน่าจะเป็นร่วมกันของคำสั่งและคำพูดของผม V ซึ่งรวมถึงในทวีม. โพสต์โดยผู้ใช้ที่เวลา t ใน l สถานที่ตั้ง (,) M TL PZU ความน่าจะเป็นการกระจายของ Z หัวข้อสร้างโดยทวีตม. ซึ่งถูกโพสต์โดยผู้ใช้ U ที่เวลา t ใน l สถานที่ตั้ง แต่จำนวนประโยคและคำจำนวนเมตรไม่เป็นที่รู้จัก P (U, T, L, M) เป็นน่าจะเป็นของทวีตม. โพสต์โดยผู้ใช้ U ที่เวลา t ใน l สถานที่ตั้ง ZM หมายถึงหัวข้อ Z ที่รวมอยู่ในทวีตม.; T, Lu หมายถึงผู้ใช้ U ที่เวลา t อาจจะอยู่ใน l สถานที่ตั้ง; ผสมเทียม M หมายถึงความถี่ของคำ F ของคำว่า V ซึ่งรวมอยู่ในคำสั่งผมว่าคำพูดเหล่านั้นประกอบด้วยทวีตม.
จากเกณฑ์ดังกล่าววัตถุประสงค์ของการรับรู้ข้อมูลบริบทสามารถบรรลุ ถัดไปน่าจะเป็นหลังของ (2) มีการจัดอันดับสำหรับคำแนะนำจุดที่น่าสนใจ ในความเป็นจริงน่าจะเป็นมากขึ้นหลังมีความสามารถมากขึ้นของบริบทการรับรู้.
ความสัมพันธ์ของกลุ่มผู้ใช้และจำนวนทวีตทำเครื่องหมายแสดงในตารางที่ 1 เนื่องจากผลข้อเสนอแนะแล้วเสร็จโดยผู้ใช้เพื่อให้ได้ผลลัพธ์ที่หลีกเลี่ยงไม่ได้มีความส่วนตัวสูง ดังนั้นโคเฮน 'ค่าสัมประสิทธิ์แคปป้าจะนำมาใช้สำหรับข้อตกลงในการแสดงความสมเหตุสมผลของผล สูตรการคำนวณเป็น Pr () Pr ()
1 Pr () AEE K ในรูปที่ 2 มากที่สุดของค่า K อยู่ระหว่าง 0.6 และ 0.8 และ K (2, 3) = 0.821 อยู่ระหว่าง 0.8 และ 1 เนื่องจาก k (0.6, 0.8] ประสบความสำเร็จในความสอดคล้องขนาดกลางและ k (0.8,1] ประสบความสำเร็จที่สมบูรณ์แบบ สอดคล้องเพื่อให้การประเมินผลในสี่ของผู้ใช้เป็นมืออาชีพและมีความแม่นยำ
การแปล กรุณารอสักครู่..
