DISCUSSION
Personalized Web search depends greatly on the user data. Hence data collection becomes an integral part of any personalized Web search research. In order to achieve the proper collection of user search data, a specialized Web browser is utilised [5] and incorporated with the user model. This browser [5] has the ability to collect both the explicit as well as implicit data from the Web user. In particular this browser tracks user Scrolling Speed and other additional parameters such as: Page Size, Click-Through.
1. Analysis of correlation model for user parameters
The user search parameters are Time-spent, Scrolling-Speed, Click-through, Page-size, Maxscroll, Min-scroll and Time per Page-size ratio. Among these, the most significant parameters are Time-spent, Average-scrolling speed and Number of queries and also their relationship as well as significance are examined using Pearson correlation with 524 users’ records. Time-spent and Average-scrolling speed are inversely proportional, Average-scrolling speed and number of queries are also inversely proportional and the number of query and Time-spent is directly proportional. In similar manner the other combinations of search parameter also estimated. The Pearson correlation is best suitable for measuring the inversely proportional relationship whereas Spearman Rank-Order Correlation and Kendall's tau-b are suitable for estimating the directly proportional relationship between the other user’s parameters.
2. Z-Sample Test based result analysis
Hypothesis test on user data based on time-spent on a Web page is considered based on statistical measures (mean, median and mode, etc) such as H0 and H1 called Null hypothesis and Alternative hypothesis respectively.
H0: A page is interest to a user if time-spent>= 15 seconds and
H1: A page is of not-interest to a user if time-spent < 15 seconds.
Based on the above test results, the finalized user’s minimum time-spent value will be 15 seconds. It also predicts that if it is greater than 15 seconds, the user is interested on the particular page; otherwise the user is not interested. This resultant value is tested by set of 10 user’s data as shown in Figure 11. Similarly average scrolling speeds as well as other parameters like maximum-scrolling speed, minimum scrolling-speed, etc. are initialized using various statistical measures.
3. Weighed N-Gram Based User Content Categorization
Here the documents are represented by N-gram frequency profiles. It is set of N-grams arranged based on their frequency of that particular document. The grams are ordered according to their frequency values, in the form of chronological order. Table 11 provides single session query based user content categorization using N-gram approach with the help of ODP Taxonomy.
Here the N - value is restricted up to 3 (i.e., 1, 2 and 3). The N-value is obtained by several experiments. Each gram from the specific N-value based ordered list is compared with ODP taxonomy and matched categories are chosen and listed based on their frequencies and ranked. Finally top ranked category is assigned as resultant category based on the contents referred during their search process.
4. Fuzzification Model Selection
This user model analyzes the distribution of various user parameters from the user data and compares it with various fuzzification membership functions such as triangle and trapezoidal fuzzy membership function based graphs. The best suitable fuzzification membership is chosen for user parameters based on the resemblance with the data distribution. This may be the reason for the resemblance of the entire user parameters into either Triangular or Trapezoidal fuzzification functions. And the model is not approached from the server side collected data set. Further, this model will enhance with inclusion of other fuzzifier models for doing fuzzification on user parameters.
5. User Interest classification using fuzzy approach
This model considered a set of four interest class labels I, and the expert members defined a set of parameters and constraints P relevant to a particular topical user interest class. I = {i1, i2, i3, i4} where i1, i2, i3, i4 are representing the four topical interest class label under consideration. P = {p1, p2, p3…….. pm} where p1, p2, p3…….. pm represents the parameters and constraints of a particular topical interest class of user.
This research work makes a mild attempt to implement the concept of fuzzy rule based user model that integrates fuzzy techniques in reducing the complexity of identification of users’ interest based on their log information. This user model developed and incorporated fuzzy rules for estimating user’s interest class.
This model tested 524 records from 10 different users and assigned class labels using fuzzy approach. It also performed filtering of the Not-interest and Weak-Interest pages and recommended only Medium as well Strong-Interest pages. Finally it performed categorization of the users based on their class labels. Here the class labels are represented by numerical values such as: 1, 2, 3, and 4. the corresponding linguistic labels of each user search parameters are represented in the Table 12.
Here NI, WI, MI, and SI represent Not-Interested, Weakly-Interested, Mediumly-Interested, and Strongly-Interested respectively. Similarly LOW, LMD, MED, and HGH are indicated as Low, Low-Medium, Medium, and High respectively. Table 13 provide the single user accessed 20 pages, its category labels and their corresponding interest class labels. Category label consists of both main (root) category represented within the bracket as well as its sub (ancestor) category of the page which belongs to is shown. i.e. USER_1 accessed Page No: 1 belongs to Main category: Computer and sub-category: Web_Mining.
6. Grouping the User Web pages and Queries based on Categories
This model also performs the grouping of user accessed pages and its related queries based on their categories. This approach provides the inference of the users’ major interest area in order to provide their anticipated based on their interest. Here the USER_1 accessed 58 Web pages are grouped and the result is shown in Figure 12. This user accessed Web pages mostly belonged to C1. So it infers that the USER_1 is interested in “data_mining/databases/software/computers” category based contents shown in Figure 13.
In order to test the performance of this model, the Bayesian classifier is approached with the same data set (524 records from 10 different users). The results show that the Fuzzy rule based user model provides remarkable results than Bayesian classifier which is shown in Table 14. Compared with Bayesian classifier the proposed model provides less number of failure rate classifications and higher accuracy rate of successful classification.
CONCLUSION AND FUTURE WORK
The proposed User interest based classification in a personalized Web search using the fuzzy model delivered the acceptable rate of classification results. Heuristic based approach is incorporated in this model, so it enhances the accuracy of the classification of the user interest. The fuzzification functions are playing a major role for handling uncertainty data in such vague environment. Here the fuzzification is performed based on specific membership function and the selection of a specific membership function is based on the nature of the search data. Therefore caution has to be exercised during the membership function selection process. In future, the same model shall be drawn-out using Artificial Neural Networks (ANN). Genetic algorithm can be used for estimating errors and automatic fuzzifier selection process. In addition, the same user model will be extended to perform the prediction of user's interest fluctuation as well as interest decays.
สนทนา ค้นหาเว็บส่วนบุคคลขึ้นอยู่อย่างมากกับข้อมูลผู้ใช้ จึง เก็บรวบรวมข้อมูลจะ เป็นส่วนหนึ่งของการวิจัยค้นหาเว็บส่วนบุคคล เพื่อให้คอลเลกชันที่เหมาะสมของผู้ใช้ค้นหาข้อมูล เว็บเบราว์เซอร์เฉพาะจะใช้ [5] และรวมกับรูปแบบผู้ใช้ ความสามารถในการเก็บรวบรวมทั้งชัดเจน รวมทั้งนัยข้อมูลจากผู้ใช้เว็บเบราว์เซอร์นี้ [5] ได้ โดยเฉพาะใน เบราว์เซอร์นี้ติดตามผู้ใช้ Scrolling เร็วและพารามิเตอร์อื่น ๆ เพิ่มเติมเช่น: ขนาดกระดาษ คลิกผ่าน 1. การวิเคราะห์แบบจำลองความสัมพันธ์ของพารามิเตอร์ผู้ใช้ พารามิเตอร์การค้นหาผู้ใช้ที่ ใช้เวลา ความ เร็ว Scrolling คลิกผ่าน ขนาดกระดาษ Maxscroll เลื่อนนาทีและเวลาสำหรับแต่ละอัตราส่วนขนาดของหน้า ในหมู่เหล่านี้ พารามิเตอร์สำคัญที่สุดคือ ความเร็วในการ ใช้เวลา เลื่อนเฉลี่ย และจำนวนแบบสอบถาม และยังความสัมพันธ์ ตลอดจนความสำคัญคือตรวจสอบโดยใช้สหสัมพันธ์เพียร์สัน มีระเบียนผู้ 524 เวลาที่ใช้ และ เลื่อนเฉลี่ยมีสัดส่วน inversely เลื่อนเฉลี่ยความเร็ว และจำนวนแบบสอบถามก็ inversely สัดส่วน และจำนวน ของแบบสอบถาม และเวลาที่ใช้จะเป็นสัดส่วนโดยตรง ในลักษณะคล้าย ชุดของพารามิเตอร์การค้นหาประเมินด้วย สหสัมพันธ์เพียร์สันมีส่วนเหมาะสำหรับการวัดความสัมพันธ์เป็นสัดส่วน inversely ขณะที่สหสัมพันธ์ Spearman สั่งอันดับและของเคนดัลเต่า b เหมาะสำหรับการประเมินความสัมพันธ์ระหว่างพารามิเตอร์ของผู้ใช้อื่นเป็นสัดส่วนโดยตรง 2. Z ตัวอย่างทดสอบโดยการวิเคราะห์ผลลัพธ์ ทดสอบสมมติฐานข้อมูลตามเวลาใช้บนเว็บเพจของผู้ใช้จะพิจารณาตามมาตรการทางสถิติ (หมายถึง มัธยฐาน และโหมด ฯลฯ) เช่น H0 และ H1 ว่าสมมติฐาน Null และสมมติฐานทางเลือกตามลำดับ H0: หน้าจะสนใจผู้ใช้เวลาใช้ > = 15 วินาที และ H1: เป็นหน้าไม่สนใจผู้ใช้ถ้าเวลาใช้ < 15 วินาที ขึ้นอยู่กับผลการทดสอบข้างต้น ค่าใช้เวลาต่ำสุดของผู้ใช้ finalized จะเป็นวินาที ก็ยังทำนายว่า ถ้ามากกว่า 15 วินาที ผู้สนใจในหน้าหนึ่ง ๆ มิฉะนั้น ผู้ใช้จะไม่สนใจ มีทดสอบค่านี้ผลแก่ โดยชุดของข้อมูลของผู้ใช้ 10 ดังแสดงในรูปที่ 11 ในทำนองเดียวกัน เฉลี่ยความเร็วในการเลื่อนเป็นพารามิเตอร์อื่น ๆ เช่นความเร็วในการเลื่อนสูงสุด ต่ำสุดเลื่อนเร็ว ฯลฯ ถูกเตรียมใช้งานมาตรการทางสถิติต่าง ๆ 3. N ชั่งน้ำหนักกรัมตามประเภทเนื้อหาของผู้ใช้ ที่นี่เอกสารจะแสดง โดยใช้ค่าความถี่ N กรัม มันชุดของ N-กรัมเรียงตามความบ่อยครั้งของการ กรัมไม่เรียงลำดับตามค่าความถี่ ในรูปแบบของลำดับ ตาราง 11 แสดงเซสชันเดียวโดยใช้แบบสอบถามผู้ใช้เนื้อหาประเภทใช้วิธี N กรัม โดยใช้ระบบภาษี ODP ที่นี่ N - ค่าถูกจำกัดถึง 3 (เช่น 1, 2 และ 3) ค่า N จะได้รับ โดยการทดลองหลาย ๆ แต่ละกรัมจากรายการสั่งตามค่า N เฉพาะเปรียบเทียบกับระบบ ODP และประเภทจับคู่จะเลือกแสดงตามความถี่ของพวกเขา และจัดอันดับ ประเภทการจัดอันดับด้านบนสุด ถูกกำหนดเป็นประเภทผลแก่ตามเนื้อหาที่อ้างอิงในระหว่างกระบวนการค้นหา 4. เลือกรูปแบบ fuzzification รูปแบบนี้ผู้วิเคราะห์การกระจายของพารามิเตอร์ต่าง ๆ ของผู้ใช้จากข้อมูลผู้ใช้ และเปรียบเทียบกับฟังก์ชันสมาชิก fuzzification ต่าง ๆ เช่นสามเหลี่ยมและสมาชิก trapezoidal เอิบฟังก์ชันโดยใช้กราฟ มีเลือกสมาชิก fuzzification เหมาะสุดสำหรับพารามิเตอร์ผู้ใช้ตามความคล้ายคลึงกับการแจกแจงข้อมูล นี่อาจเป็นเหตุผลที่ในรูปของพารามิเตอร์ผู้ใช้ทั้งหมดในระบบสามสกุลหรือ Trapezoidal fuzzification ฟังก์ชัน และไม่มีประดับรูปแบบจากเซิร์ฟเวอร์ด้านรวบรวมข้อมูลชุด เพิ่มเติม รุ่นนี้จะปรับปรุง โดยรวมอื่น ๆ รุ่น fuzzifier สำหรับทำ fuzzification พารามิเตอร์ผู้ใช้ 5. ผู้สนใจประเภทใช้วิธีการที่ชัดเจน รุ่นนี้ถือว่าเป็นชุดของสี่ชั้นสนใจป้ายฉัน และสมาชิกผู้เชี่ยวชาญกำหนดชุดของพารามิเตอร์และข้อจำกัดที่เกี่ยวข้องกับเฉพาะผู้สนใจเรียน P ฉัน = {i1, i2, i3, i4 } ที่ i1, i2, i3, i4 แสดงป้ายชื่อคลาสสนใจเฉพาะสี่ภายใต้การพิจารณา P = { p1, p 2, p3... pm } ที่ p1, p 2, p3 ... น.แสดงพารามิเตอร์และข้อจำกัดของคลาสนใจเฉพาะเจาะจงของผู้ใช้ งานวิจัยนี้เป็นความพยายามที่ไม่รุนแรงจะใช้แนวคิดของแบบจำลองผู้ใช้กฎชัดเจนตามที่รวมเทคนิคที่ชัดเจนในการลดความซับซ้อนของรหัสที่น่าสนใจของผู้ใช้ตามข้อมูลการบันทึก รูปแบบนี้ผู้พัฒนา และรวมกฎชัดเจนสำหรับการประเมินผู้เรียนสนใจ รุ่นนี้ทดสอบระเบียน 524 จากผู้ใช้ 10 และกำหนดป้ายชื่อคลาสโดยใช้วิธีการที่ชัดเจน ยังทำหน้าไม่สนใจและอ่อนแอสนใจกรอง และแนะนำเฉพาะกลางหน้าแข็งดอกเบี้ยดี สุดท้าย จะทำการจัดประเภทของผู้ใช้ตามป้ายชื่อคลาส นี่ป้ายคลาจะแทน ด้วยค่าตัวเลขเช่น: 1, 2, 3 และ 4. ป้ายชื่อภาษาศาสตร์ที่เกี่ยวข้องของแต่ละผู้ใช้ค้นหาพารามิเตอร์จะแสดงใน 12 ตารางนี่ NI, WI, MI และ SI แสดงไม่สนใจ สนใจสูญ สนใจ Mediumly สนใจอย่างยิ่งตามลำดับ ในทำนองเดียวกัน ต่ำ LMD, MED และ HGH จะแสดงเป็นต่ำ ต่ำกลาง กลาง และสูงตามลำดับ ตาราง 13 ให้ผู้ที่เข้าถึง 20 หน้า ป้ายชื่อประเภทของ และป้ายชื่อคลาสสนใจที่สอดคล้องกัน ป้ายชื่อประเภทประกอบด้วยประเภททั้งหลัก (หลัก) ที่แสดงในวงเล็บเป็นประเภทย่อย (บรรพบุรุษ) ของการเป็นสมาชิกจะแสดง เช่น USER_1 เข้าถึงไม่มีหน้า: 1 ของหมวดหมู่หลัก: คอมพิวเตอร์และหมวดหมู่ย่อย: Web_Mining 6. จัดกลุ่มผู้ใช้เว็บเพจและแบบสอบถามตามประเภท รุ่นนี้ยังทำการจัดกลุ่มตามประเภทของแบบสอบถามของที่เกี่ยวข้องและผู้ใช้เข้าถึงหน้า วิธีนี้มีข้อของผู้สนใจที่สำคัญเพื่อให้การคาดการณ์ตาม ที่นี่ USER_1 เข้าถึง 58 เว็บเพจที่ถูกจัดกลุ่มและผลจะแสดงในรูป 12 นี้ผู้ใช้เข้าถึงเว็บเพจส่วนใหญ่อยู่กับ C1 ดัง นั้น infers ที่ USER_1 ที่ได้รับความสนใจในเนื้อหาประเภท"data_mining/ฐาน ข้อมูล/ซอฟต์แวร์/คอมพิวเตอร์" ตามที่แสดงในรูปที่ 13เพื่อทดสอบประสิทธิภาพของรูปแบบนี้ classifier ทฤษฎีจะประดับกับชุดข้อมูลเดียวกัน (524 ระเบียนจาก 10 ผู้ใช้) ผลลัพธ์แสดงว่า แบบจำลองผู้ใช้ตามกฎที่ชัดเจนให้ผลลัพธ์ที่น่าทึ่งกว่า classifier ทฤษฎีซึ่งแสดงในตาราง 14 เปรียบเทียบกับทฤษฎี classifier แบบเสนอให้ลดจำนวนความล้มเหลวจัดประเภทอัตรา และอัตราความแม่นยำสูงประเภทประสบความสำเร็จ สรุปผลและทำงานในอนาคต สนใจผู้เสนอตามการจัดประเภทในการค้นหาเว็บส่วนบุคคลใช้แบบชัดเจนอัตราการยอมรับผลการจัดประเภทการจัดส่ง วิธีการใช้แล้วเป็นส่วนประกอบในรุ่นนี้ เพื่อช่วยความถูกต้องของการจัดประเภทของดอกเบี้ยที่ผู้ใช้ ฟังก์ชัน fuzzification กำลังเล่นบทบาทสำคัญในการจัดการข้อมูลความไม่แน่นอนในสภาพแวดล้อมที่คลุมเครือเช่น นี่ fuzzification ที่จะดำเนินการตามที่สมาชิกระบุฟังก์ชัน และเลือกฟังก์ชันสมาชิกเฉพาะขึ้นอยู่กับลักษณะของข้อมูลที่ค้นหา ดังนั้น ความระมัดระวังได้ถูกใช้ระหว่างการเลือกฟังก์ชันสมาชิก ในอนาคต แบบเดียวกันจะถูกดึงออกใช้ประดิษฐ์ประสาทเครือข่าย (แอน) ขั้นตอนวิธีพันธุกรรมสามารถใช้สำหรับการประเมินข้อผิดพลาดและกระบวนการเลือกอัตโนมัติ fuzzifier นอกจากนี้ แบบผู้ใช้เดียวกันจะขยายการทำนายผู้สนใจความผันผวนรวมทั้งสนใจ decays
การแปล กรุณารอสักครู่..
การอภิปราย
ส่วนบุคคลค้นหาเว็บขึ้นอยู่กับข้อมูลของผู้ใช้ การเก็บรวบรวมข้อมูลดังนั้นจะกลายเป็นส่วนหนึ่งของการวิจัยค้นหาเว็บใด ๆ ส่วนบุคคล เพื่อให้บรรลุคอลเลกชันที่เหมาะสมของการค้นหาข้อมูลของผู้ใช้เว็บเบราเซอร์ที่ใช้เฉพาะ [5] รวมกับรูปแบบการใช้งาน เบราว์เซอร์นี้ [5] มีความสามารถในการเก็บรวบรวมทั้งสองอย่างชัดเจนรวมทั้งข้อมูลนัยจากผู้ใช้เว็บ โดยเฉพาะอย่างยิ่งเบราว์เซอร์นี้ติดตามการใช้ความเร็วในการเลื่อนและพารามิเตอร์เพิ่มเติมอื่น ๆ เช่น:. หน้าขนาดการคลิกผ่าน
1 การวิเคราะห์รูปแบบความสัมพันธ์กันสำหรับพารามิเตอร์ใช้
พารามิเตอร์การค้นหาของผู้ใช้เวลาใช้เวลา, การเลื่อนความเร็วการคลิกผ่านหน้าขนาด Maxscroll Min-เลื่อนที่และเวลาต่ออัตราส่วนหน้าขนาด กลุ่มคนเหล่านี้พารามิเตอร์สำคัญที่สุดคือเวลาใช้เวลา, ความเร็วเฉลี่ยเลื่อนและจำนวนของแบบสอบถามและความสัมพันธ์ของพวกเขาเช่นเดียวกับความสำคัญมีการตรวจสอบโดยใช้ความสัมพันธ์เพียร์สันที่มีประวัติ 524 ผู้ใช้ เวลาใช้เวลาและความเร็วเฉลี่ยเลื่อนเป็นสัดส่วนผกผันความเร็วเฉลี่ยเลื่อนและจำนวนของคำสั่งนี้ยังมีสัดส่วนผกผันและจำนวนของแบบสอบถามและเวลาการใช้จ่ายเป็นสัดส่วนโดยตรง ในลักษณะที่คล้ายกันผสมอื่น ๆ ของพารามิเตอร์ค้นหายังคาด สหสัมพันธ์เพียร์สันเป็นที่เหมาะสมที่สุดสำหรับการวัดความสัมพันธ์ตามสัดส่วนผกผันในขณะที่ความสัมพันธ์ Spearman Rank สั่งและเคนดอลเอกภาพ-B มีความเหมาะสมสำหรับการประเมินสัดส่วนความสัมพันธ์โดยตรงระหว่างพารามิเตอร์ของผู้อื่น.
2 Z-ตัวอย่างทดสอบการวิเคราะห์ผลตาม
สมมติฐานการทดสอบข้อมูลของผู้ใช้ขึ้นอยู่กับเวลาที่ใช้ในหน้าเว็บที่มีการพิจารณาขึ้นอยู่กับมาตรการทางสถิติ (ค่าเฉลี่ยค่ามัธยฐานและโหมด ฯลฯ ) เช่น H0 และ H1 เรียกว่าสมมติฐานและสมมติฐานทางเลือกตามลำดับ.
H0 : หน้าเป็นที่น่าสนใจให้กับผู้ใช้ถ้าเวลาการใช้จ่าย> = 15 วินาทีและ
H1: หน้าเป็นที่ไม่น่าสนใจให้กับผู้ใช้ในกรณีที่เวลาใช้เวลา <15 วินาที.
ขึ้นอยู่กับผลการทดสอบข้างต้นขั้นต่ำของผู้ใช้ที่สิ้นสุดของเวลา ค่าใช้จ่ายจะเป็น 15 วินาที นอกจากนี้ยังคาดการณ์ว่าถ้ามันเป็นมากกว่า 15 วินาทีผู้ใช้มีความสนใจโดยเฉพาะอย่างยิ่งในหน้า; มิฉะนั้นผู้ใช้ไม่ได้สนใจ ค่านี้เป็นผลการทดสอบโดยชุดของข้อมูลผู้ใช้ 10 ดังแสดงในรูปที่ 11 ในทำนองเดียวกันการเลื่อนความเร็วเฉลี่ยรวมทั้งพารามิเตอร์อื่น ๆ เช่นความเร็วสูงสุดเลื่อนขั้นต่ำเลื่อนความเร็ว ฯลฯ จะเริ่มต้นการใช้มาตรการสถิติต่างๆ.
3 ชั่งน้ำหนัก N-แกรมจากหมวดหมู่เนื้อหาของผู้ใช้
ที่นี่เอกสารที่เป็นตัวแทนจากโปรไฟล์ความถี่ N-กรัม มันเป็นชุดของ N-กรัมจัดขึ้นอยู่กับความถี่ของพวกเขาโดยเฉพาะอย่างยิ่งของเอกสารที่ กรัมจะได้รับคำสั่งตามค่าความถี่ของพวกเขาในรูปแบบของลำดับ ตารางที่ 11 มีการสอบถามครั้งเดียวหมวดหมู่เนื้อหาที่ผู้ใช้โดยใช้วิธีการ N-กรัมด้วยความช่วยเหลือของ ODP อนุกรมวิธาน.
ที่นี่ยังไม่มี - มูลค่าถูก จำกัด ถึง 3 (กล่าวคือ 1, 2 และ 3) N-ค่าที่ได้จากการทดลองหลาย กรัมจากแต่ละที่เฉพาะเจาะจง N-ค่าตามรายการสั่งซื้อจะถูกเปรียบเทียบกับอนุกรมวิธาน ODP และประเภทการจับคู่ได้รับการแต่งตั้งและจดทะเบียนขึ้นอยู่กับความถี่ของพวกเขาและการจัดอันดับ ประเภทสุดท้ายอันดับที่ได้รับมอบหมายเป็นหมวดหมู่ผลลัพธ์ขึ้นอยู่กับเนื้อหาที่อ้างระหว่างขั้นตอนการค้นหาของพวกเขา.
4 Fuzzification รุ่นเลือก
รูปแบบการใช้งานนี้วิเคราะห์การกระจายตัวของผู้ใช้พารามิเตอร์ต่างๆจากข้อมูลของผู้ใช้และเปรียบเทียบกับฟังก์ชั่นสมาชิก fuzzification ต่างๆเช่นรูปสามเหลี่ยมและรูปทรงสี่เหลี่ยมคางหมูฟังก์ชั่นสมาชิกเลือนกราฟตาม สมาชิก fuzzification ที่เหมาะสมที่สุดคือการเลือกสำหรับผู้ใช้พารามิเตอร์ขึ้นอยู่กับความคล้ายคลึงกับการกระจายข้อมูล นี่อาจจะเป็นเหตุผลที่คล้ายคลึงกับของพารามิเตอร์ของผู้ใช้ทั้งหมดในทั้งสามเหลี่ยมสี่เหลี่ยมคางหมูหรือฟังก์ชั่น fuzzification และรูปแบบที่ไม่ได้รับการทาบทามจากฝั่งเซิร์ฟเวอร์เก็บข้อมูลที่ตั้ง นอกจากนี้รูปแบบนี้จะช่วยเพิ่มด้วยการรวมของรุ่นอื่น ๆ สำหรับการทำ fuzzifier fuzzification พารามิเตอร์ที่ผู้ใช้.
5 ผู้ใช้ที่สนใจการจัดหมวดหมู่การใช้วิธีการเลือน
รุ่นนี้ถือว่าเป็นชุดของป้ายชั้นดอกเบี้ยสี่ผมและกรรมการผู้ทรงคุณวุฒิที่กำหนดชุดของพารามิเตอร์และข้อ จำกัด ที่เกี่ยวข้องกับ P ชั้นสนใจของผู้ใช้เฉพาะที่โดยเฉพาะอย่างยิ่ง I = {i1, i2, i3, i4} ที่ i1, i2, i3, i4 เป็นตัวแทนฉลากระดับความสนใจเฉพาะที่สี่ภายใต้การพิจารณา P = {p1, p2, p3 ...... .. น} ที่ P1, P2, P3 ...... .. นแสดงให้เห็นถึงพารามิเตอร์และข้อ จำกัด ของระดับความสนใจเฉพาะที่เฉพาะของผู้ใช้.
งานวิจัยนี้จะทำให้ความพยายามในการดำเนินการที่ไม่รุนแรงแนวคิด ของการปกครองแบบเลือนผู้ใช้ที่รวมเทคนิคการเลือนในการลดความซับซ้อนของประชาชนที่สนใจของผู้ใช้ขึ้นอยู่กับข้อมูลบันทึกของพวกเขา รูปแบบการใช้งานนี้ได้รับการพัฒนาและรวมกฎฟัซซี่สำหรับการประเมินระดับความสนใจของผู้ใช้.
รุ่นนี้ผ่านการทดสอบ 524 ระเบียนจาก 10 คนที่แตกต่างกันและป้ายชื่อชั้นที่ได้รับมอบหมายโดยใช้วิธีการเลือน นอกจากนี้ยังดำเนินการกรองไม่ได้ดอกเบี้ยและหน้าอ่อนดอกเบี้ยและแนะนำเพียงปานกลางเช่นเดียวกับหน้าแข็งแกร่งดอกเบี้ย ในที่สุดมันก็ดำเนินการจัดหมวดหมู่ของผู้ใช้ที่ใช้บนฉลากชั้นเรียนของตน นี่คือป้ายชื่อชั้นจะถูกแทนด้วยค่าตัวเลขเช่น:. 1, 2, 3, และ 4 ป้ายภาษาศาสตร์ที่สอดคล้องกันของพารามิเตอร์การค้นหาผู้ใช้แต่ละคนจะแสดงในตารางที่ 12
นี่ NI, WI, MI และ SI เป็นตัวแทนที่ไม่สนใจ , อ่อน-สนใจ Mediumly-สนใจและขอ-สนใจตามลำดับ ต่ำในทำนองเดียวกัน LMD, MED และ HGH จะแสดงดังต่ำ, กลางต่ำกลางและสูงตามลำดับ ตารางที่ 13 ให้ผู้ใช้คนเดียวเข้าถึง 20 หน้าป้ายหมวดหมู่ของมันและดอกเบี้ยที่สอดคล้องกันของพวกเขาป้ายชั้น ป้ายประเภทที่มีทั้งหลัก (root) ประเภทตัวแทนที่อยู่ในวงเล็บเช่นเดียวกับการย่อย (บรรพบุรุษ) ประเภทของหน้าซึ่งเป็นที่แสดงให้เห็น เช่น USER_1 เข้าถึงหน้าไม่มี: 1 เป็นหมวดหลัก: คอมพิวเตอร์และหมวดหมู่ย่อย:. Web_Mining
6 การจัดกลุ่มผู้ใช้งานเว็บเพจและแบบสอบถามขึ้นอยู่กับประเภท
รุ่นนี้ยังดำเนินการจัดกลุ่มของผู้ใช้เข้าถึงหน้าและคำสั่งที่เกี่ยวข้องตามหมวดหมู่ของพวกเขา วิธีการนี้จะให้ข้อสรุปของผู้ใช้พื้นที่ที่น่าสนใจที่สำคัญเพื่อที่จะให้พวกเขาคาดว่าจะขึ้นอยู่กับความสนใจของพวกเขา นี่ USER_1 เข้าถึง 58 หน้าเว็บจะถูกจัดกลุ่มและผลที่จะแสดงในรูปที่ 12 นี้ผู้ใช้เข้าถึงหน้าเว็บส่วนใหญ่เป็น C1 ดังนั้นจึงอนุมานว่า USER_1 มีความสนใจใน "data_mining / ฐานข้อมูล / ซอฟแวร์ / คอมพิวเตอร์" ประเภทเนื้อหาตามที่แสดงในรูปที่ 13.
เพื่อทดสอบประสิทธิภาพการทำงานของรุ่นนี้, ลักษณนาม Bayesian จะเข้าหาด้วยข้อมูลชุดเดียวกัน (524 ระเบียนจาก 10 ผู้ใช้งานที่แตกต่างกัน) ผลการศึกษาพบว่ากฎฟัซซี่แบบใช้ based ให้ผลลัพธ์ที่น่าทึ่งกว่าลักษณนาม Bayesian ซึ่งจะแสดงในตารางที่ 14 เมื่อเทียบกับลักษณนาม Bayesian รูปแบบที่นำเสนอมีจำนวนน้อยของการจำแนกประเภทอัตราความล้มเหลวและอัตราความถูกต้องสูงขึ้นของการจัดหมวดหมู่ที่ประสบความสำเร็จ.
สรุปและในอนาคตการทำงาน
เสนอดอกเบี้ยที่ผู้ใช้จำแนกตามในการค้นหาเว็บส่วนบุคคลโดยใช้รูปแบบเลือนส่งอัตราที่ยอมรับได้ของผลการจัดหมวดหมู่ ตามแนวทางแก้ปัญหาเป็นนิติบุคคลที่จัดตั้งในรูปแบบนี้จึงช่วยเพิ่มความถูกต้องของการจำแนกประเภทของสนใจของผู้ใช้ ฟังก์ชั่น fuzzification กำลังเล่นบทบาทสำคัญในการจัดการข้อมูลที่ไม่แน่นอนในสภาพแวดล้อมที่คลุมเครือดังกล่าว นี่ fuzzification จะดำเนินการตามหน้าที่สมาชิกที่เฉพาะเจาะจงและการเลือกฟังก์ชั่นเฉพาะสมาชิกจะขึ้นอยู่กับลักษณะของการค้นหาข้อมูล ระมัดระวังดังนั้นจะต้องมีการใช้สิทธิในระหว่างขั้นตอนการเลือกฟังก์ชั่นสมาชิก ในอนาคตรูปแบบเดียวกันจะถูกดึงออกโดยใช้โครงข่ายประสาทเทียม (ANN) ขั้นตอนวิธีทางพันธุกรรมสามารถนำมาใช้สำหรับการประเมินข้อผิดพลาดและ fuzzifier อัตโนมัติขั้นตอนการคัดเลือก นอกจากนี้ยังมีรูปแบบการใช้งานเดียวกันจะขยายการดำเนินการคาดการณ์ของความผันผวนของความสนใจของผู้ใช้เช่นเดียวกับดอกเบี้ยสูญสลาย
การแปล กรุณารอสักครู่..
การสนทนาส่วนบุคคลค้นหาเว็บ
จะขึ้นอยู่กับข้อมูลผู้ใช้ ดังนั้น การเก็บข้อมูลจะกลายเป็นส่วนหนึ่งของใด ๆส่วนบุคคลค้นหาเว็บวิจัย เพื่อให้คอลเลกชันที่เหมาะสมของการค้นหาข้อมูลผู้ใช้เฉพาะเว็บเบราเซอร์จะใช้ [ 5 ] และรวมกับผู้ใช้แบบนี้เบราว์เซอร์ [ 5 ] มีความสามารถในการรวบรวมทั้งชัดเจน ตลอดจนข้อมูลโดยปริยาย จากเว็บของผู้ใช้ โดยเฉพาะในเบราว์เซอร์นี้จะติดตามผู้ใช้ความเร็วในการเลื่อนและพารามิเตอร์อื่น ๆ เพิ่มเติม เช่น ขนาด หน้าคลิกผ่าน
1 การวิเคราะห์รูปแบบความสัมพันธ์ของตัวแปรที่ผู้ใช้
ผู้ใช้ค้นหาค่าเวลา , ความเร็วในการเลื่อน , คลิกผ่าน , ขนาด , maxscroll หน้ามิน และเลื่อนเวลาต่ออัตราส่วนขนาดของหน้า ระหว่างนี้ ตัวแปรสำคัญที่สุดจะใช้เวลาเฉลี่ยความเร็วในการเลื่อนและจำนวนแบบสอบถามและความสัมพันธ์ของพวกเขา รวมทั้งจะตรวจสอบการใช้สถิติสัมประสิทธิ์สหสัมพันธ์กับข้อมูลและผู้ใช้ เวลาเฉลี่ย และความเร็วในการเลื่อนเป็นปฏิภาคผกผัน ,เฉลี่ยความเร็วในการเลื่อนและจำนวนแบบสอบถามยังแปรผกผันกับจำนวนของเวลาที่ใช้ คือ แบบสอบถาม และเป็นสัดส่วนโดยตรง ในลักษณะที่คล้ายกันชุดอื่น ๆของพารามิเตอร์การค้นหายังประมาณสหสัมพันธ์เพียร์สันเหมาะที่สุดสำหรับการวัดความสัมพันธ์แปรผกผันโดยที่ Spearman Rank เพื่อความสัมพันธ์ และ เคนดอลล์ ก็ tau-b เหมาะสำหรับการประเมินความสัมพันธ์สัดส่วนโดยตรงระหว่างพารามิเตอร์อื่น ๆของผู้ใช้
2 . จากการวิเคราะห์ผลการทดสอบ z-sample
การทดสอบสมมติฐาน ข้อมูลผู้ใช้ ตาม เวลา ที่ใช้ในหน้าเว็บจะพิจารณาตามมาตรการทางสถิติ ( ค่าเฉลี่ย ค่ามัธยฐาน และค่าฐานนิยม ฯลฯ ) เช่น H0 และ H1 เรียกว่าสมมติฐานว่างและสมมติฐานทางเลือก ตามลำดับ
H0 : หน้ามีความสนใจกับผู้ใช้ถ้าเวลา > = 15 วินาทีและ H1
: หน้าจะไม่ได้สนใจกับผู้ใช้ถ้าใช้เวลา < 15 วินาที
จากผลการทดสอบข้างต้นเวลาต่ำสุดที่สรุปค่าจะเป็นผู้ใช้ใช้เวลา 15 วินาที นอกจากนี้ยังคาดการณ์ว่า ถ้ามันเป็นมากกว่า 15 วินาที ผู้ใช้ที่สนใจในหน้าโดยเฉพาะ มิฉะนั้นผู้ใช้จะไม่ได้สนใจ ค่าดังกล่าวนี้ได้รับการทดสอบโดยการตั้งค่าของผู้ใช้ 10 ของข้อมูลดังแสดงในรูปที่ 11 ในทำนองเดียวกันการเลื่อนความเร็วเฉลี่ยเช่นเดียวกับพารามิเตอร์อื่น ๆเช่นสูงสุดความเร็วในการเลื่อนความเร็วในการเลื่อนขั้น ฯลฯ เริ่มต้น โดยใช้มาตรการทางสถิติต่าง ๆ
3 หนัก n-gram ผู้ใช้เนื้อหาจัดหมวดหมู่
ที่นี่เอกสารจะแสดงความถี่ n-gram โปรไฟล์พื้นฐาน มันเป็นชุดของ n-grams จัดเรียงตามความถี่ของเอกสารใดที่ กรัม จะสั่งตามค่าความถี่ของพวกเขาในรูปแบบของลำดับ .ตารางที่ 11 แสดงแบบสอบถามเซสชันเดี่ยวจัดหมวดหมู่เนื้อหาของผู้ใช้ ด้วยวิธีการ n-gram ด้วยความช่วยเหลือของ ODP อนุกรมวิธานตาม
ที่นี่ - มูลค่าถูก จำกัด ถึง 3 ( เช่น 1 , 2 และ 3 ) การ n-value ได้มาจากการทดลองหลายแต่ละกรัมจาก n-value เฉพาะตามคำสั่งรายการเทียบกับ ODP อนุกรมวิธานและจับคู่หมวดหมู่จะถูกเลือก และจดทะเบียนตามความถี่ของพวกเขาและอันดับ . ในที่สุดก็ติดอันดับประเภท กำหนดให้เป็นประเภทดังกล่าวตามเนื้อหาอ้างอิงในระหว่างการค้นหาของพวกเขา
4
เลือกแบบจำลองฟัซซีฟิเคชั่นใช้แบบจำลองนี้ วิเคราะห์การกระจายของค่าพารามิเตอร์ต่าง ๆ จากผู้ใช้ ข้อมูลผู้ใช้ และเปรียบเทียบกับฟังก์ชันสมาชิกฟัซซีฟิเคชั่นต่างๆ เช่น สามเหลี่ยม และแบบสมาชิกฟังก์ชันสี่เหลี่ยมคางหมูตามกราฟ สมาชิกฟัซซีฟิเคชั่นเหมาะสมที่สุด เลือกพารามิเตอร์สำหรับผู้ใช้ตามความคล้ายคลึงกับข้อมูลการกระจายนี้อาจจะเป็นเหตุผลสำหรับความคล้ายคลึงของพารามิเตอร์ที่ผู้ใช้ทั้งหมดเป็นสามเหลี่ยม หรือสี่เหลี่ยมคางหมูฟังก์ชันฟัซซีฟิเคชั่น . และรูปแบบไม่ก็จากฝั่งเซิร์ฟเวอร์เก็บข้อมูลชุด เพิ่มเติม รุ่นนี้จะเพิ่มประสิทธิภาพ ด้วยการรวมของรุ่นอื่น ๆตัวทำให้คลุมเครือสำหรับการทำฟัซซีฟิเคชั่นในพารามิเตอร์ที่ผู้ใช้
5 หมวดหมู่ความสนใจผู้ใช้โดยใช้
วิธีการฟัซซี่รุ่นนี้ถือว่าเป็นชุดของสี่สนใจเรียนป้ายชื่อฉัน และผู้เชี่ยวชาญสมาชิกกำหนดชุดของพารามิเตอร์ที่กำหนดโดยผู้ใช้เฉพาะที่ P ที่เกี่ยวข้องกับความสนใจเรียน ผม = { i1 I2 , I3 , ไอโฟร์ , I2 , I3 i0 } , ที่ , ไอโฟร์เป็นตัวแทนสี่เฉพาะที่สนใจเรียนป้ายชื่อภายใต้การพิจารณา P = { P1 , P2 , P3 . . . . . PM } ที่ P1 , P2 , P3 . . . . .น. เป็นพารามิเตอร์และข้อจำกัดของเฉพาะหัวข้อความสนใจเรียนของผู้ใช้
งานวิจัยนี้ทำให้ความพยายามเล็กน้อยที่จะใช้แนวคิดของกฎฟัซซีแบบบูรณาการตามผู้ใช้เทคนิคฟัซซีในการลดความซับซ้อนของการกำหนดความสนใจของผู้ใช้ขึ้นอยู่กับข้อมูลที่เข้าสู่ระบบของพวกเขาใช้แบบจำลองนี้พัฒนาและ บริษัท กฎฟัซซี เพื่อประเมินระดับความสนใจของผู้ใช้
รุ่นนี้ทดสอบ 524 บันทึก 10 ผู้ใช้ที่แตกต่างกันและระดับการใช้ป้ายแบบวิธีการ มันยังแสดงการกรองของไม่ได้สนใจและหน้าสนใจที่อ่อนแอและแนะนำสื่อเท่านั้นที่หน้าสนใจมากครับในที่สุดก็ดำเนินการจัดหมวดหมู่ของผู้ใช้ที่ยึดป้ายของชั้น ที่นี่ห้องป้ายแทนด้วยค่าที่เป็นตัวเลขเช่น 1 , 2 , 3 และ 4 ภาษาป้ายชื่อที่สอดคล้องกันของแต่ละผู้ใช้ค้นหาพารามิเตอร์จะแสดงในตารางที่ 12 .
ที่นี่ ผม วี มิ และ ซี เป็นตัวแทน ไม่สนใจ อย่างอ่อนสนใจ mediumly สนใจ และมีความสนใจ ตามลำดับในทำนองเดียวกัน lmd , กลาง , ต่ำและพบว่า HGH เป็นน้อย ปานกลาง ปานกลาง ต่ำ และสูง ตามลำดับ ตารางที่ 13 ให้ผู้ใช้เข้าถึงเดียว 20 หน้าป้ายชื่อประเภทของความสนใจเรียนและป้ายชื่อที่สอดคล้องกันของพวกเขา ป้ายประเภทที่ประกอบด้วยหลัก ( root ) ประเภทแสดงภายในวงเล็บรวมทั้งย่อย ( บรรพบุรุษ ) ซึ่งเป็นของประเภทของหน้าถูกแสดง เช่นuser_1 เข้าถึงหน้า : 1 เป็นของประเภทหลักและประเภทย่อย : web_mining คอมพิวเตอร์ .
6 การจัดกลุ่มผู้ใช้เว็บและการค้นหาตามหมวดหมู่
รุ่นนี้ยังสามารถจัดกลุ่มผู้ใช้เข้าถึงหน้าเว็บ และบริษัทที่เกี่ยวข้องแบบสอบถามขึ้นอยู่กับประเภทของพวกเขาวิธีการนี้มีการอนุมานของผู้ใช้หลักของความสนใจในพื้นที่ เพื่อให้ตนคาดการณ์ไว้ตามความสนใจของพวกเขา ที่นี่ user_1 เข้าถึง 58 หน้าเว็บจะถูกจัดกลุ่ม และผลจะแสดงในรูปที่ 12 ผู้ใช้เข้าถึงหน้าเว็บส่วนใหญ่เป็นของ C1 .ดังนั้นจึงอนุมานได้ว่า user_1 สนใจ " data_mining / ฐานข้อมูล / ซอฟต์แวร์ / คอมพิวเตอร์ " หมวดหมู่ตามเนื้อหาที่แสดงในรูปที่ 13 .
เพื่อทดสอบประสิทธิภาพของรุ่นนี้เป็นแบบกระบอกเข้าหาด้วยชุดข้อมูลเดียวกัน ( แต่จากบันทึก 10 ผู้ใช้ที่แตกต่างกัน )แสดงผลที่ใช้แบบจำลองฟัซซีใช้กฎให้ผลลัพธ์ที่น่าทึ่งกว่าแบบเบส์ซึ่งแสดงดังตารางที่ 14 เมื่อเทียบกับแบบตัวแบบจำลองมีจำนวนน้อยของอัตราความล้มเหลวที่สูงของการจำแนกหมวดหมู่และอัตราความสำเร็จ
สรุปและงานในอนาคตผู้ใช้ที่เสนอดอกเบี้ยตามหมวดหมู่ในการค้นหาเว็บส่วนบุคคลโดยใช้แบบจำลองฟัซซี่ส่งอัตราการยอมรับผลการจำแนก วิธีฮิวริสติกที่ใช้เป็นส่วนประกอบในรูปแบบนี้ เพื่อช่วยเพิ่มความแม่นยำในการจำแนกผู้ใช้สนใจ โดยฟัซซีฟิเคชั่นฟังก์ชั่นเล่นมีบทบาทสำคัญในการจัดการข้อมูลในสภาพแวดล้อมที่ไม่แน่นอนคลุมเครือดังกล่าวที่นี่ฟัซซีฟิเคชั่นจะดําเนินการใช้ฟังก์ชันเฉพาะสมาชิก และเลือกฟังก์ชันเฉพาะสมาชิก ขึ้นอยู่กับลักษณะของข้อมูลการค้นหา ดังนั้นจึงต้องใช้ความระมัดระวังในการเลือกฟังก์ชั่นการเป็นสมาชิกของกระบวนการ ในอนาคต รุ่นเดียวกันจะถูกดึงออก โดยใช้โครงข่ายประสาทเทียม ( ANN )ขั้นตอนวิธีทางพันธุกรรมที่สามารถใช้สำหรับการประมาณการผิดพลาดโดยอัตโนมัติและกระบวนการเลือกตัวทำให้คลุมเครือ . นอกจากนี้ รูปแบบผู้ใช้เดียวกันจะขยายเพื่อแสดงการคาดการณ์ความผันผวนของดอกเบี้ยของผู้ใช้รวมทั้งดอกเบี้ยสลายตัว
การแปล กรุณารอสักครู่..