5.0 EXPERIMENTAL RESULTS
We performed several experiments with an objective to investigate the suitability of fuzzy clustering for dis- covering good document relationships and to evaluate the performance of the proposed information retrieval system. As our prime aim is to use this technique of document retrieval in e-learning applications for retrieving most relevant documents related to a particular concept, we preferred to choose data set related to teaching domain. Hence, we collected data related to Books Preview from three famous Publishers’ website, namely, http://www.phindia.com, http://www.tatamcgrawhill.com, and http://www.cengageasia.com. We mainly focused on the catalog related to Computer Science, Computer Engineering and Information Technology. From these, we extracted textual information related to books introduction and kept these as independent text files. The extracted data were from 10 different domains, namely, Operating systems, Data- base management system, Computer networks, Information technology, Programming Languages, Neural network, e-commerce, Bioinformatics computing, Algorithms and Software engineering. For efficiently managing the data, we performed the Information retrieval experiments by taking 10 documents from each domain, thereby making a total of 100 documents. The data set was preprocessed for extracting the vector space representation, before the clustering algorithm was applied. Initially the stop words were re- moved and subsequently stemming was done. We used the java version of Porter stemming Algorithm [22]. Frequency of each word in different documents and their respective weights were determined. This produced a very big list of keywords (or index terms). The top t maximum weighted terms were chosen from the dataset which resulted in the list of terms further being reduced to an even smaller size. The maximal weight of
tj over all 100 document is taken to obtain the maximal-weight wj of the term tj i.e.,
100 max( ) 1 wj wij i . Once wj for all of these terms was obtained, the term list was sorted based on decreasing value of wj, and from this list we chose the top t. Here, for our experiment, t was kept at 100. So, every document was denoted as a vector of dimension of 100, after preprocessing.
5.0 ผลการทดลอง We performed several experiments with an objective to investigate the suitability of fuzzy clustering for dis- covering good document relationships and to evaluate the performance of the proposed information retrieval system. As our prime aim is to use this technique of document retrieval in e-learning applications for retrieving most relevant documents related to a particular concept, we preferred to choose data set related to teaching domain. Hence, we collected data related to Books Preview from three famous Publishers’ website, namely, http://www.phindia.com, http://www.tatamcgrawhill.com, and http://www.cengageasia.com. We mainly focused on the catalog related to Computer Science, Computer Engineering and Information Technology. From these, we extracted textual information related to books introduction and kept these as independent text files. The extracted data were from 10 different domains, namely, Operating systems, Data- base management system, Computer networks, Information technology, Programming Languages, Neural network, e-commerce, Bioinformatics computing, Algorithms and Software engineering. For efficiently managing the data, we performed the Information retrieval experiments by taking 10 documents from each domain, thereby making a total of 100 documents. The data set was preprocessed for extracting the vector space representation, before the clustering algorithm was applied. Initially the stop words were re- moved and subsequently stemming was done. We used the java version of Porter stemming Algorithm [22]. Frequency of each word in different documents and their respective weights were determined. This produced a very big list of keywords (or index terms). The top t maximum weighted terms were chosen from the dataset which resulted in the list of terms further being reduced to an even smaller size. The maximal weight of tj over all 100 document is taken to obtain the maximal-weight wj of the term tj i.e., 100 max( ) 1 wj wij i . Once wj for all of these terms was obtained, the term list was sorted based on decreasing value of wj, and from this list we chose the top t. Here, for our experiment, t was kept at 100. So, every document was denoted as a vector of dimension of 100, after preprocessing.
การแปล กรุณารอสักครู่..

5.0 ผลการทดลองต่าง ๆเรา มีวัตถุประสงค์เพื่อศึกษาความเหมาะสมของ Fuzzy การจัดกลุ่มสำหรับพวกเขาครอบคลุมความสัมพันธ์เอกสารที่ดีและเพื่อประเมินประสิทธิภาพของการเสนอการสืบค้นระบบเป็นเป้าหมายสำคัญของเราคือการใช้เทคนิคนี้ในการค้นคืนเอกสารอิเล็กทรอนิกส์สืบค้นเอกสารที่เกี่ยวข้องมากที่สุดที่เกี่ยวข้องกับแนวคิดที่เฉพาะเจาะจง เราต้องการที่จะเลือกชุดข้อมูลที่เกี่ยวข้องกับการสอน โดเมน ดังนั้น เราได้รวบรวมข้อมูลที่เกี่ยวข้องกับตัวอย่างหนังสือจากสำนักพิมพ์ที่มีชื่อเสียง ' 3 เว็บไซต์ ได้แก่ http://www.phindia.com http://www.tatamcgrawhill.com , และ http : / / www .cengageasia.com . เราส่วนใหญ่มุ่งเน้นไปที่รายการที่เกี่ยวข้องกับ วิทยาศาสตร์คอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ และเทคโนโลยีสารสนเทศ จากสิ่งเหล่านี้ เราดึงข้อมูลข้อความที่เกี่ยวข้องกับแนะนำหนังสือและเก็บไว้เหล่านี้เป็นอิสระไฟล์ข้อความ ข้อมูลที่สกัดได้จาก 10 โดเมนที่แตกต่างกัน ได้แก่ ระบบปฏิบัติการ ระบบจัดการฐานข้อมูล , เครือข่าย , คอมพิวเตอร์ , เทคโนโลยีสารสนเทศการเขียนโปรแกรมภาษา , เครือข่ายประสาทขั้นตอนวิธีชีวสารสนเทศศาสตร์พาณิชย์อิเล็กทรอนิกส์ คอมพิวเตอร์และวิศวกรรมซอฟต์แวร์ ให้มีประสิทธิภาพในการจัดการข้อมูล เราได้ทำการทดลองโดยการเรียกใช้ข้อมูล 10 เอกสารจากแต่ละโดเมน ทำให้จำนวน 100 เอกสาร ข้อมูล ชุด preprocessed สำหรับการสกัดไอคอนเวกเตอร์การแสดงก่อนที่จะสามารถใช้วิธีการ . เริ่มหยุดหรือ re - ย้ายและต่อมากั้นหมด เราใช้ Java รุ่นของพอร์เตอร์ ( ขั้นตอนวิธี [ 22 ] ความถี่ของแต่ละคำในเอกสารที่แตกต่างกันและน้ำหนักของตนไว้ นี้ผลิตรายการใหญ่ของคำหลัก ( หรือศัพท์ดรรชนี )ด้านบน T สูงสุดน้ำหนักเงื่อนไขการคัดเลือกจากข้อมูลซึ่งส่งผลให้ในรายการของคำศัพท์เพิ่มเติมถูกลดลงเป็นขนาดที่แม้แต่น้อย สูงสุดน้ำหนัก
TJ ทั้งหมด 100 เอกสารถ่ายให้ได้สูงสุดน้ำหนัก wj ของคำเช่น I ,
100 max ( ) 1 wj - ฉัน . เมื่อ wj สำหรับเงื่อนไขเหล่านี้ทั้งหมดได้ ในรายการคําเรียงตามค่าของ wj ลดลง ,และจากรายการนี้เราเลือกด้านบนที ที่นี่ สำหรับการทดลองของเรา ไม่ได้ถูกเก็บไว้ที่ 100 ดังนั้น ทุกๆ เอกสารที่ถูกแสดงเป็นเวกเตอร์ขนาด 100 หลังจากการเตรียม .
การแปล กรุณารอสักครู่..
