is one of the representative models for processing data streams.
This model conducts mining operations employing data structures
of sliding window forms to handle dynamic data streams. In
particular, it can be used effectively in data stream environments
that consider the latest information within bounded memory
space.
Meanwhile, erasable pattern mining [21,22] is a variation of
frequent pattern mining and finds a set of patterns that can
be deleted from a product database on the basis of a usergiven
threshold. However, traditional erasable pattern mining
approaches also have the aforementioned problems in data stream
environments. Especially, since the latest tree-based methods [23,
21] perform two or more database scans in order to store
information of product databases into their own tree structures,
it is hard for the traditional methods to discover erasable
patterns considering the characteristics of continuous, dynamic
data streams. In addition, they also have limitations that cannot
reflect product information in the real world to their mining
processes because they do not consider additional information
of components such as their prices or importance. In real world
applications, components or items composing products have
different weights according to their quality, size, price, etc.;
therefore, we need to employ such characteristics of components
in the erasable pattern mining procedure. Motivated by the
aforementioned issues, in this paper, we propose a Weighted
Erasable Pattern mining algorithm on Sliding window-based data
streams (called WEPS). The main contributions of the proposed
algorithm are as follows.
1. We devise a new algorithm, WEPS, for extracting weighted
erasable patterns by considering sliding window-based data
stream environments. The algorithm improves efficiency of the
mining operations by employing a new tree structure suitable
for weighted erasable pattern mining and the sliding window
model, and a new list structure including essential information
for the mining process. In addition, empirical examples are
provided to help clear understanding of the proposed method.
2. We propose pattern pruning techniques based on constraints of
component weights. Through the proposed technique, we not
only reduce the number of unnecessary mining operations in
WEPS but also improve its efficiency. Moreover, the algorithm
can discover more useful pattern results compared to the
previous approaches.
3. We provide extensive experimental results and their analyses
of the proposed algorithm. Various real and synthetic datasets
are used in our tests, and state-of-the-art tree-based erasable
pattern mining methods are compared to our WEPS in terms
of runtime, memory, pattern generation, and scalability. The
results show that the proposed algorithm is more outstanding
than the previous methods.
The remainder of this paper is as follows. In Section 2, previous
studies related to our method are introduced, and in Section 3,
details of the proposed algorithm are described with empirical
examples. In Section 4, we show results of the performance
evaluation of our algorithm and previous ones, and in Section 5,
we finally conclude this paper.
เป็นรูปแบบตัวแทนสำหรับกระแสข้อมูลการประมวลผลอย่างใดอย่างหนึ่งรุ่นนี้ดำเนินการทำเหมืองแร่ที่ใช้โครงสร้างข้อมูลบานเลื่อนหน้าต่างฟอร์มจะจัดการกับกระแสข้อมูลแบบไดนามิก ในเฉพาะ สามารถใช้ได้อย่างมีประสิทธิภาพในสภาพแวดล้อมในการสตรีมข้อมูลที่พิจารณาข้อมูลล่าสุดในหน่วยความจำยามพื้นที่ในขณะเดียวกัน การทำเหมืองแร่รูปแบบลบได้ [21,22] เป็นรูปแบบของการทำเหมืองแร่รูปแบบที่พบบ่อย และค้นหาชุดรูปแบบที่สามารถลบออกจากฐานข้อมูลผลิตภัณฑ์ตาม usergivenขีดจำกัด อย่างไรก็ตาม การทำเหมืองแร่รูปแบบดั้งเดิมของการลบได้วิธีมีปัญหาดังกล่าวในสตรีมข้อมูลสภาพแวดล้อม ตั้งแต่วิธีการล่าสุดจากต้นไม้ [23 โดยเฉพาะ21] ทำ สองสแกนฐานข้อมูลเพื่อเก็บข้อมูลของฐานข้อมูลผลิตภัณฑ์ลงในแผนภูมิตัวเองมันยากสำหรับวิธีการแบบดั้งเดิมเพื่อค้นพบลบได้รูปแบบการพิจารณาลักษณะของต่อเนื่อง แบบไดนามิกกระแสข้อมูล นอกจากนี้ พวกเขายังมีข้อจำกัดที่ไม่สามารถสะท้อนในโลกแห่งความจริงเพื่อการทำเหมืองแร่กระบวนการเนื่องจากพวกเขาไม่พิจารณาข้อมูลเพิ่มเติมส่วนประกอบเช่นราคาหรือความสำคัญของพวกเขา ในโลกจริงโปรแกรมประยุกต์ ส่วนประกอบ หรือสินค้าเขียนผลิตภัณฑ์มีตุ้มน้ำหนักที่แตกต่างกันตามคุณภาพของพวกเขา ขนาด ราคา ฯลฯ .,ดังนั้น เราจำเป็นต้องใช้เช่นลักษณะของส่วนประกอบในขั้นตอนการทำเหมืองแร่รูปแบบลบได้ แรงจูงใจโดยการปัญหาดังกล่าวข้างต้น ในกระดาษนี้ เรานำเสนอการถ่วงน้ำหนักอัลกอริทึมการทำเหมืองแร่รูปแบบลบได้บนข้อมูลจากหน้าต่างบานเลื่อนกระแสข้อมูล (เรียกว่า WEPS) ผลงานหลักของการนำเสนออัลกอริทึมมีดังนี้1. เราประดิษฐ์อัลกอริธึม WEPS สำหรับการดึงถ่วงน้ำหนักรูปแบบการลบได้ โดยพิจารณาข้อมูลจากหน้าต่างบานเลื่อนสภาพแวดล้อมที่สตรีม อัลกอริทึมช่วยเพิ่มประสิทธิภาพการทำเหมืองแร่ โดยการใช้โครงสร้างแผนภูมิใหม่เหมาะสำหรับการทำเหมืองแร่รูปแบบลบได้ถ่วงน้ำหนักและหน้าต่างบานเลื่อนรูปแบบ และโครงสร้างรายการใหม่รวมทั้งข้อมูลที่จำเป็นสำหรับการทำเหมืองแร่ นอกจากนี้ ตัวอย่างเชิงประจักษ์คือให้ความเข้าใจของวิธีการนำเสนอเราเสนอเทคนิคการตัดรูปตามข้อจำกัดของส่วนประกอบน้ำหนัก ผ่านเทคนิคการนำเสนอ เราไม่ช่วยลดจำนวนของการดำเนินงานเหมืองแร่ไม่จำเป็นในWEPS แต่ยัง ปรับปรุงประสิทธิภาพ นอกจากนี้ การสามารถค้นพบรูปแบบผลประโยชน์ที่เปรียบเทียบกับการวิธีการก่อนหน้านี้3. เราให้ครอบคลุมผลการทดลองและการวิเคราะห์ของพวกเขาของอัลกอริทึมเสนอ ชุดข้อมูลจริง และสังเคราะห์ต่าง ๆใช้ในการทดสอบของเรา และรัฐของการศิลปะต้นไม้ตามลบได้วิธีการทำเหมืองแร่รูปแบบเมื่อเทียบกับ WEPS เราในเงื่อนไขของรันไทม์ หน่วยความจำ สร้างลาย และขนาด การผลลัพธ์แสดงขั้นตอนวิธีการนำเสนอโดดเด่นมากขึ้นกว่าวิธีการก่อนหน้านี้ส่วนที่เหลือของเอกสารนี้จะเป็นดังนี้ ในส่วนที่ 2 ก่อนหน้านี้studies related to our method are introduced, and in Section 3,details of the proposed algorithm are described with empiricalexamples. In Section 4, we show results of the performanceevaluation of our algorithm and previous ones, and in Section 5,we finally conclude this paper.
การแปล กรุณารอสักครู่..
