is one of the representative models for processing data streams.
This model conducts mining operations employing data structures
of sliding window forms to handle dynamic data streams. In
particular, it can be used effectively in data stream environments
that consider the latest information within bounded memory
space.
Meanwhile, erasable pattern mining [21,22] is a variation of
frequent pattern mining and finds a set of patterns that can
be deleted from a product database on the basis of a usergiven
threshold. However, traditional erasable pattern mining
approaches also have the aforementioned problems in data stream
environments. Especially, since the latest tree-based methods [23,
21] perform two or more database scans in order to store
information of product databases into their own tree structures,
it is hard for the traditional methods to discover erasable
patterns considering the characteristics of continuous, dynamic
data streams. In addition, they also have limitations that cannot
reflect product information in the real world to their mining
processes because they do not consider additional information
of components such as their prices or importance. In real world
applications, components or items composing products have
different weights according to their quality, size, price, etc.;
therefore, we need to employ such characteristics of components
in the erasable pattern mining procedure. Motivated by the
aforementioned issues, in this paper, we propose a Weighted
Erasable Pattern mining algorithm on Sliding window-based data
streams (called WEPS). The main contributions of the proposed
algorithm are as follows.
1. We devise a new algorithm, WEPS, for extracting weighted
erasable patterns by considering sliding window-based data
stream environments. The algorithm improves efficiency of the
mining operations by employing a new tree structure suitable
for weighted erasable pattern mining and the sliding window
model, and a new list structure including essential information
for the mining process. In addition, empirical examples are
provided to help clear understanding of the proposed method.
2. We propose pattern pruning techniques based on constraints of
component weights. Through the proposed technique, we not
only reduce the number of unnecessary mining operations in
WEPS but also improve its efficiency. Moreover, the algorithm
can discover more useful pattern results compared to the
previous approaches.
3. We provide extensive experimental results and their analyses
of the proposed algorithm. Various real and synthetic datasets
are used in our tests, and state-of-the-art tree-based erasable
pattern mining methods are compared to our WEPS in terms
of runtime, memory, pattern generation, and scalability. The
results show that the proposed algorithm is more outstanding
than the previous methods.
The remainder of this paper is as follows. In Section 2, previous
studies related to our method are introduced, and in Section 3,
details of the proposed algorithm are described with empirical
examples. In Section 4, we show results of the performance
evaluation of our algorithm and previous ones, and in Section 5,
we finally conclude this paper.
เป็นหนึ่งในตัวแทนของรูปแบบการประมวลผลกระแสข้อมูลรุ่นนี้ดำเนินการทำเหมืองแร่โดยใช้โครงสร้างข้อมูลเลื่อนรูปแบบหน้าต่างข้อมูลแบบไดนามิกเพื่อจัดการกับกระแสข้อมูล ในโดยเฉพาะ สามารถใช้อย่างมีประสิทธิภาพในสภาพแวดล้อมที่กระแสข้อมูลที่พิจารณาข้อมูลล่าสุดภายในหน่วยความจำล้อมรอบพื้นที่ขณะเดียวกัน ลบออกรูปแบบเหมืองแร่ [ 21,22 ] เป็นรูปแบบของเหมืองแร่รูปแบบบ่อยและพบว่าชุดของรูปแบบที่สามารถถูกลบออกจากฐานข้อมูลผลิตภัณฑ์บนพื้นฐานของ usergivenเกณฑ์ แต่แบบดั้งเดิมรูปแบบลบออก เหมืองแร่วิธีมีปัญหาดังกล่าวในกระแสข้อมูลสภาพแวดล้อม โดยเฉพาะอย่างยิ่งตั้งแต่ล่าสุดตามต้นไม้วิธี [ 2321 ] แสดงสองหรือมากกว่าการสแกนฐานข้อมูลเพื่อเก็บข้อมูลจากฐานข้อมูลเป็นโครงสร้างต้นไม้ของตนเองมันเป็นเรื่องยากสำหรับวิธีการแบบดั้งเดิมที่จะค้นพบลบออกรูปแบบการพิจารณาลักษณะของอย่างต่อเนื่องแบบไดนามิกกระแสข้อมูล นอกจากนี้พวกเขายังมีข้อจำกัดที่ไม่สามารถสะท้อนให้เห็นถึงข้อมูลผลิตภัณฑ์ในโลกจริงของเหมืองแร่กระบวนการเพราะพวกเขาไม่พิจารณาข้อมูลเพิ่มเติมของส่วนประกอบ เช่น ราคา หรือ ความสําคัญ ในโลกจริงการใช้งาน ส่วนประกอบ หรือรายการสินค้ามีประกอบด้วยน้ำหนักที่แตกต่างกันตามคุณภาพของพวกเขา , ขนาด , ราคา ฯลฯดังนั้นเราจึงต้องใช้ลักษณะของส่วนประกอบลบออกรูปแบบเหมืองแร่ในกระบวนการ แรงจูงใจ โดยประเด็นดังกล่าว ในกระดาษนี้เราเสนอถัวลบออกรูปแบบการทำเหมืองข้อมูลขั้นตอนวิธีการในหน้าต่างเลื่อนตามข้อมูลกระแส ( เรียกว่า weps ) ผลงานหลักของเสนอขั้นตอนมีดังนี้1 . เราคิดแบบใหม่ weps เพื่อสกัดถัวลบออกรูปแบบหน้าต่างบานเลื่อน โดยพิจารณาตามข้อมูลสภาพแวดล้อมที่กระแส ขั้นตอนวิธีการเพิ่มประสิทธิภาพของทำเหมืองโดยการใช้โครงสร้างต้นไม้ใหม่ที่เหมาะสมสำหรับเหมืองแร่และหน้าต่างบานเลื่อนลายลบออกถัวรูปแบบและรายการใหม่โครงสร้างรวมถึงข้อมูลที่จำเป็นสำหรับขั้นตอนการทำเหมือง นอกจากนี้ มีตัวอย่างเชิงประจักษ์เพื่อช่วยให้ความเข้าใจที่ชัดเจนของวิธีการที่ได้นำเสนอ2 . เรานำเสนอรูปแบบการตัดเทคนิคตามข้อจำกัดของค่าน้ำหนักองค์ประกอบ ผ่านการเสนอเทคนิค เราไม่ลดจำนวนของเหมืองที่ไม่จำเป็นในweps แต่ยังปรับปรุงประสิทธิภาพของ นอกจากนี้ ขั้นตอนวิธีการสามารถค้นพบรูปแบบผลลัพธ์ที่มีประโยชน์มากขึ้นเมื่อเทียบกับวิธีก่อนหน้านี้3 . เรามีผลการทดลองอย่างละเอียดและการวิเคราะห์ของพวกเขาของวิธีที่เสนอ . ข้อมูลที่แท้จริงและสังเคราะห์ต่าง ๆใช้ในการทดสอบของเราและรัฐ - of - the - art ตามต้นไม้ลบออกวิธีการทำเหมืองแบบเทียบกับ weps ของเราในแง่ของ runtime , หน่วยความจำ , รุ่น , รูปแบบและกล่าว ที่ผลการวิจัยพบว่าวิธีที่เสนอที่โดดเด่นมากขึ้นกว่าวิธีก่อนหน้านี้ส่วนที่เหลือของบทความนี้ มีดังนี้ ในส่วนที่ 1 ก่อนการศึกษาที่เกี่ยวข้องกับวิธีของเราจะแนะนำ และในมาตรา 3รายละเอียดของวิธีที่เสนอเป็นเชิงอธิบายตัวอย่าง ในมาตรา ๔ ที่เราแสดงผลการปฏิบัติงานการประเมินผลของขั้นตอนวิธีและก่อนหน้านี้ของเราทั้งหลาย และในมาตรา 5ในที่สุดเราก็พบกระดาษแผ่นนี้
การแปล กรุณารอสักครู่..
