2.2. Erasable pattern mining based on tree structure
Erasable pattern mining is a method that discovers all of the
erasable patterns from a given product database according to a
maximum gain threshold given by the user. In particular, unlike
traditional frequent pattern mining approaches, erasable pattern
miners find patterns with gain values smaller than or equal to
a given threshold. META [29] is a representative erasable pattern
mining algorithm based on a Breadth-First Search (BFS) manner.
META performs Apriori-like mining operations to mine erasable
patterns; therefore, it also operates in a generate-and-test manner,
which causes excessive candidate pattern creations. MERIT [30]
is another approach for discovering such patterns on the basis
of tree data structures. The algorithm was proposed to solve
the efficiency problem of META, and it effectively improved the
performance by using its own data structures, WPPC-tree and NCSet.
However, MERIT has several problems as follows. The first
one is the error occurring when the algorithm uses its equivalent
class-based pattern expanding technique. Because of this error,
the algorithm may cause a fatal pattern loss problem during the
mining process [31,23]. The second problem is that it requires two
database scans to mine patterns and does not consider the different
importance of each item in product databases. MERIT+ [23] is a
method solving the pattern loss problem of MERIT by excluding
this defective technique. dMERIT+ [23] is another approach based
on MERIT+. The algorithm additionally employs a hash table
and an advanced version of NC-set, dNC-set, in order to improve
mining efficiency. With more sophisticated considerations for the
ancestor–descendant relations, the algorithm constructs dNC-set
by removing duplicated information that can occur in NC-set. The
hash table of the algorithm is used to map post-order information
to a table form. In addition, there are other erasable pattern mining
algorithms based on list data structures, VME [32] and MEI [31].
VME employs its own data structure, PID_set, to mine erasable
patterns in a different way from the tree-based methods. MEI also
follows a similar way with VME, but it additionally considers the
difference of indexes by using its data structure, dPID_set. In spite of
the various efforts to improve erasable pattern mining techniques,
there is no algorithm for mining erasable patterns over sliding
window-based data streams before the proposed algorithm, WEPS.
In addition, our method is a more advanced approach that can also
deal with different importance of items in data streams.
2.2 การทำเหมืองแร่รูปลบได้ตามโครงสร้างแผนภูมิการทำเหมืองแร่รูปแบบลบได้เป็นวิธีการที่พบทั้งหมดรูปแบบลบได้จากฐานข้อมูลกำหนดผลิตภัณฑ์ตามเกณฑ์กำไรสูงสุดโดยผู้ใช้ โดยเฉพาะอย่างยิ่ง ไม่เหมือนวิธีทำเหมืองแร่รูปแบบดั้งเดิมของบ่อย รูปแบบลบได้ผู้ปฏิบัติค้นหารูปแบบรูปแบบได้รับค่าที่น้อยกว่า หรือเท่ากับเกณฑ์การกำหนด META [29] คือ รูปแบบลบได้ตัวแทนอัลกอริทึมการทำเหมืองที่อิงลักษณะค้นหาแนวกว้าง (BFS)META Apriori เหมือนเหมืองดำเนินการเหมืองลบได้รูปแบบ ดังนั้น มันยังทำงานในลักษณะสร้าง และทดสอบซึ่งทำให้ผู้สมัครที่มากเกินไปในรูปแบบสร้างสรรค์ บุญ [30]วิธีอื่นสำหรับการค้นหาเช่นรูปแบบบนพื้นฐานของโครงสร้างข้อมูลของแผนภูมิ อัลกอริทึมถูกเสนอเพื่อแก้ปัญหาประสิทธิภาพของ META และปรับปรุงประสิทธิภาพการประสิทธิภาพ โดยใช้โครงสร้างของข้อมูล แผนภูมิ WPPC และ NCSetอย่างไรก็ตาม บุญมีปัญหาต่าง ๆ ดังนี้ ครั้งแรกเป็นข้อผิดพลาดที่เกิดขึ้นเมื่ออัลกอริทึมใช้เทียบเท่าตามรูปขยายเทคนิค เนื่องจากข้อผิดพลาดนี้ขั้นตอนวิธีอาจทำให้เกิดปัญหาขาดทุนรูปแบบที่ร้ายแรงในระหว่างการกระบวนการทำเหมืองแร่ [31,23] ปัญหาสองคือ ว่า มันต้องมีสองฐานข้อมูลการสแกนเพื่อให้รูปแบบการระเบิด และไม่พิจารณาความแตกต่างกันความสำคัญของแต่ละรายการในฐานข้อมูลผลิตภัณฑ์ บุญ + [23] เป็นการวิธีการแก้ปัญหาการสูญเสียรูปแบบของบุญ โดยไม่รวมthis defective technique. dMERIT+ [23] is another approach basedon MERIT+. The algorithm additionally employs a hash tableand an advanced version of NC-set, dNC-set, in order to improvemining efficiency. With more sophisticated considerations for theancestor–descendant relations, the algorithm constructs dNC-setby removing duplicated information that can occur in NC-set. Thehash table of the algorithm is used to map post-order informationto a table form. In addition, there are other erasable pattern miningalgorithms based on list data structures, VME [32] and MEI [31].VME employs its own data structure, PID_set, to mine erasablepatterns in a different way from the tree-based methods. MEI alsofollows a similar way with VME, but it additionally considers thedifference of indexes by using its data structure, dPID_set. In spite ofthe various efforts to improve erasable pattern mining techniques,there is no algorithm for mining erasable patterns over slidingwindow-based data streams before the proposed algorithm, WEPS.In addition, our method is a more advanced approach that can alsodeal with different importance of items in data streams.
การแปล กรุณารอสักครู่..
