I. INTRODUCTION Bag-of-items data, such as market baskets in retail or tagsets in text, is growing at a tremendous rate in many domains. A retail market basket comprises of products purchased by a customer in a store visit. A tagset comprises of a set of keywords describing an object (e.g. YouTube video, Flickr image, or a movie, etc.). Bag-of-items data mining attempts to discover novel patterns, create actionable insights, engineer predictive features, and drive intelligent decisions from such data. More than a decade ago, Frequent Itemset Mining (FISM) [1] powered by the Apriori algorithm [2] became the standard for finding large and frequent itemsets in bag-of-items data. As the vocabulary and data size grew, scaling the original Apriori algorithm became the primary focus of research. This lead to a number of innovations in scalable data structures and algorithms, some of which are highlighted in Section II-A. Several other paradigms such as rare itemset mining [15], [14], indirect association mining [10], etc, emerged to address limitations of, and
ผมเปิดกระเป๋าของรายการข้อมูล เช่น ตะกร้าในตลาดค้าปลีก หรือ tagsets ในข้อความ มีการเติบโตในอัตราที่มหาศาลในหลายโดเมน ตลาดค้าปลีกตะกร้า ประกอบด้วย สินค้าที่ซื้อโดยลูกค้าในร้านไป เป็น tagset ประกอบด้วยชุดของคำหลักที่อธิบายวัตถุ ( เช่นวิดีโอ YouTube , Flickr ภาพหรือภาพยนตร์ ฯลฯ ) กระเป๋าของรายการการทำเหมืองข้อมูลพยายามที่จะค้นพบรูปแบบใหม่สร้าง device ข้อมูลเชิงลึก , วิศวกรคุณสมบัติพยากรณ์และไดรฟ์การตัดสินใจฉลาด จากข้อมูลดังกล่าว กว่าทศวรรษที่ผ่านมา , เหมืองแร่ itemset บ่อย ( fism ) [ 1 ] ที่ขับเคลื่อนโดยขั้นตอนวิธีแบบ [ 2 ] เป็นมาตรฐานจึงหา itemsets ขนาดใหญ่และบ่อยครั้งในถุงของรายการข้อมูล เป็นคำศัพท์และข้อมูลขนาดโต ปรับขั้นตอนวิธีการแบบเดิม กลายเป็นเป้าหมายหลักของการวิจัย ตะกั่วนี้ไปยังหมายเลขของนวัตกรรมในโครงสร้างข้อมูลและขั้นตอนวิธีที่ยืดหยุ่น ซึ่งจะเน้นในส่วน ii-a. หลายอื่น ๆเช่นเหมืองแร่หายาก itemset กระบวนทัศน์ [ 15 ] , [ 14 ] , [ 10 ] สมาคมทางอ้อม เหมืองแร่ ฯลฯ ชุมนุมไปยังที่อยู่ข้อ จำกัด ของ , และ
การแปล กรุณารอสักครู่..