As discussed in Chapter 5, frequent

As discussed in Chapter 5, frequent-pattern mining finds a set of patterns that occur
frequently in a data set, where a pattern can be a set of items (called an itemset),
a subsequence, or a substructure. A pattern is considered frequent if its count satisfies
a minimum support. Scalable methods for mining frequent patterns have been
extensively studied for static data sets. However, mining such patterns in dynamic
data streams poses substantial new challenges. Many existing frequent-pattern mining
algorithms require the system to scan the whole data set more than once, but
this is unrealistic for infinite data streams. How can we perform incremental updates
of frequent itemsets for stream data since an infrequent itemset can become frequent
later on, and hence cannot be ignored? Moreover, a frequent itemset can become
infrequent as well. The number of infrequent itemsets is exponential and so it is
impossible to keep track of all of them.
To overcome this difficulty, there are two possible approaches. One is to keep
track of only a predefined, limited set of items and itemsets. This method has very
limited usage and expressive power because it requires the system to confine the
scope of examination to only the set of predefined itemsets beforehand. The second
approach is to derive an approximate set of answers. In practice, approximate
answers are often sufficient. A number of approximate item or itemset counting
algorithms have been developed in recent research. Here we introduce one such
algorithm: the Lossy Counting algorithm. It approximates the frequency of items
or itemsets within a user-specified error bound, e. This concept is illustrated as
follows.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ตามที่อธิบายไว้ในบทที่ 5 ทำเหมืองแร่รูปแบบโปรแกรมค้นหาชุดรูปแบบที่เกิดขึ้นในชุดข้อมูล ซึ่งรูปแบบสามารถเป็นชุดของรายการ (itemset เรียกว่า),subsequence เป็น หรือ substructure ที่ รูปแบบถือว่าบ่อยของจำนวนตรงการสนับสนุนน้อยที่สุด สามารถปรับวิธีการทำเหมืองแร่รูปแบบบ่อย ๆ ได้ศึกษาอย่างกว้างขวางสำหรับค่าคงที่ อย่างไรก็ตาม ทำเหมืองแร่รูปแบบดังกล่าวในแบบไดนามิกข้อมูลซึ่งทำให้เกิดความท้าทายใหม่ที่พบ เหมืองแร่รูปแบบเสียงที่มีอยู่มากอัลกอริทึมต้องใช้ระบบการสแกนชุดข้อมูลทั้งหมดมากกว่าหนึ่งครั้ง แต่ไม่สำหรับกระแสข้อมูลไม่อยู่ ว่าเราสามารถปรับปรุงแบบเพิ่มเติมของ itemsets บ่อยสำหรับกระแสข้อมูลตั้งแต่ itemset ไม่สามารถทำงานได้บ่อยไม่ละเว้นในภายหลัง และด้วยเหตุนี้หรือไม่ นอกจากนี้ itemset บ่อย ๆ จะกลายเป็นไม่เช่นนั้น หมายเลข itemsets ไม่มีเนน และก็ไม่สามารถที่จะติดตามของพวกเขาทั้งหมดเพื่อเอาชนะความยากลำบากนี้ มีสองวิธีในการได้ หนึ่งคือการให้ติดตามเฉพาะล่วงหน้า การจำกัดชุดของรายการและ itemsets วิธีการนี้มีมากจำกัดการใช้งานและไฟแสดงออกเนื่องจากต้องการระบบควบคุมขอบเขตการตรวจสอบเฉพาะชุดของ itemsets ล่วงหน้ามาก่อน ที่สองวิธีการที่จะมาเป็นชุดโดยประมาณของคำตอบ ในทางปฏิบัติ ประมาณคำตอบมักเพียงพอ จำนวนสินค้าโดยประมาณหรือ itemset นับอัลกอริทึมได้รับการพัฒนาในการวิจัยล่าสุด ที่นี่เราแนะนำหนึ่งดังกล่าวอัลกอริทึม: อัลกอริทึมมีการตรวจนับ มัน approximates ความถี่ของรายการหรือ itemsets ภายในเกิดข้อผิดพลาดที่ระบุผู้ใช้ ผูก อี แนวคิดนี้จะแสดงเป็นต่อไปนี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ตามที่กล่าวไว้ในบทที่ 5 การทำเหมืองรูปแบบบ่อยครั้งพบว่าชุดของรูปแบบที่เกิดขึ้น
บ่อยครั้งในชุดข้อมูลที่รูปแบบจะเป็นชุดของรายการ (เรียก itemset)
subsequence หรือโครงสร้าง รูปแบบที่เป็นที่ยอมรับว่าบ่อยครั้งถ้านับสอดคล้องกับ
การสนับสนุนขั้นต่ำที่ วิธีการปรับขนาดได้สำหรับการทำเหมืองแร่รูปแบบที่พบบ่อยได้รับการ
ศึกษาอย่างกว้างขวางสำหรับชุดข้อมูลคงที่ อย่างไรก็ตามการทำเหมืองดังกล่าวในรูปแบบไดนามิก
กระแสข้อมูลที่ทำให้เกิดความท้าทายใหม่มาก รูปแบบที่มีอยู่บ่อย ๆ การทำเหมืองแร่
ต้องใช้ระบบอัลกอริทึมในการสแกนข้อมูลทั้งหมดตั้งมากกว่าหนึ่งครั้ง แต่
นี้จะไม่สมจริงสำหรับกระแสข้อมูลที่ไม่มีที่สิ้นสุด วิธีที่เราสามารถดำเนินการปรับปรุงที่เพิ่มขึ้น
ของ itemsets บ่อยสำหรับกระแสข้อมูลตั้งแต่ไม่บ่อยนัก itemset สามารถกลายเป็นบ่อย
ในภายหลังและด้วยเหตุนี้ไม่สามารถปฏิเสธ? นอกจากนี้ itemset บ่อยจะกลายเป็น
ไม่บ่อยนักเช่นกัน จำนวน itemsets ไม่บ่อยนักจะชี้แจงและดังนั้นจึงเป็น
ไปไม่ได้ที่จะติดตามทั้งหมดของพวกเขา
เพื่อเอาชนะปัญหานี้มีสองแนวทางที่เป็นไปได้ หนึ่งคือการให้
ติดตามเฉพาะที่กำหนดไว้ล่วงหน้าชุด จำกัด ของรายการและ itemsets วิธีการนี้มีมาก
การใช้งานที่ จำกัด และแสดงพลังเพราะต้องใช้ระบบที่จะ จำกัด
ขอบเขตของการตรวจสอบเฉพาะชุดของ itemsets ที่กำหนดไว้ล่วงหน้าก่อน สอง
วิธีคือการได้รับการตั้งค่าโดยประมาณของคำตอบ ในทางปฏิบัติโดยประมาณ
มักจะมีคำตอบที่เพียงพอ จำนวนของรายการโดยประมาณหรือนับ itemset
อัลกอริทึมได้รับการพัฒนาในการวิจัยที่ผ่านมา ที่นี่เราแนะนำดังกล่าว
ขั้นตอน: ขั้นตอนวิธีการนับ Lossy มันใกล้เคียงกับความถี่ของรายการ
หรือ itemsets ภายในที่ผู้ใช้ระบุข้อผิดพลาดผูกพันอี แนวคิดนี้จะแสดงเป็น
ดังนี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ตามที่กล่าวไว้ในบทที่ 5 , เหมืองแร่รูปแบบบ่อยพบชุดของรูปแบบที่เกิดขึ้น
บ่อยในชุดข้อมูลที่เป็นรูปแบบที่สามารถตั้งค่าของรายการ ( เรียกว่า itemset )
เป็นพลังใจ หรือของ . รูปแบบถือว่าบ่อยถ้านับเข้าตา
สนับสนุนน้อย วิธีการปรับขนาดได้สำหรับรูปแบบบ่อยเหมืองแร่ได้รับ
อย่างกว้างขวางเพื่อชุดข้อมูลแบบคงที่ อย่างไรก็ตามทำเหมืองดังกล่าวในรูปแบบกระแสข้อมูลแบบไดนามิก poses ความท้าทายใหม่
เป็นชิ้นเป็นอัน หลายรูปแบบเหมืองแร่
ขั้นตอนวิธีที่มีอยู่บ่อยครั้งต้องใช้ระบบสแกนข้อมูลทั้งชุดมากกว่าหนึ่งครั้ง แต่นี้เป็นไม่สมจริง
สำหรับสตรีมข้อมูลอนันต์ วิธีที่เราสามารถทำการเพิ่มการปรับปรุง
ของเซตรายการความถี่สำหรับกระแสข้อมูลตั้งแต่ itemset ไม่บ่อยนักจะกลายเป็นบ่อย
ในภายหลังและดังนั้นจึงไม่สามารถละเลย ? นอกจากนี้ itemset บ่อยจะกลายเป็น
ไม่บ่อยเช่นกัน จำนวน itemsets ไม่บ่อยคือเอกซ์โพเนนเชียลและดังนั้นจึง
เป็นไปไม่ได้ที่จะติดตามทั้งหมดของพวกเขา .
ที่จะเอาชนะปัญหานี้ มีสองวิธีที่เป็นไปได้ หนึ่งคือการรักษา
ติดตามเท่านั้นที่กำหนดไว้ล่วงหน้าชุด จำกัด ของรายการ และ itemsets . วิธีการนี้มีมาก
การใช้งานที่ จำกัด และการแสดงพลัง เพราะต้องการระบบที่จะ จำกัด ขอบเขตของการตรวจสอบ
เพียงชุดของ itemsets ล่วงหน้าไว้ก่อน วิธีที่สอง
คือการได้มาซึ่งชุดโดยประมาณของคำตอบ ในการฝึกประมาณ
คำตอบมักจะเพียงพอ หมายเลขของสินค้าโดยประมาณ หรือ itemset นับ
อัลกอริทึมได้ถูกพัฒนาขึ้นในงานวิจัยล่าสุด ที่นี่เราแนะนำเช่น
อัลกอริทึม : วัตถุนับขั้นตอนวิธี มันใกล้เคียงกับความถี่ของรายการ
หรือ itemsets ในผู้ใช้ที่ระบุข้อผิดพลาดที่ถูกผูกไว้ เช่น แนวคิดนี้จะแสดงเป็น
1

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.