Privacy-Preserving Data Mining as a

Privacy-Preserving Data Mining as a Service in the Cloud

The discovery of frequent patterns, association rules, and correlation relationships among huge amounts of data is useful to business intelligence.
A typical example of frequent itemset mining is market basket analysis.
This process analyzes customer buying habits by finding associations between the different items that customers place in their shopping baskets.
The discovery of such associations can help retailers develop marketing strategies by gaining insight into which items customers frequently purchase together.
For a decade, there has been a growing interest in data mining as a service.
In this paradigm, a company (data owner) that lacks data storage, computational
resources, and expertise, stores its data in the cloud and outsources the mining tasks to the cloud service provider (server).
Without doubt, data mining as a service offers valuable benefits to business intelligence.
However, it also presents a serious privacy problem; that is, the server has access to company data and could learn business secrets from it.
To protect a company’s data privacy and yet enable the server to perform association rule mining on the data in the cloud, a naïve solution is for the data owner to hide the meanings of items in its transaction database by substituting items with unique numbers
(where the same item is substituted by the same number and different items are substituted by different numbers).
This one-to-one substitution approach doesn’t hide the frequencies of items. If the server
has some background knowledge (for example, information on the frequencies of some items), it can reidentify them, particularly the most frequent items.
For example, if bread is the most frequent item in retail transaction databases, the server can conclude that the most frequently occurring number refers to bread in the transformed database.

To prevent background-knowledge-based attacks,Wai Kit Wong and his colleagues proposed a
one-to-n item mapping that transforms transactions nondeterministically.
The basic idea is to add fake items to the transaction database.
However, fabrication of false data degrades the accuracy of data analytics,and the proposed method has two weaknesses that can be exploited.
First, each fake item has the same probability of being added to each transaction,
and thus appears with similar frequency when the number of transactions is large.
Second, fake items are added to transactions independently of the items already present. As a result, each fake item is independent of all other items.
This second observation holds even if the frequency of each fake item is different.
Ian Molloy and his colleagues presented a frequency-analysis-based attack to Wong and colleagues’ algorithm.
The attack could remove the independently added fake items by detecting the low
correlations between items, and some of the top frequent items were reidentified successfully.

Privacy-Preserving Data Mining as a Service in the Cloud

The discovery of frequent patterns, association rules, and correlation relationships among huge amounts of data is useful to business intelligence. 
A typical example of frequent itemset mining is market basket analysis. 
This process analyzes customer buying habits by finding associations between the different items that customers place in their shopping baskets. 
The discovery of such associations can help retailers develop marketing strategies by gaining insight into which items customers frequently purchase together.
For a decade, there has been a growing interest in data mining as a service.
In this paradigm, a company (data owner) that lacks data storage, computational
resources, and expertise, stores its data in the cloud and outsources the mining tasks to the cloud service provider (server). 
Without doubt, data mining as a service offers valuable benefits to business intelligence.
However, it also presents a serious privacy problem; that is, the server has access to company data and could learn business secrets from it.
To protect a company’s data privacy and yet enable the server to perform association rule mining on the data in the cloud, a naïve solution is for the data owner to hide the meanings of items in its transaction database by substituting items with unique numbers
(where the same item is substituted by the same number and different items are substituted by different numbers). 
This one-to-one substitution approach doesn’t hide the frequencies of items. If the server
has some background knowledge (for example, information on the frequencies of some items), it can reidentify them, particularly the most frequent items.
For example, if bread is the most frequent item in retail transaction databases, the server can conclude that the most frequently occurring number refers to bread in the transformed database.

To prevent background-knowledge-based attacks,Wai Kit Wong and his colleagues proposed a
one-to-n item mapping that transforms transactions nondeterministically.
The basic idea is to add fake items to the transaction database. 
However, fabrication of false data degrades the accuracy of data analytics,and the proposed method has two weaknesses that can be exploited. 
First, each fake item has the same probability of being added to each transaction,
and thus appears with similar frequency when the number of transactions is large. 
Second, fake items are added to transactions independently of the items already present. As a result, each fake item is independent of all other items. 
This second observation holds even if the frequency of each fake item is different. 
Ian Molloy and his colleagues presented a frequency-analysis-based attack to Wong and colleagues’ algorithm.
The attack could remove the independently added fake items by detecting the low
correlations between items, and some of the top frequent items were reidentified successfully.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

รักษาความเป็นส่วนตัวการทำเหมืองข้อมูลเป็นบริการในเมฆการค้นพบรูปแบบที่พบบ่อย กฎความสัมพันธ์ และความสัมพันธ์ความสัมพันธ์ระหว่างจำนวนข้อมูลขนาดใหญ่มีประโยชน์ในการข่าวกรองธุรกิจ ตัวอย่างทั่วไปของเหมือง itemset บ่อยวิเคราะห์ตลาดตะกร้าได้ กระบวนการนี้วิเคราะห์ลูกค้าซื้อนิสัย โดยการหาความสัมพันธ์ระหว่างสินค้าต่าง ๆ ที่ลูกค้าวางในตะกร้าช้อปปิ้งของพวกเขา การค้นพบความสัมพันธ์ดังกล่าวสามารถช่วยร้านค้าปลีกพัฒนากลยุทธ์การตลาด โดยได้รับความเข้าใจในสินค้าที่ลูกค้ามักซื้อด้วยกันสำหรับทศวรรษที่ผ่านมา มีแล้วสนใจมากขึ้นในการทำเหมืองข้อมูลเป็นบริการในกระบวนทัศน์นี้ บริษัท (เจ้าของข้อมูล) ที่ไม่มีการเก็บข้อมูล คอมพิวเตอร์ทรัพยากร และความเชี่ยวชาญ จัดเก็บข้อมูลในเมฆ และ outsources งานเหมืองแร่ไปยังผู้ให้บริการคลาวด์ (เซิร์ฟเวอร์) โดยไม่ต้องสงสัย การทำเหมืองข้อมูลเป็นบริการมีประโยชน์มีคุณค่าการข่าวกรองธุรกิจอย่างไรก็ตาม มันยังแสดงความเป็นส่วนตัวที่ร้ายแรงปัญหา นั่นคือ เซิร์ฟเวอร์ที่มีการเข้าถึงข้อมูลของบริษัท และสามารถเรียนรู้ความลับทางธุรกิจจากปกป้องข้อมูลส่วนตัวของบริษัท และได้ เปิดใช้งานเซิร์ฟเวอร์การเชื่อมโยงกฎเหมืองข้อมูลในเมฆ โซลูชันขำน่าเป็นเจ้าของข้อมูลจะซ่อนความหมายของรายการในฐานข้อมูลของธุรกรรม โดยการแทนที่รายการที่มีหมายเลขเฉพาะ(ที่เดียวกันจะแทน ด้วยจำนวนเดียวกัน และสินค้าต่าง ๆ จะแทน ด้วยตัวเลขที่แตกต่างกัน) วิธีการทดแทนแบบหนึ่งต่อหนึ่งนี้ไม่ซ่อนความถี่ของรายการ ถ้าเซิร์ฟเวอร์มีบางความรู้พื้นหลัง (ตัวอย่าง ข้อมูลความถี่ของบางสิ่ง), มันสามารถ reidentify พวกเขา โดยเฉพาะอย่างยิ่งสินค้าบ่อย ๆตัวอย่าง ถ้า สินค้าบ่อย ๆ ในฐานข้อมูลธุรกรรมขายปลีกขนมปัง เซิร์ฟเวอร์สามารถสรุปว่า จำนวนเกิดขึ้นบ่อยที่สุดหมายถึงขนมปังในฐานแปรรูปการป้องกันพื้นหลังความรู้โจมตี นำเสนอวงชุดหวายและเพื่อนร่วมงานของเขาเป็นสินค้าหนึ่ง n การแม็ปที่แปลงธุรกรรม nondeterministicallyความคิดพื้นฐานคือการ เพิ่มสินค้าปลอมในธุรกรรมฐานข้อมูล อย่างไรก็ตาม ประดิษฐ์ข้อมูลเท็จเสื่อมความถูกต้องของการวิเคราะห์ข้อมูล และวิธีการนำเสนอมีจุดอ่อนที่สองที่สามารถนำไป ก่อน แต่ละสินค้าปลอมมีความเหมือนกันของแต่ละธุรกรรม เพิ่มและจึง ปรากฏความถี่คล้ายกับหมายเลขของธุรกรรมที่มีขนาดใหญ่ รายการที่สอง ปลอมจะเพิ่มธุรกรรมอิสระสินค้าอยู่แล้ว ดังนั้น แต่ละสินค้าปลอมเป็นอิสระสินค้าอื่นทั้งหมด สังเกตที่สองนี้ถือแม้ว่าความถี่ของแต่ละสินค้าปลอมจะแตกต่างกัน เอียนเจียน่ามอลเลย์และเพื่อนร่วมงานของเขานำเสนอการโจมตีความถี่วิเคราะห์ตามวงศ์และเพื่อนร่วมงานของอัลกอริทึมการโจมตีสามารถเอาสินค้าปลอมอย่างอิสระเพิ่ม ด้วยการตรวจจับต่ำสุดความสัมพันธ์ระหว่างรายการ และสินค้าบ่อยสุดที่ reidentified เรียบร้อยแล้ว

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ความเป็นส่วนตัวรักษาการทำเหมืองข้อมูลเป็นบริการในเมฆค้นพบรูปแบบที่พบบ่อยที่กฎสมาคมและความสัมพันธ์ความสัมพันธ์ระหว่างข้อมูลจำนวนมากจะเป็นประโยชน์ในทางธุรกิจ. เป็นตัวอย่างของการทำเหมือง itemset บ่อยคือตลาดการวิเคราะห์ตะกร้า. กระบวนการนี้วิเคราะห์ลูกค้า ซื้อนิสัยโดยการค้นหาความสัมพันธ์ระหว่างรายการที่แตกต่างที่ลูกค้าวางในตะกร้าช้อปปิ้งของพวกเขา. การค้นพบของสมาคมดังกล่าวจะช่วยให้ร้านค้าปลีกในการพัฒนากลยุทธ์การตลาดโดยดึงดูดความเข้าใจในการที่ลูกค้ารายการบ่อยซื้อด้วยกัน. สำหรับทศวรรษที่ผ่านมามีการเติบโตที่น่าสนใจใน การทำเหมืองข้อมูลเป็นบริการ. ในกระบวนทัศน์นี้ บริษัท (เจ้าของข้อมูล) ที่ขาดการจัดเก็บข้อมูลการประมวลผลทรัพยากรและความเชี่ยวชาญเก็บข้อมูลในเมฆและoutsources งานเหมืองไปยังผู้ให้บริการคลาวด์ (server). โดยไม่ต้องสงสัย การทำเหมืองข้อมูลเป็นบริการที่มีประโยชน์ที่มีคุณค่าทางธุรกิจ. แต่ก็ยังมีปัญหาความเป็นส่วนตัวอย่างจริงจัง; ว่ามีเซิร์ฟเวอร์ที่มีการเข้าถึงข้อมูลของ บริษัท และสามารถเรียนรู้ความลับทางธุรกิจจากมัน. เพื่อปกป้องความเป็นส่วนตัวของข้อมูลของ บริษัท และยังช่วยให้เซิร์ฟเวอร์ที่จะดำเนินการทำเหมืองแร่การปกครองของสมาคมกับข้อมูลในเมฆเป็นทางออกที่ไร้เดียงสาเป็นเจ้าของข้อมูล ซ่อนความหมายของรายการในฐานข้อมูลการทำธุรกรรมของตนโดยการแทนรายการที่มีหมายเลขที่ไม่ซ้ำกัน(ที่รายการเดียวกันแทนจากจำนวนเดียวกันและรายการที่แตกต่างถูกเปลี่ยนตัวโดยตัวเลขที่แตกต่างกัน). นี้อย่างใดอย่างหนึ่งต่อหนึ่งวิธีการทดแทนไม่ได้ซ่อนความถี่ ของรายการ ถ้าเซิร์ฟเวอร์ที่มีความรู้พื้นฐานบางอย่าง (เช่นข้อมูลเกี่ยวกับความถี่ของบางรายการ) ก็สามารถ reidentify พวกเขาโดยเฉพาะอย่างยิ่งรายการที่พบบ่อยที่สุด. ยกตัวอย่างเช่นถ้าขนมปังเป็นรายการที่พบบ่อยที่สุดในฐานข้อมูลการทำธุรกรรมการค้าปลีกเซิร์ฟเวอร์สามารถสรุปได้ ว่าจำนวนที่เกิดขึ้นบ่อยที่สุดหมายถึงขนมปังในฐานข้อมูลเปลี่ยน. เพื่อป้องกันไม่ให้พื้นหลังความรู้ตามโจมตีหวายชุดวงศ์และเพื่อนร่วมงานของเขาที่นำเสนอการทำแผนที่รายการหนึ่งไปยัง n ที่แปลงทำธุรกรรม nondeterministically. แนวคิดพื้นฐานคือการเพิ่มของปลอม รายการไปยังฐานข้อมูลการทำธุรกรรม. อย่างไรก็ตามการผลิตของข้อมูลที่ผิดพลาดลดความถูกต้องของการวิเคราะห์ข้อมูลและวิธีการที่นำเสนอมีสองจุดอ่อนที่สามารถใช้ประโยชน์. ครั้งแรกแต่ละรายการปลอมมีความน่าจะเป็นเหมือนกันที่จะถูกเพิ่มเข้าไปในแต่ละรายการและทำให้ปรากฏมีความถี่ที่คล้ายกันเมื่อจำนวนการทำธุรกรรมที่มีขนาดใหญ่. สองรายการปลอมที่มีการเพิ่มการทำธุรกรรมที่จะเป็นอิสระจากรายการที่มีอยู่แล้วในปัจจุบัน เป็นผลให้แต่ละรายการปลอมเป็นอิสระจากรายการอื่น ๆ ทั้งหมด. นี้สังเกตที่สองถือแม้ว่าความถี่ของแต่ละรายการปลอมที่แตกต่างกัน. เอียนคีร์กีซและเพื่อนร่วมงานของเขาที่นำเสนอการโจมตีความถี่การวิเคราะห์ที่ใช้ในการอัลกอริทึมวงศ์และเพื่อนร่วมงาน. การโจมตีสามารถลบรายการที่ปลอมเพิ่มอิสระโดยการตรวจสอบต่ำความสัมพันธ์ระหว่างรายการและบางส่วนของรายการที่พบบ่อยด้านบนถูก reidentified ประสบความสำเร็จ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

รักษาความเป็นส่วนตัวการทำเหมืองข้อมูลเป็นบริการในเมฆ

การค้นพบรูปแบบบ่อย กฎของสมาคม และความสัมพันธ์ความสัมพันธ์ระหว่างยอดเงินขนาดใหญ่ของข้อมูลเป็นประโยชน์กับธุรกิจอัจฉริยะ
ตัวอย่างทั่วไปของเหมือง itemset บ่อยคือการวิเคราะห์ตะกร้าตลาด
กระบวนการนี้วิเคราะห์พฤติกรรมลูกค้าโดยการหาซื้อสมาคมระหว่างรายการที่แตกต่างกันที่สถานที่ลูกค้าในตะกร้าช้อปปิ้งของพวกเขา
การค้นพบของสมาคมดังกล่าวสามารถช่วยให้ร้านค้าปลีกในการพัฒนากลยุทธ์ทางการตลาดโดยการดึงดูดความเข้าใจในรายการที่ลูกค้ามักซื้อด้วยกัน .
สำหรับทศวรรษที่ผ่านมา , ได้มีความสนใจในการทำเหมืองข้อมูลเป็นบริการ .
ในกระบวนทัศน์นี้บริษัท ( เจ้าของข้อมูล ) ที่ขาดการจัดเก็บข้อมูลคอมพิวเตอร์
ทรัพยากรและความเชี่ยวชาญ , เก็บข้อมูลในเมฆและเงินเดือนงานเหมืองแร่เมฆผู้ให้บริการ ( server )
ไม่ต้องสงสัยการทำเหมืองข้อมูลเป็นบริการที่มีประโยชน์มีคุณค่าในการข่าวกรองธุรกิจ .
แต่ยังพบปัญหาความเป็นส่วนตัวที่ร้ายแรง นั่นคือเซิร์ฟเวอร์ที่มีการเข้าถึงข้อมูลของ บริษัท และสามารถเรียนรู้ความลับทางธุรกิจจากมัน .
เพื่อปกป้องข้อมูลส่วนบุคคลข้อมูลของ บริษัท และยังช่วยให้เซิร์ฟเวอร์เพื่อดำเนินการสมาคมกฎเหมืองแร่บนข้อมูลในเมฆ , na ไตได้โซลูชั่นสำหรับเจ้าของข้อมูลซ่อนความหมายของรายการในฐานข้อมูลของรายการ จากรายการ เฉพาะหมายเลข
( ซึ่งรายการเดียวกัน คือ ใช้เบอร์เดียวกัน และรายการต่าง ๆ จะใช้ตัวเลขที่แตกต่างกัน )
one วิธีการทดแทนนี้ไม่ซ่อนความถี่ของรายการ ถ้าเซิร์ฟเวอร์
มีความรู้พื้นหลัง ( เช่นข้อมูลเกี่ยวกับความถี่ของบางรายการ ) , มันสามารถ reidentify พวกเขา โดยเฉพาะอย่างยิ่งรายการบ่อยที่สุด
ตัวอย่างเช่นถ้าอาหารเป็นสินค้าที่ใช้บ่อยที่สุดในฐานข้อมูลธุรกรรมค้าปลีก , เซิร์ฟเวอร์สามารถสรุปได้ว่า ตัวเลขที่เกิดขึ้นบ่อยที่สุดหมายถึงขนมปังในแปลงฐานข้อมูล

เพื่อป้องกันพื้นฐานความรู้การโจมตีหวายชุดวงและเพื่อนร่วมงานของเขาเสนอ
one-to-n รายการแผนที่ที่แปลงรายการ nondeterministically .
แนวคิดพื้นฐานคือการเพิ่มรายการปลอมธุรกรรมฐานข้อมูล
แต่สร้างข้อมูลเท็จบั่นทอนความถูกต้องของการวิเคราะห์ข้อมูลและวิธีที่เสนอมีจุดอ่อนที่สามารถใช้ประโยชน์
ครั้งแรก แต่ละรายการปลอมมีความน่าจะเป็นเดียวกันของการเพิ่มในแต่ละรายการ และ จึงปรากฏมีความถี่ที่คล้ายกัน
เมื่อจำนวนของธุรกรรมที่มีขนาดใหญ่
2สินค้าปลอมที่มีการเพิ่มธุรกรรมของอิสระของรายการในปัจจุบันแล้ว เป็นผลให้แต่ละรายการของสินค้าปลอมเป็นอิสระอื่น ๆ
การสังเกตที่สองนี้ถือแม้ว่าความถี่ของแต่ละปลอมสินค้าที่แตกต่างกัน
เอียนดาวน์โหลดและเพื่อนร่วมงานของเขาที่นำเสนอการวิเคราะห์ความถี่ที่ใช้โจมตีวองและเพื่อนร่วมงาน
' ขั้นตอนวิธีการโจมตีสามารถลบเพิ่มอิสระรายการปลอมโดยการตรวจหาความสัมพันธ์ต่ำ
ระหว่างรายการ และบางรายการบ่อย ๆ ด้านบนเป็น reidentified เรียบร้อยแล้ว

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.