K-means is probably the most celebr

K-means is probably the most celebrated and widely used clustering technique;
hence it is the best representative of the class of iterative centroid-based divisive
algorithms. On the other hand, PDDP is a recently proposed technique ([4-7]). It is
representative of the non-iterative techniques based upon the Singular Value
Decomposition (SVD) of a matrix built from the data-set.
The objective of this paper is twofold:
• compare the clustering performance of bisecting K-means and PDDP;
• analyze the dynamic behavior of the K-means iterative algorithm.
In the existing literature, both these issues have been considered only empirically.
The performance of PDDP and K-means have been recently studied, and have been
reported to be somehow similar, on the basis of a few application examples ([4-7]). As
for K-means behavior, the main theoretical result known so far is [16], where it is shown
that the K-means iterative procedure is guaranteed to converge; however, nothing is said
about “where” and “how” it converges.
The main contribution of this work is to provide a simple mathematical
explanation of some features of K-means and PDDP. This is done under the restrictive
assumption that the data are uniformly distributed within a 2-dimensional ellipsoid. The
main results here obtained can be summarized as follows:
• when the number of data-points tends to infinity, K-means and PDDP converge to
the same solution;
• when the number of data-points tends to infinity, the iterative bisecting K-means
algorithm is characterized by 2 stationary-points: one is an unstable equilibrium, one
is a stable equilibrium point;
The paper is organized as follows: in Section 2 K-means and PDDP are concisely
recalled and discussed; in Section 3 they are analyzed when the number of data-points
tends to infinity, whereas in Section 4 an empirical analy

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ถึงจะโด่งดังมากที่สุด และใช้กันแพร่หลายคลัสเตอร์เทคนิคจึง ถือเป็นตัวแทนที่ดีที่สุดของชั้นซ้ำตามเซนทรอยด์แตกแยกอัลกอริทึม บนมืออื่น ๆ PDDP เป็นเทคนิคนำเสนอเมื่อเร็ว ๆ นี้ ([4-7]) มันเป็นเทคนิคไม่ซ้ำจากค่าเอกพจน์เป็นผู้แทนแยกส่วนประกอบ (SVD) ของเมทริกซ์ที่สร้างจากชุดข้อมูลวัตถุประสงค์ของเอกสารนี้มีอยู่สองประการ:•เปรียบเทียบประสิทธิภาพระบบคลัสเตอร์ของ bisecting ถึงและ PDDP•วิเคราะห์ลักษณะการทำงานแบบไดนามิกของอัลกอริทึมซ้ำถึงในวรรณคดีที่มีอยู่ ปัญหาเหล่านี้ทั้งสองได้รับการพิจารณาเฉพาะเชิงประสบการณ์ด้วยประสิทธิภาพของ PDDP และถึงมีศึกษาเมื่อเร็ว ๆ นี้ และได้รับรายงานที่จะอย่างใดคล้าย ตามตัวอย่างการประยุกต์กี่ ([4-7]) เป็นถึงลักษณะการทำงาน รู้จักผลหลักทฤษฎีจนได้ [16] , ซึ่งมันแสดงให้เห็นที่ขั้นตอนซ้ำถึงจะรับประกันเพื่อมาบรรจบกัน อย่างไรก็ตาม ไม่มีพูดเกี่ยวกับ "ที่ใด" และ "อย่างไร" มันแร็คส่วนหลักของงานนี้คือการ ให้แบบง่าย ๆ ทางคณิตศาสตร์คำอธิบายของคุณสมบัติบางอย่างที่ถึงและ PDDP นี้จะกระทำภายใต้การจำกัดสมมติฐานว่า ข้อมูลมีกระจายภายในทรงรีแบบ 2 มิติ การผลหลักที่นี่ได้รับสามารถสรุปได้ดังนี้:มาบรรจบกันเมื่อจำนวนของจุดข้อมูลที่มีแนวโน้มที่อินฟินิตี้ ถึงและ PDDPแก้ไขปัญหาเดียวกันเมื่อจำนวนของจุดข้อมูลที่มีแนวโน้มที่อินฟินิตี้ ซ้ำ bisecting K-หมายถึงอัลกอริทึมเป็นลักษณะเขียนคะแนน 2: มีความสมดุลไม่เสถียร หนึ่งคือจุดสมดุลเสถียรกระดาษจัดเป็นดังนี้: ในส่วนที่ 2 ถึง PDDP ความรัดกุมเรียก และกล่าว ถึง ในส่วนที่ 3 วิเคราะห์เมื่อจำนวนของจุดข้อมูลมีแนวโน้มที่อินฟินิตี้ ในขณะที่ในส่วนที่ 4 เอาใว้เป็นเชิงประจักษ์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

K-หมายถึงน่าจะเป็นเทคนิคการจัดกลุ่มที่มีชื่อเสียงโด่งดังมากที่สุดและใช้กันอย่างแพร่หลาย;
จึงเป็นตัวแทนที่ดีที่สุดของชั้นเรียนของซ้ำเซนทรอยด์ตามแตกแยก
อัลกอริทึม บนมืออื่น ๆ , PDDP เป็นเทคนิคที่นำเสนอเมื่อเร็ว ๆ นี้ ([4-7]) มันเป็น
ตัวแทนของเทคนิคที่ไม่ซ้ำขึ้นอยู่กับมูลค่าเอกพจน์
สลายตัว (SVD) ของเมทริกซ์ที่สร้างขึ้นจากข้อมูลที่ตั้งไว้.
วัตถุประสงค์ของการวิจัยนี้เป็นสองเท่า:
•เปรียบเทียบผลการดำเนินงานการจัดกลุ่มของร่าง K-วิธีการและ PDDP;
• วิเคราะห์พฤติกรรมแบบไดนามิกของ K-หมายถึงขั้นตอนวิธีการที่กล่าวย้ำ.
ในวรรณคดีที่มีอยู่ทั้งปัญหาเหล่านี้ได้รับการพิจารณาเพียงสังเกตุ.
ประสิทธิภาพการทำงานของ PDDP K-วิธีการได้รับการศึกษาเมื่อเร็ว ๆ นี้และได้รับการ
รายงานจะคล้ายอย่างใดใน พื้นฐานของตัวอย่างการประยุกต์กี่ ([4-7]) ในฐานะที่เป็น
K-หมายถึงพฤติกรรมผลทฤษฎีหลักที่รู้จักกันเพื่อให้ห่างไกล [16] ซึ่งจะมีการแสดงให้เห็น
ว่า K-หมายถึงขั้นตอนซ้ำรับประกันได้ว่าจะมาบรรจบกัน; แต่ไม่มีอะไรจะกล่าว
เกี่ยวกับการ "ที่" และ "วิธีการ" มันลู่.
สนับสนุนหลักของงานนี้คือการให้ทางคณิตศาสตร์อย่างง่าย
คำอธิบายคุณสมบัติบางอย่างของ K-วิธีการและ PDDP นี้จะกระทำภายใต้ข้อ จำกัด
สมมติฐานที่ว่าข้อมูลจะถูกกระจายอย่างสม่ำเสมอภายในรี 2 มิติ
ผลหลักได้ที่นี่สามารถสรุปได้ดังต่อไปนี้
•เมื่อจำนวนของจุดข้อมูลที่มีแนวโน้มที่จะอินฟินิตี้, K-วิธีการและ PDDP บรรจบกันเพื่อ
แก้ปัญหาเดียวกัน;
•เมื่อจำนวนของจุดข้อมูลที่มีแนวโน้มที่จะอินฟินิตี้ที่ย้ำตัด K -means
อัลกอริทึมที่โดดเด่นด้วย 2 จุดนิ่งหนึ่งคือสมดุลไม่เสถียรหนึ่ง
เป็นจุดสมดุล;
กระดาษที่ถูกจัดขึ้นเป็นดังนี้: ในส่วนที่ 2 K-วิธีการและ PDDP จะรัดกุม
เล่าและพูดคุยกัน; ในส่วนที่ 3 จะมีการวิเคราะห์เมื่อจำนวนของจุดข้อมูลที่
มีแนวโน้มที่จะอินฟินิตี้ในขณะที่ในมาตรา 4 มีส่วนเชิงประจักษ์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

k-means อาจเป็นที่สุดกระเดื่องและใช้กันอย่างแพร่หลายสำหรับเทคนิคเพราะ มันคือ ตัวแทนที่ดีที่สุดของชั้นซ้ำโดยแบ่งเซนทรอยด์อัลกอริธึม บนมืออื่น ๆ , pddp เป็นเมื่อเร็วๆนี้เสนอเทคนิค ( [ 1 ] ) มันคือตัวแทนของไม่ซ้ำเทคนิคขึ้นอยู่กับมูลค่าเอกพจน์การเน่าสลายตัว ( SVD ) ของเมทริกซ์ที่ถูกสร้างขึ้นจากชุดข้อมูลบทความนี้มีวัตถุประสงค์สองประการ คือ- เปรียบเทียบ การจัดกลุ่มงานและ bisecting k-means pddp ;- วิเคราะห์พฤติกรรมพลวัตของ k-means ซ้ำขั้นตอนวิธีในวรรณคดี ที่มีอยู่ ปัญหาทั้งสองนี้ได้รับการพิจารณาจากผล .ประสิทธิภาพของ pddp k-means และเมื่อเร็วๆ นี้ เรียน และได้รับการรายงานที่จะคล้ายกันได้ บนพื้นฐานของโปรแกรมตัวอย่างไม่กี่ ( [ 1 ] ) เป็นสำหรับพฤติกรรม k-means ผลทางทฤษฎีหลักที่รู้จักกันเพื่อให้ห่างไกลเป็น [ 16 ] ซึ่งจะแสดงที่ k-means ซ้ำขั้นตอนที่รับประกันว่าจะมาบรรจบกัน ; อย่างไรก็ตาม , ไม่มีอะไรจะพูด" ที่ " และ " วิธีการ " มันๆ .ส่วนหลักของงานนี้คือเพื่อ ให้ง่าย ๆทางคณิตศาสตร์คำอธิบายคุณลักษณะบางอย่างของ k-means และ pddp . นี้จะกระทำภายใต้การ จำกัดสมมติฐานว่าข้อมูลจะกระจายอย่างสม่ำเสมอในรูปทรง 2 มิติ ที่หลักผลที่นี่ที่ได้สามารถสรุปได้ดังนี้- เมื่อจำนวนของจุดข้อมูลมีแนวโน้มที่จะอินฟินิตี้ k-means pddp บรรจบกับและโซลูชั่นเดียวกัน- เมื่อจำนวนของจุดข้อมูลมีแนวโน้มที่จะอินฟินิตี้ , ซ้ำ bisecting k-meansขั้นตอนวิธีเป็นลักษณะ 2 จุดหยุดนิ่ง : หนึ่งเป็นสมดุลไม่เสถียร หนึ่งคือจุดสมดุลเสถียรภาพกระดาษจัดดังนี้ ในส่วนที่ 2 k-means pddp จะรัดกุมและเรียกคืนและกล่าวถึง ในมาตรา 3 ที่พวกเขาใช้เมื่อจำนวนของจุดข้อมูลมีแนวโน้มที่จะอินฟินิตี้ ในขณะที่ในส่วนที่ 4 เป็นส่วนที่เชิงประจักษ์

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.