In (Huang 1997) we have proposed an

In (Huang 1997) we have proposed an algorithm, called k-prototypes, to cluster large data sets with mixed numeric and categorical values.// In the k-prototypes algorithm we define a dissimilarity measure that takes into account both numeric and categorical attributes.// Assume SN is the dissimilarity measure on numeric attributes defined by the squared Euclidean distance and SC is the dissimilarity measure on categorical attributes defined as the number of mismatches of categories between two objects.// We define the dissimilarity measure between two objects as SN + GSC, where g is a weight to balance the two parts to avoid favoring either type of attribute.// The clustering process of the k-prototypes algorithm is similar to the k-means algorithm except that a new method is used to update the categorical attribute values of cluster prototypes.// A problem in using that algorithm is to choose a proper weight.// We have suggested the use of the average
standard deviation of numeric attributes as a guide in choosing the weight.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ใน (หวง) เราได้นำเสนอเป็นอัลกอริทึม เรียกว่า k-แบบตัวอย่าง การคลัสเตอร์ชุดข้อมูลขนาดใหญ่ ด้วย values.// แตก และตัวเลขผสมในอัลกอริทึมแบบ k-ตัวอย่างเรากำหนดวัด dissimilarity ที่จะพิจารณาทั้งตัวเลข และแน่ชัด attributes.// SN สมมติ วัด dissimilarity ในแอตทริบิวต์ที่เป็นตัวเลขที่กำหนด โดยยุคลิดกำลังสอง และ SC เป็นวัด dissimilarity ในแอตทริบิวต์แน่ชัดที่กำหนดเป็นจำนวน mismatches ประเภทระหว่าง objects.// สองเรากำหนดวัด dissimilarity ระหว่าง วัตถุสองเป็น SN + GSC, g น้ำหนักสมดุลสองส่วนเพื่อหลีกเลี่ยงนความชนิด attribute.// กระบวนการระบบคลัสเตอร์ของอัลกอริทึมแบบตัวอย่าง k จะคล้ายกับ อัลกอริทึมหมายถึง k ยกเว้นว่าใช้วิธีใหม่ในการปรับปรุงค่าแอตทริบิวต์ที่แน่ชัดของปัญหา prototypes.// A คลัสเตอร์โดยใช้อัลกอริทึมที่จะเลือก weight.// เหมาะสมเราได้แนะนำการใช้ค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานของคุณลักษณะตัวเลขเป็นแนวในการเลือกน้ำหนัก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ใน (Huang 1997) เราได้นำเสนอขั้นตอนวิธีการที่เรียกว่า k-ต้นแบบเพื่อกลุ่มชุดข้อมูลขนาดใหญ่ที่มีค่าตัวเลขและเด็ดขาดผสม .// ในขั้นตอนวิธี k-ต้นแบบที่เรากำหนดตัวชี้วัดความแตกต่างกันที่คำนึงถึงทั้งคุณลักษณะที่เป็นตัวเลขและเด็ดขาด .// สมมติ SN เป็นตัวชี้วัดความแตกต่างกันในคุณลักษณะที่เป็นตัวเลขที่กำหนดโดยระยะทางยุคลิดสแควร์และเอสซีเป็นตัวชี้วัดความแตกต่างกันในคุณลักษณะเด็ดขาดกำหนดเป็นจำนวนที่ไม่ตรงกันของประเภทระหว่างวัตถุสอง .// เรากำหนดตัวชี้วัดความแตกต่างกันระหว่างสองวัตถุ SN + GSC, ขณะที่ g เป็นน้ำหนักเพื่อความสมดุลของทั้งสองส่วนที่จะหลีกเลี่ยงความนิยมทั้งประเภทของแอตทริบิวต์ .// กระบวนการการจัดกลุ่มของขั้นตอนวิธี k-ต้นแบบจะคล้ายกับ K-หมายถึงขั้นตอนวิธีการยกเว้นว่าวิธีการใหม่ที่จะใช้ในการปรับปรุง ค่าแอตทริบิวต์เด็ดขาดต้นแบบกลุ่ม .// ปัญหาในการใช้อัลกอริทึมที่มีให้เลือกน้ำหนักที่เหมาะสม .//
เราได้แนะนำการใช้ค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานของคุณลักษณะที่เป็นตัวเลขเป็นแนวทางในการเลือกน้ำหนัก

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

( Huang 1997 ) ได้เสนอวิธีการที่เรียกว่า k-prototypes , กลุ่มชุดข้อมูลขนาดใหญ่ ด้วยการผสมตัวเลขและเด็ดขาดค่า / / ใน k-prototypes อัลกอริทึมที่เรากำหนดจะวัดว่า จะพิจารณาทั้งตัวเลขและเด็ดขาดแอตทริบิวต์/ / สมมติ SN คือจะวัดในลักษณะที่กำหนดโดยตัวเลขยกกำลังสองระยะทางแบบยุคลิดและ SC ก็จะวัดในลักษณะเด็ดขาดกำหนดเป็นหมายเลขของความไม่ประเภทระหว่างวัตถุสอง / / เรากำหนดจะวัดระหว่างวัตถุสองเป็น SN GSC ที่ G เป็นน้ำหนักสมดุลสองส่วนเพื่อหลีกเลี่ยง สนับสนุนชนิดของแอตทริบิวต์เหมือนกัน/ / สำหรับกระบวนการของ k-prototypes อัลกอริทึมที่คล้ายกับ k-means วิธี ยกเว้นวิธีใหม่ที่ใช้ในการปรับปรุงคุณลักษณะเด็ดขาดค่า ศูนย์ต้นแบบ / / ปัญหาการใช้ขั้นตอนวิธีการเลือกน้ำหนักที่เหมาะสม / / เราแนะนำให้ใช้ค่าเฉลี่ยส่วนเบี่ยงเบนมาตรฐานของแอตทริบิวต์ตัวเลข
เป็น คู่มือในการเลือกน้ำหนัก

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.