INTRODUCTIONIn many real-world appl

INTRODUCTION
In many real-world applications it is desirable to allow
overlapping clusters as data points may intrinsically belong
to more than one cluster. For example, in social networks
users belong to numerous communities. In biology, a large
fraction of proteins belong to several protein complexes simultaneously,
and genes have multiple coding functions and
participate in different metabolic pathways. In information
retrieval and text mining, documents, news articles, and web
pages can belong to different categories.
In this paper we formulate overlapping clustering as the
problem of mapping each data point to a small set of labels
that represent cluster membership. The number of labels does
not have to be the same for all data points. The objective is to
find a mapping so that the similarity between any pair of points
in the dataset agrees as much as possible with the similarity
of their corresponding sets of labels.
While this idea is general and could be instantiated in
different clustering frameworks, in this paper we apply it to
the setting of correlation clustering [1], a clustering paradigm
defined as follows: given a complete graph with positive and
negative edges, the objective is to partition the graph so as
to minimize the number of positive edges cut by the partition
plus the number of negative edges not cut.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

แนะนำในการใช้งานจริงมาก จึงต้องให้คลัสเตอร์เป็นข้อมูลที่ทับซ้อนจุดอาจทำเป็นการคลัสเตอร์มากกว่าหนึ่ง ตัวอย่าง ในเครือข่ายทางสังคมผู้ใช้เป็นสมาชิกของชุมชนมากมาย ชีววิทยา ขนาดใหญ่เศษของโปรตีนเป็นโปรตีนคอมเพล็กซ์หลายพร้อมกันยีนมีหลายรหัสฟังก์ชัน และมีส่วนร่วมในทางเดินเผาผลาญแตกต่างกัน ในข้อมูลการเรียก และการทำเหมืองข้อความ เอกสาร ข่าว และเว็บหน้าสามารถเป็นสมาชิกประเภทต่าง ๆในเอกสารนี้ เรากำหนดซ้อนคลัสเตอร์เป็นการปัญหาของแมปแต่ละจุดข้อมูลป้ายชุดเล็กที่แสดงถึงการเป็นสมาชิกของคลัสเตอร์ หมายเลขป้ายชื่อไม่ไม่ต้องเหมือนกันสำหรับจุดข้อมูลทั้งหมด วัตถุประสงค์คือค้นหาการแม็ปเพื่อให้คล้ายคลึงระหว่างจุดคู่ใด ๆในชุดข้อมูลตกลงมากที่สุดคล้ายคลึงของชุดสอดคล้องป้ายชื่อความคิดนี้อยู่ทั่วไป และไม่สามารถสร้างอินสแตนซ์ในต่าง ๆ คลัสเตอร์กรอบ ในเอกสารนี้ เราใช้ไปการตั้งค่าของความสัมพันธ์คลัสเตอร์ [1], กระบวนทัศน์ระบบคลัสเตอร์กำหนดได้ดังนี้: ให้กราฟสมบูรณ์ มีค่าบวก และลบขอบ วัตถุประสงค์คือการ พาร์ทิชันกราฟจึงเป็นเพื่อลดจำนวนบวกขอบตัด โดยพาร์ติชันบวกจำนวนลบขอบตัดไม่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

บทนำ
ในหลาย ๆ การใช้งานจริงของโลกมันเป็นที่พึงปรารถนาเพื่อให้
ทับซ้อนกันเป็นกลุ่มจุดข้อมูลภายในอาจเป็น
มากกว่าหนึ่งกลุ่ม ยกตัวอย่างเช่นในเครือข่ายทางสังคม
ที่ผู้ใช้อยู่ในชุมชนจำนวนมาก ในชีววิทยาที่มีขนาดใหญ่
ส่วนของโปรตีนเป็นโปรตีนคอมเพล็กซ์พร้อมกันหลาย
และยีนที่มีฟังก์ชั่นหลายเข้ารหัสและการ
มีส่วนร่วมในการเผาผลาญของเซลล์ที่แตกต่างกัน ข้อมูลใน
การดึงและการทำเหมืองข้อความเอกสารบทความข่าวและเว็บ
หน้าสามารถอยู่ในประเภทที่แตกต่างกัน.
ในบทความนี้เรากำหนดทับซ้อนกันการจัดกลุ่มเป็น
ปัญหาของการทำแผนที่จุดข้อมูลแต่ละชุดเล็ก ๆ ของฉลาก
ที่แสดงถึงการเป็นสมาชิกกลุ่ม จำนวนของป้ายไม่
จำเป็นต้องเป็นเหมือนกันสำหรับจุดข้อมูลทั้งหมด โดยมีวัตถุประสงค์เพื่อ
หาการทำแผนที่เพื่อให้ความคล้ายคลึงกันระหว่างคู่ของจุดใด ๆ
ในชุดข้อมูลที่เห็นด้วยมากที่สุดเท่าที่เป็นไปได้ด้วยความคล้ายคลึงกัน
ของชุดที่สอดคล้องกันของพวกเขาป้าย.
ในขณะที่ความคิดนี้เป็นทั่วไปและสามารถ instantiated ใน
กรอบการจัดกลุ่มที่แตกต่างกันในเรื่องนี้ กระดาษที่เราใช้มันในการ
ตั้งค่าของการจัดกลุ่มความสัมพันธ์ [1], กระบวนทัศน์การจัดกลุ่ม
ที่กำหนดไว้ดังต่อไปนี้ให้สมบูรณ์ด้วยกราฟเชิงบวกและ
เชิงลบขอบวัตถุประสงค์คือการแบ่งพาร์ติชันของกราฟเพื่อที่
จะลดจำนวนขอบบวกตัดโดย พาร์ทิชัน
บวกจำนวนขอบเชิงลบไม่ได้ตัด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

บทนำ
ในหลายโลกจริงๆ มันเป็นที่พึงปรารถนาเพื่อให้
ซ้อนกลุ่มเป็นจุดข้อมูลอาจเป็นของ
ภายในกลุ่มได้มากกว่าหนึ่ง ตัวอย่างเช่น , ในเครือข่ายทางสังคม
ผู้ใช้เป็นของชุมชนมากมาย ในชีววิทยา ส่วนใหญ่
โปรตีนเป็นของหลายโปรตีนเชิงซ้อนพร้อมกัน
และยีนมีหลายหน้าที่และ
นะครับมีส่วนร่วมในการเผาผลาญเซลล์แตกต่างกัน ในการค้นคืนสารสนเทศ
และเหมืองแร่ , เอกสารข้อความ , ข่าว , บทความและเว็บ
หน้าจะเป็นของประเภทที่แตกต่างกัน ในกระดาษนี้เราตั้งซ้อนกัน

สามารถเป็นปัญหาของการทำแผนที่แต่ละจุดข้อมูลเป็นชุดๆป้าย
ที่เป็นตัวแทนของสมาชิกกลุ่ม หมายเลขป้ายไม่
ไม่ต้องเหมือนกันสำหรับข้อมูลทุกจุดโดยมีวัตถุประสงค์เพื่อ
หาแผนที่ให้ ความเหมือนระหว่างคู่คะแนน
ใน DataSet เห็นด้วยมากที่สุดกับความเหมือน
ชุดของป้ายชื่อที่สอดคล้องกันของพวกเขา .
ในขณะที่ความคิดนี้เป็นทั่วไปและสามารถ instantiated
แตกต่างกันในกรอบแบ่งกลุ่ม ในกระดาษนี้เราใช้

ฉากของ ความสัมพันธ์ทางพื้นที่ [ 1 ] , การจัดกลุ่มกระบวนทัศน์
นิยามดังนี้ให้กราฟสมบูรณ์ มีขอบเชิงลบและบวก
, วัตถุประสงค์คือฉากกราฟเพื่อ
เพื่อลดจำนวนของขอบบวกตัดโดยพาร์ทิชัน
บวกจํานวนลบขอบ ไม่ตัด

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.