1. IntroductionThe application of d

1. Introduction
The application of data mining techniques is becoming increasingly important in modern organizations that seek to utilize
the knowledge that is embedded in the mass organizational data to improve efficiency, effectiveness and competitiveness.
In recent years data mining practitioners and researchers have become aware of the need for formal data mining
process models that prescribes the journey from data to discovering knowledge. Thus a multi-industry collective of practitioners
(e.g. www.crisp-dm.org; [55]) came together to develop the cross-industry standard procedure for data mining
(CRISP-DM) which was further extended by researchers (e.g. [17]). The data mining process (see Fig. 1) has been described
in various ways (e.g. [17,55]) but essentially consists of the following steps [40]: Application Domain or Business Understanding
(which includes definition of data mining goals), Data Understanding, Data Preparation, Data Mining, Evaluation
(e.g. evaluation of results based on DM goals), and Deployment.
In this paper we will use the term segmentation to refer to the set of clusters that result from a given partitioning of the
dataset by a clustering algorithm. It should be noted that a common presumption that underlies the proposal of solution
approaches for clustering is that for each dataset there is a single optimal segmentation (i.e. partitioning) that is independent
of the objectives of the end-user. For example Halkidi et al. [32] speaks of the ‘‘ ‘optimal’ clustering scheme as the outcome of
running a clustering algorithm (i.e., a partitioning) that best fits the inherent partitions of the data set”. So how would this ‘optimal’
partitioning (i.e. segmentation) be identified if two or more segmentations appear to have approximately the ‘best’ fit.
Further would this choice be based on the goals of the clustering exercise (e.g. fraud detection vs. marketing profiling vs.
theory building)? It appears to us that when clustering is used for knowledge discovery that what is the ‘best fit’ may not
be independent of the goals of the clustering exercise. Thus Kim [38] suggests that for some situations ‘‘comparison between

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

1
แนะนำการประยุกต์ใช้เทคนิคการทำเหมืองข้อมูลจะกลายเป็นความสำคัญมากขึ้นในองค์กรสมัยใหม่ที่พยายามที่จะใช้ประโยชน์จากความรู้
ที่ฝังอยู่ในข้อมูลองค์กรมวลเพื่อปรับปรุงประสิทธิภาพประสิทธิผลและการแข่งขัน.
ในปีที่ผ่านมาผู้ปฏิบัติงานการทำเหมืองข้อมูลและนักวิจัยได้ตระหนักถึง ความจำเป็นในการทำเหมืองข้อมูลอย่างเป็นทางการ
รูปแบบกระบวนการที่กำหนดเดินทางจากข้อมูลที่ค้นพบความรู้ จึงร่วมกันหลายอุตสาหกรรมของผู้ปฏิบัติงาน
(เช่น www.crisp-dm.org [55]) มาร่วมกันเพื่อพัฒนาขั้นตอนมาตรฐานข้ามอุตสาหกรรมสำหรับการทำเหมืองข้อมูล
(กรอบ DM) ซึ่งได้รับการขยายต่อไปโดยนักวิจัย (เช่น [17]) ขั้นตอนการทำเหมืองข้อมูล (ดูรูปที่ 1.) ได้รับการอธิบาย
ในรูปแบบต่างๆ (เช่น [1755]) แต่เป็นหลักประกอบด้วยขั้นตอนดังต่อไปนี้ [40]: การประยุกต์ใช้โดเมนหรือธุรกิจเข้าใจ
(ซึ่งรวมถึงการกำหนดเป้าหมายของการทำเหมืองข้อมูล) ความเข้าใจข้อมูลการเตรียมข้อมูลการทำเหมืองข้อมูลการประเมินผลการ
(เช่นการประเมินผลตามเป้าหมาย: dm ) และการใช้งาน.
ในบทความนี้เราจะใช้การแบ่งส่วนระยะที่จะอ้างถึงชุดของกลุ่มที่เกิดจากการแบ่งพาร์ติชันที่กำหนดของชุด
โดยขั้นตอนวิธีการจัดกลุ่ม มันควรจะตั้งข้อสังเกตว่าข้อสันนิษฐานทั่วไปที่รองรับข้อเสนอของการแก้ปัญหา
วิธีการสำหรับการจัดกลุ่มเป็นที่สำหรับแต่ละชุดมีการแบ่งส่วนที่ดีที่สุดเพียงครั้งเดียว (เช่นการแบ่ง) ที่เป็นอิสระ
ตามวัตถุประสงค์ของผู้ใช้ปลายทาง ตัวอย่างเช่น halkidi ตอัล [32] พูดถึง 'ดีที่สุด' รูปแบบการจัดกลุ่ม'' เป็นผลของการทำงาน
ขั้นตอนวิธีการจัดกลุ่ม (เช่นพาร์ทิชัน) ที่เหมาะกับพาร์ทิชันโดยธรรมชาติของชุดข้อมูล " ดังนั้นวิธีการที่จะนี้ 'ดีที่สุด'
แบ่ง (เช่นการแบ่งส่วน) ระบุถ้าสองคนหรือมากกว่า segmentations ปรากฏว่ามีประมาณพอดี 'ดี'.
ต่อไปจะเลือกนี้จะขึ้นอยู่กับเป้าหมายของการออกกำลังกายการจัดกลุ่ม (เช่นตรวจสอบการทุจริตกับโปรไฟล์การตลาดเมื่อเทียบกับการสร้างทฤษฎี
)? จะปรากฏให้เราเห็นว่าเมื่อกลุ่มที่ใช้สำหรับการค้นพบความรู้ว่าสิ่งที่เป็น 'แบบที่ดีที่สุดอาจไม่ได้
เป็นอิสระจากเป้าหมายของการออกกำลังกายการจัดกลุ่ม จึง kim [38] แสดงให้เห็นว่าในบางสถานการณ์'' เปรียบเทียบระหว่าง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

1. แนะนำ
การประยุกต์เทคนิคการทำเหมืองข้อมูลเป็นสิ่งสำคัญมากขึ้นในองค์กรสมัยใหม่ที่พยายามใช้
ความรู้ที่ฝังอยู่ในข้อมูลขององค์กรโดยรวมเพื่อปรับปรุงประสิทธิภาพ ประสิทธิผล และแข่งขัน
ในข้อมูลปีที่ผ่านมา ผู้ทำเหมืองแร่และนักวิจัยได้ตระหนักถึงจำเป็นสำหรับการทำเหมืองข้อมูลเป็นทางการ
กระบวนการรูปแบบที่ได้กำหนดเดินทางข้อมูลเพื่อค้นหาความรู้ ดังนั้นอุตสาหกรรมหลายกลุ่มของผู้
(e.g. www.crisp-dm.org; [55]) มาร่วมกันพัฒนาขั้นตอนข้ามอุตสาหกรรมมาตรฐานสำหรับข้อมูล mining
(CRISP-DM) ซึ่งถูกขยายเพิ่มเติม โดยนักวิจัย (เช่น [17]) การทำเหมืองข้อมูล (ดู Fig. 1) มีการอธิบาย
ในรูปแบบต่าง ๆ (เช่น [1755]) แต่หลักประกอบด้วยขั้นตอนต่อไปนี้ [40]: โดเมนโปรแกรมประยุกต์หรือความเข้าใจธุรกิจ
(ซึ่งรวมถึงรายละเอียดของเป้าหมายการทำเหมืองข้อมูล), ความ เข้าใจข้อมูล จัดเตรียมข้อมูล การทำ เหมืองข้อมูล ประเมิน
(เช่นการประเมินผลตามเป้าหมาย DM), และใช้งาน
ในเอกสารนี้ เราจะใช้การแบ่งกลุ่มคำอ้างอิงถึงชุดของคลัสเตอร์ที่ได้จากพาร์ทิชันที่กำหนดของการ
ชุดข้อมูล โดยอัลกอริทึมระบบคลัสเตอร์ ควรสังเกตว่า ข้อสันนิษฐานที่ทั่วไปที่ underlies ข้อเสนอของโซลูชัน
ยื่นคลัสเตอร์เป็นที่สำหรับแต่ละชุดข้อมูลมี ตัวเดียวสุดเซ็ก (เช่นพาร์ทิชัน) ที่เป็นอิสระ
วัตถุประสงค์ของผู้ใช้ ตัวอย่าง Halkidi และ al. [32] พูดของ '' โครงร่างระบบคลัสเตอร์ 'เหมาะสม' ที่เป็นผลของ
เรียกใช้อัลกอริทึมระบบคลัสเตอร์(พาร์ทิเช่น ความชัน) ที่สุดที่เหมาะกับพาร์ติชันโดยธรรมชาติของชุดข้อมูล " ดังนั้นวิธีจะนี้ 'เหมาะสม'
พาร์ทิชัน (เช่นแบ่ง) ระบุหากจะ มีพอ 'ประมาณดี' กับสอง หรือหลาย segmentations
ต่อ จะนี้จะยึดเป้าหมายของการออกกำลังกายระบบคลัสเตอร์ (เช่นทุจริตตรวจสอบเทียบกับการตลาดรวบรวมสถานะเทียบกับ
ทฤษฎีอาคาร) เหมือนกับเราว่า เมื่อคลัสเตอร์ใช้สำหรับการค้นพบความรู้ที่ว่า 'พอดี' อาจไม่
จะขึ้นอยู่กับเป้าหมายของการออกกำลังกายระบบคลัสเตอร์ ดังนั้น คิม [38] แนะที่สำหรับบางสถานการณ์ '' เปรียบเทียบระหว่าง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

1 . การแนะนำ
ซึ่งจะช่วยให้แอปพลิเคชันของข้อมูลการทำเหมืองแร่เทคนิคมากขึ้นที่สำคัญมากในองค์กรที่ทันสมัยที่แสวงหาเพื่อใช้
ซึ่งจะช่วยให้ความรู้ซึ่งจะถูกฝังอยู่ในกลุ่มขององค์กรข้อมูลเพื่อปรับปรุง ประสิทธิภาพ ,ความมี ประสิทธิภาพ และความสามารถในการแข่งขัน.
ในเมื่อไม่นานมานี้ปีข้อมูลการทำเหมืองแร่และนักวิจัยได้ตระหนักถึงความจำเป็นสำหรับข้อมูลการทำเหมืองแร่
ตามมาตรฐานอย่างเป็นทางการกระบวนการรุ่นที่กำหนดให้เลิกการเดินทางจากข้อมูลในการสำรวจความรู้ ทำให้หลายอุตสาหกรรมร่วมกันของผู้ประกอบ
(เช่น www.crisp-dm.org; [ 55 ])มารวมตัวกันเพื่อการพัฒนาแบบมาตรฐานในอุตสาหกรรมขั้นตอนสำหรับข้อมูลการทำเหมืองแร่
(กรอบ - โดมินิกา)ซึ่งเป็นขยายโดยนักวิจัย(เช่น [ 17 ]) ขั้นตอนการทำเหมืองแร่ข้อมูลได้(ดูรูปที่. 1 )ได้รับการอธิบาย
ในวิธีการที่หลากหลาย(เช่น [ 1755 ])แต่โดยสรุปแล้วประกอบด้วยขั้นตอนต่อไปนี้[ 40 ],แอปพลิเคชันหรือโดเมน
ซึ่งจะช่วยการทำความเข้าใจทางธุรกิจ(ซึ่งรวมถึงความละเอียดของเป้าหมายการทำเหมืองแร่ข้อมูล)การทำความเข้าใจข้อมูลข้อมูลการเตรียมการข้อมูลการทำเหมืองแร่การประเมินผล
(เช่นการประเมินผลการค้นหาตามเป้าหมาย DM )และการปรับใช้.
ในเอกสารนี้เราจะใช้การแบ่งส่วนระยะสั้นที่จะดูที่การตั้งค่าของระบบคลัสเตอร์ซึ่งเป็นผลจากการแบ่งพาร์ติชั่นให้เป็นของ
dataset โดยอัลกอริธึมคลัสเตอร์ที่ ควรจะได้บันทึกไว้ว่าสันนิษฐานว่าโดยทั่วไปที่แต่ข้อเสนอของโซลูชัน
แนวทางสำหรับระบบคลัสเตอร์คือ dataset แต่ละห้องมีเพียงครั้งเดียวอย่างมี ประสิทธิภาพ การแบ่งส่วน(เช่นการแบ่งพาร์ติชั่น)ซึ่งเป็นอิสระ
วัตถุประสงค์ของผู้ใช้ปลายทางได้ ตัวอย่างเช่น halkidi et al . [ 32 ]พูดของ"โครงการ'คลัสเตอร์ได้มากที่สุดที่เป็นผลที่ได้รับจาก
ใช้ระบบคลัสเตอร์อัลกอริทึม(เช่นการแบ่งพาร์ติชั่น)ที่ดีที่สุดสำหรับพาร์ติชันที่มีอยู่ของข้อมูลที่ตั้งค่า" ดังนั้นจะทำอย่างไรดีที่สุด''
การแบ่งพาร์ติชั่น(เช่นการแบ่งส่วน)นี้จะได้รับการจำแนกหากสองตัวหรือมากกว่า segmentations ปรากฏขึ้นในการมีประมาณ'ที่ดีเยี่ยมของความเหมาะสม.
เพิ่มเติมทางเลือกแห่งนี้เป็นไปตามเป้าหมายของการใช้ระบบคลัสเตอร์ซึ่งช่วยป้องกันได้(เช่นการตรวจจับการฉ้อโกงเมื่อเทียบกับโปรไฟล์การตลาดเมื่อเทียบกับอาคาร
ทฤษฎี) สิ่งที่ปรากฏว่าเมื่อระบบคลัสเตอร์จะใช้สำหรับการค้นหาความรู้ว่าอะไรคือ'สวมใส่ได้พอดีที่สุด'อาจไม่
ซึ่งจะช่วยเป็นอิสระของเป้าหมายของการออกกำลังกายที่คลัสเตอร์ ดังนั้นบริษัทหลักทรัพย์[ 38 ]เสนอว่าในสถานการณ์"การเปรียบเทียบระหว่าง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.