label, such as “spam” or “not spam.

label, such as “spam” or “not spam.” In clustering, however, each item is assigned to
one or more clusters, where the cluster does not necessarily correspond to a meaningful
concept, such as “spam” or “not spam.” Instead, as we will describe later
in this chapter, items are grouped together according to their similarity. Therefore,
rather than mapping items onto a predefined set of labels, clustering allows
the data to “speak for itself ” by uncovering the implicit structure that relates the
items.
Both classification and clustering have been studied for many years by information
retrieval researchers, with the aim of improving the effectiveness, or in
some cases the efficiency, of search applications. From another perspective, these
two tasks are classic machine learning problems. In machine learning, the learning
algorithms are typically characterized as supervised or unsupervised. In supervised
learning, a model is learned using a set of fully labeled items, which is often called
the training set. Once a model is learned, it can be applied to a set of unlabeled
items, called the test set, in order to automatically apply labels. Classification is
often cast as a supervised learning problem. For example, given a set of emails
that have been labeled as “spam” or “not spam” (the training set), a classification
model can be learned. The model then can be applied to incoming emails in order
to classify them as “spam” or “not spam”.
Unsupervised learning algorithms, on the other hand, learn entirely based on
unlabeled data. Unsupervised learning tasks are often posed differently than supervised
learning tasks, since the input data is not mapped to a predefined set of
labels. Clustering is the most common example of unsupervised learning. As we
will show, clustering algorithms take a set of unlabeled data as input and then
group the items using some notion of similarity.
There are many other types of learning paradigms beyond supervised and unsupervised,
such as semi-supervised learning, active learning, and online learning.
However, these subjects are well beyond the scope of this book. Instead, in this
chapter, we provide an overview of basic yet effective classification and clustering
algorithms and methods for evaluating them.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ป้าย เช่น "สแปม" หรือ "ไม่สแปม" ในคลัสเตอร์ อย่างไรก็ตาม แต่ละรายการถูกกำหนดให้กับอย่าง น้อยหนึ่งกลุ่ม ที่คลัสเตอร์ไม่จำเป็นต้องตรงกับที่มีความหมายแนวคิด เช่น "สแปม" หรือ "ไม่สแปม" แทน เป็นเราจะอธิบายในภายหลังในบทนี้ สินค้าจะถูกจัดกลุ่มตามความคล้ายคลึงกันของพวกเขา ดังนั้นแทนการแม็ปสินค้าลงบนป้ายชื่อ ชุดคลัสเตอร์ช่วยให้ข้อมูล "พูดสำหรับตัวเอง" โดยเปิดเผยโครงสร้างนัยที่เกี่ยวข้องกับรายการทั้งการจัดประเภทและคลัสเตอร์มีการศึกษาหลายปีที่ผ่านมาข้อมูลนักวิจัยเรียก มีจุดมุ่งหมาย ของการปรับปรุงประสิทธิภาพ หรือในบางกรณีประสิทธิภาพ ค้นหางาน จากอีกมุมหนึ่ง เหล่านี้สองงานเป็นปัญหาคลาสสิกเครื่องการเรียนรู้ ในการเรียนรู้ของเครื่อง การเรียนรู้อัลกอริทึมโดยทั่วไปมีลักษณะเป็นผู้สอน หรือคอยกำกับ ในการดูแลการเรียนรู้ แบบจำลองเป็นการเรียนรู้โดยใช้ชุดของรายการที่มีป้ายชื่อเต็ม ซึ่งมักจะเรียกว่าการฝึกอบรมได้ เมื่อมีการเรียนรู้แบบ มันสามารถใช้กับชุดไม่มีป้ายชื่อรายการ ชุดทดสอบ ที่เรียกว่าเพื่อที่จะใช้ป้ายชื่อโดยอัตโนมัติ การจัดประเภทเป็นหล่อมักจะเป็นปัญหาการเรียนรู้ดูแล ตัวอย่างเช่น ได้รับชุดของอีเมล์ที่มีการติดป้ายเป็น "สแปม" หรือ "สแปม" (การฝึกอบรมชุด), การจัดประเภทสามารถเรียนรู้รูปแบบ รูปแบบจากนั้นสามารถใช้กับอีเมล์ขาเข้าในใบสั่งในการจัดประเภทพวกเขาเป็น "สแปม" หรือ "สแปม"อัลกอริทึมการเรียนรู้ที่ขั่ว คง เรียนรู้ทั้งหมดตามไม่มีป้ายชื่อข้อมูล งานที่คอยกำกับการเรียนรู้มักจะหนักอึ้งต่างกว่าดูแลเรียนรู้งาน เนื่องจากข้อมูลที่ป้อนไม่ได้แมปชุดของป้ายชื่อ คลัสเตอร์ตัวอย่างของการเรียนรู้คอยกำกับอยู่ ขณะที่เราจะแสดง อัลกอริธึม clustering ใช้ชุดของข้อมูลที่ไม่มีป้ายชื่อเป็นการป้อนข้อมูลแล้วกลุ่มสินค้าที่ใช้ความคิดบางอย่างของความคล้ายคลึงกันมีหลายประเภทของการเรียนรู้กรอบการดูแล และคอย กำกับเช่นดูแลกึ่งการเรียนรู้ การเรียนรู้ และการเรียนรู้ออนไลน์อย่างไรก็ตาม วิชาเหล่านี้จะดีกว่าขอบเขตของหนังสือเล่มนี้ แทน ในการนี้บทที่ เราให้ภาพรวมของพื้นฐานยังมีประสิทธิภาพการจัดหมวดหมู่และคลัสเตอร์อัลกอริทึมและวิธีการสำหรับการประเมินนั้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ป้ายเช่น "สแปม" หรือ "ไม่ใช่สแปม." ในการจัดกลุ่มอย่างไรก็ตามแต่ละรายการได้รับมอบหมายให้
หนึ่งหรือมากกว่ากลุ่มที่คลัสเตอร์ไม่จำเป็นต้องสอดคล้องกับความหมาย
แนวคิดเช่น "สแปม" หรือ "ไม่ใช่สแปม " แต่ในขณะที่เราจะอธิบายในภายหลัง
ในบทนี้รายการจะรวมกลุ่มกันตามความคล้ายคลึงกันของพวกเขา ดังนั้น
แทนที่จะทำแผนที่รายการบนชุดที่กำหนดไว้ล่วงหน้าของป้ายการจัดกลุ่มจะช่วยให้
ข้อมูลที่จะ "พูดให้ตัวเอง" โดยการเปิดเผยโครงสร้างนัยที่เกี่ยวข้อง
รายการ.
ทั้งจำแนกและจัดกลุ่มได้รับการศึกษามานานหลายปีโดยข้อมูล
นักวิจัยดึงด้วย จุดมุ่งหมายของการปรับปรุงประสิทธิภาพหรือใน
บางกรณีประสิทธิภาพของการใช้งานการค้นหา จากมุมมองอื่นเหล่านี้
สองงานมีปัญหาการเรียนรู้เครื่องคลาสสิก ในการเรียนรู้เครื่องการเรียนรู้
ขั้นตอนวิธีการที่โดดเด่นมักจะเป็นภายใต้การดูแลใกล้ชิดหรือ ภายใต้การดูแลใน
การเรียนรู้รูปแบบที่จะเรียนรู้โดยใช้ชุดของรายการฉลากซึ่งมักจะเรียกว่า
ชุดการฝึกอบรม เมื่อรูปแบบการเรียนรู้ที่จะสามารถนำไปใช้กับชุดของที่ไม่มีป้ายกำกับ
รายการที่เรียกว่าชุดทดสอบเพื่อที่จะใช้ป้ายกำกับโดยอัตโนมัติ การจำแนกประเภท
มักจะโยนเป็นปัญหาการเรียนรู้ภายใต้การดูแล ยกตัวอย่างเช่นรับชุดของอีเมล
ที่ได้รับการระบุว่าเป็น "สแปม" หรือ "ไม่ใช่สแปม" (ชุดฝึกอบรม) การจำแนก
รูปแบบสามารถเรียนรู้ได้ รูปแบบนั้นจะสามารถนำไปใช้กับอีเมลขาเข้าเพื่อ
ที่จะจัดให้เป็น "สแปม" หรือ "ไม่ใช่สแปม".
ขั้นตอนวิธีการเรียนรู้ Unsupervised บนมืออื่น ๆ ที่เรียนรู้ทั้งหมดขึ้นอยู่กับ
ข้อมูลที่ไม่มีป้ายกำกับ งานการเรียนรู้ใกล้ชิดมักจะโพสต์ที่แตกต่างกว่าภายใต้การดูแล
งานการเรียนรู้ตั้งแต่การป้อนข้อมูลที่ไม่ได้แมปกับชุดที่กำหนดไว้ล่วงหน้าของ
ฉลาก การจัดกลุ่มเป็นตัวอย่างที่พบบ่อยที่สุดของการเรียนรู้ใกล้ชิด ในฐานะที่เรา
จะแสดงขั้นตอนวิธีการจัดกลุ่มจะใช้ชุดของข้อมูลที่ไม่มีป้ายกำกับเป็น input และจากนั้น
กลุ่มรายการที่ใช้ความคิดของความคล้ายคลึงกันบาง.
มีชนิดอื่น ๆ ของกระบวนทัศน์การเรียนรู้ที่เกินอยู่ภายใต้การดูแลและใกล้ชิด,
เช่นกึ่งภายใต้การดูแลการเรียนรู้การเรียนรู้การใช้งานและ การเรียนรู้ออนไลน์.
อย่างไรก็ตามเรื่องเหล่านี้เป็นอย่างดีเกินขอบเขตของหนังสือเล่มนี้ แต่ในเรื่องนี้
บทที่เราให้ภาพรวมของพื้นฐานจำแนกและจัดกลุ่ม แต่มีประสิทธิภาพใน
ขั้นตอนวิธีการและวิธีการสำหรับการประเมินพวกเขา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ป้ายชื่อเช่น " ขยะ " หรือ " ไม่พึงประสงค์ " ในการแบ่งกลุ่ม อย่างไรก็ตาม แต่ละรายการจะได้รับหนึ่งหรือมากกว่าหนึ่งกลุ่ม ซึ่งกลุ่มที่ไม่จําเป็นต้องสอดคล้องกับความหมายแนวคิดดังกล่าวเป็น " ขยะ " หรือ " ไม่สแปม แทนที่เราจะอธิบายในภายหลังในบทนี้ สินค้าจะถูกจัดกลุ่มเข้าด้วยกันตามความคล้ายคลึงกันของพวกเขา ดังนั้นมากกว่ารายการแผนที่ไปยังที่กำหนดไว้ล่วงหน้าชุดของป้ายชื่อ , การจัดกลุ่มช่วยให้ข้อมูลที่จะ " พูดให้ตัวเอง " โดยเปิดเผยโครงสร้างที่เกี่ยวข้องโดยปริยายรายการทั้งการจำแนกและแบ่งกลุ่มข้อมูลได้รับการศึกษามานานหลายปี โดยข้อมูลนักวิจัยสืบค้นข้อมูล โดยมีวัตถุประสงค์ของการปรับปรุงประสิทธิภาพ หรือในบางกรณี ประสิทธิภาพของโปรแกรมการค้นหา จากมุมมองอื่น เหล่านี้สองงานคลาสสิค เครื่องมีปัญหาการเรียนรู้ ในการเรียนรู้ของเครื่อง , การเรียนรู้ขั้นตอนวิธีโดยทั่วไปมีลักษณะเป็นแบบ หรือแบบไม่โต้ตอบ ในมีการเรียนรู้แบบการเรียนรู้โดยใช้ชุดของครบ ป้ายสินค้า ซึ่งมักเรียกว่าการตั้งค่า เมื่อนายแบบได้ สามารถใช้กับชุดใกล้เคียงรายการ เรียกว่าชุดทดสอบ , โดยอัตโนมัติเพื่อให้ใช้ฉลาก ประเภท คือมักจะโยนเป็นการเรียนรู้แบบมีผู้สอนปัญหา ตัวอย่างเช่น ได้รับชุดของอีเมลที่ได้รับการระบุว่าเป็น " ขยะ " หรือ " ขยะ " ( ชุดฝึก ) , การจำแนกรุ่นที่สามารถเรียนรู้ รูปแบบแล้วสามารถใช้กับอีเมล์ที่เข้ามาเพื่อแบ่งได้เป็น " ขยะ " หรือ " ไม่พึงประสงค์ "ขั้นตอนวิธีการเรียนรู้แบบไม่มีผู้สอนบนมืออื่น ๆที่เรียนรู้ทั้งหมดขึ้นอยู่กับข้อมูลใกล้เคียงกัน งานดาวแคระดำมักจะวางแตกต่างกว่ามีการเรียนรู้งาน เนื่องจากข้อมูลที่ป้อนเป็นแมปไปยังที่กำหนดไว้ล่วงหน้าชุดป้ายชื่อ การแบ่งกลุ่ม คือ ตัวอย่างที่พบมากที่สุดของการเรียนรู้แบบไม่มีผู้สอน . เป็นเราจะแสดงการจัดกลุ่มขั้นตอนวิธีใช้ชุดของข้อมูลที่ใกล้เคียงเข้าแล้วกลุ่มสินค้าที่ใช้บางความคิดที่คล้ายคลึงกันมีอยู่หลายชนิดอื่น ๆของการเรียนรู้กระบวนทัศน์เกินควบคุมและโดยขาดการควบคุมเช่นกึ่งการเรียนรู้แบบมีผู้สอน , ปราดเปรียว , การเรียนรู้ออนไลน์ การเรียนรู้อย่างไรก็ตาม คนเหล่านี้เป็นอย่างดีนอกเหนือขอบเขตของหนังสือเล่มนี้ ในนี้แทนบทที่ , เราให้ภาพรวมของพื้นฐาน แต่ประสิทธิภาพการจำแนกและแบ่งกลุ่มข้อมูลขั้นตอนวิธีการและวิธีการประเมินพวกเขา

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.