Multiple-instance learning
From Wikipedia, the free encyclopedia
In machine learning, multiple-instance learning (MIL) is a variation on supervised learning. Instead of receiving a set of instances which are individually labeled, the learner receives a set of labeled bags, each containing many instances. In the simple case of multiple-instance binary classification, a bag may be labeled negative if all the instances in it are negative. On the other hand, a bag is labeled positive if there is at least one instance in it which is positive. From a collection of labeled bags, the learner tries to either (i) induce a concept that will label individual instances correctly or (ii) learn how to label bags without inducing the concept.
Take image classification for example in Amores (2013). Given an image, we want to know its target class based on its visual content. For instance, the target class might be "beach", where the image contains both "sand" and "water". In MIL terms, the image is described as a bag X = {X_1,..,X_N}, where eachX_i is the feature vector (called instance) extracted from the corresponding i-th region in the image and N is the total regions (instances) partitioning the image. The bag is labeled positive ("beach") if it contains both "sand" region instance and "water" region instance.
Multiple-instance learning was originally proposed under this name by Dietterich, Lathrop & Lozano-Pérez (1997), but earlier examples of similar research exist, for instance in the work on handwritten digit recognition by Keeler, Rumelhart & Leow (1990). Recent reviews of the MIL literature include Amores (2013), which provides an extensive review and comparative study of the different paradigms, and Foulds & Frank (2010), which provides a thorough review of the different assumptions used by different paradigms in the literature.
Examples of where MIL is applied are:
Molecule activity
Predicting binding sites of Calmodulin binding proteins [1]
Predicting function for alternatively spliced isoforms Li, Menon & et al. (2014),Eksi et al. (2013)
Image classification Maron & Ratan (1998)
Text or document categorization
Numerous researchers have worked on adapting classical classification techniques, such as support vector machines or boosting, to work within the context of multiple-instance learning.
เรียนรู้หลายอย่างจากวิกิพีเดีย สารานุกรมฟรีเรียนรู้เครื่องจักร เรียนรู้หลายอย่าง (ล้านบาท) เป็นการเปลี่ยนแปลงการเรียนรู้มี ผู้เรียนได้รับชุดของ ถุงป้ายแต่ละประกอบด้วยอินสแตนซ์หลายแทนที่จะได้รับชุดของอินสแตนซ์ที่มีชื่อแต่ละ ในกรณีเรื่องของอินสแตนซ์หลายประเภทไบนารี ถุงอาจมีป้ายชื่อที่ลบอินสแตนซ์ทั้งหมดในนั้นจะเป็นค่าลบ บนมืออื่น ๆ กระเป๋ามีป้ายบวกถ้ามีอย่างน้อยหนึ่งในนั้นที่เป็นค่าบวก จากคอลเลกชันของป้ายถุง พยายามอย่างใดอย่างหนึ่ง (i) ผู้เรียนก่อให้เกิดแนวคิดที่จะป้ายชื่ออินสแตนซ์แต่ละอย่างถูกต้อง หรือ (ii) เรียนรู้วิธีการติดฉลากถุง โดย inducing แนวคิดใช้การจัดประเภทภาพตัวอย่างใน Amores (2013) ให้ภาพ เราต้องรู้เป้าหมายของชั้นขึ้นอยู่กับเนื้อหาของภาพ ตัวอย่าง ชั้นเป้าหมายอาจเป็น "บี" รูปที่ประกอบด้วย "ทราย" และ "น้ำ" ในล้าน อธิบายรูปเป็นถุง X = {X_1,..,X_N }, ที่ eachX_i เป็นเวกเตอร์คุณลักษณะ (เรียกว่าอินสแตนซ์) สกัดจากภาค i-th สอดคล้องในภาพ และ N คือ การรวมภูมิภาค (อินสแตนซ์) ภาพการพาร์ทิชัน กระเป๋ามีป้ายบวก ("บี") ถ้าประกอบด้วยอินสแตนซ์ของภูมิภาค "ทราย" และ "น้ำ" ภูมิภาคอินสแตนซ์เรียนรู้หลายอย่างเดิมได้ถูกเสนอชื่อนี้ โดย Dietterich, Lathrop และ Lozano-Pérez (1997), แต่ก่อนหน้าตัวอย่างงานวิจัยที่คล้ายกันมี อยู่ เช่นในการทำงานในการเขียนด้วยลายมือตัวเลขโดย Keeler, Rumelhart และ Leow (1990) รีวิววรรณคดีล้านบาทล่าสุดรวม Amores (2013), ซึ่งช่วยให้การตรวจสอบอย่างละเอียดและศึกษาเปรียบเทียบของ paradigms ต่าง ๆ และ Foulds และแฟรงค์ (2010), ซึ่งช่วยให้การตรวจสอบอย่างละเอียดของสมมติฐานต่าง ๆ ที่ใช้ โดย paradigms ต่าง ๆ ในวรรณคดีตัวอย่างของการที่มีใช้ล้านบาทได้แก่: กิจกรรมโมเลกุล คาดการณ์รวมไซต์ของ Calmodulin โปรตีนรวม [1] คาดการณ์ฟังก์ชันหรือ spliced isoforms Li, Menon และ et al. (2014), Eksi et al. (2013) การจัดประเภทภาพ Maron และราตัน (1998) การจัดประเภทข้อความหรือเอกสารนักวิจัยมากมายได้ทำงานในการปรับเทคนิคประเภทคลาสสิก เช่นเครื่องเวกเตอร์สนับสนุนหรือส่งเสริม การทำงานในบริบทของการเรียนรู้หลายอย่าง
การแปล กรุณารอสักครู่..

การเรียนรู้หลายตัวอย่าง
จากวิกิพีเดียสารานุกรมเสรีในการเรียนรู้เครื่อง, การเรียนรู้หลายตัวอย่าง (MIL) เป็นรูปแบบการเรียนรู้ภายใต้การดูแล แทนที่จะได้รับชุดของกรณีที่มีความโดดเด่นเป็นเอกลักษณ์ที่ผู้เรียนจะได้รับชุดของถุงที่มีข้อความแต่ละที่มีหลาย ๆ กรณี ในกรณีที่เรียบง่ายของหลายเช่นการจำแนกไบนารีถุงอาจมีข้อความเชิงลบหากทุกกรณีในนั้นเป็นลบ ในทางตรงกันข้าม, ถุงมีข้อความระบุว่าในเชิงบวกถ้ามีอย่างน้อยหนึ่งตัวอย่างในนั้นซึ่งเป็นบวก จากคอลเลกชันของถุงที่มีข้อความที่ผู้เรียนพยายามที่จะ (i) ทำให้เกิดแนวคิดที่จะติดป้ายแต่ละกรณีอย่างถูกต้องหรือ (ii) เรียนรู้วิธีการติดป้ายถุงโดยไม่ต้องกระตุ้นให้เกิดแนวความคิด. ใช้เวลาการจัดหมวดหมู่ของภาพเช่นใน Amores (2013) ได้รับภาพที่เราต้องการที่จะรู้ว่าระดับเป้าหมายตามเนื้อหาของภาพ ยกตัวอย่างเช่นระดับเป้าหมายอาจจะเป็น "ชายหาด" ซึ่งภาพที่มีทั้ง "ทราย" และ "น้ำ" ในแง่ MIL ภาพจะถูกอธิบายว่าเป็นถุง X = {X_1, .. , x_n } ที่ eachX_i เป็นคุณลักษณะเวกเตอร์ (เรียกว่าเป็นต้น) ที่สกัดจากภูมิภาคที่ i ที่สอดคล้องกันในภาพและ N คือทั้งหมด ภูมิภาค (กรณี) แบ่งภาพ ถุงจะมีป้ายที่เป็นบวก ("ชายหาด") ถ้ามันมีทั้ง "ทราย" เช่นภูมิภาคและ "น้ำ" เช่นภูมิภาค. การเรียนรู้หลายตัวอย่างแรกที่เสนอภายใต้ชื่อนี้โดย Dietterich, Lathrop & ซาโน-Pérez (1997) แต่ก่อนหน้านี้ ตัวอย่างของการวิจัยที่คล้ายกันอยู่ตัวอย่างเช่นในการทำงานในการรับรู้หลักที่เขียนด้วยลายมือโดยคีลเลอร์, Rumelhart & Leow (1990) ความคิดเห็นล่าสุดของวรรณกรรม MIL รวม Amores (2013) ซึ่งมีการตรวจสอบอย่างกว้างขวางและการศึกษาเปรียบเทียบกรอบความคิดที่แตกต่างกันและ Foulds และแฟรงก์ (2010) ซึ่งมีการตรวจสอบอย่างละเอียดของสมมติฐานที่แตกต่างกันโดยใช้กรอบความคิดที่แตกต่างกันในวรรณคดีตัวอย่างของ MIL ที่ถูกนำไปใช้คือ: กิจกรรมโมเลกุลทำนายเว็บไซต์ที่มีผลผูกพันของ calmodulin โปรตีน [1] ทำนายฟังก์ชั่นสำหรับไอโซฟอร์มแต่งงานหรือหลี่น้อนและ et al, (2014) Eksi et al, (2013) การจัดหมวดหมู่ภาพ Maron & Ratan (1998) ข้อความหรือเอกสารหมวดหมู่นักวิจัยจำนวนมากได้ทำงานเกี่ยวกับการปรับเทคนิคการจำแนกประเภทคลาสสิกเช่นเครื่องเวกเตอร์การสนับสนุนหรือส่งเสริมการทำงานในบริบทของการเรียนรู้หลายเช่น
การแปล กรุณารอสักครู่..

หลายอินสแตนซ์
เรียน จากวิกิพีเดีย สารานุกรมเสรีในการเรียนรู้
เครื่องตัวอย่างการเรียนรู้หลายมิล ( ) เป็นรูปแบบการเรียน ดูแล แทนที่จะได้รับชุดของอินสแตนซ์ซึ่งเป็นแบบป้าย ผู้เรียนได้รับชุดของป้ายถุงแต่ละที่มีอินสแตนซ์มาก ในกรณีง่ายหลายอินสแตนซ์ไบนารีการจัดหมวดหมู่กระเป๋าอาจจะถูกลบถ้ากรณีทั้งหมดเป็นลบ บนมืออื่น ๆ , ถุงมีข้อความระบุว่าเป็นบวกหากมีอย่างน้อยหนึ่งตัวอย่างในนั้นซึ่งเป็นบวก จากคอลเลกชันของป้ายชื่อกระเป๋า โดยพยายามให้ ( ผม ) ทำให้เกิดแนวคิดที่จะฉลากแต่ละกรณีได้อย่างถูกต้อง หรือ ( 2 ) เรียนรู้วิธีการป้ายถุงโดยไม่ต้องกระตุ้นแนวคิด .
เอาภาพตัวอย่างในการ amores ( 2013 ) ให้ภาพที่เราต้องการรู้ระดับของเป้าหมายขึ้นอยู่กับเนื้อหาของภาพ . ตัวอย่างเช่นชั้นเรียนเป้าหมายอาจจะ " บีช " ที่ภาพมีทั้ง " ทราย " และ " น้ำ " ในแง่ล้าน ภาพ ลักษณะเป็นถุง x = { x_1 . . x_n } , , ,ที่ eachx_i เป็นคุณลักษณะเวกเตอร์ ( เรียกว่าอินสแตนซ์ ) ที่สกัดได้จากภูมิภาค i-th สอดคล้องกันในรูปและภูมิภาครวม ( กรณี ) แบ่งภาพ กระเป๋ามีป้ายบวก ( " ทะเล " ) ถ้ามันมีทั้ง " ทราย " ภาคและอินสแตนซ์ " ตัวอย่างเขตน้ำ "
หลายอินสแตนซ์เรียนเสนอเดิมภายใต้ชื่อ dietterich นี้ ,& Lathrop lozano-p éเรซ ( 1997 ) แต่ตัวอย่างก่อนหน้านี้ของการวิจัยที่คล้ายกันอยู่ เช่นในงานรู้จำตัวเลขที่เขียนด้วยลายมือโดยคีเลอร์ rumelhart & เ ียว ( 1990 ) รีวิวล่าสุดของมิลวรรณกรรมรวม amores ( 2013 ) ซึ่งมีการตรวจสอบอย่างละเอียด และเปรียบเทียบกระบวนทัศน์ที่แตกต่างกันและโฟลด์ส&แฟรงค์ ( 2010 )ซึ่งมีการตรวจสอบอย่างละเอียดของสมมติฐานที่แตกต่างกันใช้กระบวนทัศน์ที่แตกต่างกันในวรรณคดี
ตัวอย่างที่มิลใช้ :
ทำนายการผูกโมเลกุลกิจกรรมเว็บไซต์ของคาลโมดูลินโปรตีนที่จับ [ 1 ]
ทำนายฟังก์ชันสำหรับต่อหรือไมลี่ , เมน& et al . ( 2014 ) , eksi et al . ( 2013 )
ภาพหมวดหมู่มารอน&หวาย ( 1998 )
ข้อความหรือเอกสารประเภท
มากมาย นักวิจัยได้ทำการคลาสสิกหมวดหมู่เทคนิค เช่น การส่งเสริมสนับสนุนเวกเตอร์เครื่องจักร หรือ ทำงานในบริบทของอินสแตนซ์แบบหลาย
การแปล กรุณารอสักครู่..
