Learning to classify objects is a fundamental problem in artificial intelligence and other
fields, one which has been attacked from many angles. Despite many successes, there are
some domains in which the task has proven very difficult, due either to the inherent difficulty
of the domain or to the lack of sufficient data for learning. For example, instancebased
learning programs (also called exemplar-based (Salzberg, 1990) or nearest neighbor
(Cover & Hart, 1967) methods), which learn by storing examples as points in a feature
space, require some means of measuring distance between examples (Aha, 1989; Aha &
Kibler, 1989; Salzberg, 1989; Cost & Salzberg, 1990). An example is usually a vector of
feature values plus a category label. When the features are numeric, normalized Euclidean
distance can be used to compare examples. However, when the feature values have symbolic,
unordered values (e.g., the letters of the alphabet, which have no natural inter-letter
"distance"), nearest neighbor methods typically resort to much simpler metrics, such as
counting the features that match. (Towell et al. (1990) recently used this metric for the
nearest neighbor algorithm in their comparative study.) Simpler metrics may fail to capture
the complexity of the problem domains, and as a result may not perform well.
เรียนรู้การจัดประเภทวัตถุเป็นพื้นฐานปัญหาในปัญญาประดิษฐ์ และอื่น ๆฟิลด์ ที่ได้ถูกโจมตีจากหลายมุม แม้ มีความสำเร็จมาก มีโดเมนบางที่งานได้พิสูจน์ยากมาก กำหนดว่าจะยากแต่กำเนิดโดเมน หรือการขาดข้อมูลที่เพียงพอสำหรับการเรียนรู้ ตัวอย่างเช่น instancebasedเรียนรู้โปรแกรม (เรียกว่าใช้ exemplar (Salzberg, 1990) หรือ ใกล้บ้าน(ฝาครอบและฮาร์ท 1967) วิธี), การเรียนรู้ โดยการเก็บตัวอย่างเป็นจุดในคุณลักษณะพื้นที่ ใช้บางวิธีวัดระยะห่างระหว่างตัวอย่าง (ลเอ 1989 Aha และKibler, 1989 Salzberg, 1989 ต้นทุนและ Salzberg, 1990) ตัวอย่างมักจะเป็นเวกเตอร์ของค่าคุณลักษณะพร้อมป้ายชื่อประเภท เมื่อคุณลักษณะเป็นตัวเลข ตามปกติ Euclideanสามารถใช้ระยะทางการเปรียบเทียบตัวอย่าง อย่างไรก็ตาม เมื่อค่าคุณลักษณะมีสัญลักษณ์ค่าปกติ (เช่น แบบตัวอักษร ที่มีจดหมายระหว่างไม่ธรรมชาติ"ห่างจากที่พัก"), ใกล้ใกล้เคียงทั่วรีสอร์ทวิธีการวัดง่ายมาก เช่นลักษณะการทำงานที่ตรงกับการตรวจนับ (Towell et al. (1990) ใช้สำหรับวัดนี้ใกล้บ้านอัลกอริทึมในการศึกษาเปรียบเทียบ) วัดง่ายกว่าอาจล้มเหลวในการจับภาพความซับซ้อน ของปัญหาโดเมน และ เป็นผลอาจทำดี
การแปล กรุณารอสักครู่..

เรียนรู้ที่จะแยกแยะวัตถุเป็นปัญหาพื้นฐานในด้านปัญญาประดิษฐ์และสาขาอื่น ๆ
, หนึ่งซึ่งกำลังถูกโจมตีจากหลาย ๆ มุม แม้จะมีความสำเร็จมาก มีบางโดเมนที่
งานพิสูจน์ได้ยากมาก เนื่องจากทั้งโดยธรรมชาติยาก
ของโดเมนหรือการขาดข้อมูลที่เพียงพอสำหรับการเรียนรู้ ตัวอย่างเช่น instancebased
การเรียนรู้โปรแกรม ( เรียกว่าแบบอย่างตาม ( Tagaytay , 2533 ) หรือเพื่อนบ้านที่ใกล้ที่สุด
( ปก&ฮาร์ท , 1967 ) วิธีการ ) ซึ่งเรียนโดยการเก็บตัวอย่างคะแนนเป็นในลักษณะ
พื้นที่ต้องมีวิธีการวัดระยะทางระหว่างตัวอย่าง ( AHA , 1989 ; AHA &
คิปเลอร์ , 1989 ; ซาลซ์ , 1989 ; ต้นทุน &ซาลซ์ , 2533 ) ตัวอย่างมักจะเป็นเวกเตอร์ของ
คุณลักษณะค่าบวกประเภทป้ายเมื่อมีตัวเลขปกติใช้
ระยะทางที่สามารถใช้ในการเปรียบเทียบตัวอย่าง อย่างไรก็ตาม เมื่อคุณสมบัติค่ามีสัญลักษณ์
ค่าเรียงลําดับ ( เช่น ตัวอักษรของตัวอักษร ซึ่งไม่มีธรรมชาติระหว่างตัวอักษร
" ระยะทาง " ) เพื่อนบ้านที่ใกล้ที่สุดวิธีการมักจะใช้ง่ายกว่ามากที่สุดเช่น
นับคุณสมบัติที่ตรงกับ ( ถึงมาก et al .( 1990 ) เมื่อเร็ว ๆนี้ใช้ระบบเมตริกสำหรับเพื่อนบ้านที่ใกล้ที่สุดในการเปรียบเทียบขั้นตอนวิธี
. ) ง่ายกว่าการวัดอาจล้มเหลวที่จะจับ
ความซับซ้อนของปัญหาโดเมน และผลอาจไม่ดี .
การแปล กรุณารอสักครู่..
