2.1.1 Error Measures
We will first consider the formalisms required for regression problems, then toward the
end of section 2.1.2 extend the notation to deal with classification. Consider an unknown
function φ : X → Y , which maps from an input space X ⊆ R
m
to an output space Y ⊆ R.
Here we assume a single dimensional output space, but all results are easily generalised to
the multi-dimensional case [10, 51]. In the problem context we have discussed so far, the
input space corresponds to the photograph of the person, the current weather conditions
and the demographic information; the output space corresponds to the weight of the person,
the amount of snow and the average house price. The overriding principle we work to is
that we only have access to a limited, random, data sample of φ’s behaviour, which we must
use to construct a system that can generalise and predict correctly on future inputs. The
data sample is the set t = {(x1
, d
1
), (x2
, d
2
), ..., (x
N
, d
N
)}, where each input vector xn ∈ X,
and each target variable d
n = φ(xn) + ǫ where ǫ is a random scalar value, assumed to be
Gaussian distributed with zero mean. This definition for d reflects that our source for this
data sample t is not entirely representative of φ, it is noisy
1
. The set t is drawn randomly
2.1.1 มาตรการข้อผิดพลาดเราจะมาพิจารณาดู formalisms ที่จำเป็นสำหรับปัญหาการถดถอย แล้วไปสิ้นสุดส่วน 2.1.2 ขยายสัญกรณ์เพื่อจัดการกับการจัดประเภท ไม่รู้จักการพิจารณาφฟังก์ชัน: X → Y แผนผังที่ได้จากพื้นที่ X ⊆ Rmต้องการผลผลิตพื้นที่ Y ⊆อาร์ที่นี่เราถือว่าช่องว่างผลผลิตมิติเดียว แต่ผลลัพธ์ทั้งหมดมี generalised เพื่อง่ายกรณีหลายมิติ [10, 51] ในบริบทของปัญหาที่เราได้กล่าวถึงเพื่อห่างไกล การพื้นที่ป้อนข้อมูลที่สอดคล้องกับภาพถ่ายของบุคคล สภาพอากาศปัจจุบันและ ข้อมูลประชากร พื้นที่แสดงผลสอดคล้องกับน้ำหนักของบุคคลจำนวนหิมะและราคาบ้านเฉลี่ย ตรรกะที่เราทำงานเพื่อเป็นว่า เราจะเข้าถึงข้อมูลจำกัด สุ่ม ตัวอย่างของพฤติกรรมของφ ซึ่งเราต้องการสร้างระบบที่สามารถ generalise และทำนายได้อย่างถูกต้องในปัจจัยการผลิตในอนาคต ที่ตัวอย่างข้อมูลเป็นทีตั้ง = {(x 1, d1), (x 2, d2), ..., (xN, dN)}, แต่ละอินพุตเวกเตอร์ xn ∈ Xและ d แต่ละตัวแปรเป้าหมายn = φ(xn) + ǫซึ่งǫเป็นการสุ่มค่าสเกลา ถือGaussian กระจาย มีค่าเฉลี่ยเป็นศูนย์ ข้อกำหนดนี้สำหรับ d สะท้อนที่แหล่งของเรานี้ข้อมูลตัวอย่าง t ไม่ใช่ตัวแทนทั้งหมดของφ มีเสียงดัง1. ออกทีตั้งค่าแบบสุ่ม
การแปล กรุณารอสักครู่..

2.1.1
มาตรการข้อผิดพลาดก่อนอื่นเราจะพิจารณาformalisms
ที่จำเป็นสำหรับปัญหาการถดถอยแล้วต่อท้ายของส่วน2.1.2 ขยายสัญกรณ์ที่จะจัดการกับการจัดหมวดหมู่ พิจารณาที่ไม่รู้จักฟังก์ชั่นφ: X → Y ซึ่งแผนที่จากอวกาศใส่ X ⊆ R เมตรพื้นที่ออก Y ⊆อาร์นี่เราถือว่าเป็นพื้นที่เอาท์พุทมิติเดียวแต่ผลทั้งหมดจะถูกทั่วไปได้อย่างง่ายดายเพื่อกรณีหลายมิติ [ 10, 51] ในบริบทปัญหาที่เราได้พูดคุยกันเพื่อให้ห่างไกลในพื้นที่การป้อนข้อมูลที่สอดคล้องกับรูปถ่ายของบุคคลที่สภาพอากาศปัจจุบันและข้อมูลประชากร; พื้นที่การแสดงผลที่สอดคล้องกับน้ำหนักของคนที่ปริมาณของหิมะและราคาบ้านเฉลี่ย หลักการสำคัญที่เราทำงานเพื่อเป็นว่าเรามีการเข้าถึงที่ จำกัด การสุ่มกลุ่มตัวอย่างข้อมูลของพฤติกรรมφซึ่งเราจะต้องใช้ในการสร้างระบบที่สามารถพูดคุยและคาดการณ์อย่างถูกต้องในปัจจัยการผลิตในอนาคต ตัวอย่างข้อมูลที่เป็นเสื้อชุด = {(x1, D 1), (x2, D 2), ... , (x N, D ไม่มี)} ซึ่งแต่ละการป้อนข้อมูลเวกเตอร์ xn ∈ X, และเป้าหมายในแต่ละตัวแปร d n = φ (xn) + ǫที่ǫเป็นค่าสเกลาสุ่มสันนิษฐานว่าจะเป็นเสียนกับศูนย์กระจายเฉลี่ย คำนิยามสำหรับ d นี้สะท้อนให้เห็นว่าแหล่งที่มาของเราสำหรับเรื่องนี้ทีตัวอย่างข้อมูลที่ไม่ได้เป็นตัวแทนของφทั้งหมดก็จะมีเสียงดัง1 เสื้อชุดที่มีการสุ่ม
การแปล กรุณารอสักครู่..
