might thus describe the issue as on

might thus describe the issue as one of problem uncertainty.
To take a familiar example, which we do
not explore in detail in this paper because it has
been explored elsewhere, the relative costs of different
kinds of misclassification may differ and may be
unknown. A very common resolution is to assume
equal costs (Jamain and Hand [24] found that most
comparative studies of classification rules made this
assumption) and to use straightforward error rate
as the performance criterion. However, equality is
but one choice, and an arbitrary one at that, and
one which we suspect is in fact rarely appropriate.
In assuming equal costs, one is adopting a particular
problem which may not be the one which is really
to be solved. Indeed, things are even worse than
this might suggest, because relative misclassification
costs may change over time. Provost and Fawcett
[36] have described such situations: “Comparison often
is difficult in real-world environments because
key parameters of the target environment are not
known. The optimal cost/benefit tradeoffs and the
target class priors seldom are known precisely, and
often are subject to change (Zahavi and Levin [47];
Friedman and Wyatt [8]; Klinkenberg and Thorsten
[29]). For example, in fraud detection we cannot ignore
misclassification costs or the skewed class distribution,
nor can we assume that our estimates are
precise or static (Fawcett and Provost [6]).”
Moving on, our fourth argument is that classification
methods are typically evaluated by reporting
their performance on a variety of real data sets.
However, such empirical comparisons, while superficially
attractive, have major problems which are often
not acknowledged. In general, we suggest in Section
5 that no method will be universally superior
to other methods: relative superiority will depend
on the type of data used in the comparisons, the
particular data sets used, the performance criterion
and a host of other factors. Moreover, the relative
performance will depend on the experience the person
making the comparison has in using the methods,
and this experience may differ between methods:
researcher A may find that his favorite method
is best, merely because he knows how to squeeze the
best performance from this method.
These various arguments together suggest that an
apparent superiority in classification accuracy, obtained
in “laboratory conditions,” may not translate
to a superiority in real-world conditions and, in
particular, the apparent superiority of highly sophisticated
methods may be illusory, with simple methods
often being equally effective or even superior in
classifying new data points.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ดังนั้นอาจอธิบายปัญหานี้เป็นปัญหาความไม่แน่นอนอย่างใดอย่างหนึ่งใช้ตัวอย่างคุ้นเคย ที่เราทำไม่สำรวจรายละเอียดในเอกสารนี้เนื่องจากมีการสำรวจอื่น ๆ สัมพัทธ์ต้นทุนแตกต่างกันชนิด misclassification อาจแตกต่างกัน และอาจไม่ทราบ ความละเอียดธรรมดาจะถือว่าเท่ากับต้นทุน (Jamain และมือ [24] พบว่าส่วนใหญ่ทำการศึกษาเปรียบเทียบการจัดประเภทกฎนี้อัสสัมชัญ) และใช้อัตราข้อผิดพลาดที่ตรงไปตรงมาเป็นเกณฑ์ประสิทธิภาพการ อย่างไรก็ตาม ความเสมอภาคคือทางเลือกหนึ่ง และเป็นส่วนหนึ่งกำหนดว่า และที่เราสงสัยว่าเป็นจริงไม่ค่อยเหมาะสมในสมมติว่าต้นทุนเท่ากัน หนึ่งใช้เฉพาะปัญหาที่อาจจะเป็นหนึ่งที่เป็นจริงได้รับการแก้ไข จริง สิ่งแย่ยิ่งกว่านี้อาจแนะนำ เนื่องจาก misclassification สัมพัทธ์ต้นทุนอาจเปลี่ยนแปลงช่วงเวลา Fawcett และ provost[36] ได้อธิบายสถานการณ์เช่น: "เปรียบเทียบมักจะเป็นเรื่องยากในสภาพแวดล้อมจริงเนื่องจากพารามิเตอร์ที่สำคัญของสิ่งแวดล้อมเป้าหมายไม่รู้จักกัน ยืนยันต้นทุนประโยชน์สูงสุดและเป้าหมายระดับ priors ค่อยเป็นที่รู้จักอย่างแม่นยำ และมักจะมีการเปลี่ยนแปลง (Zahavi และ Levin [47];ฟรีดแมนและ Wyatt [8]; Klinkenberg และ Thorsten[29]) . เช่น ตรวจสอบทุจริตเราไม่สามารถละเว้นข้อผิดพลาดmisclassification ต้นทุนหรือการกระจายชั้นบิดไม่สามารถเราสมมติว่า การประเมินของเราเป็นแม่นยำ หรือสถิต (Fawcett และ Provost [6]) "เลื่อน อาร์กิวเมนต์ที่สี่ของเราเป็นประเภทที่วิธีจะประเมิน โดยรายงานการปฏิบัติกับความหลากหลายของชุดข้อมูลที่แท้จริงอย่างไรก็ตาม เช่นประจักษ์เปรียบเทียบ ในขณะที่เผิน ๆปัญหาสำคัญที่มักมีเสน่ห์ยอมรับไม่ ทั่วไป เราแนะนำในส่วน5 ว่า ไม่มีวิธีจะเหนือกว่าแบบกับวิธีการอื่น ๆ: ปมสัมพัทธ์จะขึ้นอยู่กับชนิดของข้อมูลที่ใช้ในการเปรียบเทียบ การใช้ชุดเฉพาะของข้อมูล เกณฑ์ประสิทธิภาพและปัจจัยอื่น ๆ ให้เลือกมากมาย ยิ่งไปกว่านั้น ญาติประสิทธิภาพจะขึ้นอยู่กับประสบการณ์บุคคลทำการเปรียบเทียบได้ในโดยใช้วิธีการและประสบการณ์นี้อาจแตกต่างกันระหว่างวิธี:นักวิจัย A อาจพบว่าวิธีของเขาชื่นชอบสุด เพียง เพราะเขารู้วิธีการบีบประสิทธิภาพสูงที่สุดจากวิธีการนี้อาร์กิวเมนต์ต่าง ๆ เหล่านี้ร่วมกันแนะนำที่เป็นเหนือกว่าชัดเจนในประเภทแม่นยำ ได้รับใน"ห้องปฏิบัติการ อาจไม่แปลจะเหนือกว่าในโลกจริง และ ในโดยเฉพาะอย่างยิ่ง เหนือกว่าชัดเจนของมีความซับซ้อนสูงวิธีอาจ illusory ด้วยวิธีง่าย ๆมักจะมีประสิทธิภาพเท่าเทียมกัน หรือเหนือกว่าแม้ในประเภทจุดข้อมูลใหม่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

จึงอาจอธิบายปัญหาเป็นหนึ่งในปัญหาของความไม่แน่นอน. เพื่อที่จะใช้เป็นตัวอย่างที่คุ้นเคยซึ่งเราไม่ได้สำรวจในรายละเอียดในบทความนี้เพราะได้รับการสำรวจที่อื่นๆ ค่าใช้จ่ายญาติของที่แตกต่างกันชนิดจำแนกอาจแตกต่างกันและอาจจะไม่รู้จัก ความละเอียดที่พบบ่อยมากคือการสมมติค่าใช้จ่ายเท่ากับ (Jamain และมือ [24] พบว่าส่วนใหญ่การศึกษาเปรียบเทียบการจัดหมวดหมู่ของกฎนี้ทำให้สมมติฐาน) และใช้อัตราความผิดพลาดตรงไปตรงมาเป็นเกณฑ์ประสิทธิภาพ อย่างไรก็ตามความเสมอภาคเป็นแต่หนึ่งในทางเลือกและหนึ่งโดยพลการที่นั้นและหนึ่งที่เราสงสัยว่าในความเป็นจริงที่เหมาะสมไม่ค่อย. ในสมมติว่าค่าใช้จ่ายเท่ากันหนึ่งคือการใช้โดยเฉพาะอย่างยิ่งปัญหาที่เกิดขึ้นซึ่งอาจจะไม่เป็นหนึ่งที่เป็นจริงที่จะแก้ไข อันที่จริงสิ่งที่เลวร้ายยิ่งกว่านี้อาจแนะนำเพราะญาติจำแนกค่าใช้จ่ายที่อาจมีการเปลี่ยนแปลงอยู่ตลอดเวลา พระครูและ Fawcett [36] ได้อธิบายสถานการณ์เช่นนี้ "เปรียบเทียบมักจะเป็นเรื่องยากในสภาพแวดล้อมที่โลกแห่งความจริงเพราะพารามิเตอร์ที่สำคัญของสภาพแวดล้อมเป้าหมายไม่ได้รู้จักกัน ค่าใช้จ่ายที่ดีที่สุด / ได้รับประโยชน์และความสมดุลไพรเออร์ระดับเป้าหมายที่ไม่ค่อยเป็นที่รู้จักกันอย่างแม่นยำและมักจะมีการเปลี่ยนแปลง(Zahavi และเลวิน [47]; ฟรีดแมนและไวแอตต์ [8]; Klinkenberg และ Thorsten [29]) ยกตัวอย่างเช่นในการตรวจสอบการทุจริตที่เราไม่สามารถละเลยค่าใช้จ่ายจำแนกหรือการกระจายระดับเบ้ที่หรือเราสามารถสมมติว่าประมาณการของเรามีความแม่นยำหรือคงที่(Fawcett และพระครู [6]). "ย้ายอาร์กิวเมนต์ที่สี่ของเราคือการจำแนกวิธีการโดยทั่วไปจะมีการประเมินโดยการรายงานผลการดำเนินงานของพวกเขาในความหลากหลายของชุดข้อมูลที่แท้จริง. อย่างไรก็ตามการเปรียบเทียบเชิงประจักษ์ดังกล่าวในขณะที่เผิน ๆที่น่าสนใจมีปัญหาที่สำคัญซึ่งมักจะไม่ได้รับการยอมรับ โดยทั่วไปเราแนะนำไว้ในมาตรา5 ว่าวิธีการจะไม่มีอย่างกว้างขวางที่เหนือกว่าวิธีการอื่นๆ ที่เหนือกว่าญาติจะขึ้นอยู่กับชนิดของข้อมูลที่ใช้ในการเปรียบเทียบที่ชุดข้อมูลโดยเฉพาะอย่างยิ่งการใช้เกณฑ์ประสิทธิภาพและโฮสต์ของปัจจัยอื่นๆ นอกจากนี้เมื่อเทียบผลการดำเนินงานจะขึ้นอยู่กับประสบการณ์คนที่ทำให้การเปรียบเทียบมีการใช้วิธีการและประสบการณ์นี้อาจแตกต่างระหว่างวิธีการ: นักวิจัยอาจพบว่าวิธีการที่เขาชื่นชอบจะดีที่สุดเพียงเพราะเขารู้วิธีที่จะบีบประสิทธิภาพที่ดีที่สุดจากวิธีการนี้. ข้อโต้แย้งต่างๆเหล่านี้เข้าด้วยกันแนะนำว่าเหนือกว่าเห็นได้ชัดในความถูกต้องจำแนกได้ใน"ห้องปฏิบัติการ" ไม่อาจแปลไปยังเหนือกว่าในสภาพจริงของโลกและในโดยเฉพาะอย่างยิ่งที่เหนือกว่าชัดเจนของที่มีความซับซ้อนสูงวิธีการอาจจะไม่จริงด้วยวิธีการที่เรียบง่ายมักจะเป็นที่มีประสิทธิภาพเท่าเทียมกันหรือแม้กระทั่งการที่เหนือกว่าในการจำแนกจุดข้อมูลใหม่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

อาจทำให้อธิบายปัญหาหนึ่งของความไม่แน่นอนของปัญหา .
เอาตัวอย่างที่คุ้นเคย ซึ่งพวกเรา
ไม่สำรวจในรายละเอียดในบทความนี้เพราะมันมี
ถูกสำรวจที่อื่น ต้นทุนสัมพัทธ์ที่แตกต่างกัน
ของผิดพลาดอาจแตกต่างกันและอาจมี
ที่ไม่รู้จัก ความละเอียดที่พบบ่อยมาก คือสมมติ
ต้นทุนเท่ากัน ( jamain และมือ [ 24 ] พบว่าส่วนใหญ่
การศึกษาเปรียบเทียบกฎการจำแนกทำให้สมมติฐานนี้

) และใช้อัตราการผิดพลาดตรงไปตรงมาเป็นเกณฑ์ประสิทธิภาพ อย่างไรก็ตาม ความเท่าเทียมกัน
แต่ทางเลือกหนึ่งและเป็นหนึ่งในนั้น และที่เราสงสัยอยู่

ในความเป็นจริงไม่ค่อยเหมาะสม สมมติว่าต้นทุนเท่ากับ หนึ่งคือการใช้ปัญหาเฉพาะ
ซึ่งอาจจะเป็นหนึ่งที่เป็นความจริง
ที่จะแก้ไข แน่นอนสิ่งที่แย่กว่า
นี้อาจจะแนะนำ เพราะต้นทุนผิดพลาด
ญาติอาจเปลี่ยนแปลงตลอดเวลา ประธานและฟอว์เซตต์
[ 36 ] ได้อธิบายสถานการณ์เช่นนี้ : " การเปรียบเทียบมักจะยากในสภาพแวดล้อมจริง

พารามิเตอร์สำคัญของสิ่งแวดล้อมเพราะเป้าหมายไม่ได้
รู้จัก ต้นทุน / ผลประโยชน์ที่เหมาะสมและ tradeoffs
คลาสเป้าหมายเริ่มไม่ค่อยเป็นที่รู้จักกันแน่นอน และ
มักจะมีการเปลี่ยนแปลง ( และ zahavi เลวิน [ 47 ] ;
ฟรีดแมนและ Wyatt [ 8 ] ; และ klinkenberg Thorsten
[ 29 ] ) ตัวอย่างเช่นในการตรวจสอบการทุจริต เราไม่สามารถละเลย
ผิดพลาดหรือค่าใช้จ่ายเบ้ชั้นกระจาย
หรือที่เราสามารถสมมติว่าประมาณการของเรา
แม่นยำหรือคงที่ ( ฟอว์เซตต์ และพระครู [ 6 ] ) "
ย้ายอาร์กิวเมนต์ที่สี่ของเราคือการจำแนก

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.