majority of software modules are re

majority of software modules are represented with non-faulty labels and the rest
are marked with faulty labels during the modeling phase. These kinds of datasets
are called imbalanced / unbalanced / skewed, and different performance metrics
exist to evaluate the performance of fault prediction techniques that are built on
these imbalanced datasets. The majority of these metrics are calculated by using a
confusion matrix, which will be explained in later sections. Furthermore, ROC
curves are very popular for performance evaluation. The ROC curve plots the
probability of a false alarm (PF) on the x-axis and the probability of detection
(PD) on the y-axis. The ROC curve was first used in signal detection theory to
evaluate how well a receiver distinguishes a signal from noise, and it is still used
in medical diagnostic tests [45].
In this study, we investigate 85 software fault prediction papers based on their
performance evaluation metrics. In this paper, these metrics are briefly outlined
and the current trend is reflected. We included papers in our review if the paper
describes research on software fault prediction and software quality prediction.
We excluded position papers that do not include experimental results. The
inclusion of papers was based on the degree of similarity of the study with our
fault prediction research topic. The exclusion did not take into account the
publication year of the paper or methods used. We categorized metrics into two
main groups: the first group of metrics are used to evaluate the performance of the
prediction system, which classifies the module into faulty or non-faulty class; the
second group of metrics are used to evaluate the performance of the system, which
predicts the number of faults in each module of the next release of a system.
Therefore, researchers can choose a metric from one of these groups according to
their research objectives. The first group of metrics are calculated by using a
confusion matrix. These metrics were identified through our literature review and
this set may not be a complete review of all the metrics. However, we hope that
this paper will cover the major metrics applied frequently in software fault
prediction studies. This paper is organized as follows: Section 2 describes the
software fault prediction research area. Section 3 explains the performance
metrics. Section 4 presents the conclusions and suggestions.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ส่วนใหญ่โมดูลซอฟต์แวร์จะแสดงป้ายชื่อที่ไม่ใช่ความผิดพลาดและส่วนเหลือมีเครื่องหมายป้ายความผิดพลาดระหว่างขั้นตอนการสร้างโมเดล ชุดข้อมูลต่าง ๆ เหล่านี้เรียกว่าวัดประสิทธิภาพขาดดุล/ สมดุล/ เบ้ และแตกต่างกันมีการประเมินประสิทธิภาพของเทคนิคการคาดเดาความผิดที่สร้างบนชุดข้อมูลเหล่านี้รับ ส่วนใหญ่ของการวัดเหล่านี้จะถูกคำนวณ โดยใช้การเมตริกซ์ที่ทำสับสน ซึ่งจะอธิบายไว้ในส่วนหลัง นอกจากนี้ ROCกราฟนิยมมากสำหรับการประเมินประสิทธิภาพ วางเส้นโค้ง ROCน่าเป็นการเตือนผิดพลาด (PF) บนแกน x และความน่าเป็นของการตรวจสอบ(PD) บนแกน y เส้นโค้ง ROC ครั้งแรกในทฤษฎีการตรวจจับสัญญาณการประเมินวิธีการที่ดีตัวรับแยกสัญญาณจากสัญญาณรบกวน และยังใช้ในการทดสอบวินิจฉัยทางการแพทย์ [45]ในการศึกษานี้ เราตรวจสอบ 85 ซอฟต์แวร์คาดเดาเอกสารข้อบกพร่องตามความการวัดประเมินประสิทธิภาพ ในกระดาษนี้ การวัดเหล่านี้สั้น ๆ ไว้และปัจจุบันแนวโน้มที่ยอด เรามีเอกสารการรีวิวของเราถ้ากระดาษอธิบายงานวิจัยทำนายข้อบกพร่องของซอฟต์แวร์และซอฟต์แวร์คุณภาพคาดเดาเราแยกเอกสารที่ไม่มีผลการทดลอง การรวมเอกสารตามระดับของความคล้ายคลึงกันของการศึกษากับเราหัวข้อวิจัยคาดเดาผิด ข้อยกเว้นที่ไม่ได้เอาเข้าบัญชีปีสิ่งพิมพ์กระดาษหรือวิธีใช้ เราแบ่งการวัดออกเป็นสองกลุ่มหลัก: กลุ่มแรกของการวัดจะใช้เพื่อประเมินประสิทธิภาพของการระบบคาดเดา คล่องโมในระดับผิด หรือไม่ผิดพลาด การกลุ่มที่สองของการวัดจะใช้ในการประเมินประสิทธิภาพของระบบ ที่คาดการณ์จำนวนของข้อบกพร่องในแต่ละโมดูลของรุ่นถัดไปของระบบดังนั้น นักวิจัยสามารถเลือกการวัดจากกลุ่มเหล่านี้ตามอย่างใดอย่างหนึ่งวัตถุประสงค์ของพวกเขา กลุ่มแรกของวัดจะถูกคำนวณ โดยใช้การเมตริกซ์ความสับสน วัดเหล่านี้ระบุถึงการทบทวนวรรณกรรม และชุดนี้ไม่ได้เห็นสมบูรณ์ของวัดทั้งหมด อย่างไรก็ตาม เราหวังว่ากระดาษนี้จะครอบคลุมตัวชี้วัดหลักที่ใช้บ่อยในข้อบกพร่องของซอฟต์แวร์การศึกษาการคาดเดา เอกสารนี้ถูกจัดเป็นดังนี้: ส่วนที่ 2 อธิบายการซอฟต์แวร์ผิดคาดเดาพื้นที่วิจัย ส่วนที่ 3 อธิบายประสิทธิภาพการทำงานตัวชี้วัด หมวดที่ 4 นำเสนอข้อสรุปและข้อเสนอแนะ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ส่วนใหญ่ของโมดูลซอฟต์แวร์เป็นตัวแทนที่มีป้ายชื่อที่ไม่ใช่ความผิดพลาดและส่วนที่เหลือ
มีการทำเครื่องหมายที่มีป้ายชื่อที่ผิดพลาดในระหว่างขั้นตอนการสร้างแบบจำลอง เหล่านี้ชนิดของชุดข้อมูล
จะเรียกว่าขาดดุล / ไม่สมดุล / เบ้และตัวชี้วัดประสิทธิภาพการทำงานที่แตกต่างกัน
อยู่ในการประเมินผลการปฏิบัติงานของเทคนิคการทำนายความผิดที่ถูกสร้างขึ้นใน
ชุดข้อมูลที่ไม่สมดุลเหล่านี้ ส่วนใหญ่ของตัวชี้วัดเหล่านี้จะถูกคำนวณโดยใช้
เมทริกซ์ความสับสนซึ่งจะอธิบายในส่วนต่อมา นอกจากนี้ร็อค
เส้นโค้งเป็นที่นิยมมากสำหรับการประเมินผลการปฏิบัติงาน เส้นโค้ง ROC แปลง
น่าจะเป็นของความตื่นตระหนก (PF) บนแกน x และความน่าจะเป็นของการตรวจสอบ
(PD) บนแกน y เส้นโค้ง ROC ถูกใช้ครั้งแรกในสัญญาณทฤษฎีการตรวจสอบการ
ประเมินวิธีการที่ดีรับแตกต่างสัญญาณจากเสียงรบกวนและมันก็ยังคงใช้
ในการตรวจวินิจฉัยทางการแพทย์ [45].
ในการศึกษานี้เราจะตรวจสอบ 85 ซอฟต์แวร์เอกสารการทำนายความผิดขึ้นอยู่กับพวกเขา
ประสิทธิภาพ ตัวชี้วัดการประเมินผล ในงานวิจัยนี้ชี้วัดเหล่านี้จะถูกระบุไว้ในเวลาสั้น ๆ
และแนวโน้มในปัจจุบันสะท้อนให้เห็น เรารวมถึงเอกสารในการตรวจสอบของเราถ้ากระดาษ
อธิบายการวิจัยเกี่ยวกับการทำนายความผิดของซอฟแวร์และการทำนายคุณภาพซอฟต์แวร์.
เราได้รับการยกเว้นตำแหน่งงานที่ไม่รวมผลการทดลอง
รวมของเอกสารก็ขึ้นอยู่กับระดับของความคล้ายคลึงกันของการศึกษาของเราที่มี
หัวข้องานวิจัยการทำนายความผิด การยกเว้นไม่คำนึงถึง
ปีสิ่งพิมพ์ของกระดาษหรือวิธีการที่ใช้ เราแบ่งตัวชี้วัดออกเป็นสอง
กลุ่มหลัก: กลุ่มแรกของตัวชี้วัดที่ใช้ในการประเมินผลการทำงานของ
ระบบการคาดการณ์ซึ่งจัดประเภทโมดูลในชั้นเรียนที่ผิดพลาดหรือไม่ผิดพลาด;
กลุ่มที่สองของตัวชี้วัดที่ใช้ในการประเมินผลการทำงานของระบบซึ่ง
คาดการณ์จำนวนความผิดพลาดในโมดูลของรุ่นถัดไปของระบบแต่ละ.
ดังนั้นนักวิจัยจึงสามารถเลือกตัวชี้วัดจากหนึ่งในกลุ่มคนเหล่านี้เป็นไปตาม
วัตถุประสงค์ของการวิจัยของพวกเขา กลุ่มแรกของตัวชี้วัดที่มีการคำนวณโดยใช้
เมทริกซ์ความสับสน ตัวชี้วัดเหล่านี้ถูกระบุถึงการทบทวนวรรณกรรมของเราและ
ชุดนี้ไม่อาจจะเป็นความคิดเห็นที่สมบูรณ์ของตัวชี้วัดทั้งหมด อย่างไรก็ตามเราหวังว่า
บทความนี้จะครอบคลุมตัวชี้วัดที่สำคัญที่ใช้บ่อยในความผิดของซอฟแวร์
การศึกษาการทำนาย กระดาษนี้จะมีการจัดระเบียบดังนี้ส่วนที่ 2 อธิบาย
ซอฟต์แวร์วิจัยการทำนายความผิด ส่วนที่ 3 อธิบายผลการดำเนินงาน
ตัวชี้วัด หมวดที่ 4 นำเสนอข้อสรุปและข้อเสนอแนะ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ส่วนใหญ่ของโมดูลซอฟต์แวร์จะแสดงบนฉลาก และส่วนที่เหลือเสียหายมีเครื่องหมายฉลากผิดพลาดในระหว่างการเฟส ชนิดของข้อมูลเหล่านี้จะเรียกว่าสมดุล / มั่นคง / เบ้ และตัวชี้วัดประสิทธิภาพที่แตกต่างกันอยู่เพื่อประเมินสมรรถนะของเทคนิคที่สร้างขึ้นในความผิด ทำนายข้อมูลสมดุลเหล่านี้ ส่วนใหญ่ของตัวชี้วัดเหล่านี้จะถูกคำนวณโดยใช้ความสับสนเมทริกซ์ซึ่งจะอธิบายในส่วนในภายหลัง นอกจากนี้ ร็เส้นโค้งเป็นที่นิยมมากสำหรับการประเมินการปฏิบัติงาน แปลง : โค้งความน่าจะเป็นของความผิดพลาด ( PF ) บนแกน x และความน่าจะเป็นของการตรวจสอบ( PD ) บนแกน Y . Roc โค้งแรกใช้ในการตรวจจับสัญญาณทฤษฎีประเมินว่าดีเครื่องรับสัญญาณที่แตกต่างจากเสียงรบกวน และยังใช้ในทางการแพทย์ การวินิจฉัยการทดสอบ [ 45 ]ในการศึกษาครั้งนี้ได้ศึกษา 85 ซอฟต์แวร์ผิดทำนายตามเอกสารตัวชี้วัดการประเมินผลการปฏิบัติงาน ในกระดาษนี้ , ตัวชี้วัดเหล่านี้จะอธิบายสั้น ๆและแนวโน้มในปัจจุบันจะสะท้อนกลับ ในความคิดเห็นของเรา ถ้าเรารวมเอกสารกระดาษอธิบายถึงการวิจัยในการทำนายและพยากรณ์คุณภาพซอฟต์แวร์ของซอฟต์แวร์เราแยกออกตำแหน่งเอกสารที่ไม่รวมผลจากการทดลอง ที่รวมเอกสาร ขึ้นอยู่กับระดับของความคล้ายคลึงกันของการศึกษาของเราหัวข้อวิจัยทำนายผิด การยกเว้นไม่ใช้เข้าบัญชีปีของสิ่งพิมพ์กระดาษ หรือ วิธีการที่ใช้ เราแบ่งวัดออกเป็นสองกลุ่มหลัก กลุ่มแรกของตัวชี้วัดที่ใช้ในการประเมินการปฏิบัติงานของระบบพยากรณ์ ซึ่งจัดว่าโมดูลเป็นผิดพลาดหรือไม่เสียระดับ ;กลุ่มที่สองเป็นวัดที่ใช้ประเมินประสิทธิภาพของระบบ ซึ่งคาดการณ์จำนวนของข้อบกพร่องในแต่ละโมดูลของรุ่นถัดไปของระบบดังนั้น นักวิจัยสามารถเลือกเมตริกจากหนึ่งในกลุ่มเหล่านี้ตามวัตถุประสงค์ของพวกเขา กลุ่มแรกเป็นวัดที่คำนวณโดยใช้ความสับสนเมทริกซ์ ตัวชี้วัดเหล่านี้ถูกระบุผ่านการทบทวนวรรณกรรมและชุดนี้อาจจะมีความคิดเห็นที่สมบูรณ์ของตัวชี้วัดทั้งหมด อย่างไรก็ตาม เราหวังว่ากระดาษนี้จะครอบคลุมตัวชี้วัดหลักที่ใช้บ่อยในข้อบกพร่องซอฟต์แวร์ศาสตร์พยากรณ์ กระดาษนี้จะจัดได้ดังนี้ ส่วนที่ 1 อธิบายพื้นที่วิจัยซอฟต์แวร์การคาดการณ์ผิด ส่วนที่ 3 อธิบายถึงประสิทธิภาพมาตรวัด ส่วนที่ 4 นำเสนอข้อสรุปและข้อเสนอแนะ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.