The comprehensive dataset utilized is available from the Breast Cancer Wisconsin (Diagnostic) Dataset on
the UC Irvine Machine Learning Repository. The dataset is fairly rich in examples, considering m = 569
patients. It consists of a matrix with 32 columns, where the first such column is the patient ID and so
ignored in this study and the second column is the label M = 1 for malignant and B = 0 for benign. The
remaining 30 columns form the vector xi in the training example (xi, yi). There are ten distinct continuous
features measured, namely the radius, texture, perimeter, area, smoothness, compactness, concave points,
concavity, symmetry and fractal dimension. For each of these, the average, standard error and the worst case
measurements are reported. The class distribution is given by 357 benign samples(⇠62.7%) and 212 malignant
samples(⇠37.3%). Note that this is fairly representative of the positive learning malignant samples, which
can be di"cult in medical based datasets, such as with AIDs diagnoses. Another dataset to be explored for
future research focuses other physical and also biological features, such as clump thickness, since cancer cells
tend to form multilayers, uniformity of cell size and shape, epithelial cell size, bare nuclei, bland chromatin
and mitoses. A comparison of the results from training on this dataset to the prior one could help distinguish
the characteristics that are most relevant in the diagnosis process.
ที่ครอบคลุมข้อมูลที่ใช้สามารถใช้ได้จากมะเร็งเต้านมวิสคอนซิน ( วินิจฉัย ) ข้อมูลใน UC Irvine
การเรียนรู้เครื่องเก็บข้อมูล ข้อมูลค่อนข้างรวยในตัวอย่างพิจารณา M = 569
ผู้ป่วย มันประกอบด้วยเมทริกซ์กับ 32 คอลัมน์ที่มีคอลัมน์แรกเป็นคนไข้ เช่น ID และดังนั้น
ไม่สนใจในการศึกษานี้และคอลัมน์ที่สองเป็นป้าย M = 1 B = 0 สำหรับร้าย และเนื้องอก
เหลือ 30 คอลัมน์รูปแบบเวกเตอร์ Xi ในการฝึกอบรมตัวอย่าง ( ซีอี ) มีสิบที่แตกต่างกันอย่างต่อเนื่อง
คุณสมบัติวัด คือ รัศมี , เนื้อ , ปริมณฑล , พื้นที่ , เรียบ , แข็ง , จุด ,
เว้าเว้า สมมาตร และมิติเศษส่วน สำหรับแต่ละเหล่านี้ เฉลี่ยข้อผิดพลาดมาตรฐานและกรณีเลวร้ายที่สุดวัด
รายงาน ห้องแจกให้โดย 357 แบบตัวอย่าง ( ⇠ 62.7 % ) และ 212 เนื้อร้าย
ตัวอย่าง ( ⇠ 37.3 % ) ทราบว่า นี้เป็นธรรม ตัวแทนของ การเรียนรู้ทางบวกอย่างร้ายกาจ ซึ่ง
สามารถตี้ " ลัทธิตามข้อมูลทางการแพทย์ เช่นกับโรคเอดส์ อีกวันที่ต้องสํารวจสําหรับ
การวิจัยในอนาคตจะเน้นและชีวภาพคุณสมบัติทางกายภาพอื่น ๆ เช่น ความหนาของกอ เนื่องจากเซลล์มะเร็งมีแนวโน้มที่จะฟอร์ม
multilayers , ความสม่ำเสมอของขนาดและรูปร่างในเซลล์เยื่อบุผิวขนาดเปลือยนิวเคลียส
โครมาติน จืด และ mitoses . การเปรียบเทียบผลลัพธ์จากการฝึกอบรมในชุดข้อมูลนี้ไปก่อนหนึ่งอาจช่วยแยกแยะความแตกต่าง
ลักษณะที่เกี่ยวข้องมากที่สุดในกระบวนการวินิจฉัย
การแปล กรุณารอสักครู่..