As we mentioned in Section 1, the m

As we mentioned in Section 1, the main contributions of this paper are: (a) the evaluation of the performance of seven BN classifiers in order to determine their effectiveness for accurately diagnosing breast cancer using two real-world breast cancer datasets, and (b) the empirical proof that the interobserver variability problem is implicitly contained in these data.
For the first contribution, the results in Experiments 1–4 show that only in the dataset collected by a single observer (Experiment 1), it is possible to consistently and accurately carry out the cytodiagnosis of breast cancer. For the remaining experiments, the results show that the subjective observation of the samples leads, in general, to a poor performance of the BN classifiers. Even the Naïve Bayesian classifier, which is very robust when noise is present, reflects such an anomaly. Thus, these results strongly suggest that the effectiveness of this kind of classifiers is significantly reduced when data from different observers is to be taken into account. In other words, it is not possible to generalize which features are the most relevant ones for determining the presence/absence of breast cancer. Regarding the second contribution, the results in Experiments 2–4 show that interobserver variability is implicitly present in the data: globally, the observers see the same; locally, they see different things. This implies that they are taking into account more information than that portrayed in the data; i.e., they are using more knowledge to make a decision. It is important to mention that the process or processes that cytopathologists follow to make their final diagnoses have not been yet fully understood and can only be partially explained in terms of pattern recognition with occasional use of heuristic logic [8]. Our results support this finding. Furthermore, as Cross et al. point out, all the features coded in the breast cancer datasets used in the present study were made by the expert cytopathologists, who carried out most of the processing that is probably required to solve the diagnostic problem. If this is true, then there is little work left to any classifier that uses these datasets. Hence, the information provided there is subjective rather than objective. To ameliorate this problem, alternative data collection methods such as image analysis techniques could be used so that objective measures from sample raw digitalized images can be extracted. It would then be interesting, in a future work, to investigate the possibility of building a pre-processing vision module capable of extracting “objective” features from raw images as well as integrating more information in the data (such as clinical details for instance) and, again, check the performance of the BN classifiers using this extended dataset. An important problem, worth mentioning, regarding the nature of the databases is that of the loss of richness in the representation of the cytopathological features: cytopathologists are forced to represent those naturally continuous features in a dichotomized way. A relevant exploration would be that of the possibility of codifying such characteristics with more power and richness than that of a binary coding. To do so, it would be necessary to allow pathologists to codify the features using a bigger range of possible values for each variable. It would also be very interesting to explore the incorporation of prior knowledge in the different procedures presented here to check if their performance can be significantly improved.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ตามที่เรากล่าวถึงในส่วนที่ 1 ผลงานหลักของเอกสารนี้จะ: (ก) การประเมินประสิทธิภาพของคำนามภาษาพันเจ็ดเพื่อกำหนดประสิทธิภาพในการวินิจฉัยมะเร็งเต้านมโดยใช้ 2 datasets มะเร็งเต้านมจริง และ (ข)หลักฐานประจักษ์ที่ว่า ปัญหาความแปรผัน interobserver นัยอยู่ในข้อมูลเหล่านี้ได้อย่างถูกต้องสำหรับส่วนแรก ผลลัพธ์ในการทดลอง 1-4 แสดงว่าเฉพาะในชุดข้อมูลที่เก็บรวบรวมไว้แหล่งเดียว (ทดลอง 1), มันเป็นไปอย่างสม่ำเสมอ และดำเนิน cytodiagnosis มะเร็งเต้านมได้อย่างถูกต้อง สำหรับการทดลองที่เหลือ ผลลัพธ์แสดงว่า สังเกตตามอัตวิสัยของตัวอย่างนำ ทั่วไป เพื่อประสิทธิภาพที่ดีของคำนามภาษาพัน แม้กระทั่งในทฤษฎีขำน่า classifier ซึ่งแข็งแกร่งมากเมื่อเสียงปัจจุบัน สะท้อนให้เห็นถึงการช่วย ดังนั้น ผลลัพธ์เหล่านี้ขอแนะนำว่า ประสิทธิภาพของของคำนามภาษาอย่างมีนัยสำคัญลดลงเมื่อนำมาพิจารณาข้อมูลจากผู้สังเกตการณ์ที่แตกต่างกัน ในคำอื่น ๆ ไม่ได้ทั่วไปคุณลักษณะที่มีอยู่มากที่สุดในการกำหนดสถานะ/ขาดงานมะเร็งเต้านม เกี่ยวกับสัดส่วนสอง ผลการทดลองแสดง 2-4 ที่มีความแปรผัน interobserver นัยนำเสนอข้อมูล: ทั่วโลก ผู้สังเกตการณ์ที่เห็นเหมือนกัน ภายใน พวกเขาเห็นสิ่งที่แตกต่างกัน หมายความว่า พวกเขาจะคำนึงถึงข้อมูลเพิ่มเติมกว่าที่สื่อถึงข้อมูล เช่น พวกเขากำลังใช้ความรู้เพิ่มเติมเพื่อตัดสินใจ จะต้องพูดว่า กระบวนการหรือกระบวนการที่ cytopathologists ทำตามเพื่อให้การวินิจฉัยขั้นสุดท้ายไม่ได้ยัง และสามารถอธิบายสินค้าเป็นบางส่วนในการรู้จำแบบมีตรรกะ [8] ใช้เป็นครั้งคราวเท่านั้น ผลของเราสนับสนุนการค้นหานี้ นอกจากนี้ เป็น al. ร้อยเอ็ดขนชี้ คุณลักษณะการเข้ารหัสใน datasets มะเร็งเต้านมที่ใช้ในการศึกษาปัจจุบันถูกทำ โดย cytopathologists ผู้เชี่ยวชาญ ผู้ดำเนินการส่วนใหญ่ของการประมวลผลที่อาจจะต้องแก้ไขปัญหาการวินิจฉัย ถ้าเป็นจริง แล้วมีงานน้อยซ้ายไป classifier ใด ๆ ที่ใช้ datasets เหล่านี้ ดังนั้น ข้อมูลที่ให้มีตามอัตวิสัยแทนวัตถุประสงค์ เพื่อ ameliorate ปัญหานี้ วิธีการเก็บข้อมูลอื่นเช่นเทคนิคการวิเคราะห์ภาพสามารถใช้เพื่อให้สามารถแยกวัตถุประสงค์มาตรการจากภาพดิจิทัลดิบอย่างนั้น แล้วจะน่าสนใจ ในงานในอนาคต การตรวจสอบความเป็นไปได้ของการสร้างวิสัยทัศน์โมก่อนการประมวลผลความสามารถในการแยกคุณลักษณะ "วัตถุประสงค์" จากภาพวัตถุดิบ ตลอดจนการรวมข้อมูลเพิ่มเติมข้อมูล (เช่นคลินิกรายละเอียดตัวอย่าง) อีกครั้ง การตรวจสอบประสิทธิภาพของคำนามภาษาพันที่ใช้ชุดข้อมูลนี้เพิ่มเติม มีปัญหาที่สำคัญ คุ้มค่า กล่าวถึงเกี่ยวกับลักษณะของฐานข้อมูลคือสูญเสียความรุ่มรวยในแสดงคุณลักษณะ cytopathological: cytopathologists ถูกบังคับให้แสดงคุณลักษณะเหล่านั้นอย่างต่อเนื่องเป็นธรรมชาติในแบบ dichotomized สำรวจที่เกี่ยวข้องจะเป็นที่ของ codifying ลักษณะดังกล่าว มีพลังงานมากขึ้นและร่ำรวยกว่าที่เป็นรหัสไบนารี การทำ มันจะจำเป็นให้ pathologists ประมวลคุณลักษณะโดยใช้ช่วงของค่าที่เป็นไปได้ใหญ่สำหรับแต่ละตัวแปร มันยังจะน่าสนใจมากการประสานของความรู้เดิมในกระบวนการต่าง ๆ ที่นำเสนอเพื่อตรวจสอบถ้าประสิทธิภาพของพวกเขาสามารถได้มากขึ้น

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ที่เรากล่าวถึงในส่วนที่ 1, ผลงานหลักของงานวิจัยนี้คือ (ก) การประเมินผลการปฏิบัติงานของเจ็ดพันล้านลักษณนามในการสั่งซื้อเพื่อตรวจสอบประสิทธิภาพของพวกเขาได้อย่างถูกต้องวินิจฉัยมะเร็งเต้านมโดยใช้สองโลกแห่งความจริงชุดข้อมูลโรคมะเร็งเต้านมและ (ข ) หลักฐานเชิงประจักษ์ว่าปัญหาความแปรปรวน interobserver มีอยู่โดยปริยายในข้อมูลเหล่านี้.
สำหรับผลงานครั้งแรกในผลการทดลองแสดงให้เห็นว่า 1-4 เท่านั้นในชุดข้อมูลที่เก็บรวบรวมโดยผู้สังเกตการณ์เดียว (การทดลองที่ 1) มันเป็นไปได้ที่จะต่อเนื่องและ ได้อย่างถูกต้องดำเนินการ cytodiagnosis ของมะเร็งเต้านม สำหรับการทดลองที่เหลืออยู่ผลลัพธ์ที่แสดงให้เห็นว่าการสังเกตส่วนตัวของตัวอย่างที่นำไปสู่โดยทั่วไปเพื่อประสิทธิภาพที่ดีของ BN ลักษณนาม แม้ไร้เดียงสาลักษณนามเบย์ซึ่งเป็นที่แข็งแกร่งมากเมื่อเสียงเป็นปัจจุบันสะท้อนให้เห็นถึงความผิดปกติดังกล่าว ดังนั้นผลลัพธ์เหล่านี้ขอแนะนำให้ประสิทธิภาพของการจําแนกชนิดของนี้จะลดลงอย่างมากเมื่อข้อมูลจากการสังเกตการณ์ที่แตกต่างกันที่จะถูกนำเข้าบัญชี ในคำอื่น ๆ มันเป็นไปไม่ได้ที่จะพูดคุยซึ่งมีคุณสมบัติเป็นคนที่เกี่ยวข้องมากที่สุดสำหรับการตรวจสอบการปรากฏตัว / ไม่มีของมะเร็งเต้านม เกี่ยวกับผลงานที่สองผลในการทดลอง 2-4 แสดงให้เห็นว่าเป็นความแปรปรวน interobserver โดยปริยายอยู่ในข้อมูล: ทั่วโลกสังเกตการณ์เห็นเดียวกัน; ในพื้นที่ที่พวกเขาเห็นสิ่งที่แตกต่าง นี่ก็หมายความว่าพวกเขาจะคำนึงถึงข้อมูลที่มากขึ้นกว่าที่แสดงให้เห็นในข้อมูล; กล่าวคือพวกเขาจะใช้ความรู้มากขึ้นในการตัดสินใจ มันเป็นสิ่งสำคัญที่จะพูดถึงว่ากระบวนการหรือกระบวนการที่ cytopathologists ปฏิบัติตามเพื่อให้การวินิจฉัยสุดท้ายของพวกเขายังไม่ได้รับยังไม่เข้าใจอย่างเต็มที่และสามารถอธิบายได้บางส่วนในแง่ของการจดจำรูปแบบที่มีการใช้เป็นครั้งคราวของตรรกะแก้ปัญหา [8] ผลของเราสนับสนุนการค้นพบนี้ นอกจากเป็นครอสและอัล ชี้ให้เห็นคุณลักษณะทั้งหมดที่เขียนในชุดข้อมูลโรคมะเร็งเต้านมที่ใช้ในการศึกษาครั้งนี้ได้ทำโดยผู้เชี่ยวชาญ cytopathologists ที่ดำเนินการมากที่สุดของการประมวลผลที่จำเป็นอาจจะแก้ปัญหาการวินิจฉัย ถ้าเป็นจริงแล้วมีงานเล็ก ๆ น้อย ๆ จากซ้ายไปลักษณนามที่ใช้ชุดข้อมูลเหล่านี้ ดังนั้นข้อมูลที่ให้มีความเป็นส่วนตัวมากกว่าวัตถุประสงค์ เพื่อเยียวยาปัญหานี้วิธีการเก็บรวบรวมข้อมูลทางเลือกเช่นเทคนิคการวิเคราะห์ภาพที่สามารถนำมาใช้เพื่อให้มาตรการวัตถุประสงค์จากภาพดิจิตอลตัวอย่างดิบสามารถสกัด จากนั้นก็จะเป็นที่น่าสนใจในการทำงานในอนาคต, การตรวจสอบความเป็นไปได้ของการสร้างโมดูลวิสัยทัศน์ก่อนการประมวลผลความสามารถในการสกัด "เป้าหมาย" คุณสมบัติจากภาพดิบเช่นเดียวกับการบูรณาการข้อมูลเพิ่มเติมในข้อมูล (เช่นรายละเอียดทางคลินิกเป็นต้น) และอีกครั้งการตรวจสอบประสิทธิภาพการทำงานของลักษณนาม BN ใช้ชุดข้อมูลที่ขยายนี้ ปัญหาที่สำคัญมูลค่าการกล่าวขวัญเกี่ยวกับลักษณะของฐานข้อมูลเป็นที่ของการสูญเสียความอุดมสมบูรณ์ในการเป็นตัวแทนของคุณสมบัติ cytopathological ที่: cytopathologists ถูกบังคับให้เป็นตัวแทนของคุณสมบัติเหล่านั้นอย่างต่อเนื่องตามธรรมชาติในทาง dichotomized สำรวจที่เกี่ยวข้องจะเป็นที่เป็นไปได้ของประมวลกฎหมายลักษณะดังกล่าวมีอำนาจมากขึ้นและความอุดมสมบูรณ์กว่าที่ของการเข้ารหัสไบนารี ต้องการทำเช่นนั้นก็จะมีความจำเป็นที่จะช่วยให้นักพยาธิวิทยาเพื่อประมวลคุณสมบัติโดยใช้ช่วงที่ใหญ่กว่าของค่าที่เป็นไปได้สำหรับแต่ละตัวแปร นอกจากนี้ยังจะน่าสนใจมากในการสำรวจรวมตัวกันของความรู้ก่อนในขั้นตอนการที่แตกต่างกันที่นำเสนอนี้เพื่อตรวจสอบว่าผลการดำเนินงานของพวกเขาได้ดีขึ้นอย่างมีนัยสำคัญ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ตามที่กล่าวไว้ในมาตรา 1 ผลงานหลักของบทความนี้คือ ( 1 ) การประเมินสมรรถนะของเจ็ดพันล้านคำลักษณนามในการตรวจสอบประสิทธิภาพของพวกเขาถูกต้องวินิจฉัยมะเร็งเต้านมโดยใช้สองจริงข้อมูลมะเร็งเต้านม และ ( ข ) หลักฐานเชิงประจักษ์ว่า การ interobserver ปัญหาโดยปริยาย ที่มีอยู่ในข้อมูลเหล่านี้
สำหรับส่วนแรกผลลัพธ์ในการทดลองที่ 1 และ 4 พบว่าเฉพาะในข้อมูลที่เก็บรวบรวมโดยผู้สังเกตการณ์เดี่ยว ( การทดลองที่ 1 ) เป็นไปได้อย่างต่อเนื่องและถูกต้องดำเนินการไครโอเจนนิกส์ของมะเร็งเต้านม สำหรับการทดลองที่เหลือ ผลที่ได้แสดงให้เห็นว่าแบบอัตนัยของตัวอย่างข้อมูลทั่วไป เพื่อประสิทธิภาพที่ดีของโครงการ คือ แม้แต่นาไตได้แบบเบส์ ,ที่แข็งแกร่งมากเมื่อเสียงอยู่ที่สะท้อนให้เห็นเป็นมิติ ดังนั้น ผลลัพธ์เหล่านี้ขอแนะนำให้ประสิทธิภาพของชนิดของคำจะลดลงอย่างมากเมื่อข้อมูลจากผู้สังเกตการณ์ที่แตกต่างกันที่จะเข้าบัญชี ในคำอื่น ๆมันเป็นไปไม่ได้ที่จะอนุมานซึ่งคุณลักษณะที่เกี่ยวข้องมากที่สุดสำหรับการมี / ไม่มีของโรคมะเร็งเต้านมในส่วนที่สอง ผลลัพธ์ในการทดลองที่ 2 และ 4 แสดงให้เห็นว่า การเป็น interobserver โดยปริยาย ปัจจุบันในข้อมูล : ทั่วโลก , ผู้สังเกตการณ์เห็นเดียวกัน ในประเทศที่พวกเขาเห็นสิ่งที่แตกต่างกัน นี้หมายความว่าพวกเขาจะพิจารณาข้อมูลเพิ่มเติมกว่าที่ปรากฎในข้อมูล เช่น มีการใช้ความรู้ในการตัดสินใจมันเป็นสิ่งสำคัญที่จะระบุว่ากระบวนการหรือกระบวนการที่ cytopathologists ตามเพื่อให้วินิจฉัยขั้นสุดท้ายของพวกเขาไม่ได้ แต่เข้าใจและสามารถอธิบายในแง่ของรูปแบบบางส่วนที่มีการใช้เป็นครั้งคราวของฮิวริสติกตรรกะ [ 8 ] ผลของเราสนับสนุนการค้นพบนี้ นอกจากนี้ เป็นครอส et al . ออกจากจุดคุณลักษณะทั้งหมดที่เขียนในมะเร็งเต้านม ข้อมูลที่ใช้ในการศึกษาดำเนินการโดยผู้เชี่ยวชาญ cytopathologists ที่ดำเนินการมากที่สุดของการประมวลผลที่อาจต้องแก้ปัญหาวินิจฉัย ถ้าเป็นเรื่องจริง มีงานเหลือๆใช้ลักษณนามว่า ข้อมูลเหล่านี้ ดังนั้น ข้อมูลที่ให้มีอัตนัยมากกว่าวัตถุประสงค์ปรับปรุงปัญหานี้ วิธีการเก็บรวบรวมข้อมูลอื่น เช่น เทคนิคการวิเคราะห์ภาพ สามารถใช้เพื่อวัตถุประสงค์ต่างๆ จากตัวอย่างภาพดิจิตอลดิบสามารถสกัดได้ มันก็น่าสนใจ ในการทำงานในอนาคตเพื่อศึกษาความเป็นไปได้ของการสร้างวิสัยทัศน์โมดูลการประมวลผลสามารถสกัด " วัตถุประสงค์ " คุณสมบัติจากภาพดิบ ตลอดจนการบูรณาการข้อมูลเพิ่มเติมในข้อมูล ( เช่น รายละเอียดทางคลินิกสำหรับอินสแตนซ์ ) และอีกครั้งตรวจสอบประสิทธิภาพของคำลักษณนามที่ใช้น้ำมันนี้ขยายชุดข้อมูล . ปัญหาสำคัญปัญหาหนึ่งมูลค่าการกล่าวขวัญเกี่ยวกับลักษณะของฐานข้อมูล คือเรื่องของการสูญเสียของความมั่งคั่งในการเป็นตัวแทนของลักษณะ cytopathological : cytopathologists ถูกบังคับให้ตัวแทนเหล่านั้นอย่างต่อเนื่องตามธรรมชาติใน dichotomized คุณสมบัติทาง การสำรวจที่เกี่ยวข้องจะว่า ความเป็นไปได้ของการควบคุมลักษณะดังกล่าวมีอำนาจและร่ำรวยกว่าของ Binary นะครับ ทำดังนั้นจำเป็นต้องให้นักไปในลักษณะการใช้ช่วงใหญ่ของค่าที่เป็นไปได้ของแต่ละตัวแปร จะน่าสนใจมากที่จะสำรวจการประสานความรู้ในวิธีการนำเสนอที่แตกต่างกันเพื่อดูว่าประสิทธิภาพของพวกเขาสามารถปรับปรุงอย่างมากที่นี่

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.