Decision trees are powerful classif

Decision trees are powerful classification algorithms that are becoming increasingly more popular with the growth of data mining
in the field of information systems. Popular decision tree algorithms include Quinlan’s ID3, C4.5, C5 [18, 19], and Breiman et
al.’s CART [20]. As the name implies, this technique recursively separates observations in branches to construct a tree for the
purpose of improving the prediction accuracy. CART builds classification and regression trees for predicting continuous
dependent variables (regression) and categorical predictor variables (classification). The classic CART algorithm was popularized
by Breiman et al. (Breiman, Friedman, Olshen, & Stone, 1984; see also Ripley, 1996). Although researchers are investigating
enhancing CART performance in classification problems, less research is done on enhancing CART performance in disease
diagnosis especially in diagnosis of heart disease. In this paper, existing method (CART) is applied to detect heart disease which
takes more time and more memory to produce the result. CART(Classification and Regression Tree) uses Gini index to measure
the impurity of a partition or set of training tuples. It can handle high dimensional categorical data. Decision Trees can also handle
continuous data (as in regression) but they must be converted to categorical data. The CART decision tree algorithm can be used
to build both classification trees (to classify categorical response variables) and regression trees (to forecast continuous response
variables). It can handle high dimensional categorical data. In most cases, the interpretation of results summarized in a tree is very
simple. This simplicity is useful not only for purposes of rapid classification of new observations (it is much easier to evaluate just
one or two logical conditions, than to compute classification scores for each possible group, or predicted values, based on all
predictors and using possibly some complex nonlinear model equations), but can also often yield a much simpler "model" for
explaining why observations are classified or predicted in a particular manner. The final results of using tree methods for
classification or regression can be summarized in a series of (usually few) logical if-then conditions (tree nodes). Therefore, there
is no implicit assumption that the underlying relationships between the predictor variables and the dependent variable are linear,
follow some specific non-linear link function, or that they are even monotonic in nature. Thus, tree methods are particularly well
suited for data mining tasks, where there is often little a priori knowledge nor any coherent set of theories or predictions regarding
which variables are related and how. In those types of data analyses, tree methods can often reveal simple relationships between
just a few variables that could have easily gone unnoticed using other analytic techniques.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ต้นไม้ตัดสินใจเป็นอัลกอริทึมการจัดประเภทที่มีประสิทธิภาพที่จะเป็นที่นิยมมากขึ้นมากขึ้น มีการเติบโตของการทำเหมืองข้อมูลในเขตข้อมูลของระบบสารสนเทศ ตัดสินใจที่นิยมต้นไม้อัลกอริทึมรวมของ Quinlan ID3, C4.5, C5 [18, 19], Breiman และร้อยเอ็ดรถเข็นของ al. [20] ตามความหมายของชื่อ นี้ recursively เทคนิคแยกสังเกตสาขาเพื่อสร้างแผนภูมิสำหรับการวัตถุประสงค์ของการปรับปรุงความแม่นยำของการคาดเดา รถสร้างต้นไม้การจัดประเภทและการถดถอยสำหรับการคาดการณ์อย่างต่อเนื่องขึ้นอยู่กับตัวแปร (ถดถอย) และตัวแปร predictor แน่ชัด (จัดประเภท) อัลกอริทึมรถคลาสสิกถูก popularizedโดย Breiman et al. (Breiman ฟรีดแมน Olshen และ หิน 1984 ดูริบ 1996) แม้ว่านักวิจัยจะตรวจสอบเพิ่มประสิทธิภาพของรถเข็นในปัญหาประเภท วิจัยน้อยจะทำเกี่ยวกับการเพิ่มประสิทธิภาพของรถเข็นในโรคการวินิจฉัยโดยเฉพาะอย่างยิ่งในการวินิจฉัยโรคหัวใจ ในเอกสารนี้ วิธีการที่มีอยู่ (รถเข็น) จะใช้เพื่อตรวจหาโรคหัวใจที่ใช้เวลาและหน่วยความจำเพิ่มเติมจะทำให้ได้ผลลัพธ์ รถเข็น (การจัดประเภทและแผนภูมิการถดถอย) ใช้ดัชนี Gini วัดมลทินของพาร์ติชันหรือชุดฝึกอบรม tuples มันสามารถจัดการกับข้อมูลแน่ชัดมิติสูง นอกจากนี้ยังสามารถจัดการต้นไม้ตัดสินใจข้อมูลต่อเนื่อง (ในถดถอย) แต่พวกเขาต้องถูกแปลงเป็นข้อมูลที่แน่ชัด สามารถใช้รถเข็นตัดสินใจทรีอัลกอริทึมสร้างต้นไม้ประเภท (การจัดประเภทตัวแปรตอบสนองแน่ชัด) และต้นไม้ถดถอย (การคาดการณ์ผลตอบรับอย่างต่อเนื่องตัวแปร) มันสามารถจัดการกับข้อมูลแน่ชัดมิติสูง ในกรณีส่วนใหญ่ การตีความผลที่สรุปไว้ในต้นไม้มากเป็นง่าย ๆ ความเรียบง่ายนี้จะเป็นประโยชน์ไม่เฉพาะสำหรับวัตถุประสงค์ของการจัดประเภท (จึงง่ายมากที่จะประเมินเพียงสังเกตใหม่อย่างรวดเร็วหนึ่ง หรือสองตรรกศาสตร์เงื่อนไข กว่าการคำนวณจัดประเภทคะแนนสำหรับแต่ละกลุ่มได้ หรือค่าคาดการณ์ ยึดทั้งหมดpredictors และอาจบางคอมเพล็กซ์ไม่เชิงเส้นโดยใช้แบบจำลองสมการ), แต่สามารถจะผลตอบแทนมากง่ายกว่า "แบบ" สำหรับอธิบายเหตุสังเกตจำแนก หรือทำนายในลักษณะเฉพาะ ผลสุดท้ายของการใช้แผนภูมิวิธีการจัดประเภทหรือถดถอยสามารถสรุปเป็นชุดข้อมูล (มักน้อย) ตรรกะเงื่อนไขถ้าแล้ว (โหนดแผนภูมิ) ดังนั้น มีมีอัสสัมชัญไม่นัยที่เน้นความสัมพันธ์ระหว่างตัวแปร predictor และขึ้นอยู่กับตัวแปรเชิงเส้นตามฟังก์ชันไม่เชิงเส้นการเชื่อมโยงเฉพาะบาง หรือ ที่พวกเขาอยู่แม้ monotonic ในธรรมชาติ ดังนั้น แผนภูมิวิธีจะดีโดยเฉพาะอย่างยิ่งเหมาะสำหรับงานการทำเหมืองข้อมูล ไม่มีมัก priori ความรู้น้อยหรือชุดใด ๆ coherent ของทฤษฎีหรือคาดคะเนเกี่ยวกับตัวแปรที่เกี่ยวข้อง และวิธีการ ในบรรดาชนิดของการวิเคราะห์ข้อมูล แผนภูมิวิธีสามารถมักจะเปิดเผยเรื่องความสัมพันธ์ระหว่างเพียงไม่กี่ตัวแปรที่อาจมีได้ไปสังเกตโดยใช้เทคนิคคู่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ต้นไม้การตัดสินใจเป็นขั้นตอนวิธีการจัดหมวดหมู่ที่มีประสิทธิภาพที่มากขึ้นจะกลายเป็นที่นิยมมากขึ้นกับการเจริญเติบโตของการทำเหมืองข้อมูล
ในด้านของระบบสารสนเทศ อัลกอริทึมต้นไม้ตัดสินใจที่นิยม ได้แก่ ควินแลนของ ID3, C4.5, C5 [18 19] และ Breiman et
al. รถเข็นของ [20] เป็นชื่อที่แสดงถึงเทคนิคนี้ซ้ำแยกสังเกตในสาขาที่จะสร้างต้นไม้สำหรับ
วัตถุประสงค์ของการปรับปรุงความถูกต้องคาดการณ์ รถเข็นสร้างต้นไม้การจัดหมวดหมู่และการถดถอยอย่างต่อเนื่องในการทำนาย
ตัวแปรตาม (ถดถอย) และตัวแปรเด็ดขาด (จำแนกประเภท) อัลกอริทึมรถคลาสสิกเป็นที่นิยม
โดย Breiman et al, (Breiman ฟรีดแมน, Olshen และหิน 1984; ดูริปลีย์, 1996) แม้ว่านักวิจัยจะตรวจสอบ
รถเข็นเพิ่มประสิทธิภาพในการจัดหมวดหมู่ปัญหาการวิจัยน้อยจะทำในการเพิ่มประสิทธิภาพในรถเข็นโรค
การวินิจฉัยโรคโดยเฉพาะอย่างยิ่งในการวินิจฉัยของโรคหัวใจ ในบทความนี้วิธีการที่มีอยู่ (รถเข็น) ถูกนำไปใช้ในการตรวจสอบการเกิดโรคหัวใจที่
ต้องใช้เวลามากขึ้นและมีหน่วยความจำมากขึ้นในการผลิตผล รถเข็น (ต้นไม้การจัดหมวดหมู่และการถดถอย) ใช้ดัชนี Gini เพื่อวัดความ
บริสุทธิ์ของพาร์ทิชันหรือชุดของ tuples การฝึกอบรม มันสามารถจัดการข้อมูลที่สูงมิติเด็ดขาด ต้นไม้การตัดสินใจนอกจากนี้ยังสามารถจัดการ
ข้อมูลอย่างต่อเนื่อง (ในขณะที่การถดถอย) แต่พวกเขาจะต้องถูกแปลงเป็นข้อมูลที่แน่ชัด ขั้นตอนวิธีการตัดสินใจรถเข็นต้นไม้สามารถนำมาใช้
ในการสร้างทั้งต้นไม้การจัดหมวดหมู่ (การจำแนกตัวแปรตอบสนองเด็ดขาด) และต้นถดถอย (ที่จะคาดการณ์การตอบสนองอย่างต่อเนื่อง
ตัวแปร) มันสามารถจัดการข้อมูลที่สูงมิติเด็ดขาด ในกรณีส่วนใหญ่การแปลผลสรุปในต้นเป็นอย่างมาก
ที่เรียบง่าย ความเรียบง่ายนี้จะเป็นประโยชน์ไม่เพียง แต่สำหรับวัตถุประสงค์ของการจัดหมวดหมู่อย่างรวดเร็วของการสำรวจใหม่ (มันง่ายมากที่จะประเมินเพียง
หนึ่งหรือสองเงื่อนไขตรรกะมากกว่าที่จะคำนวณคะแนนการจัดหมวดหมู่สำหรับแต่ละกลุ่มเป็นไปได้หรือค่าคาดการณ์บนพื้นฐานของทุก
การพยากรณ์และการใช้อาจจะเป็นบางส่วน สมการเชิงเส้นรูปแบบที่ซับซ้อน) แต่ก็มักจะสามารถให้ผลผลิตที่ง่ายมาก "รูปแบบ" สำหรับ
การอธิบายว่าทำไมการสังเกตจะจัดหรือที่คาดการณ์ไว้ในลักษณะที่เฉพาะเจาะจง ผลสุดท้ายของการใช้วิธีต้นไม้
การจัดหมวดหมู่หรือการถดถอยสามารถสรุปได้ในชุดของ (ปกติไม่กี่) ตรรกะแล้วถ้าเงื่อนไข (โหนด) ดังนั้นจึงมีความ
เป็นสมมติฐานที่ไม่มีนัยที่ความสัมพันธ์พื้นฐานระหว่างตัวแปรและตัวแปรตามเป็นเส้นตรง
ตามฟังก์ชั่นการเชื่อมโยงบางอย่างที่ไม่ใช่เชิงเส้นที่เฉพาะเจาะจงหรือว่าพวกเขาจะได้ต่อเนื่องในธรรมชาติ ดังนั้นวิธีการที่ต้นไม้โดยเฉพาะอย่างยิ่ง
เหมาะสำหรับการทำเหมืองข้อมูลงานที่มักจะมีเล็ก ๆ น้อย ๆ ความรู้เบื้องต้นหรือชุดใด ๆ ที่เชื่อมโยงกันของทฤษฎีหรือการคาดการณ์เกี่ยวกับการ
ที่เกี่ยวข้องตัวแปรและวิธีการ ในประเภทที่วิเคราะห์ข้อมูลวิธีต้นไม้มักจะสามารถที่จะเปิดเผยความสัมพันธ์ระหว่างง่าย
เพียงตัวแปรไม่กี่คนที่จะได้ไปไม่มีใครสังเกตเห็นได้อย่างง่ายดายโดยใช้เทคนิคการวิเคราะห์อื่น ๆ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ต้นไม้การตัดสินใจเป็นขั้นตอนวิธีการจำแนกที่มีประสิทธิภาพจะกลายเป็นที่นิยมมากขึ้นมากขึ้นกับการเติบโตของข้อมูลเหมืองแร่
ในด้านระบบข้อมูล ขั้นตอนวิธีต้นไม้การตัดสินใจยอดนิยมรวมถึง ควินแลนของ ID3 , โปรแกรม C4.5 , C5 [ 18 , 19 ] และ breiman et
อัล ซื้อ [ 20 ] เป็นชื่อนัย , เทคนิคนี้ recursively แยกสังเกตในสาขาการสร้างต้นไม้
วัตถุประสงค์ของการปรับปรุงค่าความถูกต้อง รถเข็นสร้างการจำแนกและการถดถอยต้นไม้ทำนายตัวแปรอย่างต่อเนื่อง
( ถดถอย ) และตัวแปรเชิงกลุ่ม ( หมวดหมู่ ) ขั้นตอนวิธีรถเข็นคลาสสิคถูก popularized
โดย breiman et al . ( breiman Friedman olshen & , , หิน , 1984 , ดูละคร , 1996 ) ถึงแม้ว่านักวิจัยได้ตรวจสอบ
การเพิ่มสมรรถนะรถในปัญหาการวิจัยน้อยทำในการเพิ่มประสิทธิภาพในการวินิจฉัยโรคโดยเฉพาะโรค
รถเข็นในการวินิจฉัยโรคหัวใจ ในกระดาษนี้ วิธีการที่มีอยู่ ( รถเข็น ) จะใช้เพื่อตรวจหาโรคหัวใจที่
ใช้เวลามากขึ้นและหน่วยความจำมากขึ้นเพื่อผลิตผล รถเข็น ( หมวดหมู่ต้นไม้ถดถอย ) ใช้วัด
ดัชนีจีนีความสกปรกของพาร์ทิชันหรือชุดของที่มีการฝึกอบรม มันสามารถจัดการกับสูงขนาดจำแนกประเภทข้อมูล ต้นไม้การตัดสินใจสามารถจัดการ
ข้อมูลอย่างต่อเนื่อง ( ในการ ) แต่พวกเขาจะต้องถูกแปลงเป็นข้อมูลเชิงคุณภาพ รถเข็นสามารถใช้ขั้นตอนวิธีต้นไม้ตัดสินใจ
สร้างทั้งหมวดหมู่ต้นไม้ ( จัดกลุ่มตัวแปรตอบสนองอย่างแท้จริง ) และสมการถดถอยต้นไม้ ( พยากรณ์
การตอบสนองอย่างต่อเนื่องตัวแปร ) มันสามารถจัดการกับสูงขนาดจำแนกประเภทข้อมูล ในกรณีส่วนใหญ่ , การตีความของผลสรุปในต้นไม้มาก
ง่ายๆ ความเรียบง่ายนี้จะเป็นประโยชน์ไม่เพียง แต่เพื่อวัตถุประสงค์ของการจัดหมวดหมู่ของข้อมูลใหม่อย่างรวดเร็ว ( มันเป็นเรื่องง่ายที่จะประเมินแค่
หนึ่งหรือสองตรรกะเงื่อนไข กว่าจะคำนวณคะแนนของแต่ละได้รับการจำแนกกลุ่ม หรือคาดการณ์ตาม
ค่าปัจจัยทำนายและใช้สมการที่ซับซ้อนบางอย่างอาจจะไม่เชิงเส้นแบบ ) แต่ก็มักจะทำให้ง่ายขึ้น " นางแบบ "
อธิบายเหตุผล สังเกตจะแบ่งหรือคาดการณ์ในบางลักษณะ ผลลัพธ์สุดท้ายของโดยใช้วิธีต้นไม้
การจำแนกหรือถดถอยสามารถสรุปในชุด ( ไม่กี่มักจะ ) ตรรกะถ้าเงื่อนไข ( โหนดต้นไม้ ) ดังนั้นจึงมี
ไม่มีนัยสมมติฐานพื้นฐานที่ความสัมพันธ์ระหว่างตัวแปรตัวแปรและตัวแปรเชิงเส้น ,
ตามเฉพาะบางเส้นเชื่อมโยงการทำงาน หรือแม้แต่อย่างเดียวที่พวกเขามีในธรรมชาติ ดังนั้นวิธีการที่ต้นไม้โดยเฉพาะอย่างยิ่งดี
เหมาะสำหรับงานเหมืองข้อมูลที่มักจะมีเพียงเล็กน้อยระหว่างความรู้หรือติดต่อกันชุดทฤษฎีหรือคาดคะเนเกี่ยวกับ
ซึ่งตัวแปรที่เกี่ยวข้องและวิธี ในประเภทของการวิเคราะห์ข้อมูล วิธีการ ต้นไม้ก็มักจะเปิดเผยความสัมพันธ์อย่างง่ายระหว่าง
เพียงไม่กี่ตัวที่สามารถไปสังเกตการใช้เทคนิคเชิงวิเคราะห์อื่น ๆ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.