Many clinical studies contain strokes of unknown type. Two statistical learning methods, lasso logistic regression and random forest, plus multiple imputation were applied to the Systolic Hypertension in the Elderly Program (SHEP) dataset to classify strokes of unknown type using patient characteristics. Impact of the newly classified strokes on ischemic and hemorrhagic stroke risk ratios (RR) in the active versus placebo groups was determined.
Study design: SHEP was a randomized trial with 4736 participants aged 60 years or older with isolated systolic hypertension who were randomly assigned to receive antihypertensive treatment or placebo. Mean follow-up was 4.5 years. A total of 262 incident strokes occurred (217 ischemic, 28 hemorrhagic and 17 unknown). The adjusted RR of ischemic stroke in the active group versus placebo was 0.63, 95% confidence interval (CI) [0.48–0.82] and for hemorrhagic stroke was 0.46, 95% CI [0.21–1.02].
Methods: Patient characteristics were compared between known and unknown strokes, and between stroke types. The known strokes were split into training and test sets for purposes of model building and determining prediction accuracy. Univariate logistic regression, lasso logistic regression and random forests were performed on the training set. Prediction accuracy was gauged using ROC curves on the test set. Multiple imputation was employed to account for prediction uncertainty. Univariate and multivariate Cox regressions were performed on the imputed datasets.
Results: The lasso method performed slightly better [AUC = 0.61, 95% CI (0.36–0.86)] than the random forest method [AUC = 0.603, 95% CI (0.35–0.85)] and was chosen to classify the unknown strokes. The posterior probabilities were used to impute 20 complete data sets. Application of Rubin’s formula to univariate and multivariate Cox regression models from the imputed data sets gave similar RRs to the original results for hemorrhagic and ischemic stroke with slightly wider 95% CI’s. Conclusions: Neither lasso nor random forest performed very well in classifying the 17 unknown strokes in SHEP, likely due to small sample size. Statistical learning combined with multiple imputation is a potentially valuable tool in classifying stroke type in clinical studies with large sample size
การศึกษาทางคลินิกหลายประกอบด้วยจังหวะไม่ทราบชนิด 2 การเรียนรู้วิธีการทางสถิติบ่วงถดถอยโลจิสติกแบบป่า บวกหลายส่วนบุคคลเพื่อใช้ในโปรแกรมผู้สูงอายุ ความดันโลหิตสูง systolic ( เชฟ ) ข้อมูลเพื่อจำแนกชนิดโดยใช้ลักษณะที่จังหวะของผู้ป่วย ผลกระทบของการจัดจังหวะในผู้ป่วยโรคหลอดเลือดสมองตีบใหม่และอัตราส่วนความเสี่ยง ( RR ) ในการใช้งานเมื่อเทียบกับยาหลอกในกลุ่มถูกกำหนดไว้รูปแบบการศึกษา : เชพเป็นการวิจัยเชิงทดลองแบบมี 4736 ผู้ที่มีอายุ 60 ปีขึ้นไป กับแยก systolic ความดันโลหิตสูงที่ครั้งนี้มีวัตถุประสงค์ เพื่อรับการรักษาความดันโลหิตสูงหรือยาหลอก หมายถึงการติดตามคือ 4.5 ปี ทั้งหมด 262 เหตุการณ์ที่เกิดขึ้น ( แต่ลายเส้นเลือดตกเลือด , 28 และ 17 ไม่ทราบ ) ปรับ RR ของโรคหลอดเลือดสมองตีบในกลุ่มใช้เมื่อเทียบกับยาหลอก คือ 0.63 , ช่วงความเชื่อมั่น 95% ( CI ) [ 3 ] และ 0.48 และผู้ป่วยโรคหลอดเลือดสมองเป็น 0.46 , 95% CI [ 0.21 – 1.02 ]วิธีการ : ลักษณะเปรียบเทียบระหว่างผู้ป่วยที่รู้จักและไม่รู้จัก ลายเส้น และ ระหว่างรูปแบบจังหวะ รู้จักจังหวะแบ่งออกเป็นการฝึกอบรมและชุดทดสอบสำหรับวัตถุประสงค์ของรูปแบบอาคาร และการตรวจสอบความถูกต้องพยากรณ์ univariate logistic regression บ่วงถดถอยโลจิสติก , แบบป่าจำนวนการตั้งค่า ความถูกต้องของการทำนายถูกจำกัดโดยใช้เส้นโค้ง ROC ในการทดสอบชุด การใช้บัญชีหลายตำหนิความไม่แน่นอนพยากรณ์ และสมการถดถอยหลายตัวแปรทั้งสอง Cox จำนวนใดๆในชุดข้อมูลผลลัพธ์ : บ่วงบาศวิธีปฏิบัติดีขึ้นเล็กน้อย [ ยา = 0.61 , 95% CI ( 0.36 ( 0.86 ) กว่าสุ่มวิธีป่า [ = ค่าความเข้มข้น , 95% CI ( 0.35 – 0.85 ) ] และเลือกที่จะแยกประเภทลายเส้นที่ไม่รู้จัก น่าจะเป็นด้านหลังถูกใส่ความ 20 ข้อมูลเสร็จสมบูรณ์ชุด การใช้สูตรการรักษาของ Rubin และค็อกซ์ถดถอยหลายตัวแปรแบบจากชุดข้อมูลใดๆให้ rrs คล้ายกับผลลัพธ์เดิม สำหรับผู้ป่วยโรคหลอดเลือดสมองตีบกว้างขึ้นเล็กน้อยและมี 95% CI . ข้อสรุป และเชือกหรือสุ่มป่าแสดงได้ดีมากเมื่อ 17 ไม่รู้จักจังหวะในเชพ น่าจะเกิดจากกลุ่มตัวอย่างขนาดเล็ก สถิติเรียนรวมกับหลายส่วนบุคคลเป็นเครื่องมือที่มีคุณค่าที่อาจเกิดขึ้นเมื่อจังหวะชนิดในการศึกษาทางคลินิกที่มีขนาดตัวอย่างใหญ่
การแปล กรุณารอสักครู่..
