(This question is an edited version of a question I previously posted which one user recommended would benefit from more focus).
I have 2000 questionnaires from respondents which ask 33 different questions about which issues are present in their lives - i.e. alcohol abuse, domestic violence, mental health, child abuse, learning difficulties etc.
Each question can only be answered yes/no (which I've re-coded as 1/0).
I'd like to use this dataset to start creating n profiles of respondents to define which variables naturally cluster together e.g. (alcohol abuse and domestic violence), (mental health, child abuse, domestic violence), (alcohol abuse, learning difficulties) across some/all of the 33 differnt variables.
A note I've read on-line indicates that hierarchical cluster analysis is not appropriate for a dataset of this scale/type due to sensitivity of the position of how data is sorted in the dataset, and recommends two-step cluster analysis instead.
Consequently, I'd be really interested in your input on whether hierarchical, two-step or other methods are most appropriate for exploring clusters of responses that natually associate together using a binary dataset.
( คำถามนี้เป็นรุ่นแก้ไขของคำถามที่ผมโพสต์ก่อนหน้านี้ที่ผู้ใช้คนหนึ่งที่แนะนำจะได้รับประโยชน์จากโฟกัสมากกว่า )ผมมี 2000 คน จากผู้ตอบแบบสอบถามที่ถามคำถามเกี่ยวกับปัญหาที่แตกต่างกัน 33 อยู่ในชีวิตของพวกเขา - เช่นการละเมิดแอลกอฮอล์ , ความรุนแรงภายในประเทศ , สุขภาพจิต , เด็กและเยาวชน ปัญหาการเรียนรู้ ฯลฯคำถามแต่ละคำถามจะตอบ ใช่ / ไม่ใช่ ( ซึ่งผมจะเขียนเป็น 1 / 0 )ฉันต้องการที่จะใช้ข้อมูลนี้เพื่อเริ่มต้นการสร้าง n โปรไฟล์ของผู้ตอบแบบสอบถามเพื่อกำหนดตัวแปรตามธรรมชาติซึ่งกลุ่มด้วยกันเช่น ( การละเมิดแอลกอฮอล์และความรุนแรงในครอบครัว , สุขภาพจิต , การละเมิดเด็ก , ความรุนแรงในครอบครัว ) , ( การละเมิดแอลกอฮอล์ปัญหาการเรียนรู้ ) ข้ามบางส่วน / ทั้งหมดของ 33 differnt ตัวแปรหมายเหตุ ผมเคยอ่านพบว่า การวิเคราะห์กลุ่มออนไลน์ ลำดับชั้นไม่เหมาะสมสำหรับข้อมูลนี้ขนาด / ชนิด เนื่องจากความไวของตำแหน่งอย่างไรข้อมูล เรียงข้อมูล และแนะนำการวิเคราะห์กลุ่มที่ 2 แทนจากนั้น ฉันสนใจจริงๆในการป้อนข้อมูลของคุณว่าลําดับชั้น 2 หรือวิธีการอื่น ๆ มีความเหมาะสมมากที่สุดสำหรับการสำรวจกลุ่มของการตอบสนองที่ Natually เชื่อมโยงเข้าด้วยกันโดยใช้ข้อมูลไบนารี
การแปล กรุณารอสักครู่..
