Figure 1: Twitter data collection method. For users (red) who scored positively for depression, we date back from the reported onset of depression up to one year, and collect all of their Twitter postings. For users (blue) scoring negatively for depression, we collect one year of their Twitter feeds dating back from the day the survey was taken.
In our final data set of 476 users, we used the responses to the CES-D questionnaires as our primary depression level estimation tool. With CES-D, typically three groups of depression severity are calculated (Radloff, 1977): low (0-15), mild to moderate (16-22), and high range (23-60). The literature indicates that a cut-off of 16 is prone to yielding a high number of false-positives. Thus, several studies adopt higher cut-offs (e.g., 20, 22, or 27). In this work, we used 22 as our chosen threshold (also see Park et. al., (2012)), to minimize Type I and Type II errors in our subsequent prediction task.
We obtained 171 users (~36%) who scored positive for depression. We note that Park et. al., (2012) found a similar percentage of individuals in their study, scoring positively for depression. Two classes of users were construct-ed in this manner: an MDD positive class of 171 users scoring high for depression; and negative class of 305 users: ones with little or no signs of the condition.
รูปที่ 1: ทวิตเตอร์วิธีเก็บรวบรวมข้อมูล สำหรับผู้ใช้ (แดง) คะแนนบวกสำหรับภาวะซึมเศร้า เราวันกลับจากเริ่มรายงานโรคซึมเศร้าขึ้นหนึ่งปี และรวบรวมบัญชี Twitter ของพวกเขา สำหรับผู้ใช้ (สีฟ้า) ให้คะแนนลบสำหรับภาวะซึมเศร้า เรารวบรวมหนึ่งปีของตัวดึงข้อมูล Twitter การเดทหลังจากวันที่ได้ดำเนินการสำรวจในของเราสุดท้ายชุดข้อมูลของผู้ใช้ที่ 476 เราใช้การตอบรับแบบสอบถามที่งาน CES D เป็นเครื่องมือประเมินระดับของภาวะซึมเศร้าหลัก กับงาน CES-D โดยทั่วไปความรุนแรงของภาวะซึมเศร้ากลุ่มคำนวณ (Radloff, 1977): ต่ำ (0-15) (23-60) อยู่ในช่วงอ่อนบรรเทา (16-22), และสูง วรรณกรรมบ่งชี้ว่า ตัดของ 16 แนวโน้มให้ผลผลิตสูงจำนวนทำงานผิดพลาดไม่ ดังนั้น ศึกษาหลายนำสูงตัดเลือก (เช่น 20, 22 หรือ 27) ในงานนี้ เราใช้ 22 เป็นขีดจำกัดของเราท่าน (ยังเห็นสวนร้อยเอ็ด. al., (2012)), ย่อพิมพ์ฉันและ II ชนิดข้อผิดพลาดในงานของเราทำนายตามมาเรารับ 171 ผู้ (~ 36% คะแนนเป็นบวกสำหรับภาวะซึมเศร้า เราสังเกตว่า สวนร้อยเอ็ด al., (2012) พบเปอร์เซ็นต์เหมือนของบุคคลในการเรียน คะแนนบวกสำหรับภาวะซึมเศร้า ชั้นสองของผู้ใช้ได้สร้าง-ed ในลักษณะนี้: คลาสที่มีบวก MDD ผู้ 171 คะแนนสูงในโรคซึมเศร้า และลบคลาสของผู้ใช้ 305: คน มีน้อย หรือไม่มีเงื่อนไขในการ
การแปล กรุณารอสักครู่..

รูปที่ 1 : วิธีเก็บข้อมูล Twitter สำหรับผู้ใช้ ( สีแดง ) ที่ได้คะแนนบวก ซึมเศร้า เราอาจกลับมาจากรายงานการโจมตีของภาวะซึมเศร้าถึงหนึ่งปีและเก็บทั้งหมดของการโพสต์ที่ Twitter ของพวกเขา สำหรับผู้ใช้ ( สีฟ้า ) ให้คะแนนลบ ซึมเศร้า เรารวบรวมฟีดที่ Twitter ของพวกเขาหนึ่งปีย้อนหลังจากวันสำรวจถ่าย .
ในข้อมูลชุดสุดท้ายของเราแล้ว ผู้ใช้เราใช้คำตอบที่ดีในระดับภาวะซึมเศร้าหลักของเรา ค่าเครื่องมือ กับแบบปกติกลุ่มที่ 3 ความรุนแรงของภาวะซึมเศร้า คำนวณ ( radloff , 1977 ) : ต่ำ ( 0-15 ) เล็กน้อยถึงปานกลาง ( 16-22 ) และสูงช่วง ( 23-60 ) วรรณคดี แสดงว่าตัด 16 มีแนวโน้มที่จะให้ผลผลิตเป็นจำนวนสูงของผลบวกปลอม ดังนั้นหลายการศึกษาอุปการะสูงตัดไม่ชอบ ( e.g . , 20 , 22 , 27 ) ในงานนี้ เราใช้เป็นเกณฑ์การเลือกของเรา 22 ( ยังเห็นปาร์ค et al . , ( 2012 ) เพื่อลด ชนิด และประเภทที่สองข้อผิดพลาดในงานพยากรณ์ของเราที่ตามมา เราได้รับผู้ใช้ 171
~ i ( 36% ) ที่ได้คะแนนบวกสำหรับภาวะซึมเศร้า เราทราบว่าปาร์ค et al . , ( 2555 ) พบว่าเปอร์เซ็นต์ที่คล้ายคลึงกันของบุคคลในการศึกษาของพวกเขาคะแนนบวกสำหรับภาวะซึมเศร้า สองประเภทของผู้ใช้ถูกสร้างเอ็ดในลักษณะนี้ : mdd บวกห้อง 171 ผู้ใช้คะแนนสูง ซึมเศร้า และชั้นเชิงลบของผู้ใช้ : 305 ที่มีสัญญาณน้อย หรือ ไม่มีเงื่อนไข
การแปล กรุณารอสักครู่..
