3.3. Data analysis frame work
The goal of study is to understand whether the chosen station is the nearest station choice or not (1, or 0). In this sense, the logistic regression model works as a classifier for understanding the probability of choosing the nearest station among the chosen stations. The logistic models estimate the conditional distribu- tion of the response Y, given the input variables X, Pr (Y = 1 |X = x). which is a binary output from the input variables, such as train users' and their trips’ characteristics. The parameters of x, which is best fit to the data, was solved using Maximum likelihood estimation. It can easily modify log p, which has an unbounded range, using logistic transformation, logP=1 _ p, which is the natural logarithm of odds that train users choose the nearest train station. Therefore, we can transform the function of x into linear function. Actually, logistic regression is linear interpolation for the log-odds (Faraway, 2005). Fig. 3 summarises the data analysis procedure. If the chosen station is the nearest station, the dependent variable is one, otherwise it is zero. The independent variables (Xn in Eq. (1)) are the characteristics of chosen stations, individual respondents and their trips. The form of the logistic regression equation is (Ralph et al., 2006): ln p 1 _ p _ _ ¼ b0 þ b1X1 þ b2X2 þ . . . þ bnX2 þ e where p is the proportion of successes;X1 to X2 are independent variables;n is the number of independent variables;b0 is the intercept;bi (i = 1,...,n) are the regression parameters; ande is the random error term. In this study, p represents the proportion choosing the nearest station. And so 1 _ p is the proportion not choosing the nearest station. p=1 _ p is the “odds” of choosing the nearest station. lnp=1 _ p f g is called the “log odds” or the “logit” of Y. Regression parameters, bi (i = 1,..., p), reflect the change in the log odds (or logit) of Y relative to a one unit change in Xi. The independent variables Xi can be continuous or categorical variables. The logistic regression model was used for captive and non-captive stations respectively to identify the significant factors affecting the nearest station choice of train users. Sensitivity tests were also conducted based on established the models to understand the influences of independent variables, such as distance, on the nearest station choice.
In addition, we used R Package ‘polycor’ to compute a heterogenous correlation matrix, consisting of Pearson product- moment correlations between numeric variables, polyserial correlations between numeric and ordinal variables, and poly- choric correlations between ordinal variables.
3.3. ข้อมูลวิเคราะห์ทำงาน เป้าหมายของการศึกษาจะเข้าใจว่า ท่านเป็นสถานีทางเลือกสถานีที่ใกล้ที่สุด หรือไม่ (1 หรือ 0) ในความรู้สึกนี้ แบบถดถอยโลจิสติกทำงานเป็น classifier สำหรับศึกษาความเป็นไปได้ของการเลือกสถานีที่ใกล้ที่สุดระหว่างสถานีท่าน แบบจำลอง logistic ประเมินเงื่อนไข distribu-สเตรชันของตอบ Y ให้ป้อนค่าตัวแปร X, Pr (Y = 1 | X = x) ซึ่งเป็นผลจากตัวแปรอินพุต เช่นผู้ใช้รถไฟและการเดินทางของไบนารีลักษณะ พารามิเตอร์ของ x ซึ่งเป็นข้อมูลที่ดีที่สุดเหมาะสม ถูกแก้ไขโดยใช้การประเมินความเป็นไปได้สูงสุด สามารถได้อย่างง่ายดายปรับเปลี่ยนล็อก p ซึ่งเป็นช่วงงที่ ใช้ logistic แปลง logP = 1 _ p ซึ่งเป็นลอการิทึมของราคาที่ผู้ใช้รถเลือกสถานีที่ใกล้ที่สุด ได้ ดังนั้น เราสามารถเปลี่ยนฟังก์ชันของ x เป็นฟังก์ชันเชิงเส้น จริง การถดถอยโลจิสติกจะสอดแทรกเชิงเส้นสำหรับล็อกเศษ (Faraway, 2005) Fig. 3 summarises ขั้นตอนการวิเคราะห์ข้อมูล ถ้า สถานีที่ใกล้ที่สุดสถานีท่าน ขึ้นอยู่กับตัวแปรเป็นหนึ่ง หรือ เป็นศูนย์ ตัวแปรอิสระ (Xn ใน Eq. (1)) ลักษณะ ของสถานีท่าน ผู้ตอบแต่ละตัวเดินได้ (ราล์ฟและ al., 2006) เป็นรูปแบบของสมการถดถอยโลจิสติก: ln p 1 _ p __¼ b0 þ b1X1 þ b2X2 þ...อีþþ bnX2 โดยที่ p คือ สัดส่วนของความสำเร็จ X 1 2 X เป็นตัวแปรอิสระ n คือ จำนวนตัวแปรอิสระ b0 คือ จุดตัดแกน bi (ฉัน = 1,..., n) เป็นพารามิเตอร์ถด ande คำข้อผิดพลาดแบบสุ่มได้ ในการศึกษานี้ p หมายถึงสัดส่วนการเลือกสถานีที่ใกล้ที่สุด และดังนั้น 1 _ p เป็นสัดส่วนที่ไม่เลือกสถานีที่ใกล้ที่สุด p = 1 _ p คือ "ราคา" ของการเลือกสถานีที่ใกล้ที่สุด lnp = 1 _ p f g จะเรียกว่า "ล็อกราคา" หรือ "logit" พารามิเตอร์ถดถอย Y., bi (ฉัน = 1,..., p), สะท้อนการเปลี่ยนแปลงในราคาล็อก (หรือ logit) ของ Y สัมพันธ์กับการเปลี่ยนแปลงหน่วยหนึ่งสิ ตัวแปรอิสระสิได้ตัวแปรต่อเนื่อง หรือแตก แบบถดถอยโลจิสติกใช้สำหรับภายในกิจการและ และ จำเลยไม่ใช่สถานีตามลำดับเพื่อระบุปัจจัยสำคัญที่ส่งผลกระทบต่อผู้ใช้รถเลือกสถานีที่ใกล้ที่สุด ทดสอบความไวได้ยังดำเนินตามในสร้างแบบจำลองเพื่อทำความเข้าใจอิทธิพลของตัวแปรอิสระ เช่นระยะทาง ในทางสถานีที่ใกล้ที่สุดนอกจากนี้ เราใช้แพคเกจ R 'polycor' การคำนวณเมทริกซ์สหสัมพันธ์ heterogenous ประกอบด้วยความสัมพันธ์ขณะนี้ผลิตภัณฑ์เพียร์สันระหว่างตัวแปรตัวเลข polyserial ความสัมพันธ์ระหว่างตัวแปรตัวเลข และเครื่องหมายสัญลักษณ์ และโพลี - choric ความสัมพันธ์ระหว่างตัวแปรเครื่องหมายสัญลักษณ์
การแปล กรุณารอสักครู่..

3.3 กรอบการวิเคราะห์ข้อมูลการทำงานเป้าหมายของการศึกษาคือการเข้าใจว่าสถานีได้รับการแต่งตั้งเป็นทางเลือกสถานีที่ใกล้ที่สุดหรือไม่ (1 หรือ 0)
ในแง่นี้รูปแบบการถดถอยโลจิสติกทำงานเป็นลักษณนามสำหรับการทำความเข้าใจน่าจะเป็นของการเลือกสถานีที่ใกล้ที่สุดระหว่างสถานีที่เลือก โมเดลโลจิสติกประเมินการกระจายเงื่อนไขของการตอบสนอง Y ที่ได้รับตัวแปร x, พีอาร์ (Y = 1 | X = x) ซึ่งเป็นผลผลิตไบนารีจากตัวแปรเช่นผู้ใช้รถไฟและการเดินทางของพวกเขาลักษณะ พารามิเตอร์ของ x ซึ่งเป็นแบบที่ดีที่สุดกับข้อมูลที่ได้รับการแก้ไขโดยใช้การประมาณค่าความน่าจะเป็นสูงสุด มันสามารถปรับเปลี่ยนหน้าเข้าสู่ระบบซึ่งมีหลากหลายมากมายโดยใช้การเปลี่ยนแปลงโลจิสติก LogP = 1 _ พีซึ่งเป็นลอการิทึมธรรมชาติของอัตราต่อรองที่ฝึกอบรมผู้ใช้เลือกจากสถานีรถไฟที่ใกล้ที่สุด ดังนั้นเราจึงสามารถเปลี่ยนฟังก์ชั่นของ x ในการทำงานเชิงเส้น อันที่จริงการถดถอยโลจิสติกเป็นเชิงเส้นสำหรับการเข้าสู่ระบบการต่อรอง (Faraway 2005) มะเดื่อ. 3 สรุปขั้นตอนการวิเคราะห์ข้อมูล ถ้าสถานีได้รับการแต่งตั้งเป็นสถานีที่ใกล้ที่สุด, ตัวแปรตามเป็นหนึ่งมิฉะนั้นจะเป็นศูนย์ ตัวแปรอิสระ (Xn ในสมการ (1).) จะมีลักษณะของสถานีได้รับการแต่งตั้งผู้ตอบแบบสอบถามของแต่ละบุคคลและเดินทางของพวกเขา รูปแบบของสมการถดถอยโลจิสติกคือ (ราล์ฟ et al, 2006.) LN 1 พีพี _ _ _ ¼ b0 þ b1X1 þ b2X2 þ . . þ bnX2 þอีพีที่มีสัดส่วนของความสำเร็จ; X1 X2 จะเป็นตัวแปรอิสระ n คือจำนวนตัวแปรอิสระ; b0 คือตัด; สอง (i = 1, ... , n) คือตัวแปรถดถอย; Ande เป็นคำข้อผิดพลาดแบบสุ่ม ในการศึกษานี้แสดงให้เห็นถึงสัดส่วนพีเลือกสถานีที่ใกล้ที่สุด และอื่น ๆ 1 _ พีเป็นสัดส่วนไม่ได้เลือกสถานีที่ใกล้ที่สุด p = 1 _ พีคือ "การต่อรอง" ของการเลือกสถานีที่ใกล้ที่สุด LNP = 1 _ PFG เรียกว่า "การต่อรองการเข้าสู่ระบบ" หรือ "โลจิต" ของพารามิเตอร์วายถดถอยสอง (i = 1, ... , P) สะท้อนให้เห็นถึงการเปลี่ยนแปลงในอัตราต่อรองล็อก (หรือ logit) Y ของญาติ การเปลี่ยนแปลงในหนึ่งหน่วย Xi ตัวแปรอิสระ Xi สามารถเป็นตัวแปรต่อเนื่องหรือเด็ดขาด รูปแบบการถดถอยโลจิสติกที่ใช้สำหรับสถานีเชลยและไม่เป็นเชลยตามลำดับในการระบุปัจจัยที่สำคัญที่มีผลต่อทางเลือกสถานีที่ใกล้ที่สุดของผู้ใช้รถไฟ การทดสอบความไวแสงได้ดำเนินการนอกจากนี้ยังขึ้นอยู่กับรูปแบบการจัดตั้งขึ้นเพื่อทำความเข้าใจอิทธิพลของตัวแปรอิสระเช่นระยะทางในการเลือกสถานีที่ใกล้ที่สุด.
นอกจากนี้เราใช้ R แพคเกจ 'polycor' ในการคำนวณเมทริกซ์ความสัมพันธ์ heterogenous ประกอบด้วย product- เพียร์สัน ความสัมพันธ์ระหว่างตัวแปรขณะที่ตัวเลขความสัมพันธ์ระหว่างตัวแปร polyserial ตัวเลขและลำดับและความสัมพันธ์ choric โพลีระหว่างตัวแปรลำดับ
การแปล กรุณารอสักครู่..
