3.3. Data analysis framework The goal of study is to understand whether the chosen station is the nearest station choice or not (1, or 0). In this sense, the logistic regression model works as a classifier for understanding the probability of choosing the nearest station among the chosen stations. The logistic models estimate the conditional distribu- tion of the response Y, given the input variables X, Pr (Y = 1 |X = x). which is a binary output from the input variables, such as train users' and their trips’ characteristics. The parameters of x, which is best fit to the data, was solved using Maximum likelihood estimation. It can easily modify log p, which has an unbounded range, using logistic transformation, logP=1 _ p, which is the natural logarithm of odds that train users choose the nearest train station. Therefore, we can transform the function of x into linear function. Actually, logistic regression is linear interpolation for the log-odds (Faraway, 2005). Fig. 3 summarises the data analysis procedure. If the chosen station is the nearest station, the dependent variable is one, otherwise it is zero. The independent variables (Xn in Eq. (1)) are the characteristics of chosen stations, individual respondents and their trips. The form of the logistic regression equation is (Ralph et al., 2006): ln p 1 _ p _ _ ¼ b0 þ b1X1 þ b2X2 þ . . . þ bnX2 þ e where p is the proportion of successes;X1 to X2 are independent variables;n is the number of independent variables;b0 is the intercept;bi (i = 1,...,n) are the regression parameters; ande is the random error term. In this study, p represents the proportion choosing the nearest station. And so 1 _ p is the proportion not choosing the nearest station. p=1 _ p is the “odds” of choosing the nearest station. lnp=1 _ p f g is called the “log odds” or the “logit” of Y. Regression parameters, bi (i = 1,..., p), reflect the change in the log odds (or logit) of Y relative to a one unit change in Xi. The independent variables Xi can be continuous or categorical variables. The logistic regression model was used for captive and non-captive stations respectively to identify the significant factors affecting the nearest station choice of train users. Sensitivity tests were also conducted based on established the models to understand the influences of independent variables, such as distance, on the nearest station choice.
In addition, we used R Package ‘polycor’ to compute a heterogenous correlation matrix, consisting of Pearson product- moment correlations between numeric variables, polyserial correlations between numeric and ordinal variables, and poly- choric correlations between ordinal variables.
3.3. ข้อมูลวิเคราะห์กรอบเป้าหมายของการศึกษาจะเข้าใจว่า ท่านเป็นสถานีทางเลือกสถานีที่ใกล้ที่สุด หรือไม่ (1 หรือ 0) ในความรู้สึกนี้ แบบถดถอยโลจิสติกทำงานเป็น classifier สำหรับศึกษาความเป็นไปได้ของการเลือกสถานีที่ใกล้ที่สุดระหว่างสถานีท่าน แบบจำลอง logistic ประเมินเงื่อนไข distribu-สเตรชันของตอบ Y ให้ป้อนค่าตัวแปร X, Pr (Y = 1 | X = x) ซึ่งเป็นผลจากตัวแปรอินพุต เช่นผู้ใช้รถไฟและการเดินทางของไบนารีลักษณะ พารามิเตอร์ของ x ซึ่งเป็นข้อมูลที่ดีที่สุดเหมาะสม ถูกแก้ไขโดยใช้การประเมินความเป็นไปได้สูงสุด สามารถได้อย่างง่ายดายปรับเปลี่ยนล็อก p ซึ่งเป็นช่วงงที่ ใช้ logistic แปลง logP = 1 _ p ซึ่งเป็นลอการิทึมของราคาที่ผู้ใช้รถเลือกสถานีที่ใกล้ที่สุด ได้ ดังนั้น เราสามารถเปลี่ยนฟังก์ชันของ x เป็นฟังก์ชันเชิงเส้น จริง การถดถอยโลจิสติกจะสอดแทรกเชิงเส้นสำหรับล็อกเศษ (Faraway, 2005) Fig. 3 summarises ขั้นตอนการวิเคราะห์ข้อมูล ถ้า สถานีที่ใกล้ที่สุดสถานีท่าน ขึ้นอยู่กับตัวแปรเป็นหนึ่ง หรือ เป็นศูนย์ ตัวแปรอิสระ (Xn ใน Eq. (1)) ลักษณะ ของสถานีท่าน ผู้ตอบแต่ละตัวเดินได้ (ราล์ฟและ al., 2006) เป็นรูปแบบของสมการถดถอยโลจิสติก: ln p 1 _ p __¼ b0 þ b1X1 þ b2X2 þ...อีþþ bnX2 โดยที่ p คือ สัดส่วนของความสำเร็จ X 1 2 X เป็นตัวแปรอิสระ n คือ จำนวนตัวแปรอิสระ b0 คือ จุดตัดแกน bi (ฉัน = 1,..., n) เป็นพารามิเตอร์ถด ande คำข้อผิดพลาดแบบสุ่มได้ ในการศึกษานี้ p หมายถึงสัดส่วนการเลือกสถานีที่ใกล้ที่สุด และดังนั้น 1 _ p เป็นสัดส่วนที่ไม่เลือกสถานีที่ใกล้ที่สุด p = 1 _ p คือ "ราคา" ของการเลือกสถานีที่ใกล้ที่สุด lnp = 1 _ p f g จะเรียกว่า "ล็อกราคา" หรือ "logit" พารามิเตอร์ถดถอย Y., bi (ฉัน = 1,..., p), สะท้อนการเปลี่ยนแปลงในราคาล็อก (หรือ logit) ของ Y สัมพันธ์กับการเปลี่ยนแปลงหน่วยหนึ่งสิ ตัวแปรอิสระสิได้ตัวแปรต่อเนื่อง หรือแตก แบบถดถอยโลจิสติกใช้สำหรับภายในกิจการและ และ จำเลยไม่ใช่สถานีตามลำดับเพื่อระบุปัจจัยสำคัญที่ส่งผลกระทบต่อผู้ใช้รถเลือกสถานีที่ใกล้ที่สุด ทดสอบความไวได้ยังดำเนินตามในสร้างแบบจำลองเพื่อทำความเข้าใจอิทธิพลของตัวแปรอิสระ เช่นระยะทาง ในทางสถานีที่ใกล้ที่สุดนอกจากนี้ เราใช้แพคเกจ R 'polycor' การคำนวณเมทริกซ์สหสัมพันธ์ heterogenous ประกอบด้วยความสัมพันธ์ขณะนี้ผลิตภัณฑ์เพียร์สันระหว่างตัวแปรตัวเลข polyserial ความสัมพันธ์ระหว่างตัวแปรตัวเลข และเครื่องหมายสัญลักษณ์ และโพลี - choric ความสัมพันธ์ระหว่างตัวแปรเครื่องหมายสัญลักษณ์
การแปล กรุณารอสักครู่..

3.3 กรอบการวิเคราะห์ข้อมูลเป้าหมายของการศึกษาคือการเข้าใจว่าสถานีได้รับการแต่งตั้งเป็นทางเลือกสถานีที่ใกล้ที่สุดหรือไม่ (1 หรือ 0) ในแง่นี้รูปแบบการถดถอยโลจิสติกทำงานเป็นลักษณนามสำหรับการทำความเข้าใจน่าจะเป็นของการเลือกสถานีที่ใกล้ที่สุดระหว่างสถานีที่เลือก โมเดลโลจิสติกประเมินการกระจายเงื่อนไขของการตอบสนอง Y ที่ได้รับตัวแปร x, พีอาร์ (Y = 1 | X = x) ซึ่งเป็นผลผลิตไบนารีจากตัวแปรเช่นผู้ใช้รถไฟและการเดินทางของพวกเขาลักษณะ พารามิเตอร์ของ x ซึ่งเป็นแบบที่ดีที่สุดกับข้อมูลที่ได้รับการแก้ไขโดยใช้การประมาณค่าความน่าจะเป็นสูงสุด มันสามารถปรับเปลี่ยนหน้าเข้าสู่ระบบซึ่งมีหลากหลายมากมายโดยใช้การเปลี่ยนแปลงโลจิสติก LogP = 1 _ พีซึ่งเป็นลอการิทึมธรรมชาติของอัตราต่อรองที่ฝึกอบรมผู้ใช้เลือกจากสถานีรถไฟที่ใกล้ที่สุด ดังนั้นเราจึงสามารถเปลี่ยนฟังก์ชั่นของ x ในการทำงานเชิงเส้น อันที่จริงการถดถอยโลจิสติกเป็นเชิงเส้นสำหรับการเข้าสู่ระบบการต่อรอง (Faraway 2005) มะเดื่อ. 3 สรุปขั้นตอนการวิเคราะห์ข้อมูล ถ้าสถานีได้รับการแต่งตั้งเป็นสถานีที่ใกล้ที่สุด, ตัวแปรตามเป็นหนึ่งมิฉะนั้นจะเป็นศูนย์ ตัวแปรอิสระ (Xn ในสมการ (1).) จะมีลักษณะของสถานีได้รับการแต่งตั้งผู้ตอบแบบสอบถามของแต่ละบุคคลและเดินทางของพวกเขา รูปแบบของสมการถดถอยโลจิสติกคือ (ราล์ฟ et al, 2006.) LN 1 พีพี _ _ _ ¼ b0 þ b1X1 þ b2X2 þ . . þ bnX2 þอีพีที่มีสัดส่วนของความสำเร็จ; X1 X2 จะเป็นตัวแปรอิสระ n คือจำนวนตัวแปรอิสระ; b0 คือตัด; สอง (i = 1, ... , n) คือตัวแปรถดถอย; Ande เป็นคำข้อผิดพลาดแบบสุ่ม ในการศึกษานี้แสดงให้เห็นถึงสัดส่วนพีเลือกสถานีที่ใกล้ที่สุด และอื่น ๆ 1 _ พีเป็นสัดส่วนไม่ได้เลือกสถานีที่ใกล้ที่สุด p = 1 _ พีคือ "การต่อรอง" ของการเลือกสถานีที่ใกล้ที่สุด LNP = 1 _ PFG เรียกว่า "การต่อรองการเข้าสู่ระบบ" หรือ "โลจิต" ของพารามิเตอร์วายถดถอยสอง (i = 1, ... , P) สะท้อนให้เห็นถึงการเปลี่ยนแปลงในอัตราต่อรองล็อก (หรือ logit) Y ของญาติ การเปลี่ยนแปลงในหนึ่งหน่วย Xi ตัวแปรอิสระ Xi สามารถเป็นตัวแปรต่อเนื่องหรือเด็ดขาด รูปแบบการถดถอยโลจิสติกที่ใช้สำหรับสถานีเชลยและไม่เป็นเชลยตามลำดับในการระบุปัจจัยที่สำคัญที่มีผลต่อทางเลือกสถานีที่ใกล้ที่สุดของผู้ใช้รถไฟ การทดสอบความไวแสงได้ดำเนินการนอกจากนี้ยังขึ้นอยู่กับรูปแบบการจัดตั้งขึ้นเพื่อทำความเข้าใจอิทธิพลของตัวแปรอิสระเช่นระยะทางในการเลือกสถานีที่ใกล้ที่สุด.
นอกจากนี้เราใช้ R แพคเกจ 'polycor' ในการคำนวณเมทริกซ์ความสัมพันธ์ heterogenous ประกอบด้วย product- เพียร์สัน ความสัมพันธ์ระหว่างตัวแปรขณะที่ตัวเลขความสัมพันธ์ระหว่างตัวแปร polyserial ตัวเลขและลำดับและความสัมพันธ์ choric โพลีระหว่างตัวแปรลำดับ
การแปล กรุณารอสักครู่..

3.3 . กรอบเป้าหมายของการศึกษาวิเคราะห์ข้อมูลเพื่อให้เข้าใจว่าเป็นสถานีที่ใกล้ที่สุดสถานีที่เลือก เลือก หรือ ไม่ ( 1 หรือ 0 ) ในความรู้สึกนี้ , การวิเคราะห์การถดถอยโลจิสติก ทำงานเป็นส่วนขยายสำหรับความเข้าใจความน่าจะเป็นของการเลือกสถานีที่ใกล้ที่สุดระหว่างเลือกสถานี โมเดลโลจิสติกการประเมินตามเงื่อนไข distribu - tion ของการตอบสนองคให้ใส่ตัวแปร x , PR ( Y = 1 | X = X ) ซึ่งคือผลผลิตไบนารีจากตัวแปรนำเข้า เช่น ผู้ใช้รถไฟและการเดินทางของพวกเขาลักษณะ ค่าของ x ที่เหมาะสม ให้ข้อมูล แก้ไขได้โดยใช้การประมาณความควรจะเป็นสูงสุด มันสามารถปรับเปลี่ยนเข้าสู่ระบบ P ซึ่งมีช่วงความ การใช้โลจิสติกส์ การ logp = 1 _ Pซึ่งเป็นธรรมชาติราคาที่ผู้ใช้เลือกลอการิทึมของรถไฟที่สถานีรถไฟที่ใกล้ที่สุด ดังนั้นเราจึงสามารถเปลี่ยนฟังก์ชันของ x เป็นฟังก์ชันเชิงเส้น จริงๆ แล้วคือการถดถอยแบบเชิงเส้นสำหรับ log เดิมพัน ( ไกล , 2005 ) รูปที่ 3 summarises ขั้นตอนการวิเคราะห์ข้อมูล ถ้าสถานีที่เลือกเป็นสถานีที่ใกล้ที่สุด ตัวแปรหนึ่ง มิฉะนั้น จะเป็นศูนย์ตัวแปรอิสระ ( คริสเตียนในอีคิว ( 1 ) เป็นลักษณะของการเลือกกลุ่มตัวอย่างแต่ละสถานี และการเดินทางของพวกเขา รูปแบบของสมการถดถอยโลจิสติก ( Ralph et al . , 2006 ) : ใน P 1 _ P _ _ ¼ B0 þ b1x1 þ b2x2 þ . . . . . . . . þ bnx2 þ E ที่ p คือสัดส่วนของความสำเร็จ ; X1 กับ X2 ตัวแปรอิสระ ; n คือจำนวนตัวแปรอิสระ ; B0 เป็นสกัดกั้น ; บี ( i = 1 , . . .n ) ได้สมการพารามิเตอร์ Ande คือความคลาดเคลื่อนในระยะ ในการศึกษานี้ , P หมายถึง สัดส่วนการเลือกสถานีที่ใกล้ที่สุด ดังนั้น 1 _ P มีสัดส่วน ไม่ใช่เลือกที่สถานีที่ใกล้ที่สุด P = 1 _ P เป็น " โอกาส " ของการเลือกสถานีที่ใกล้ที่สุด lnp = 1 _ P F G เรียกว่า " บันทึกราคา " หรือ " โดยใช้ " ของวายบี ( พารามิเตอร์ถดถอย , i = 1 , . . . , p ) ,สะท้อนให้เห็นถึงการเปลี่ยนแปลงใน log เดิมพัน ( หรือโลจิต ) Y เทียบกับหนึ่งหน่วยการเปลี่ยนแปลงใน Xi ตัวแปรอิสระหรือตัวแปรอย่างต่อเนื่อง Xi ได้เด็ดขาด โมเดลการถดถอยโลจิสติกใช้เชลยและไม่ใช่เชลยสถานีตามลำดับเพื่อระบุปัจจัยที่มีผลต่อทางเลือกของผู้ใช้ ใกล้ สถานีรถไฟการทดสอบความไวก็ดำเนินการตามขึ้นแบบเข้าใจอิทธิพลของตัวแปรอิสระ เช่น ระยะทาง ในการเลือกสถานีที่ใกล้ที่สุด
นอกจากนี้ เราใช้ R ' แพคเกจ ' polycor คำนวณเมทริกซ์สหสัมพันธ์ของ Pearson Product - กลุ่ม ซึ่งขณะนี้ความสัมพันธ์ระหว่างตัวแปรตัวเลขความสัมพันธ์ระหว่างตัวแปรที่เป็นตัวเลขและ polyserial อันดับและโพลี - choric ความสัมพันธ์ระหว่างตัวแปร . .
การแปล กรุณารอสักครู่..
