Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/37026
Title: | การหาค่าพารามิเตอร์ริดจ์ที่เหมาะสมเพื่อแก้ปัญหาพหุสัมพันธ์ในการวิเคราะห์ความถดถอยโลจิสติกแบบสองกลุ่ม |
Other Titles: | Optimal ridge parameter for solving multicollinearity problem in binary logistic regression |
Authors: | สาวิตรี บุญพัชรนนท์ |
Advisors: | กัลยา วานิชย์บัญชา |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี |
Advisor's Email: | [email protected] |
Subjects: | การประมาณค่าพารามิเตอร์ การวิเคราะห์การถดถอยโลจิสติก การถดถอยริดจ์ Parameter estimation Logistic regression analysis Ridge regression (Statistics) |
Issue Date: | 2554 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | หาค่าพารามิเตอร์ริดจ์ที่เหมาะสมสำหรับแก้ปัญหาพหุสัมพันธ์ ในการวิเคราะห์ความถดถอยโลจิสติกแบบสองกลุ่มซึ่งดำเนินการภายใต้ขอบเขตของจำนวนตัวแปรอิสระที่ศึกษาคือ 2 และ 3 ตัว ระดับความสัมพันธ์ของตัวแปรอิสระซึ่งมีทั้งระดับความสัมพันธ์สูง กลางและต่ำ การแจกแจงของค่าตัวแปรอิสระซึ่งศึกษาภายใต้ 3 การแจกแจงคือ การแจกแจงปัวซองส์ การแจกแจงปกติ และการแจกแจงแกมมา ค่าประสิทธิ์ความถดถอยมีค่า 2, 3 และ 4 และขนาดตัวอย่างเป็น 40 และ 70 สำหรับจำนวนตัวแปรอิสระเท่ากับ 2 ตัว ส่วนจำนวนตัวแปรอิสระเท่ากับ 3 ตัว จะศึกษาที่ขนาดตัวอย่าง 60 และ 100 โดยจำลองข้อมูลและวิเคราะห์ผลด้วยโปรแกรม R 2.9.0 และโปรแกรม SPSS for Windows ver.19 ทั้งนี้การประมาณค่าสัมประสิทธิ์ความถดถอยด้วยวิธีการแบบริดจ์ใช้หลักการของนิวตัน-ราฟสัน ส่วนเกณฑ์ที่ใช้ในตัดสินใจเลือกค่าพารามิเตอร์บริดจ์ที่เหมาะสมมีด้วยกัน 2 เกณฑ์คือ เกณฑ์ Mean absolute percentage error (MAPE) และเกณฑ์ค่าส่วนเบี่ยงเบนมาตรฐาน (SD) การศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฎว่า ในกรณีของจำนวนตัวแปรอิสระเท่ากับ 2 และ 3 ตัว ให้ผลสอดคล้องไปในทิศทางเดียวกัน โดยถ้าเพิ่มระดับความสัมพันธ์ของตัวแปรอิสระหรือเพิ่มขนาดตัวอย่าง จะส่งผลให้ค่าพารามิเตอร์ริดจ์มีค่าสูงขึ้น ซึ่งถ้าพิจารณาเปอร์เซ็นต์การเพิ่มขึ้นของค่าพารามิเตอร์ริดจ์ในแต่ละการแจกแจงของตัวแปรอิสระจะพบว่า การแจกแจงที่ให้เปอร์เซ็นต์การเพิ่มขึ้นเรียงลำดับจากมากไปน้อยดังนี้ การแจกแจงแกมมา การแจกแจงปกติ และการแจกแจงปัวซองส์ ตามลำดับ ส่วนถ้าพิจารณาค่าสัมประสิทธิ์ความถดถอยที่เพิ่มขึ้นพบว่า ค่าพารามิเตอร์ริดจ์มีค่าลดลง โดยเปอร์เซ็นต์การลดลงของค่าพารามิเตอร์ริดจ์เรียงลำดับการแจกแจงของตัวแปรอิสระสำหรับค่าสัมประสิทธิ์ความถดถอยเท่ากับ 2 และ 3 จากมากไปน้อย เป็นดังนี้ การแจกแจงแกมมา การแจกแจงปกติ และการแจกแจงปัวซองส์ ส่วนค่าสัมประสิทธิ์ความถดถอยเท่ากับ 4 สามารถเรียงลำดับได้ดังนี้ การแจกแจงปกติ การแจกแจงแกมมา และการแจกแจงปัวซองส์ ตามลำดับ |
Other Abstract: | To find the optimal ridge parameter for solving multicollinearity problem between the independent variables in binary logistic regression. This study scopes on 2 and 3 independent variables, low, medium and high correlations, Poisson Normal and Gamma distribution and which the logistic regression coeffcients, are 2,3, and 4, sample sizes are 40 and 70 for the two independent variables, 60 and 100 for the three independent variables. Simulating and analyzing data in this study use R 2.9.0 and PSS for Windows ver.19. The coefficient of logistic regression uses Newton-Raphson methods. Mean absolute pecentage error (MAPE) and standard deviation (SD) are the criteria for selecting the optimal ridge parameter. Studying under these assumptions can gain many useful results. In case of two and three independent variables, the results are the same. When we increase the correlation or the sample size, the value of ridge parameters are increase. If we consider on the increased percents of ridge parameter, the distributions that have the highest percent increased to the lowest percent are Gamma, Normal and Poisson distribution, respectively. On the other hand, when we consider from the view of the coefficient, the ridge paramenters are decreased. If we focus on the decreased percents of ridge parameter, the distributions that have the highest percent to the lowest percent are Gamma, Normal and Poisson distribution for the coefficients that equal 2 and 3, but when the coefficients are equal 4, the highest percent increased to the lowest are Normal, Gamma and Poisson distribution. |
Description: | วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2554 |
Degree Name: | สถิติศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | สถิติ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/37026 |
URI: | http://doi.org/10.14457/CU.the.2011.770 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2011.770 |
Type: | Thesis |
Appears in Collections: | Acctn - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
sawitree_bo.pdf | 1.65 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.