Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/71011
Title: | การเปรียบเทียบการประมาณค่าสัมประสิทธิ์ในการถดถอยเชิงเส้นพหุคูณ เมื่อเกิดพหุสัมพันธ์ |
Other Titles: | A comparison of coefficient estimation in multiple linear regression with multicollinearity |
Authors: | อัชฌา อระวีพร |
Advisors: | ธีระพร วีระถาวร |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย |
Advisor's Email: | [email protected] |
Subjects: | วิธีกำลังสองน้อยที่สุด การวิเคราะห์การถดถอย การถดถอยริดจ์ สหสัมพันธ์ (สถิติ) Least squares Regression analysis Ridge regression (Statistics) Correlation (Statistics) |
Issue Date: | 2541 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบการประมาณค่าสัมประสิทธิ์การถดถอยเชิงเส้นพหุคูณเมื่อเกิด พหุสัมพันธ์ระหว่างตัวแปรอิสระ โดยทำการเปรียบเทียบวิธีกำลังสองน้อยสุด (OLS) วิธีที่ได้จากสมการการทดถอยริดจ์ โดยใช้วิธีของบรีแมน (RID) และวิธีของสมการถดถอยเชิงเส้นการ์ล็อต (GAR) เกณฑ์การเปรียบเทียบที่ใช้คืออัตราส่วน ของค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง โดยที่การแจกแจงของค่าความคลาดเคลื่อนที่ศึกษาคือ การแจกแจงแบบปกติซึ่งมีค่าเฉลี่ยเท่ากับ 1 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05 และ 0.15 การแจกแจงแบบปกติปลอมปนซึ่งมีสเกลแฟคเตอร์ เท่ากับ 3 และ 10 เปอร์เซ็นต์การปลอมปนเท่ากับ 5 และ 10 การแจกแจงแบบไวบูลล์ซึ่งมีพารามิเตอร์มาตราส่วนเท่ากับ 1 และพารามิเตอร์สัณฐานเท่ากับ 1, 2 และ 5 ตามลำดับ และการแจกแจงแบบลอกนอร์มอลซึ่งมีค่าเฉลี่ยเท่ากับ 0 และ ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.22, 0.55 และ 0.84 ตามลำดับ โดยกำหนดขนาดตัวอย่างเท่ากับ 10, 30, 50 และ 100 ตามลำดับ จำนวนตัวแปรอิสระเท่ากับ 3 และ 5 และระดับความสัมพันธ์ระหว่างตัวแปรอิสระเท่ากับ 0.1 และ 0.3 (ระดับต่ำ), 0.5 (ระดับปานกลาง), 0.7 และ 0.9 (ระดับสูง) และ 0.99 (ระดับสูงมาก) ตามลำดับ ในการวิจัยครั้งนี้ได้ทำการจำลองเหตุการณ์ต่าง ๆ ด้วยเครื่องคอมพิวเตอร์โดยใช้เทคนิคมอนติคาร์โลและกระทำซ้ำ 500 ครั้งในแต่ละกรณี ผลการเปรียบเทียบค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง มีดังนี้ กระดับความสัมพันธ์วิธี RID จะให้ผลดีเกือบทุกกรณี ยกเว้นกรณีที่ระดับความสัมพันธ์สูงมาก ในกรณีที่ระดับความสัมพันธ์สูงมากและความคลาดเคลื่อนมีการแจกแจงแบบปกติและปกติปลอมปน วิธี GAR จะให้ผลดีเมื่อจำนวนตัวแปรอิสระเท่ากับ 3 (ขนาดตัวอย่าง = 30, 50) และเมื่อจำนวนตัวแปรอิสระเท่ากับ 5 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05 (ขนาดตัวอย่าง = 30, 50) ส่วนวิธี OLS จะให้ผลดีเมื่อจำนวนตัวแปรอิสระเท่ากับ 5 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05 (ขนาดตัวอย่าง = 10) ส่วนกรณีที่ระดับความสัมพันธ์สูงมากและความคลาดเคลื่อนมีการแจกแจงแบบไวบูลล์ วิธี GAR จะให้ผลดี เมื่อจำนวนตัวแปรอิสระเท่ากับ 3 พารามิเตอร์สัณฐานเท่ากับ 5 (ขนาดตัวอย่าง = 50) ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองจะแปรผันตามปัจจัยต่อไปนี้ ระดับความสัมพันธ์ ส่วนเบี่ยงเบนมาตร- ฐาน จำนวนตัวแปรอิสระ สเกลแฟคเตอร์ และเปอร์เซ็นต์การปลอมปน โดยเรียงลำดับจากมากไปน้อย แต่แปรผกผันกับ ขนาดตัวอย่าง |
Other Abstract: | The objective of this research is to compare multiple linear regression coefficient estimating methods under multicollinearity conditions by comparing Ordinary Least Square method (OLS), Ridge Regression by Breiman method (RID) and Garrote Linear Regression method (GAR). The criterion of comparison is the ratio of average values of the mean square errors. This study examines the residual distribution from a normal distribution with mean of 1.0, standard deviation of 0.05 and 0.15; contaminated - normal distribution with scale factors of 3 and 10 each with percent contaminations of 5 and 10; Weibull distribution with scale parameter of 1, with shape parameter of 1, 2 and 5; and lognormal distribution with mean of 0, and standard deviations of 0.22, 0.55 and 0.84, respectively. This study uses sample sizes of 10, 30, 50 and 100, respectively. The levels of correlation among independent variables are equal to 0.1 and 0.3 (low), 0.5 (middle), 0.7 and 0.9 (high), and 0.99 (very high), respectively, for the number of independent variables of 3 and 5. The data are obtained through simulation using a Monte Carlo technique with 500 reptitions for each case. The results for comparing the average value of mean square error are as follows: For every level of correlation, the RID method generally gives the best results, except in die cases when the level of correlation is very high. In the case of level of correlation is very high and the residuals have normal and contaminated-normal distribution, the GAR method gives the best results with 3 independent variables (sample sizes = 30, 50) and 5 independent variables, with standard deviation of 0.05 (sample sizes = 30, 50). The OLS method gives the best result with 5 independent variables, and a standard deviation of 0.05 (sample size = 10). The case of level of correlation is very high and the residuals have a Weibull distribution, the GAR method gives the best result with 3 independent variables, and a shape parameter of 5 (sample size = 50). The average value of mean square error varies with (in descending order): levels of correlation, standard deviation, the number of independent variables, scale factor, and percent contamination. The average value of mean square error varies conversly to sample sizes. |
Description: | วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2541 |
Degree Name: | สถิติศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | สถิติ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/71011 |
ISBN: | 9743319778 |
Type: | Thesis |
Appears in Collections: | Grad - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Autcha_ar_front_p.pdf | หน้าปก และบทคัดย่อ | 1.18 MB | Adobe PDF | View/Open |
Autcha_ar_ch1_p.pdf | บทที่ 1 | 996.48 kB | Adobe PDF | View/Open |
Autcha_ar_ch2_p.pdf | บทที่ 2 | 1.07 MB | Adobe PDF | View/Open |
Autcha_ar_ch3_p.pdf | บทที่ 3 | 1.19 MB | Adobe PDF | View/Open |
Autcha_ar_ch4_p.pdf | บทที่ 4 | 9.76 MB | Adobe PDF | View/Open |
Autcha_ar_ch5_p.pdf | บทที่ 5 | 1.11 MB | Adobe PDF | View/Open |
Autcha_ar_back_p.pdf | บรรณานุกรม และภาคผนวก | 1.52 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.