Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/22512
Title: การหาจุดแบ่งของตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภทสำหรับการพยากรณ์การจำแนกข้อมูลโดยใช้ฟังก์ชันโลจิทเป็นฟังก์ชันเชื่อมโยง
Other Titles: The cut-off point estimation of binary logistic regression model for predictive classification using logit function as a link function
Authors: อรุณรัตน์ โพธิ์คำ
Advisors: สุพล ดุรงค์วัฒนา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: [email protected]
Subjects: การวิเคราะห์การถดถอยโลจิสติก
ข้อมูล -- การจำแนก
Issue Date: 2554
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อหาจุดแบ่งของตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภทสำหรับการพยากรณ์การจำแนกข้อมูลโดยใช้ฟังก์ชันโลจิท เป็นฟังก์ชันเชื่อมโยง ปัจจัยที่สนใจศึกษาในครั้งนี้คือ สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษา (a) เท่ากับ 0.1, 0.5 และ 0.9 ระดับความสัมพันธ์ระหว่างตัวแปรอิสระ (P) เท่ากับ ความสัมพันธ์กันในระดับอย่างต่ำ: 0 < Max{Pij} < 0.30 ความสัมพันธ์กันในระดับปานกลาง: 0.30 < Max{Pij} < 0.60 ความสัมพันธ์กันในระดับสูง: 0.60 <Max{Pij} < 0.90 ขนาดตัวอย่าง (n) คือ n= 50,100,150,200,250 และจำนวนตัวแปรอิสระ (P) คือ P = 1,2,3,4,5 ข้อมูลทั้งหมดนี้ใช้การจำลองโดยเทคนิคมอนติคาร์โล ด้วยโปรแกรม R การหาจุดที่ทำให้สัดส่วนความถูกต้องในการจำแนกกลุ่มมีค่าสูงสุดผลการวิจัยสรุปได้ดังนี้ กรณีสัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษา เปลี่ยนแปลง แต่ปัจจัยอื่นๆคงที่ พบว่า ที่สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษามีค่าเท่ากับ 0.5 ค่าจุดแบ่งมีค่าลู่เข้าสู่ 0.5 แต่ที่ค่าอื่นๆ ค่าจุดแบ่งมีค่ามากกว่า 0.5 กรณีระดับความสัมพันธ์ระหว่างตัวแปรอิสระเพิ่มขึ้น แต่ปัจจัยอื่นๆ คงที่ พบว่า ที่สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษามีค่าเท่ากับ 0.1 ค่าจุดแบ่งมีแนวโน้มเพิ่มขึ้นจาก 0.5 กรณีขนาดตัวอย่างเพิ่มขึ้น แต่ปัจจัยอื่นๆ คงที่ พบว่า ที่ สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษามีค่าต่ำ เมื่อขนาดตัวอย่างเพิ่มขึ้น ค่าจุดแบ่งมีแนวโน้มเพิ่มขึ้น กรณีจำนวนตัวแปรอิสระเพิ่มขึ้นแต่ปัจจัยอื่นๆ คงที่ พบว่า ที่สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษามีค่าต่ำ จำนวนตัวแปรอิสระเพิ่มขึ้น ค่าจุดแบ่งมีค่าลดลงจาก 0.5 แต่ที่สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษามีค่าสูง จำนวนตัวแปรอิสระเพิ่มขึ้น ค่าจุดแบ่งมีแนวโน้มเพิ่มขึ้นจาก จาก 0.5
Other Abstract: The objective of this study is to find the cut-off point estimation of binary logistic regression model for predictive classification using logit function as a link function.The interesting factors are the failure rate (a) of the values 0.1,0.5 and 0.9, degree of multicollinearity among independent variables (P) with 3 levels; low level (0 < Max{Pij} < 0.30), medium level (0.30 < Max{Pij} < 0.60 ) and high level (0.60 < Max{Pij} < 0.90),sample size (n) of the values 50,100,150,200,250 and the number of independent variables (p) of the values 1,2,3,4,5.The data are generated using Monte Carlo technique through R-program. The cut-off point that the proportion of Classification Error rate with the highest value. The results are summarized as follow : As the failure rate changes, the sample size increases, the number of independent variables increases and the other factors are kept constant.The pattern of convergence to 0.5 would be a sinusoidal wave. Alternately up and down and the speed of convergence as a short-term period is the starting point of convergence to 0.5 in the short term .As the degree of multicollinearity increases and the other factors are kept constant. The pattern of convergence to 0.5 would be a exponential wave.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2554
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/22512
URI: http://doi.org/10.14457/CU.the.2011.884
metadata.dc.identifier.DOI: 10.14457/CU.the.2011.884
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
arunrat_po.pdf1.38 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.