Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/70646
Title: | Self-balancing recursive partitioning algorithm for classification problems |
Other Titles: | ขั้นตอนวิธีการแบ่งกั้นเวียนเกิดแบบการปรับดุลด้วยตนเองสำหรับปัญหาการจำแนกประเภท |
Authors: | Artit Sagoolmuang |
Advisors: | Krung Sinapiromsaran |
Other author: | Chulalongkorn University. Faculty of Science |
Advisor's Email: | [email protected] |
Subjects: | Discriminant analysis การวิเคราะห์การจำแนกประเภท |
Issue Date: | 2019 |
Publisher: | Chulalongkorn University |
Abstract: | Creating an effective classification model has been played an important role in knowledge discovery in a database methodology for the past several years. However, there is a critical issue that significantly affects the classification performance appearing in many real-world situations, which is called a class imbalanced problem. In this dissertation, a classification model built based on the recursive partitioning algorithm is improved under the concept of modified entropy components for handling a classification problem regardless of the class imbalanced situation. Three methodologies are introduced for achieving different purposes. The first methodology is presented to classify a binary-class imbalanced dataset dealing only with numeric attributes, and then it is enhanced to deal with the multi-class case in the second methodology. The third methodology is designed to work with a dataset consisting of both numeric attributes and categorical attributes. The experimental results on both synthetic datasets and real-world datasets from the UCI repository show that these proposed methodologies significantly outperform other existing methods. |
Other Abstract: | การสร้างตัวแบบการจำแนกประเภทที่มีประสิทธิภาพมีบทบาทสำคัญในระเบียบวิธีการค้นพบความรู้ในฐานข้อมูลในช่วงหลายปีที่ผ่านมา อย่างไรก็ตามประเด็นสำคัญที่ส่งผลกระทบต่อประสิทธิภาพในการจำแนกประเภทอย่างมีนัยสำคัญเรียกว่าปัญหาความไม่ดุลระหว่างกลุ่ม ซึ่งปรากฎในสถานการณ์โลกจริงจำนวนมาก ในวิทยานิพนธ์นี้นำเสนอตัวแบบการจำแนกประเภทที่สร้างขึ้นตามขั้นตอนวิธีการแบ่งกั้นเวียนเกิดที่ได้รับการปรับปรุงภายใต้แนวคิดของส่วนประกอบเอนโทรปีที่ถูกดัดแปลง เพื่อจัดการกับปัญหาการจำแนกประเภทโดยไม่คำนึงถึงสถานการณ์ความไม่ดุลระหว่างกลุ่ม ระเบียบวิธีสามรูปแบบถูกนำเสนอด้วยจุดมุ่งหมายที่ต่างกัน ระเบียบวิธีแรกถูกนำเสนอเพื่อจำแนกชุดข้อมูลที่ไม่ดุลทวิคลาส สำหรับลักษณะประจำเชิงตัวเลขเท่านั้น และจากนั้นวิธีดังกล่าวถูกเพิ่มสมรรถนะเพื่อให้จัดการกับกรณีหลายคลาสที่ปรากฎในระเบียบวิธีที่สอง สำหรับระเบียบวิธีที่สามสามารถทำงานกับชุดข้อมูลที่ประกอบด้วยลักษณะประจำเชิงตัวเลขและลักษณะประจำแบบเด็ดขาด ผลการทดลองกับทั้งชุดข้อมูลสังเคราะห์และชุดข้อมูลโลกจริง จากคลังข้อมูลยูซีไอแสดงให้เห็นว่าระเบียบวิธีที่นำเสนอเหล่านี้ให้ผลที่ดีกว่าวิธีการอื่นที่มีอย |
Description: | Thesis (Ph.D.)--Chulalongkorn University, 2019 |
Degree Name: | Doctor of Philosophy |
Degree Level: | Doctoral Degree |
Degree Discipline: | Applied Mathematics and Computational Science |
URI: | http://cuir.car.chula.ac.th/handle/123456789/70646 |
URI: | http://doi.org/10.58837/CHULA.THE.2019.11 |
metadata.dc.identifier.DOI: | 10.58837/CHULA.THE.2019.11 |
Type: | Thesis |
Appears in Collections: | Sci - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
6072834623.pdf | 1.75 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.