Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/70367
Title: การจำแนกเพศจากชื่อผู้ใช้งานภาษาไทยบนเฟซบุ๊ก
Other Titles: Gender classification of Thai username on Facebook
Authors: สุพิชชา ยืนยงค์
Advisors: สุกรี สินธุภิญโญ
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
Subjects: เฟซบุ๊ก
การประมวลผลคำ
ความน่าจะเป็น
การเรียนรู้ของเครื่อง
Facebook ‪(Electronic resource)‬
Word processing
Probabilities
Machine learning
Issue Date: 2562
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์นี้นำเสนอการนำการเรียนรู้ของเครื่องมาประยุกต์ในการจำแนกเพศผู้ใช้งานเฟซบุ๊กโดยใช้เพียงชื่อผู้ใช้งานเท่านั้น ซึ่งข้อมูลส่วนตัวของผู้ใช้งานของโซเชียลเนตเวิร์คมีความสำคัญในการนำมาวิเคราะห์ แต่บางครั้งไม่มีการเปิดเผยข้อมูล เช่น อายุ หรือเพศ โดยการศึกษาส่วนใหญ่มักจะนำเอาข้อความบนเว็บเพจมาวิเคราะห์ แต่การศึกษานี้เลือกใช้ชื่อผู้ใช้งานในการจำแนกเพศ โดยเพศสามารถอนุมานได้จากทั้งชื่อจริงและชื่อแฝงของผู้ใช้งาน โดยงานวิจัยนี้สนใจเฉพาะชื่อที่เป็นภาษาไทย ซึ่งชื่อของคนไทยจะมีรูปแบบที่สามารถแสดงตัวตนความเป็นเพศได้ การรวมกันของแบบจำลองสำหรับการจำแนกเพศจากชื่อผู้ใช้งานภาษาไทยบนเฟซบุ๊กที่แตกต่างกัน ในแต่ละแบบจำลองมีการเรียนรู้โดยใช้วิธีการเรียนรู้แบบจำลองเชิงทำนาย ได้แก่ การจำแนกเพศจากชื่อจริง การจำแนกเพศจากชื่อแฝง การจำแนกชื่อจริงและชื่อแฝง และการจำแนกชื่อทั้งหมด โดยผลการจำแนกทั้งหมดจะถูกรวมในแบบจำลองสุดท้าย เมื่อใช้วิธีนี้แบบจำลองมีความถูกต้องที่ 85.85% ซึ่งได้ผลลัพธ์ที่ดีกว่าเมื่อเปรียบเทียบกับการจำแนกเพศโดยคน ที่มีความถูกต้องที่ 77.03%
Other Abstract: This thesis presents an application of machine learning to classify Facebook users’ gender based on their username alone. User profile information on social networks is important in many studies, but occasionally no information is publicly available online, such as age or gender. Most studies only use textual information from the web page. Instead, we opted to study gender classification by username, in which the gender is inferred from the users first name and alias name. We focused only on Thai names which may have certain patterns that reveal the owner’s gender. A combination of different models is proposed to classify gender based on Thai Facebook usernames. Each model was trained using a supervised learning approach include gender classification from first name, gender classification from alias name, first name and alias name classification, and gender classification from all usernames. Furthermore, all the classification results were combined into a final model. Using this method, the model achieved 85.85% level of accuracy. Which has better results when compared to gender classification by the human that has accuracy is 77.03%
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2562
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/70367
URI: http://doi.org/10.58837/CHULA.THE.2019.1145
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2019.1145
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
6170973921.pdf2.79 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.