Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/64172
Title: โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล
Other Titles: Soccer News Summarization
Authors: กรวิชญ์ กำปั่นทอง
อภิชัย สมนาม
Advisors: นฤมล ประทานวณิช
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์
Advisor's Email: [email protected]
Subjects: การเรียนรู้ของเครื่อง
ข่าวกีฬา
โปรแกรมประยุกต์
Machine learning
Sports journalism
Application software
Issue Date: 2561
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: โครงการวิจัยในชั้นเรียน เรื่อง “โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล” มีวัตถุประสงค์ คือ พัฒนาโปรแกรมสรุปเนื้อหาข่าวสารเกี่ยวกับกีฬาฟุตบอล โดยนำเทคนิคการเรียนรู้ของเครื่อง มาประยุกต์ใช้เริ่มจากการใช้ word embedding ซึ่งเป็นวิธีที่ใช้สำหรับเปลี่ยนคำเป็นเวกเตอร์จำนวนจริง หลังจากนั้นใช้ตัวแบบทางคณิตศาสตร์ sequence-to-sequence มาใช้ในการประมวลข้อมูลข่าวเพื่อสร้างสรุปข่าว ในส่วนของการวัดผลนั้น เพื่อเปรียบเทียบคะแนนที่ได้จากสรุปที่ได้จากตัวแบบทางคณิตศาสตร์และสรุปที่ได้จากการสุ่ม คณะผู้จัดทำใช้ BLEU scores ซึ่งวัดว่ามีจำนวนคำที่เหมือนกับสรุปข่าวจริงอยู่กี่คำ ทั้งแบบ 1-gram ที่พิจารณาคำแต่ละคำแยกกัน และแบบ 2-gram ที่พิจารณาสองคำที่อยู่ติดกัน ผลการวิจัยที่ได้แสดงให้เห็นว่า สรุปที่ได้จากตัวแบบทางคณิตศาสตร์นั้นดีกว่าสรุปที่ได้จากการสุ่มโดยเฉพาะเมื่อพิจารณาแบบสองคำที่อยู่ติดกัน นอกจากนี้สรุปที่ได้จากโมเดลสามารถอ่านแล้วพอเข้าใจได้ว่าทีมใดชนะ
Other Abstract: The objective of this project is to apply machine learning techniques for soccer’s news summarization. First, we used a word embedding technique which converts words into numerical vectors. Then, we applied a sequence-to-sequence model to learn the conversion of news scripts to their corresponding summaries. To evaluate the model performance, we used 1-gram and 2- gram BLEU scores to compute the number of words that the model and the random procedure recalled from the true summaries. Our results reveal that the summaries from the sequenceto- sequence model had higher BLEU scores than the output from random summarization, especially on the 2-gram BLEU scores, indicating more readability. Additionally, the model’s summaries were moderately understandable which team was the winner.
Description: โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561
URI: http://cuir.car.chula.ac.th/handle/123456789/64172
Type: Senior Project
Appears in Collections:Sci - Senior Projects

Files in This Item:
File Description SizeFormat 
Korawitch_K_Se_2561.pdf1.24 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.