Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/70363
Title: การขยายความสามารถตัวต้นคิดของแกนส์สำหรับการสร้างภาพที่หลากหลายจากภาพร่าง
Other Titles: Enhancement of GANs’ generator for diverse image generation from sketch
Authors: วรินธร ภูสมสาย
Advisors: ญาใจ ลิ่มปิยะกรณ์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
Subjects: การรู้จำใบหน้ามนุษย์ (วิทยาการคอมพิวเตอร์)
Human face recognition (Computer science)
Issue Date: 2562
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การเปลี่ยนแปลงลักษณะกายภาพใบหน้าอาจเป็นผลมาจากวัยที่เพิ่มขึ้น การทำศัลยกรรม หรือการปลอมแปลง ผู้ต้องสงสัยหรืออาชญากรปกปิดอัตลักษณ์ของตนด้วยภาพลักษณ์ที่ผิดไปจากเดิม เช่น ใส่วิกผม สวมแว่นตา หรือติดหนวดเครา งานวิจัยนี้เป็นประโยชน์ต่อการสร้างลักษณะหลากหลายที่ประดิษฐ์ขึ้นให้ผิดไปจากเดิมของผู้ต้องสงสัย หรือใบหน้าที่เปลี่ยนไปของบุคคลสูญหาย เทคนิคแกนส์ได้ถูกประยุกต์ใช้เพื่อสังเคราะห์ภาพสีจากภาพร่าง โดยภาพผลลัพธ์ที่ได้สามารถสร้างความหลากหลายของใบหน้าที่เกิดจากความแตกต่างของคุณลักษณะบนใบหน้าสลับไปมาได้ 5 แบบ ประกอบด้วย มี/ไม่มีผม มี/ไม่มีการแต่งหน้า ผมตรง/ผมลอน ใส่/ไม่ใส่แว่นตา และมี/ไม่มีหนวดเครา แนวทางที่นำเสนอได้ขยายความสามารถตัวต้นคิดของสตาร์แกน2ด้วยสถาปัตยกรรมยูเน็ต การประเมินสมรรถนะของแบบจำลองที่นำเสนอกระทำผ่านการทดลองเปรียบเทียบกับสมรรถนะของสตาร์แกน2 โดยใช้ค่าคะแนนเอฟไอดีสำหรับวัดคุณภาพของภาพที่สร้างขึ้น พบว่า ค่าคะแนนตัววัดเอฟไอดีบนชุดข้อมูลทดสอบให้ผลน้อยกว่า 40% ของค่าที่ได้จากแบบจำลองเส้นฐานสตาร์แกน2 อีกทั้งผลลัพธ์ภาพสังเคราะห์ที่สร้างขึ้นจากคุณลักษณะหลากหลายบนใบหน้าดูเป็นธรรมชาติและสมจริง
Other Abstract: Face physical changes may result from aging, surgery, or disguise. The criminal suspects conceal their identity with false appearances such as wearing a wig, glasses, beard and mustache. This research benefits the generation of various fictitious appearances of the suspects or facial changes of lost persons. The technique of GANs is applied for synthesizing a color image from a sketch. The output image can be varied in five facial attributes with a toggle: haired/ bald  wear/ not wear makeup  straight/ wavy hair  wear/ not wear glasses  beard and mustache/ no beard and mustache. The approach enhances the Generator of StarGan2 with the U-Net architecture. The experiments were carried out to evaluate the performance of the proposed model compared to that of StarGan2. FID scores are used for measuring the quality of the generated images. The FID scores measured on the test data reported about 40% less than that of the baselined StarGan2 model and the synthesized images with varied facial attributes look natural and realistic.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2562
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/70363
URI: http://doi.org/10.58837/CHULA.THE.2019.1138
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2019.1138
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
6170958521.pdf3.3 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.