Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/7684
Title: | การประยุกต์ใช้การโปรแกรมตรรกะเชิงอุปนัย ในการรู้จำตัวพิมพ์อักษรภาษาไทย |
Other Titles: | An application of inductive logic programming to Thai printed character recognition |
Authors: | อภิญญา สุพรรณวรรษา |
Advisors: | บุญเสริม กิจศิริกุล |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย |
Advisor's Email: | [email protected], [email protected] |
Subjects: | การรู้จำอักขระ (คอมพิวเตอร์) การโปรแกรมตรรกะเชิงอุปนัย การเรียนรู้ของเครื่อง ภาษาไทย -- ตัวอักษร |
Issue Date: | 2540 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | งานวิทยานิพนธ์ฉบับนี้มีวัตถุประสงค์ เพื่อประยุกต์ใช้การโปรแกรมตรรกะเชิงอุปนัย หรือ ไอแอลพี ในการรู้จำตัวพิมพ์อักษรภาษาไทย ระบบไอแอลพีที่เลือกใช้ คือ ระบบ PROGOL ขั้นตอนการวิจัยเริ่มจากการใช้ PROGOL ในการเรียนรู้ตัวพิมพ์อักษรภาษาไทย ซึ่งข้อมูลที่จำเป็นต่อการเรียนรู้ ได้แก่ ตัวอย่างและความรู้ส่วนหลัง ผลที่ได้จากการเรียนรู้ คือ กลุ่มของกฎ ซึ่งแต่ละกฎจะนิยามลักษณะสำคัญของตัวอักษรภาษาไทยแต่ละตัว ขั้นตอนถัดมา คือ การนำกฎที่ได้จากการเรียนรู้มาใช้ในการรู้จำตัวอักษร โดยเปรียบเทียบกฎที่ได้กับตัวอักษรที่ต้องการรู้จำ และเลือกกฎที่ตรงกับลักษณะของตัวอักษรนั้นๆ มากที่สุดให้เป็นผลการรู้จำ การทดสอบวิธีการดังกล่าวแบ่งออกเป็น 2 การทดลอง การทดลองแรกเพื่อทดสอบการรู้จำตัวอักษรแบบที่ไม่เคยเรียนรู้มาก่อน โดยใช้ตัวอักษรรูปแบบ EUCROSIA ในการเรียนรู้ และใช้รูปแบบ CORDIA ในการทดสอบการรู้จำ พบว่าผลการรู้จำมีความถูกต้อง 87.38% จากจำนวนตัวอักษรที่ทำการทดสอบ 539 ตัวอักษร การทดลองที่สองเพื่อทดสอบการรู้จำตัวอักษรที่มีสัญญาณรบกวน โดยใช้ตัวอักษรรูปแบบ CORDIA และ EUCROSIA ในการเรียนรู้ และนำตัวอักษรทั้งสองรูปแบบนั้นไปคัดลอกด้วยเครื่องถ่ายเอกสารได้จำนวนตัวอักษร 2156 ตัวอักษร แล้วจึงนำมาทดสอบการรู้จำ พบว่าผลการรู้จำมีความถูกต้อง 87.89% เวลาในการรู้จำโดยเฉลี่ย 0.13 วินาทีต่อการรู้จำ 1 ตัวอักษร |
Other Abstract: | The purpose of this thesis is to apply Inductive Logic Programming (ILP) to Thai printed character recognition. The ILP system which have been chosen is PROGOL. First, PROGOL is employed to learn Thai printed Characters. The examples of characters and background knowledge are mainly used to train PROGOL. The output of PROGOL is a set of rules each of which defines the characteristics of a Thai character. Then, the learned rules are used to recognize an input character by comparing them with the input character, and the most matched rule together with associated character is selected as the output. Two experiments were run to test the method. In the first experiment designed for unseen fonts, the Eucrosia fonts are used for training and the Cordia fonts are used for testing. The recognition rate is 87.38%, tested with 539 characters. In the second experiment for noisy fonts, the Cordia and Eucrosia fonts are used for training, and the copies produced by a copy machine of both types of fonts composed of 2156characters are used for testing. The recognition rate is 87.89%. The average recognition time is 0.13 second per character. |
Description: | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2540 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิทยาศาสตร์คอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/7684 |
ISBN: | 9746379437 |
Type: | Thesis |
Appears in Collections: | Grad - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Apinya_Su_front.pdf | 463.53 kB | Adobe PDF | View/Open | |
Apinya_Su_ch1.pdf | 596.13 kB | Adobe PDF | View/Open | |
Apinya_Su_ch2.pdf | 508.65 kB | Adobe PDF | View/Open | |
Apinya_Su_ch3.pdf | 1.54 MB | Adobe PDF | View/Open | |
Apinya_Su_ch4.pdf | 482.23 kB | Adobe PDF | View/Open | |
Apinya_Su_ch5.pdf | 229.77 kB | Adobe PDF | View/Open | |
Apinya_Su_back.pdf | 787.86 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.