Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/11750
Title: การแยกตัวอักษรจากลายมือเขียนภาษาไทยที่เป็นคำ
Other Titles: Segmentation of handwritten Thai words
Authors: กรรณทิพย์ กิรติรัตนพฤกษ์
Advisors: สมชาย จิตะพันธ์กุล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
Subjects: ภาษาไทย -- ไวยากรณ์
การรู้จำรูปแบบ
การรู้จำอักขระ (คอมพิวเตอร์)
การวิเคราะห์ข้อมูลภาพ
Issue Date: 2544
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: สร้างกระบวนการตัดแยกตัวอักษรลายมือเขียนภาษาไทย โดยใช้วิธีการแยกตัวอักษรด้วยการวิเคราะห์องค์ประกอบเชิงภาพ (Image based or dissection) ร่วมกับความรู้ฮิวริสติคซึ่งได้จากการวิเคราะห์โครงสร้างตัวอักษรภาษาไทย มาใช้ในการตรวจสอบบริเวณการติดกันของตัวอักษร เพื่อหาแนวทางการแยกการติดกันของตัวอักษร (Segmentation Path) ที่เหมาะสม ผลการทดสอบกระทำบนเครื่องไมโครคอมพิวเตอร์ ที่ใช้หน่วยประมวลผลการเป็นเพนเทียมความเร็ว 733 เมกะเฮิรตซ์ และมีหน่วยความจำแรม 128 เมกะไบต์ ฐานข้อมูลภาพคำที่ใช้ทดสอบจำนวน 1,539 คำ ประกอบด้วยตัวอักษรจำนวน 12,117 ตัว แบ่งออกเป็น ข้อมูลภาพคำที่มีแต่ตัวอักษรเดี่ยวจำนวน 191 คำ ข้อมูลภาพคำที่มีเฉพาะการติดกันของตัวอักษรในแนวระดับจำนวน 846 คำ ข้อมูลภาพคำที่มีเฉพาะการติดกันของตัวอักษรต่างระดับจำนวน 277 คำ และข้อมูลภาพคำที่มีการติดกันของตัวอักษรทั้งในแนวระดับและต่างระดับจำนวน 225 คำ อัตราความถูกต้องของตัวอักษรที่ได้จากการตัดแยก 84.71%
Other Abstract: To propose a method of image based, segmentation of Thai handwritten word. The segmentation algorithms proposed in this thesis are formed using heuristically analysis of Thai character to identify the patterns of Thai character connection. The experiment was conducted on a microcomputer with Pentium III 733 MHz and 128 Mbytes RAM. Database of 1,539 Thai handwritten word images, composed of 12,117 characters. was tested to verify the proposed segmentation scheme. The database can be separated to 191 word images which all the characters are single characters, 846 word images in which only internal character connections are located, 277 word images in which only external character connections are included, and 225 word images in which both internal character connections and external character connections are located. Correct segmented character rate is 84.71%.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2544
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมไฟฟ้า
URI: http://cuir.car.chula.ac.th/handle/123456789/11750
ISBN: 9740304125
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
kantip.pdf1.66 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.