Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/72099
Title: การออกแบบและพัฒนาส่วนจำเพาะการค้นข้อความไทยในเอกสารพีดีเอฟ
Other Titles: A design and development of a Thai text search module in PDF files
Authors: สุรพงษ์ เชาว์เชี่ยวชาญ
Advisors: สมชาย ประสิทธิ์จูตระกูล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
Subjects: การค้นคืนสารสนเทศ
ระบบการสร้างภาพเอกสาร
ภาษาไทย
Portable document software
Issue Date: 2543
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์นี้นำเสนอการออกแบบและพัฒนาส่วนจำเพาะซึ่งใช้สำหรับการค้นข้อความไทยในเอกสารพีดีเอฟ ส่วนจำเพาะนี้มีหน้าที่หลักคือการถอดรหัสอักขระ การเปรียบเทียบลายอักขระ และการแสดงตำแหน่งในเอกสารที่ค้นพบ ความซับซ้อนของส่วนจำเพาะนี้อยู่ที่ขั้นตอนการถอดรหัส ทั้งนี้เนื่องจากเครื่องมือการสร้างเอกสารพีดีเอฟในปัจจุบันไม่สนับสนุนการเข้ารหัสภาษาไทยที่เป็นมาตรฐาน ดังนั้นอักขระไทยต่างๆ ในเอกสารพีดีเอฟ จึงถูกเข้ารหัสในหลากหลายรูปแบบ ขั้นตอนการถอดรหัสอาศัยข้อมูลของแบบอักษรชื่ออักขระและสภาพแวดล้อมที่สร้างเอกสารพีดีเอฟนั้นๆ ประกอบการวิเคราะห์การถอดรหัส การพัฒนาอาศัยชุดพัฒนาส่วนจำเพาะที่ใช้ได้กับซอฟต์แวร์แสดงเอกสารพีดีเอฟอะโครแบต ส่วนจำเพาะสามารถค้นข้อความไทยในเอกสารพีดีเอฟที่มีการเข้ารหัสภาษาไทยในรูป แบบคงที่ได้ทุกรูป แบบ
Other Abstract: This thesis presents a design and development of a Thai text search module in PDF files. The Objectives of this module are to decode characters, match strings, and highlight the matched strings. The complexity of the module is in the decoding step since current PDF creation tools do not support standard Thai character encoding. As a result, Thai characters are encoded in many different formats. The decoding step uses font description, character names, and information related to tools and environment used for generating PDF files for analyzing encoded characters. The module was developed using Acrobat PDF software development kit. The module can search Thai text in any fixed-format encoded PDF files.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/72099
ISBN: 9743469591
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Surapong_ch_front_p.pdfหน้าปก สารบัญ และบทคัดย่อ822.16 kBAdobe PDFView/Open
Surapong_ch_ch1_p.pdfบทที่ 1875.08 kBAdobe PDFView/Open
Surapong_ch_ch2_p.pdfบทที่ 21.37 MBAdobe PDFView/Open
Surapong_ch_ch3_p.pdfบทที่ 31.31 MBAdobe PDFView/Open
Surapong_ch_ch4_p.pdfบทที่ 4739.16 kBAdobe PDFView/Open
Surapong_ch_ch5_p.pdfบทที่ 51.13 MBAdobe PDFView/Open
Surapong_ch_ch6_p.pdfบทที่ 6684.16 kBAdobe PDFView/Open
Surapong_ch_back_p.pdfบรรณานุกรมและภาคผนวก1.84 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.