Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/52689
Title: การค้นคืนสารสนเทศเชิงความหมายและการค้นคืนสารสนเทศข้ามภาษาของสมุนไพรไทยและยาแผนปัจจุบันด้วยเทคนิคการวิเคราะห์ความหมายแฝง
Other Titles: Semantic and cross-language information retrieval for Thai traditional medicine and modern medicine using latent semantic analysis
Authors: พิชชากร เอกวรานุกูลศิริ
Advisors: นครทิพย์ พร้อมพูล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
Subjects: การค้นคืนสารสนเทศ
การค้นคืนสารสนเทศข้ามภาษา
ระบบการจัดเก็บและค้นคืนสารสนเทศ -- เภสัชศาสตร์
Information retrieval
Cross-language information retrieval
Information storage and retrieval systems -- Pharmacy
Issue Date: 2556
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ปัจจุบันมีผู้ให้บริการข้อมูลหลายรายเกี่ยวกับสมุนไพรที่เป็นภาษาไทยและยาแผนปัจจุบันที่เป็นภาษาอังกฤษ ผู้วิจัยจึงเกิดแนวคิดที่จะพัฒนาเครื่องมือที่สามารถค้นคืนได้ทั้งข้อมูลสมุนไพรและข้อมูลยาแผนปัจจุบัน เพื่อที่จะเป็นประโยชน์แก่ผู้ที่สนใจค้นคืนข้อมูลในลักษณะนี้ โดยประยุกต์การใช้เทคนิคการวิเคราะห์ความหมายแฝงและเทคนิคคำศัพท์ควบคุม ในการที่จะให้เครื่องมือนั้นสามารถค้นคืนสารสนเทศข้ามภาษาระหว่างภาษาไทยกับภาษาอังกฤษและสามารถค้นคืนสารสนเทศเชิงความหมายได้ ซึ่งผู้วิจัยได้แบ่งการประเมินประสิทธิผลของการทดลองที่ได้จากการค้นคืนเพื่อหาวิธีการที่เหมาะสมไปใช้ในการสร้างเครื่องมือดังกล่าว ออกเป็นสามส่วนดังนี้ 1) การค้นคืนด้วยขนาดเมทริกซ์ที่ต่างกัน 2) การค้นคืนด้วยรูปแบบของข้อคำถามที่ต่างกัน แบบปกติและแบบที่ให้การขยายข้อคำถามด้วยการใช้คำศัพท์ควบคุม และ 3) การค้นคืนด้วยเทคนิคที่ต่างกันนั่นคือ เทคนิคแบบจำลองปริภูมิเวคเตอร์และเทคนิคการวิเคราะห์ความหมายแฝง โดยผลการทดลองที่ 1) พบว่าหากเพิ่มขนาดเมทริกซ์ให้มากขึ้น จะทำให้ค่าระลึกและค่าความแม่นยำเพิ่มขึ้นตามไปด้วย โดยที่ขนาดเมทริกซ์ของสมุนไพรและยาแผนปัจจุบันจะอยู่ที่ 90x90 และ 30x30 ตามลำดับ นอกจากนี้ในส่วนของข้อคำถามจากผู้ใช้งานในการทดลองที่ 2) ก็เป็นอีกปัจจัยหนึ่งในการค้นคืน โดยหากค้นคืนด้วยข้อคำถามที่ผ่านการขยายข้อคำถามจากคำศัพท์ควบคุม จะให้ค่าประสิทธิผลดีกว่าการค้นคืนด้วยข้อคำถามที่ไม่ผ่านการขยายข้อคำถาม โดยค่าความแม่นยำของสมุนไพรและยาแผนปัจจุบันมีอัตราการเพิ่มขึ้นร้อยละ 68.83 และ 70.04 ตามลำดับ และในการทดลองที่ 3) เมื่อเปรียบเทียบประสิทธิผลระหว่างสองเทคนิค พบว่าการค้นคืนสมุนไพรด้วยเทคนิคการวิเคราะห์ความหมายแฝงจะให้ประสิทธิผลดีกว่าแบบจำลองปริภูมิเวคเตอร์ร้อยละ 40.77 แต่การค้นคืนยาแผนปัจจุบันด้วยแบบจำลองปริภูมิเวคเตอร์จะให้ประสิทธิผลดีกว่าการวิเคราะห์ความหมายแฝงร้อยละ 30.95 จากการประเมินด้วยค่าความแม่นยำ
Other Abstract: Nowadays there are many information providers providing herbal data and modern medicine data in Thai language and English language respectively. This research aims to develop a tool to retrieve both information types using Latent Semantic Analysis (LSA) and Controlled Vocabulary Technique (CVT) for semantic and cross-language information retrieval to serve the target audiences. In order to fine the suitable method for tool development, this research experiment was divided into three parts: 1) the retrieval based on the variation of the matrices dimensions, 2) the retrieval based on the difference forms of user query, normal query and query with terms expansion using CVT, and 3) the retrieval based on the two techniques, Vector Space Model (VSP) and LSA. From the first experiment, by varying the size of matrices used for LSA technique, we found that the size of matrices for herbal and modern medicine would be 90x90 and 30x30 respectively since each one yielded the highest result in both recall and precision in each repository. From the second experiment, query expansion technique outperformed the regular query by increasing the percentage of precision to 68.83% and 70.04% in herbal and modern medicine respectively. In addition, from the last experiment, using LSA in the retrieval of herbal repository gained 40.77% higher precision than VSM while using VSM in the retrieval of modern medicine repository yielded 70.04% higher precision than LSA.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมซอฟต์แวร์
URI: http://cuir.car.chula.ac.th/handle/123456789/52689
URI: http://doi.org/10.14457/CU.the.2013.1773
metadata.dc.identifier.DOI: 10.14457/CU.the.2013.1773
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
pitchakorn_ak.pdf2.86 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.