Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/20484
Title: การค้นคืนเว็บเพจจากการให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้โดยการแบ่งเว็บเพจเป็นส่วนย่อยและใช้แบบจำลองความน่าจะเป็น
Other Titles: Web page retrieval from user relevance feedback using web page segmentation and probabilistic model
Authors: ปรารถนา จันพลโท
Advisors: นครทิพย์ พร้อมพูล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
Subjects: เว็บไซต์ -- การออกแบบ
ระบบการจัดเก็บและค้นข้อสนเทศ
Issue Date: 2550
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: เว็บเพจเป็นหนึ่งในสารสนเทศที่ได้รับการพัฒนาขึ้นจากความก้าวหน้าของเทคโนโลยีสารสนเทศในปัจจุบัน เว็บเพจประกอบด้วยเนื้อหาหรือสารสนเทศที่มีรูปแบบหลากหลายชนิด เว็บเบราว์เซอร์เป็นส่วนสำคัญของเทคโนโลยีอินเทอร์เน็ตมีกลไกเพื่อรองรับการสืบค้นข้อมูลสารสนเทศจากหลายแหล่ง กระบวนการค้นคืนสารสนเทศแบบเว็บเพื่อให้ได้เว็บเพจที่ตรงกับความต้องการของผู้ใช้นั้นจะค้นคืนด้วยการคำนวณความคล้ายกันจากข้อคำถามเปรียบเทียบกับคำที่ปรากฏในเว็บเพจ ซึ่งผลการค้นคืนที่ได้อาจจะไม่ตรงตามความต้องการของผู้ใช้เท่าที่ควร จึงจำเป็นต้องทำการค้นคืนใหม่โดยใช้การให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้ ช่วยให้ผลการค้นคืนที่ได้ตรงตามความต้องการของผู้ใช้ได้มากขึ้น งานวิทยานิพนธ์นี้จึงมีวัตถุประสงค์เพื่อวิเคราะห์และออกแบบระบบสำหรับการค้นคืนเว็บเพจจากการให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้โดยการแบ่งเว็บเพจเป็นส่วนย่อยด้วย วีไอพีเอสอัลกอริทึม และเปลี่ยนแปลงค่าน้ำหนักของคำในข้อคำถามใหม่ที่ใช้ในการให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้ด้วยแบบจำลองความน่าจะเป็น โดยวีไอพีเอสอัลกอริทึมนั้นเป็นเทคนิคที่ใช้ในการแบ่งเว็บเพจเป็นส่วนย่อยหรือบล็อก ซึ่งผู้ใช้จะให้ผลป้อนกลับด้วยการเลือกบล็อกที่เห็นว่าตรงประเด็นกับที่ต้องการ และคำที่ปรากฏในบล็อกที่เลือก จะนำมากำหนดข้อคำถามใหม่ พร้อมทั้งเปลี่ยนแปลงค่าน้ำหนักของคำด้วยแบบจำลองความน่าจะเป็น งานวิจัยนี้ได้พัฒนาเครื่องมือเพื่อทดสอบแนวคิดที่นำเสนอ และสามารถประเมินประสิทธิผลของระบบการค้นคืนเว็บเพจด้วยค่าเรียกคืนและค่าความแม่นยำ ผลการทดลองที่ได้จากงานวิทยานิพนธ์นี้แสดงให้เห็นว่า ที่ระดับนัยสำคัญ 0.05 การให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้ด้วยวีไอพีเอสอัลกอริทึมและแบบจำลองปริภูมิเวคเตอร์ให้ผลค่าความแม่นยำมากกว่าวิธีการค้นคืนแบบไม่ใช้การให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้69.69 เปอร์เซ็นต์ และการให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้ด้วยวีไอพีเอสอัลกอริทึมและแบบจำลองความน่าจะเป็นให้ผลค่าความแม่นยำมากกว่าวิธีการค้นคืนแบบไม่ใช้การให้ผลป้อนกลับที่ตรงประเด็นจากผู้ใช้ 26.59 เปอร์เซ็นต์ เนื่องจากแบบจำลองปริภูมิเวคเตอร์สามารถเปลี่ยนแปลงได้ทั้งคำและค่าน้ำหนักของคำในข้อคำถาม ในขณะที่แบบจำลองความน่าจะเป็นเปลี่ยนแปลงเฉพาะค่าน้ำหนักของคำในข้อคำถามเท่านั้น
Other Abstract: Web page is one of various kinds of information developed in the current information technology advancement. A web page contains difference types and forms of content or information. Web browser, an important part of internet technology, provides a search mechanism to retrieve information from various sources. In web information retrieval process, retrieving a web page to meet user requirements is based on the similarity computation between terms in a query and terms in a web page. The query results may not meet user requirements so it is necessary to retrieve again with user relevance feedback which can improve the result of web information retrieval. The objective of this thesis is to analyze and design a system an approach for web page retrieval from user relevance feedback using web page segmentation with Vision based Page Segmentation (VIPS) Algorithm and term reweighting in a new query with probabilistic model. The VIPS algorithm is a technique to segment a web page into several blocks. User may select relevant blocks meet his/her need. Terms contain in the selected blocks are used to produce a new query and to recompute the weight of terms in a new query using probabilistic model. As a result, this research develops a tool to test the proposed approach. The two widely used metrics named recall and precision are use to evaluate web page retrieval results.The results of our experiment indicate that, for a level of significance 0.05, the precision value of our approach, using VIPS algorithm and vector space model (first model) is 69.69 percent greater than web page retrieval without user relevance feedback, and the precision value using VIPS algorithm and the probabilistic model (second model) is 26.59 percent greater than web page retrieval without user relevance feedback. The first model can adjusts both terms and weight of terms in the query whereas the second model can adjusts only weight of terms in that query.
Description: วิทยานิพนธ์ (วท.ม.)-- จุฬาลงกรณ์มหาวิทยาลัย, 2550
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/20484
URI: http://doi.org/10.14457/CU.the.2007.90
metadata.dc.identifier.DOI: 10.14457/CU.the.2007.90
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Prattana.pdf2.58 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.