Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/42898
Title: การทำเหมืองข้อมูลเพื่อหากฎความสัมพันธ์แบบหลายลำดับชั้นที่ปรากฏขึ้นบ่อยสุดเคอันดับแรก
Other Titles: MINING TOP-K MULTI-LEVEL ASSOCIATION RULES
Authors: สรพล ชมไพศาล
Advisors: อรรถสิทธิ์ สุรฤกษ์
โกเมศ อัมพวัน
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: [email protected]
[email protected]
Subjects: ดาต้าไมนิง
คอมพิวเตอร์
Data mining
Computers
Issue Date: 2556
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การค้นหากฎความสัมพันธ์ข้อมูลเป็นกระบวนการหนึ่งในการทำเหมืองข้อมูลที่ใช้สำหรับวิเคราะห์หาความสัมพันธ์ระหว่างสิ่งของหรือเหตุการณ์ที่เกิดขึ้นร่วมกันตั้งแต่สองสิ่งขึ้นไปภายใต้ค่าขีดแบ่งสนับสนุนและ/หรือค่าขีดแบ่งความเชื่อมั่นที่ผู้ใช้เป็นผู้กำหนด อย่างไรก็ดี สิ่งของหรือเหตุการณ์อาจถูกจัด/รวบรวมเป็นกลุ่มหรือหมวดหมู่ต่างๆที่ซึ่งเป็นเหตุให้มีการคิดค้นการค้นหากฎความสัมพันธ์แบบหลายลำดับชั้นที่จะทำให้ทราบถึงความสัมพันธ์ระหว่างหมวดหมู่หรือกลุ่มข้อมูลเพิ่มเติม อันนำมาซึ่งการได้รับองค์ความรู้จากผลลัพธ์มากขึ้นจากเดิมที่ได้ผลลัพธ์เพียงกฎความสัมพันธ์แบบลำดับชั้นเดียว ในการค้นหากฎความสัมพันธ์หลายลำดับชั้น ผู้ใช้อาจทำการกำหนดค่าขีดแบ่งสนับสนุนและ/หรือค่าขีดแบ่งความเชื่อมั่นในแต่ละลำดับชั้นที่เหมือนกันหรือแตกต่างกัน ในกรณีที่ผู้ใช้กำหนดค่าขีดแบ่งดังกล่าวไม่เหมาะสมอาจทำให้ได้ผลลัพธ์ที่มีจำนวนน้อยเกินไปหรือมากเกินไปจนผู้ใช้ไม่สามารถนำผลลัพธ์ที่ได้ไปสังเคราะห์องค์ความรู้ให้เกิดประโยชน์ได้ ดังนั้น งานวิจัยนี้จึงเสนอการค้นหากฎความสัมพันธ์แบบหลายลำดับชั้นที่น่าสนใจที่สุดตามจำนวนที่ผู้ใช้ต้องการ และเสนอขั้นตอนวิธีการหารูปแบบเซตแต่ละลำดับชั้นที่ปรากฎบ่อยที่สุดตามจำนวนที่ต้องการ โดยเริ่มพิจารณาจากสิ่งของที่มีความถี่สูงสุดจากต้นไม้แสดงรูปแบบการเกิดขึ้นเป็นลำดับแรก จากนั้นทำการสร้างกฎความสัมพันธ์ที่น่าสนใจที่สุดจากรูปแบบเซตที่ปรากฏบ่อยโดยคำนวณจากค่าถ่วงน้ำหนักความน่าสนใจของค่าสนับสนุนและค่าความเชื่อมั่นที่ผู้ใช้เป็นผู้กำหนด จากผลการทดสอบพบว่า ขั้นตอนวิธีที่นำเสนอสามารถค้นหาผลลัพธ์ได้อย่างมีประสิทธิภาพทั้งในเชิงเวลาและเชิงหน่วยความจำ เมื่อทำการกำหนดจำนวนผลลัพธ์ที่แตกต่างกัน
Other Abstract: Mining association rules is one interesting area of data mining used to discover correlation co-occurrence of items or events with user-given support/confidence thresholds. In addition, items or events can be grouped into categories. Thus, mining multi-level association rules is introduced. It can help users to gain more knowledge about correlation of items among their hierarchical categories. To discover the results, users have to assign one or more different support/confidence thresholds for items in all levels of concept hierarchy. If the defined thresholds to mine the results are not suitable, it may give more or less results that users cannot take the advantage from results. Therefore, this thesis introduces an alternative approach to mine the most interesting multi-level association rules which allow the users give a number of desired results. It starts to find the highest support of itemsets at each level by first considering the most frequent item from FP-tree, and then generate rules by calculate interesting values of these from weight of interesting values. The extensive performance studies show that the proposed approach have high performance and scalable in terms of time and memory on the various number of desired results.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/42898
URI: http://doi.org/10.14457/CU.the.2013.330
metadata.dc.identifier.DOI: 10.14457/CU.the.2013.330
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5470407021.pdf3.42 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.