Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/52567
Title: Pseudometrics for time series data classification using the nearest neighbor algorithm
Other Titles: เมตริกเทียมสำหรับการจำแนกประเภทข้อมูลอนุกรมเวลาโดยใช้อัลกอรึทึมเนียเรสท์เนเบอร์
Authors: Teesid Korsrilabutr
Advisors: Boonserm Kijsirikul
Other author: Chulalongkorn University. Faculty of Engineering
Advisor's Email: [email protected]
Subjects: Time-series analysis
Metric system
การวิเคราะห์อนุกรมเวลา
ระบบเมตริก
Issue Date: 2007
Publisher: Chulalongkorn University
Abstract: We propose that pseudometric, a subadditive distance measure, has sufficient properties to be a good structure to perform nearest neighbor pattern classification. There exist some theoretical results that asymptotically guarantee the classification accuracy of k-nearest neighbor when the sample size grows larger. These results hold true under the assumption that the distance measure is a metric. The results still hold for pseudometrics up to some technicality. Whether the results are valid for the non-subadditive distance measures is still left unanswered. Pseudometric is also practically appealing. Once we have a subadditive distance measure, the measure will have at least one significant advantage over the non-subadditive; one can directly plug such distance measure into systems which exploit the subadditivity to perform faster nearest neighbor search techniques. This work focuses on pseudometrics for time series. We propose two frameworks for studying and designing subadditive distance measures and a few examples of distance measures resulting from the frameworks. One framework is more general than the other and can be used to tailor distances from the other framework to gain better classification performance. Experimental results of nearest neighbor classification of the designed pseudometrics in comparison with well-known existing distance measures including Dynamic Time Warping showed that the designed distance measures are practical for time series classification.
Other Abstract: เรานำเสนอว่าเมตริกเทียม ซึ่งเป็นมาตรวัดระยะห่างที่ซับแอดดิทีฟ มีคุณสมบัติเพียงพอที่จะเป็นโครงสร้างที่ดีสำหรับกระทำการจำแนกแบบอย่างด้วยเนียเรสท์เนเบอร์ มีผลทางทฤษฎีจำนวนหนึ่งที่รับประกันความถูกต้องของเคเนียเรสท์เนเบอร์แบบเชิงเส้นกำกับ เมื่อจำนวนตัวอย่างสอนโตขึ้น ผลเหล่านี้เป็นจริงภายใต้เงื่อนไขว่า มาตรวัดระยะห่างเป็นเมตริก ผลเหล่านี้ยังเป็นจริงสำหรับเมตริกเทียมหลังจากการปรับแต่งทางเทคนิค ณ ขณะนี้ยังไม่มีคำตอบว่าผลเหล่านี้สามารถเป็นจริงสำหรับมาตรวัดระยะห่างที่ไม่ซับแอดดิทีฟหรือไม่ เมตริกเทียมยังมีประโยชน์ในทางปฏิบัติอีกด้วย หากเรามีมาตรวัดระยะห่างที่ซับแอดดิทีฟแล้ว มาตรวัดนั้นจะมีความได้เปรียบมาตรวัดที่ไม่ซับแอดดิทีฟอย่างน้อยหนึ่งประการ กล่าวคือ เราสามารถนำมาตรวัดดังกล่าวไปใช้ได้โดยตรงในระบบที่ใช้ประโยชน์จากคุณสมบัติซับแอดดิทีฟเพื่อทำให้การค้นหาเพื่อนบ้านใกล้ที่สุดเร็วขึ้น งานนี้มุ่งเน้นที่เมตริกเทียมสำหรับอนุกรมเวลา เราเสนอสองกรอบงานเพื่อศึกษาและออกแบบมาตรวัดระยะห่างซับแอดดิทีฟและตัวอย่างจำนวนหนึ่งของมาตรวัดระยะห่างที่ออกแบบได้จากกรอบงานทั้งคู่ กรอบงานหนึ่งมีความทั่วไปสูงกว่าอีกหนึ่งกรอบงานและสามารถใช้เพื่อปรับแต่งมาตรวัดจากอีกกรอบงานหนึ่งเพื่อให้ประสิทธิภาพในการจำแนกประเภทสูงขึ้นได้ ผลการทดลองจำแนกประเภทโดยใช้เนียเรสท์เนเบอร์ร่วมกับฟังก์ชันที่ออกแบบได้ เปรียบเทียบกับมาตรวัดระยะห่างที่เป็นที่รู้จักดีรวมถึง Dynamic Time Warping แสดงให้เห็นว่ามาตรวัดระยะห่างที่ออกแบบขึ้นใช้งานได้จริงสำหรับการจำแนกประเภทข้อมูลอนุกรมเวลา
Description: Thesis (M.Eng.)--Chulalongkorn University, 2007
Degree Name: Master of Engineering
Degree Level: Master's Degree
Degree Discipline: Computer Engineering
URI: http://cuir.car.chula.ac.th/handle/123456789/52567
URI: http://doi.org/10.14457/CU.the.2007.1983
metadata.dc.identifier.DOI: 10.14457/CU.the.2007.1983
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
teesid_ko_front.pdf1.14 MBAdobe PDFView/Open
teesid_ko_ch1.pdf1.01 MBAdobe PDFView/Open
teesid_ko_ch2.pdf1.12 MBAdobe PDFView/Open
teesid_ko_ch3.pdf2.11 MBAdobe PDFView/Open
teesid_ko_ch4.pdf728.79 kBAdobe PDFView/Open
teesid_ko_ch5.pdf476.89 kBAdobe PDFView/Open
teesid_ko_back.pdf596.17 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.