Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/59302
Title: | Anomaly detection on time series from furthest neighbor window subseries |
Other Titles: | การตรวจหาข้อมูลที่ผิดปกติบนอนุกรมเวลาจากหน้าต่างอนุกรมย่อยเพื่อนบ้านไกลสุด |
Authors: | Senee Kitimoon |
Advisors: | Krung Sinapiromsaran |
Other author: | Chulalongkorn University. Faculty of Science |
Advisor's Email: | [email protected] |
Subjects: | Time-series analysis Anomaly detection (Computer security) การวิเคราะห์อนุกรมเวลา การตรวจจับสิ่งผิดปกติ (ความปลอดภัยในระบบคอมพิวเตอร์) |
Issue Date: | 2016 |
Publisher: | Chulalongkorn University |
Abstract: | Anomaly detection in time series is classified into three types which are point anomaly, contextual anomaly, and collective anomaly. This work proposes a novel method called the Furthest Neighbor Window Subseries (FNWS) for detecting contextual anomalies which normally appear in a time series dataset. Three quartiles representing a local distribution are computed and relocated by subtracting the first data point in the window subseries. A vector of three quartiles —the lower quartile, the median and the upper quartile —is used to compute the distances among all window subseries and the furthest k-nearest neighbor distance is picked as the score. The collection of the one-dimensional score is sorted and the score quartiles are computed. The interquartile range rule from the adjusted boxplot for skew distributions is applied to identify anomalies. The empirical experiments on the benchmark time series datasets from Yahoo with a list of labeled outliers are performed and evaluated using precision, recall, and F-measure. The results show that FNWS works effectively and accurately having the average scores more than 80% on all metrics. |
Other Abstract: | การตรวจหาข้อมูลที่ผิดปกติบนอนุกรมเวลา แบ่งได้เป็นสามประเภท คือ ความผิดปกติแบบจุด ความผิดปกติเมื่อเทียบกับบริเวณข้างเคียง และความผิดปกติเมื่อรวมกันเป็นกลุ่ม งานวิจัยนี้ นำเสนอวิธีการตรวจจับความผิดปกติบนข้อมูลประเภทอนุกรมเวลา เรียกว่า การตรวจหาข้อมูลที่ผิดปกติบนอนุกรมเวลาจากหน้าต่างอนุกรมย่อยเพื่อนบ้านไกลสุด ค่าควอร์ไทล์ทั้งสามค่าซึ่งถูกใช้เป็นตัวแทนการแจกแจงจะถูกคำนวณและหักออกด้วยข้อมูลตัวแรก ในหน้าต่างอนุกรมเวลานั้น เวกเตอร์ของควอร์ไทล์ทั้งสามค่า ได้แก่ ควอร์ไทล์บน มัธยฐาน และควอร์ไทล์ล่าง จะถูกใช้เพื่อการคำนวณหาค่าระยะทางระหว่างหน้าต่างย่อย และหาระยะทางไปถึงเพื่อนบ้านตัวที่ k เพื่อนำมาใช้เป็นค่าคะแนน กลุ่มของคะแนนมิติเดียว จะถูกเรียงเพื่อคำนวณหาค่าควอร์ไทล์ เกณฑ์พิสัยควอร์ไทล์จาก บอกซ์พลอตที่ถูกปรับสำหรับการกระจายเบ้ถูกนำมาใช้เพื่อระบุจุดผิดปกติ การทดลองบนชุดข้อมูลอนุกรมเวลาที่ใช้มาจาก เบนซ์มาร์กของยาฮูถูกใช้และประเมินผลด้วยตัววัด พรีซีชัน, รีคอลล์ และ เอฟ-เมเซอร์ ผลที่ได้แสดงให้เห็นว่า เอฟเอ็นดับเบิ้ลยูเอส มีประสิทธิภาพและมีความแม่นยำมากกว่า 80% ในทุกๆ ตัววัด |
Description: | Thesis (M.Sc.)--Chulalongkorn University, 2016 |
Degree Name: | Master of Science |
Degree Level: | Master's Degree |
Degree Discipline: | Applied Mathematics and Computational Science |
URI: | http://cuir.car.chula.ac.th/handle/123456789/59302 |
URI: | http://doi.org/10.58837/CHULA.THE.2016.1304 |
metadata.dc.identifier.DOI: | 10.58837/CHULA.THE.2016.1304 |
Type: | Thesis |
Appears in Collections: | Sci - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
5772255623.pdf | 704.92 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.