Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/66824
Title: | Statistical feature selection from chaos game representation for promoter recognition |
Other Titles: | การรู้จำโปรโมเตอร์โดยใช้เทคนิคการเลือกด้วยวิธีทางสถิติจากแทนด้วยเคออสเกมส์ |
Authors: | Orawan Tinnungwattana |
Advisors: | Chidchanok Lursinsap |
Other author: | Chulalongkorn University. Faculty of Science |
Subjects: | โปรโมเตอร์ เคออสเกมส์ Promoter recognition chaos game representation Statistical feature selection Artifical neural network |
Issue Date: | 2005 |
Publisher: | Chulalongkorn University |
Abstract: | Recently, the recognition of promoters has attracted many researchers’ attention. Unfortunately, most previous prediction algorithms did not provide high enough sensitivity and specificity. The aim of this dissertation is to provide a distinct classification between Promoter and non-promoter sequences. We do not consider some well-known patterns around TSS, such as TATAAT-box and TTGACA-box, which were previously used by many researchers. The accuracy of promoter prediction is based on two factors, i.e., the representation of the given DNA sequence and the essential features of the sequence. A Chaos Game Representation (CSR) is adopted for transforming a DNA sequence having promoters and non-promoters into an image. The essential features of the CGR are selected by applying the concept of statistical feature selection. It is aimed at finding the Smallest set of features that can distinguish the classes over the full set and reduce the dimension of the classifier. Recognition can then be performed by a supervised neural network. The method in this dissertation can be applied to both prokaryotic and eukaryotic Organisms. |
Other Abstract: | ปัญหาการรู้จำโปรโมเตอร์เป็นที่สนใจของนักวิจัยในปัจจุบันแต่อัลกอริทึมที่มีอยู่ก็ยังให้ผลการทดลองที่ไม่ดีพอดังนั้นเป้าหมายของวิทยานิพนธ์นี้คือการพัฒนาอัลกอริทึมที่สามารถแยกความแตกต่างระหว่างลำดับดีเอ็นเอที่เป็นโปรโมเตอร์และไม่ใช่โปรโมเตอร์ออกให้ได้โดยไม่ได้เอารูปแบบที่มีอยู่ก่อนหน้าเช่น TATAAT-box และ TIGACA-box มาพิจารณาความถูกต้องของการทำนายโปรโมเตอร์ขึ้นอยู่กับปัจจัย 2 ประการคือการแทนลำดับดีเอ็นเอและการเลือกคุณลักษณะที่สำคัญหลักการคือการใช้เทคนิค Chaos Game Representation มาช่วยในการแปลงสำดับดีเอ็นเอซึ่งประกอบด้วยโปรโมเตอร์และไม่ใช่โปรโมเตอร์ให้เป็นภาพเพื่อที่จะเห็นรูปแบบได้ชัดเจนมากขึ้นจากนั้นจะทำการเลือกคุณสมบัติที่สำคัญที่ทำให้มีความแตกต่างกันมากที่สุดออกมาโดยใช้วิธีการเลือกทางสถิติจุดประสงค์เพื่อลดขนาดของข้อมูลให้เล็กลงเพื่อให้โครงข่ายประสาทเทียมทำการรู้จำวิธีการในงานวิจัยนี้สามารถใช้ได้ทั้งสิ่งมีชีวิตเซลล์เดียวและหลายเซลล์ |
Description: | Thesis (Ph.D.)--Chulalongkorn University, 2005 |
Degree Name: | Doctor of Philosophy |
Degree Level: | Doctoral Degree |
Degree Discipline: | Computer Science |
URI: | http://cuir.car.chula.ac.th/handle/123456789/66824 |
URI: | http://doi.org/10.14457/CU.the.2005.1861 |
ISBN: | 9745327565 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2005.1861 |
Type: | Thesis |
Appears in Collections: | Sci - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Orawan_ti_front_p.pdf | หน้าปก บทคัดย่อ และสารบัญ | 839.89 kB | Adobe PDF | View/Open |
Orawan_ti_ch1_p.pdf | บทที่ 1 | 666.15 kB | Adobe PDF | View/Open |
Orawan_ti_ch2_p.pdf | บทที่ 2 | 1.13 MB | Adobe PDF | View/Open |
Orawan_ti_ch3_p.pdf | บทที่ 3 | 692.14 kB | Adobe PDF | View/Open |
Orawan_ti_ch4_p.pdf | บทที่ 4 | 917.63 kB | Adobe PDF | View/Open |
Orawan_ti_ch5_p.pdf | บทที่ 5 | 800.24 kB | Adobe PDF | View/Open |
Orawan_ti_ch6_p.pdf | บทที่ 6 | 620.02 kB | Adobe PDF | View/Open |
Orawan_ti_back_p.pdf | บรรณานุกรม และภาคผนวก | 691.62 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.