Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/70213
Title: | เครื่องมือทางชีวสารสนเทศเพื่อตรวจหาการแปรผันเชิงโครงสร้างทางพันธุกรรม |
Other Titles: | A bioinformatics tool for structural variant detection |
Authors: | ศักยภาพ ผิวเหลือง |
Advisors: | ดวงดาว วิชาดากุล |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
Advisor's Email: | [email protected] |
Issue Date: | 2562 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | การแปรผันเชิงโครงสร้างทางพันธุกรรมคือการเปลี่ยนแปลงลำดับเบสของจีโนมที่ครอบคลุมบริเวณกว้าง การแปรผันเชิงโครงสร้างเหล่านี้มีโอกาสที่จะเกี่ยวข้องกับการเกิดโรค ดังนั้นการตรวจหาการแปรผันเชิงโครงสร้างจึงเป็นปัจจัยหนึ่งที่สำคัญในการหาสาเหตุของโรค อย่างไรก็ตามเครื่องมือสำหรับตรวจหาการแปรผันเชิงโครงสร้างที่มีอยู่มีประสิทธิภาพแตกต่างกันไปในการตรวจหาการแปรผันเชิงโครงสร้างแต่ละประเภท รวมทั้งไม่สามารถตรวจหาการแปรผันได้ครอบคลุมในตำแหน่งส่วนใหญ่ที่ได้ยืนยันจากการทดลองในห้องปฏิบัติการ วิทยานิพนธ์ฉบับนี้นำเสนอวิธีการทางคอมพิวเตอร์เพื่อตรวจหาการแปรผันเชิงโครงสร้างที่เน้นการเพิ่มประสิทธิภาพความครอบคลุม โดยพยายามรักษาความแม่นยำของการแปรผันเชิงโครงสร้างที่ตรวจพบผ่านการวิเคราะห์คู่รีด การแตกรีด และการนับรีด เพื่อรวบรวมหลักฐานที่แสดงความเป็นไปได้ในการเกิดการแปรผันเชิงโครงสร้างแต่ละประเภทในแต่ละบริเวณของจีโนม และนำเสนอวิธีการคัดกรองเบรกเอ็นด์ที่แสดงถึงตำแหน่งเริ่มต้นและตำแหน่งสิ้นสุดของการเกิดการแปรผันประเภทต่างๆ วิธีการกรองจะทำการแบ่งตัวอย่างเป็นบล็อกๆ ข้อมูลของบล็อกประกอบไปด้วย จำนวนรีดที่แมพได้ในบล็อกนั้นและจำนวนการแปรผันเชิงโครงสร้างของแต่ละประเภทภายในบล็อก การคัดกรองเบรกเอ็นด์จะอาศัยข้อมูลทั้งจากบล็อกที่เบรกเอ็นด์อยู่และบล็อกที่อยู่ติดกัน ผลลัพธ์จากการเปรียบเทียบประสิทธิภาพของวิธีการที่นำเสนอกับ SvABA DELLY GROM LUMPY และ Wham พบว่าวิธีการที่นำเสนอได้ผลลัพธ์ดีกว่าเครื่องมืออื่นๆ ในส่วนของความแม่นยำในการตรวจหาลำดับเบสที่เกิดความซ้ำเป็นชุดติดๆกันและลำดับเบสที่เกิดการกลับด้าน และความครบถ้วนในส่วนของการตรวจหาลำดับเบสที่ถูกเพิ่มเข้ามาสำหรับชุดข้อมูลจริง NA12878 และ HG00514 ที่ใช้ในการทดสอบ |
Other Abstract: | Genomic structural variations (SVs) represent large genomic alterations and have been reported to be associated with diseases. The detection of structural variations is an important approach for investigating the cause of diseases. While several tools for detecting structural variations are available, they achieved varied performance for each type of the variation. Moreover, many experimentally verified variations were still uncaught by these tools. This thesis proposes a computational method for SV detection aiming to increase the coverage while maintaining the precision. The method incorporated the read-pair, split-read, and read count analyses to compile the evidence for each SV type. To filter the potential breakends, the starting and ending positions of a SV, the genome was divided into blocks containing the read coverage and the number of detected SVs of each type. Our method then considers the data of a block suggested with a breakend position and the data of its adjacent blocks for breakend filtering. Based on two real datasets NA12878 and HG00514, our method outperformed SvABA, DELLY, GROM, LUMPY, and Wham in term of precision for detecting tandem duplication and inversion and got the highest recall for detecting insertion while maintaining the comparable precision. |
Description: | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2562 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิทยาศาสตร์คอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/70213 |
URI: | http://doi.org/10.58837/CHULA.THE.2019.1142 |
metadata.dc.identifier.DOI: | 10.58837/CHULA.THE.2019.1142 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
5970324021.pdf | 4.86 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.