[PE2024405] CÁC KỸ THUẬT TOÁN HỌC CHO BÀI TOÁN SO SÁNH ĐA TRÌNH TỰ -33%

Upload bởi: DevNet27
(0 Đánh giá)
120,000đ
80,000đ

So sánh đa trình tự (Multiple Sequence Alignment - MSA) là một trong những bài toán quan trọng của sinh tin học, đặc biệt trong tìm kiếm gene. MSA là bài toán NP và chưa có giải pháp tối ưu hoàn hảo. Nhiều phương pháp heuristic đã được phát triển để xử lý dữ liệu lớn, nhằm tìm ra giải pháp gần tối ưu với thời gian và bộ nhớ chấp nhận được. Một trong những phương pháp hiệu quả là Progressive Algorithm.

Toán học
Tài liệu
13/08/2024
[hotrodoan.vn]_cac_ky_thuat_toan_hoc_cho_bai_toan_so_sanh_da_trinh_tu_VhRSt_.pdf
  • Chức năng đầy đủ và giống demo 100%

  • Hỗ trợ lắp đặt nếu cần

  • Hỗ trợ trả lời người mua sau khi tải

KẾT LUẬN

Sinh tin học (Bioinformatics) đang có những bước phát triển đột phá, và từng bước trở thành một ngành khoa học có vai trò vô cùng quan trọng trong sự phát triển của nhân loại. Được đánh giá là một trong 10 bài toán lớn của Bioinformatics, từ khi được đặt ra cho đến hiện nay, bài toán MSA đã và vẫn đang được nghiên cứu. 
Nhiều giải pháp được đưa ra để giải quyết bài toán này, tuy nhiên cho đến hiện nay (2007), bài toán MSA vẫn là một bài toán mở, chưa có một lời giải nào có thể giải quyết bài toán trọn vẹn. Đứng trên góc độ của một công trình nghiên cứu, luận văn cố gắng đưa ra một giải pháp nhằm cung cấp thêm một cách thức để giải quyết bài toán này.
Tiếp cận theo hướng kết hợp phương pháp Progressive Algorithm và một số kỹ thuật heuristic, luận văn đã tối ưu hóa bài toán PSA về độ chính xác, cũng như không gian nhớ sử dụng cho chương trình, thông qua việc sử dụng giải thuật chia để trị kết hợp với việc sử dụng đồng thời 3 ma trận BLOSUM và các tham số về khả năng sinh gap, để phục vụ cho việc tính toán. 
Cùng với việc cải thiện chất lượng bài toán PSA, luận văn cũng đã sử dụng kết quả của bài toán TSP để mô tả quá trình phân hoạch cũng như gom nhóm, để thực hiện phép toán align cho bài toán MSA. Với việc kết hợp những kỹ thuật này, chương trình hiện thực cho giải thuật được đề xuất đã cho kết quả khá tốt. 
Kiểm thử chương trình trên tập dữ liệu mẫu BAliBASE và so sánh kết quả của chương trình với một số phần mềm được đánh giá rất tốt trong việc giải quyết bài toán MSA: CLUSTALW, SAGA, MULTALIGN,…. Về cơ bản, chương trình cho lời giải có độ ổn định cao, chính xác không thua kém CLUSTALW (phần mềm được đánh giá là cho kết quả tốt và ổn định nhất). Mặc dù thời gian chạy dài hơn so với CLUSTALW, nhưng xét về bộ nhớ sử dụng, chương trình cho kết quả sử dụng bộ nhớ khá tốt. 
Đây cũng là mục tiêu hướng tới của luận văn: cung cấp một giải pháp, cho phép giải bài toán MSA có độ chính xác cao, thời gian chạy chấp nhận được và tiết kiệm về mặt bộ nhớ. Thông qua một số thử nghiệm trên một số tập dữ liệmẫu khác, kết quả thu được của luận văn hoàn toàn có thể cung cấp cho các nhà sinh học một công cụ để giải các bài toán MSA.
Kết quả đạt được có thể được mở rộng thêm để cải thiện tốc độ chạy của chương trình. Hạn chế về mặt thời gian chạy của chương trình có thể được giải quyết bằng việc:
- Đề xuất một phương pháp song song hóa giải thuật được nêu, và triển khai bài toán trên một hệ thống tính toán song song như Cluster hoặc triển khai trên hệ thống tính toán lưới Grid.
- Thiết kế một giải thuật nhánh và cận nhằm tối ưu về thời gian chạy cũng như độ chính xác cho bài toán TSP khi số đỉnh của bài toán lớn.
Với những sự mở rộng này, chúng ta có thể xây dựng một hệ thống tính toán để giải quyết bài toán MSA một cách hữu hiệu. Đây chính là hướng phát triển của luận văn.
ĐIỂM TRUNG BÌNH
0
Xuất sắc (0)
Rất tốt (0)
Tốt (0)
Trung Bình (0)
Cần cải thiện (0)