http://repositorio.unb.br/handle/10482/53197| Fichier | Taille | Format | |
|---|---|---|---|
| FilipeMaiaSoares_DISSERT.pdf | 1,44 MB | Adobe PDF | Voir/Ouvrir |
| Titre: | Comparação paralela de sequências biológicas em múltiplas GPUs com mecanismo de tolerância a falhas |
| Auteur(s): | Soares, Filipe Maia |
| Orientador(es):: | Melo, Alba Cristina Magalhães Alves de |
| Assunto:: | Tolerância a falhas Sequências biológicas - comparação Checkpoint síncrono |
| Date de publication: | 24-nov-2025 |
| Data de defesa:: | 13-mar-2025 |
| Référence bibliographique: | SOARES, Filipe Maia. Comparação Paralela de Sequências Biológicas em Múltiplas GPUs com Mecanismo de Tolerância a Falhas. 2025. 90 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2025. |
| Résumé: | A comparação de sequências biológicas é uma das principais operações na área de Bioinformática. Os algoritmos exatos utilizados para compará-las aliado ao tamanho das sequências pode acarretar em horas ou até mesmo dias de execução. Neste contexto, é fundamental que tais aplicações estejam amparadas com mecanismos de tolerância a falhas, uma vez que a ocorrência de uma falha pode demandar a reexecução completa da aplicação, gerando prejuízos em termos de tempo e de custo. O MASA-CUDAlign é uma ferramenta de comparação de sequências paralela e exata, que implementa tolerância a falhas em apenas uma GPU. O objetivo da presente Dissertação de Mestrado consiste em propor e avaliar um mecanismo de tolerância a falhas para o MASA-CUDAlign, utilizando múltiplas GPUs, o chamado FT-CUDAlign (Fault Tolerant CUDAlign). O FT-CUDAlign é um mecanismo leve de tolerância a falhas, pois utiliza uma funcionalidade já existente na ferramenta MASA-CUDAlign, que é o armazenamento de algumas colunas em disco. Tais colunas são definidas no FT-CUDAlign como checkpoints síncronos. Além disso, foi proposto um protocolo de detecção e recuperação de falhas, usando estes checkpoints. A implementação do FT-CUDAlign foi feita em C e C++ e utiliza sockets para estabelecer a comunicação entre os processos. Os experimentos foram realizados em dois ambientes paralelos contendo de três a oito máquinas, com uma GPU em cada. Os resultados mostraram que o overhead adicionado pelo FT-CUDAlign, em execuções sem falhas, permaneceu abaixo de 11% para os experimentos realizados na nuvem da AWS e abaixo de 1% para os mesmos experimentos realizados no LAICO. Este overhead decresce à medida que se aumenta o tamanho das sequências. Os resultados também mostraram que o FTCUDAlign se mostrou eficaz ao tratar cenários de falhas simples e múltiplas, sendo capaz de concluir a computação utilizando apenas as máquinas remanescentes. |
| Abstract: | Biological sequence comparison is one of the main operations in the field of Bioinformatics. The exact algorithms used for this comparison, combined with the size of the sequences, can result in hours or even days of execution. In this context, it is essential that such applications are equipped with fault tolerance mechanisms, as the occurrence of a failure may require a complete re-execution of the application, resulting in time and cost losses. MASA-CUDAlign is a parallel and exact sequence comparison tool that implements fault tolerance in a single GPU. The objective of this Master’s Dissertation is to propose and evaluate a fault tolerance mechanism for MASA-CUDAlign using multiple GPUs, referred to as FT-CUDAlign (Fault Tolerant CUDAlign). FT-CUDAlign is a lightweight fault tolerance mechanism, as it leverages an existing feature of MASA-CUDAlign, which is the storage of certain columns on disk. These columns are defined in FT-CUDAlign as synchronous checkpoints. Additionally, a fault detection and recovery protocol was proposed, using these checkpoints. The implementation of FT-CUDAlign was carried out in C and C++ and uses sockets to establish communication between processes. The experiments were conducted in two parallel environments, consisting of three to eight machines, each equipped with a GPU. The results showed that the overhead added by FT-CUDAlign, in failure-free executions, remained below 11% for experiments conducted in the AWS cloud and below 1% for the same experiments performed in LAICO. This overhead decreases as the sequence size increases. The results also demonstrated that FTCUDAlign was effective in handling both single and multiple failure scenarios, successfully completing computations using only the remaining machines. |
| metadata.dc.description.unidade: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
| Description: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025. |
| metadata.dc.description.ppg: | Programa de Pós-Graduação em Informática |
| Licença:: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
| Collection(s) : | Teses, dissertações e produtos pós-doutorado |
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.