| Campo DC | Valor | Idioma |
| dc.contributor.advisor | Melo, Alba Cristina Magalhães Alves de | pt_BR |
| dc.contributor.author | Soares, Filipe Maia | pt_BR |
| dc.date.accessioned | 2025-11-24T16:52:26Z | - |
| dc.date.available | 2025-11-24T16:52:26Z | - |
| dc.date.issued | 2025-11-24 | - |
| dc.date.submitted | 2025-03-13 | - |
| dc.identifier.citation | SOARES, Filipe Maia. Comparação Paralela de Sequências Biológicas em Múltiplas GPUs com Mecanismo de Tolerância a Falhas. 2025. 90 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.unb.br/handle/10482/53197 | - |
| dc.description | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025. | pt_BR |
| dc.description.abstract | A comparação de sequências biológicas é uma das principais operações na área de
Bioinformática. Os algoritmos exatos utilizados para compará-las aliado ao tamanho das
sequências pode acarretar em horas ou até mesmo dias de execução. Neste contexto, é
fundamental que tais aplicações estejam amparadas com mecanismos de tolerância a falhas, uma vez que a ocorrência de uma falha pode demandar a reexecução completa da
aplicação, gerando prejuízos em termos de tempo e de custo. O MASA-CUDAlign é uma
ferramenta de comparação de sequências paralela e exata, que implementa tolerância a
falhas em apenas uma GPU. O objetivo da presente Dissertação de Mestrado consiste em
propor e avaliar um mecanismo de tolerância a falhas para o MASA-CUDAlign, utilizando
múltiplas GPUs, o chamado FT-CUDAlign (Fault Tolerant CUDAlign). O FT-CUDAlign
é um mecanismo leve de tolerância a falhas, pois utiliza uma funcionalidade já existente
na ferramenta MASA-CUDAlign, que é o armazenamento de algumas colunas em disco.
Tais colunas são definidas no FT-CUDAlign como checkpoints síncronos. Além disso, foi
proposto um protocolo de detecção e recuperação de falhas, usando estes checkpoints. A
implementação do FT-CUDAlign foi feita em C e C++ e utiliza sockets para estabelecer
a comunicação entre os processos. Os experimentos foram realizados em dois ambientes
paralelos contendo de três a oito máquinas, com uma GPU em cada. Os resultados
mostraram que o overhead adicionado pelo FT-CUDAlign, em execuções sem falhas, permaneceu abaixo de 11% para os experimentos realizados na nuvem da AWS e abaixo de
1% para os mesmos experimentos realizados no LAICO. Este overhead decresce à medida
que se aumenta o tamanho das sequências. Os resultados também mostraram que o FTCUDAlign se mostrou eficaz ao tratar cenários de falhas simples e múltiplas, sendo capaz
de concluir a computação utilizando apenas as máquinas remanescentes. | pt_BR |
| dc.language.iso | por | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.title | Comparação paralela de sequências biológicas em múltiplas GPUs com mecanismo de tolerância a falhas | pt_BR |
| dc.type | Dissertação | pt_BR |
| dc.subject.keyword | Tolerância a falhas | pt_BR |
| dc.subject.keyword | Sequências biológicas - comparação | pt_BR |
| dc.subject.keyword | Checkpoint síncrono | pt_BR |
| dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
| dc.description.abstract1 | Biological sequence comparison is one of the main operations in the field of Bioinformatics. The exact algorithms used for this comparison, combined with the size of the
sequences, can result in hours or even days of execution. In this context, it is essential
that such applications are equipped with fault tolerance mechanisms, as the occurrence of
a failure may require a complete re-execution of the application, resulting in time and cost
losses. MASA-CUDAlign is a parallel and exact sequence comparison tool that implements
fault tolerance in a single GPU. The objective of this Master’s Dissertation is to propose
and evaluate a fault tolerance mechanism for MASA-CUDAlign using multiple GPUs,
referred to as FT-CUDAlign (Fault Tolerant CUDAlign). FT-CUDAlign is a lightweight
fault tolerance mechanism, as it leverages an existing feature of MASA-CUDAlign, which
is the storage of certain columns on disk. These columns are defined in FT-CUDAlign
as synchronous checkpoints. Additionally, a fault detection and recovery protocol was
proposed, using these checkpoints. The implementation of FT-CUDAlign was carried
out in C and C++ and uses sockets to establish communication between processes. The
experiments were conducted in two parallel environments, consisting of three to eight
machines, each equipped with a GPU. The results showed that the overhead added by
FT-CUDAlign, in failure-free executions, remained below 11% for experiments conducted
in the AWS cloud and below 1% for the same experiments performed in LAICO. This
overhead decreases as the sequence size increases. The results also demonstrated that FTCUDAlign was effective in handling both single and multiple failure scenarios, successfully
completing computations using only the remaining machines. | pt_BR |
| dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
| dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
| dc.description.ppg | Programa de Pós-Graduação em Informática | pt_BR |
| Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|