Comparação paralela de sequências biológicas em múltiplas GPUs com mecanismo de tolerância a falhas

Soares, Filipe Maia

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Melo, Alba Cristina Magalhães Alves de	pt_BR
dc.contributor.author	Soares, Filipe Maia	pt_BR
dc.date.accessioned	2025-11-24T16:52:26Z	-
dc.date.available	2025-11-24T16:52:26Z	-
dc.date.issued	2025-11-24	-
dc.date.submitted	2025-03-13	-
dc.identifier.citation	SOARES, Filipe Maia. Comparação Paralela de Sequências Biológicas em Múltiplas GPUs com Mecanismo de Tolerância a Falhas. 2025. 90 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2025.	pt_BR
dc.identifier.uri	http://repositorio.unb.br/handle/10482/53197	-
dc.description	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025.	pt_BR
dc.description.abstract	A comparação de sequências biológicas é uma das principais operações na área de Bioinformática. Os algoritmos exatos utilizados para compará-las aliado ao tamanho das sequências pode acarretar em horas ou até mesmo dias de execução. Neste contexto, é fundamental que tais aplicações estejam amparadas com mecanismos de tolerância a falhas, uma vez que a ocorrência de uma falha pode demandar a reexecução completa da aplicação, gerando prejuízos em termos de tempo e de custo. O MASA-CUDAlign é uma ferramenta de comparação de sequências paralela e exata, que implementa tolerância a falhas em apenas uma GPU. O objetivo da presente Dissertação de Mestrado consiste em propor e avaliar um mecanismo de tolerância a falhas para o MASA-CUDAlign, utilizando múltiplas GPUs, o chamado FT-CUDAlign (Fault Tolerant CUDAlign). O FT-CUDAlign é um mecanismo leve de tolerância a falhas, pois utiliza uma funcionalidade já existente na ferramenta MASA-CUDAlign, que é o armazenamento de algumas colunas em disco. Tais colunas são definidas no FT-CUDAlign como checkpoints síncronos. Além disso, foi proposto um protocolo de detecção e recuperação de falhas, usando estes checkpoints. A implementação do FT-CUDAlign foi feita em C e C++ e utiliza sockets para estabelecer a comunicação entre os processos. Os experimentos foram realizados em dois ambientes paralelos contendo de três a oito máquinas, com uma GPU em cada. Os resultados mostraram que o overhead adicionado pelo FT-CUDAlign, em execuções sem falhas, permaneceu abaixo de 11% para os experimentos realizados na nuvem da AWS e abaixo de 1% para os mesmos experimentos realizados no LAICO. Este overhead decresce à medida que se aumenta o tamanho das sequências. Os resultados também mostraram que o FTCUDAlign se mostrou eficaz ao tratar cenários de falhas simples e múltiplas, sendo capaz de concluir a computação utilizando apenas as máquinas remanescentes.	pt_BR
dc.language.iso	por	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Comparação paralela de sequências biológicas em múltiplas GPUs com mecanismo de tolerância a falhas	pt_BR
dc.type	Dissertação	pt_BR
dc.subject.keyword	Tolerância a falhas	pt_BR
dc.subject.keyword	Sequências biológicas - comparação	pt_BR
dc.subject.keyword	Checkpoint síncrono	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	pt_BR
dc.description.abstract1	Biological sequence comparison is one of the main operations in the field of Bioinformatics. The exact algorithms used for this comparison, combined with the size of the sequences, can result in hours or even days of execution. In this context, it is essential that such applications are equipped with fault tolerance mechanisms, as the occurrence of a failure may require a complete re-execution of the application, resulting in time and cost losses. MASA-CUDAlign is a parallel and exact sequence comparison tool that implements fault tolerance in a single GPU. The objective of this Master’s Dissertation is to propose and evaluate a fault tolerance mechanism for MASA-CUDAlign using multiple GPUs, referred to as FT-CUDAlign (Fault Tolerant CUDAlign). FT-CUDAlign is a lightweight fault tolerance mechanism, as it leverages an existing feature of MASA-CUDAlign, which is the storage of certain columns on disk. These columns are defined in FT-CUDAlign as synchronous checkpoints. Additionally, a fault detection and recovery protocol was proposed, using these checkpoints. The implementation of FT-CUDAlign was carried out in C and C++ and uses sockets to establish communication between processes. The experiments were conducted in two parallel environments, consisting of three to eight machines, each equipped with a GPU. The results showed that the overhead added by FT-CUDAlign, in failure-free executions, remained below 11% for experiments conducted in the AWS cloud and below 1% for the same experiments performed in LAICO. This overhead decreases as the sequence size increases. The results also demonstrated that FTCUDAlign was effective in handling both single and multiple failure scenarios, successfully completing computations using only the remaining machines.	pt_BR
dc.description.unidade	Instituto de Ciências Exatas (IE)	pt_BR
dc.description.unidade	Departamento de Ciência da Computação (IE CIC)	pt_BR
dc.description.ppg	Programa de Pós-Graduação em Informática	pt_BR
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado