Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/53197
Arquivos associados a este item:
Arquivo TamanhoFormato 
FilipeMaiaSoares_DISSERT.pdf1,44 MBAdobe PDFVisualizar/Abrir
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorMelo, Alba Cristina Magalhães Alves dept_BR
dc.contributor.authorSoares, Filipe Maiapt_BR
dc.date.accessioned2025-11-24T16:52:26Z-
dc.date.available2025-11-24T16:52:26Z-
dc.date.issued2025-11-24-
dc.date.submitted2025-03-13-
dc.identifier.citationSOARES, Filipe Maia. Comparação Paralela de Sequências Biológicas em Múltiplas GPUs com Mecanismo de Tolerância a Falhas. 2025. 90 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2025.pt_BR
dc.identifier.urihttp://repositorio.unb.br/handle/10482/53197-
dc.descriptionDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação em Informática, 2025.pt_BR
dc.description.abstractA comparação de sequências biológicas é uma das principais operações na área de Bioinformática. Os algoritmos exatos utilizados para compará-las aliado ao tamanho das sequências pode acarretar em horas ou até mesmo dias de execução. Neste contexto, é fundamental que tais aplicações estejam amparadas com mecanismos de tolerância a falhas, uma vez que a ocorrência de uma falha pode demandar a reexecução completa da aplicação, gerando prejuízos em termos de tempo e de custo. O MASA-CUDAlign é uma ferramenta de comparação de sequências paralela e exata, que implementa tolerância a falhas em apenas uma GPU. O objetivo da presente Dissertação de Mestrado consiste em propor e avaliar um mecanismo de tolerância a falhas para o MASA-CUDAlign, utilizando múltiplas GPUs, o chamado FT-CUDAlign (Fault Tolerant CUDAlign). O FT-CUDAlign é um mecanismo leve de tolerância a falhas, pois utiliza uma funcionalidade já existente na ferramenta MASA-CUDAlign, que é o armazenamento de algumas colunas em disco. Tais colunas são definidas no FT-CUDAlign como checkpoints síncronos. Além disso, foi proposto um protocolo de detecção e recuperação de falhas, usando estes checkpoints. A implementação do FT-CUDAlign foi feita em C e C++ e utiliza sockets para estabelecer a comunicação entre os processos. Os experimentos foram realizados em dois ambientes paralelos contendo de três a oito máquinas, com uma GPU em cada. Os resultados mostraram que o overhead adicionado pelo FT-CUDAlign, em execuções sem falhas, permaneceu abaixo de 11% para os experimentos realizados na nuvem da AWS e abaixo de 1% para os mesmos experimentos realizados no LAICO. Este overhead decresce à medida que se aumenta o tamanho das sequências. Os resultados também mostraram que o FTCUDAlign se mostrou eficaz ao tratar cenários de falhas simples e múltiplas, sendo capaz de concluir a computação utilizando apenas as máquinas remanescentes.pt_BR
dc.language.isoporpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleComparação paralela de sequências biológicas em múltiplas GPUs com mecanismo de tolerância a falhaspt_BR
dc.typeDissertaçãopt_BR
dc.subject.keywordTolerância a falhaspt_BR
dc.subject.keywordSequências biológicas - comparaçãopt_BR
dc.subject.keywordCheckpoint síncronopt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.pt_BR
dc.description.abstract1Biological sequence comparison is one of the main operations in the field of Bioinformatics. The exact algorithms used for this comparison, combined with the size of the sequences, can result in hours or even days of execution. In this context, it is essential that such applications are equipped with fault tolerance mechanisms, as the occurrence of a failure may require a complete re-execution of the application, resulting in time and cost losses. MASA-CUDAlign is a parallel and exact sequence comparison tool that implements fault tolerance in a single GPU. The objective of this Master’s Dissertation is to propose and evaluate a fault tolerance mechanism for MASA-CUDAlign using multiple GPUs, referred to as FT-CUDAlign (Fault Tolerant CUDAlign). FT-CUDAlign is a lightweight fault tolerance mechanism, as it leverages an existing feature of MASA-CUDAlign, which is the storage of certain columns on disk. These columns are defined in FT-CUDAlign as synchronous checkpoints. Additionally, a fault detection and recovery protocol was proposed, using these checkpoints. The implementation of FT-CUDAlign was carried out in C and C++ and uses sockets to establish communication between processes. The experiments were conducted in two parallel environments, consisting of three to eight machines, each equipped with a GPU. The results showed that the overhead added by FT-CUDAlign, in failure-free executions, remained below 11% for experiments conducted in the AWS cloud and below 1% for the same experiments performed in LAICO. This overhead decreases as the sequence size increases. The results also demonstrated that FTCUDAlign was effective in handling both single and multiple failure scenarios, successfully completing computations using only the remaining machines.pt_BR
dc.description.unidadeInstituto de Ciências Exatas (IE)pt_BR
dc.description.unidadeDepartamento de Ciência da Computação (IE CIC)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Informáticapt_BR
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro simples do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.