Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/45443
Files in This Item:
File Description SizeFormat 
2022_CarlosAntonioCamposJorge.pdf2,93 MBAdobe PDFView/Open
Title: Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
Authors: Jorge, Carlos Antônio Campos
Orientador(es):: Melo, Alba Cristina Magalhães Alves de
Assunto:: Sequências biológicas - comparação
Field Programmable Gate Arrays (FPGAs)
Hardware reconfigurável
Issue Date: 5-Jan-2023
Citation: JORGE, Carlos Antônio Campos. Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas. 2022. xiii, 101 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.
Abstract: O alinhamento de sequências expõe claramente os padrões mais relevantes entre duas sequências, sendo útil para descobrir informação funcional, estrutural e evolucionária em sequências biológicas. Para tanto, é necessário descobrir o alinhamento ótimo, ou seja, o padrão que maximiza a similaridade entre as sequências. O algoritmo Longest Common Subsequence (LCS) produz o alinhamento ótimo e, por isso, é muito utilizado ao redor do mundo. Devido à complexidade quadrática de tempo, sua execução pode demorar muito se as sequências comparadas forem longas. Por isso, plataformas de hardware como FPGAs (Field Programmable Gate Arrays) tem sido exploradas. Para simplificar a programação de hardware, foram propostas soluções de alto nível, como HLS (High Level Synthesis), que transforma automaticamente um programa C, C++ ou SystemC em uma especificação de hardware, simplificando a programação. Para atingir certa simplicidade da programação e, consequentemente, reduzir o tempo necessário para a obtenção do circuito, exploramos nessa Tese a programação em HLS e em C. Além disso, investigamos soluções para a execução do algoritmo LCS tanto em plataformas FPGA stand-alone como em plataformas híbridas (CPU+FPGA). Inicialmente, confeccionamos um circuito programado em HLS, que foi executado em uma plataforma FPGA stand-alone. O circuito projetado comporta até dois co-processadores, permitindo a comparação paralela de dois pares de sequências. As execuções no ambiente stand-alone de um lote de 20 comparações de sequências sintéticas de 10K, 20K e 50K mostraram que a execução em FPGA consome menos energia e que as execuções híbridas (CPU+FPGA) atingem desempenho muito bom. Adicionalmente, foi comparado um lote de 20 sequências reais do vírus SARSCoV-2 (30K) na plataforma stand-alone. Nesse caso, a configuração com 2 co-processadores, executando 2 comparações em CPU e 18 comparações em FPGA obteve bons resultados, tanto em tempo de execução como em consumo de energia. Finalmente, a solução projetada para execução híbrida (CPU+FPGA) em plataformas stand-alone foi adaptada para execução na instância f1 da nuvem AWS. Na comparação de lotes de 20 sequências de 50K na nuvem AWS, mostramos que a configuração FPGA-only com dois coprocessadores executou-se em menor tempo e consumiu menos energia do que as configurações CPU-only e híbridas.
Abstract: Sequence alignment clearly exposes the most relevant patterns between two sequences, being useful for discovering functional, structural and evolutionary information in biological sequences. Therefore, it is necessary to find the optimal alignment, that is, the pattern that maximizes the similarity between the sequences. The Longest Common Subsequence (LCS) algorithm produces the optimal alignment and is therefore widely used around the world. Due to the quadratic complexity of time, its execution can take a long time if the compared sequences are long. Therefore, hardware platforms such as FPGAs (Field Programmable Gate Arrays) have been explored. To simplify hardware programming, high-level solutions have been proposed, such as HLS (High Level Synthesis), which automatically transforms a C, C++ or SystemC program into a hardware specification, simplifying programming. In order to achieve a certain simplicity of programming and, consequently, reduce the time needed to obtain the circuit, in this thesis we explore programming in HLS and in C. In addition, we investigate solutions for the execution of the LCS algorithm both on FPGA stand -alone as on hybrid platforms (CPU+FPGA). Initially, we made a circuit programmed in HLS, which was executed on an FPGA stand-alone platform. The designed circuit supports up to two co-processors, allowing the parallel comparison of two pairs of sequences. Executions in the stand-alone environment of a batch of 20 comparisons of 10K, 20K and 50K synthetic sequences showed that the FPGA execution consumes less power and that the hybrid executions (CPU+FPGA) achieve very good performance. Additionally, a batch of 20 real sequences of the SARS-CoV-2 virus (30K) on the stand-alone platform was compared. In this case, the configuration with 2 coprocessors, running 2 comparisons on CPU and 18 comparisons on FPGA obtained good results, both in execution time and in power consumption. Finally, the solution designed for hybrid execution (CPU+FPGA) on stand-alone platforms was adapted to run on the f1 instance of the AWS cloud. In comparing batches of 20 50K sequences in the AWS cloud, we showed that the FPGA-only configuration with two co-processors ran in less time and consumed less power than the CPU-only configurations. and hybrids.
metadata.dc.description.unidade: Instituto de Ciências Exatas (IE)
Departamento de Ciência da Computação (IE CIC)
Description: Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.
metadata.dc.description.ppg: Programa de Pós-Graduação em Informática
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).
Appears in Collections:Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/45443/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.