Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/52223
Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_JoseAntonioFioroteSantos_TESE.pdf20,56 MBAdobe PDFVisualizar/Abrir
Título: Investigação estatística de pareamentos de proteínas em abordagens coevolutivas
Autor(es): Santos, José Antonio Fiorote
Orientador(es): Treptow, Werner L.
Assunto: Coevolução de proteínas
Mutação (Biologia)
Alinhamento de sequências
Aminoácidos
Data de publicação: 12-Mai-2025
Referência: SANTOS, José Antonio Fiorote. Investigação estatística de pareamentos de proteínas em abordagens coevolutivas. 2025. 96 f., il. Tese (Doutorado em Biologia Molecular) — Universidade de Brasília, Brasília, 2025.
Resumo: As interações físicas em proteínas são mantidas ao longo da evolução por meio de mutações compensatórias. Conforme extensivamente investigado nos Últimos anos, esse sinal coevolutivo ó de grande relevância para a resolução ab initio de parceiros proteicos específicos com base em alinhamentos múltiplos de sequências (MSAs). Neste trabalho, examinamos as condições estatísticas dos sinais de coevolução que permitem previsões algorítmicas de parceiros proteicos com base em sequências de aminoácidos. Apresentamos aqui um modelo estocástico do algoritmo genético que prevê o número de parceiros proteicos corretos com base em informações de coevolução. O modelo define as probabilidades de estado usando uma mistura de distribuições normais e de Poisson, com parâmetros de entrada que incluem o número total de sequências proteicas do sistema (M), a diferença de informação coevolutiva (a) e a variância da informação coevolutiva em sistemas com parceiros completamente embaralhados (a0). A analise do modelo aponta que estratégias algorítmicas baseadas na maximização da informação coevolutiva não são eficientes para encontrar os parceiros nativos em sistemas de proteínas com muitas sequências (M > 100), mas as taxas de verdadeiros positivos (TP s) podem ser consideravelmente maiores ao desconsiderar erros cometidos entre sequências semelhantes. Essa abordagem nos permite realizar uma classificação prévia de famílias de proteínas em que os parceiros podem ser previstos de forma confiável ao ignorar erros triviais de similaridade entre sequências.
Abstract: Physical interactions in proteins are maintained throughout evolution through compensatory mutations. As extensively investigated in recent years, this coevolutionary signal is highly relevant for the ab initio resolution of specific protein partners based on multiple sequence alignments (MSAs). In this work, we examine the statistical conditions of coevolutionary signals that enable algorithmic predictions of protein partners based on amino acid sequences. Here, we present a stochastic model of the genetic algorithm that predicts the number of correct protein partners based on coevolutionary information. The model defines state probabilities using a mixture of normal and Poisson distributions, with input parameters including the total number of protein sequences in the system (M), the difference in coevolutionary information (α), and the variance of coevolutionary information in systems with completely shuffled partners (σ 2 0 ). Model analysis indicates that algorithmic strategies based on maximizing coevolutionary information are not efficient for finding native partners in protein systems with many sequences (M ≥ 100), but true positive rates (T Ps) can be considerably higher when disregarding errors made among similar sequences. This approach allows us to perform a preliminary classification of protein families in which partners can be reliably predicted by ignoring trivial similarity-based errors between sequences.
Unidade Acadêmica: Instituto de Ciências Biológicas (IB)
Departamento de Biologia Celular (IB CEL)
Informações adicionais: Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, Programa de Pós-Graduação em Biologia Molecular, 2025.
Programa de pós-graduação: Programa de Pós-Graduação em Biologia Molecular
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.