Campo DC | Valor | Idioma |
dc.contributor.advisor | Treptow, Werner L. | - |
dc.contributor.author | Santos, José Antonio Fiorote | - |
dc.date.accessioned | 2025-05-12T11:56:33Z | - |
dc.date.available | 2025-05-12T11:56:33Z | - |
dc.date.issued | 2025-05-12 | - |
dc.date.submitted | 2025-02-19 | - |
dc.identifier.citation | SANTOS, José Antonio Fiorote. Investigação estatística de pareamentos de proteínas em abordagens coevolutivas. 2025. 96 f., il. Tese (Doutorado em Biologia Molecular) — Universidade de Brasília, Brasília, 2025. | pt_BR |
dc.identifier.uri | http://repositorio.unb.br/handle/10482/52223 | - |
dc.description | Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, Programa de Pós-Graduação em Biologia Molecular, 2025. | pt_BR |
dc.description.abstract | As interações físicas em proteínas são mantidas ao longo da evolução por meio de
mutações compensatórias. Conforme extensivamente investigado nos Últimos anos, esse
sinal coevolutivo ó de grande relevância para a resolução ab initio de parceiros proteicos
específicos com base em alinhamentos múltiplos de sequências (MSAs). Neste trabalho,
examinamos as condições estatísticas dos sinais de coevolução que permitem previsões algorítmicas de parceiros proteicos com base em sequências de aminoácidos. Apresentamos
aqui um modelo estocástico do algoritmo genético que prevê o número de parceiros proteicos corretos com base em informações de coevolução. O modelo define as probabilidades
de estado usando uma mistura de distribuições normais e de Poisson, com parâmetros de
entrada que incluem o número total de sequências proteicas do sistema (M), a diferença
de informação coevolutiva (a) e a variância da informação coevolutiva em sistemas com
parceiros completamente embaralhados (a0). A analise do modelo aponta que estratégias
algorítmicas baseadas na maximização da informação coevolutiva não são eficientes para
encontrar os parceiros nativos em sistemas de proteínas com muitas sequências (M > 100),
mas as taxas de verdadeiros positivos (TP s) podem ser consideravelmente maiores ao desconsiderar erros cometidos entre sequências semelhantes. Essa abordagem nos permite
realizar uma classificação prévia de famílias de proteínas em que os parceiros podem ser
previstos de forma confiável ao ignorar erros triviais de similaridade entre sequências. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Investigação estatística de pareamentos de proteínas em abordagens coevolutivas | pt_BR |
dc.type | Tese | pt_BR |
dc.subject.keyword | Coevolução de proteínas | pt_BR |
dc.subject.keyword | Mutação (Biologia) | pt_BR |
dc.subject.keyword | Alinhamento de sequências | pt_BR |
dc.subject.keyword | Aminoácidos | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | Physical interactions in proteins are maintained throughout evolution through compensatory mutations. As extensively investigated in recent years, this coevolutionary
signal is highly relevant for the ab initio resolution of specific protein partners based on
multiple sequence alignments (MSAs). In this work, we examine the statistical conditions
of coevolutionary signals that enable algorithmic predictions of protein partners based
on amino acid sequences. Here, we present a stochastic model of the genetic algorithm
that predicts the number of correct protein partners based on coevolutionary information.
The model defines state probabilities using a mixture of normal and Poisson distributions, with input parameters including the total number of protein sequences in the system
(M), the difference in coevolutionary information (α), and the variance of coevolutionary
information in systems with completely shuffled partners (σ
2
0
). Model analysis indicates
that algorithmic strategies based on maximizing coevolutionary information are not efficient for finding native partners in protein systems with many sequences (M ≥ 100),
but true positive rates (T Ps) can be considerably higher when disregarding errors made
among similar sequences. This approach allows us to perform a preliminary classification of protein families in which partners can be reliably predicted by ignoring trivial
similarity-based errors between sequences. | pt_BR |
dc.description.unidade | Instituto de Ciências Biológicas (IB) | pt_BR |
dc.description.unidade | Departamento de Biologia Celular (IB CEL) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Biologia Molecular | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|