http://repositorio.unb.br/handle/10482/31769
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2017_BárbaraMüllerSalomãodeFaria.pdf | 7,67 MB | Adobe PDF | Visualizar/Abrir |
Título: | Seleção genômica e estudos de associação genômica ampla para características de crescimento em populações de melhoramento de Eucalyptus |
Outros títulos: | Genomic selection and genome-wide association studies for growth traits in breeding populations of Eucalyptus |
Autor(es): | Faria, Bárbara Müller Salomão de |
Orientador(es): | Grattapaglia, Dario |
Assunto: | Eucalipto - melhoramento genético Genética vegetal |
Data de defesa: | 12-Dez-2017 |
Referência: | FARIA, Bárbara Müller Salomão de. Seleção genômica e estudos de associação genômica ampla para características de crescimento em populações de melhoramento de Eucalyptus. 2017. xxi, 153 f., il. Tese (Doutorado em Biologia Molecular)—Universidade de Brasília, Brasília, 2017. |
Resumo: | Esta tese de doutorado apresenta resultados de pesquisa em seleção genômica ampla (GS) e estudos de associação genômica ampla (GWAS) em seis populações de melhoramento de Eucalyptus, com o objetivo de avaliar o potencial destas abordagens em explicar a herdabilidade, detectar associações significativas e predizer fenótipos de características de crescimento. No primeiro capítulo foram comparadas as abordagens de predição genômica e associação genômica ampla para características de crescimento em populações de melhoramento de Eucalyptus benthamii (𝑛 = 505) e Eucalyptus pellita (𝑛 = 732). Ambas as espécies são de crescente interesse comercial para o desenvolvimento de germoplasma adaptado a estresses ambientais. A capacidade preditiva atingiu 0,16 em E. benthamii e 0,44 em E. pellita para crescimento em diâmetro. As capacidades preditivas usando BLUP genômico ou diferentes métodos Bayesianos atingiram resultados semelhantes, indicando que as características de crescimento se ajustam adequadamente ao modelo infinitesimal. Nenhuma diferença foi detectada na capacidade preditiva quando diferentes conjuntos de SNPs foram utilizados, com base na posição (equidistantes no genoma, dentro de genes, podados considerando o desequilíbrio de ligação ou em cromossomos individuais), desde que o número total de SNPs utilizados fosse superior a 5.000. As capacidades preditivas obtidas pela remoção de parentesco entre as populações de treinamento e validação caíram para quase zero em E. benthamii e foram reduzidas pela metade em E. pellita. Esses resultados corroboram a visão atual de que o parentesco é o principal motor da predição genômica, embora algum desequilíbrio de ligação histórico provavelmente tenha sido capturado para E. pellita. Um estudo de associação genômica identificou apenas uma associação significativa para volume em E. pellita, ilustrando o fato de que, embora a predição genômica seja capaz de explicar grandes proporções da herdabilidade, muito pouco ou quase nada é capturado em associações significativas usando a abordagem de GWAS nas populações de melhoramento do tamanho avaliado neste estudo. Este estudo forneceu dados experimentais adicionais que indicam perspectivas positivas de usar dados genômicos para capturar grandes proporções de herdabilidade e predizer características de crescimento em espécies florestais com acurácias iguais ou melhores do que aquelas capturadas pela seleção fenotípica convencional. Adicionalmente, esses resultados documentaram a superioridade da abordagem de GS na capacidade de capturar grandes proporções da variância genética para crescimento, em comparação com o valor limitado da abordagem de GWAS ao se considerar aplicações no melhoramento operacional. A maioria dos estudos de GWAS em plantas, no entanto, assim como este descrito acima, tem sofrido com um poder estatístico limitado, especialmente para características complexas. Tamanhos amostrais maiores são necessários no sentido de aumentar a capacidade de detecção de variantes, especialmente aquelas de baixa frequência e de pequeno efeito. Devido aos desafios logísticos e altos custos para aumentar o tamanho das populações em estudos de associação, uma alternativa tem sido a implementação de Joint-GWAS, utilizando informações combinadas de populações independentes. Joint-GWAS utiliza diferentes abordagens estatísticas para combinar os resultados de múltiplos estudos em um esforço para aumentar o poder de detecção em relação a estudos individuais, melhorar as estimativas do tamanho dos efeitos e/ou resolver a incerteza quando resultados dos estudos individuais não concordam. No segundo capítulo desta tese de doutorado foi realizado um estudo de associação genômica ampla utilizando dados de quatro populações independentes para características de crescimento, montando assim uma população de associação consideravelmente maior do que estudos anteriores em espécies florestais. Dados de um total de 3.373 árvores de quatro populações híbridas de Eucalyptus grandis x Eucalyptus urophylla não relacionadas, cada uma delas com 758 a 979 indivíduos, foram utilizados. Estas populações haviam sido genotipadas com uma plataforma de SNP comum desenvolvida para Eucalyptus permitindo assim a implementação de Joint-GWAS. O impacto da correção para estrutura de população e/ou parentesco sobre a capacidade de detecção de associações significativas foi explorado utilizando seis modelos estatísticos com base na análise de SNPs individuais. Uma redução drástica no número de associações significativas foi observada ao se adotar correções mais rigorosas. Foi avaliado ainda o desempenho de diferentes abordagens de mapeamento de associação utilizando segmentos genômicos contendo vários SNPs em contrates com SNPs individuais. A abordagem de mapeamento de herdabilidades regionais, nas quatro populações analisadas de forma independente, identificou regiões genômicas que explicaram individualmente 3-13% da herdabilidade genômica. Variantes raras foram detectadas usando abordagens de Joint-GWAS baseadas em conjuntos de SNPs dentro de genes e em segmentos específicos. Associações foram detectadas em genes relacionados à biossíntese da parede celular e resistência à doença, sugerindo potenciais efeitos pleiotrópicos no crescimento da árvore. De maneira geral, o aumento do tamanho amostral e a aplicação de diferentes abordagens de análise combinada de populações ainda revelaram um número limitado de associações, corroborando a complexidade de características de crescimento e a provável participação de um grande número de variantes de pequeno efeito de difícil detecção no controle de crescimento. Entretanto, estes resultados indicam ainda que à medida que mais programas de melhoramento de Eucalyptus adotarem genômica para predizer fenótipos com base em uma plataforma SNP comum, conjuntos de dados cada vez maiores ficarão disponíveis e Joint-GWAS como descrito neste estudo de forma inédita em espécies florestais, será capaz de contribuir para a identificação de SNPs ou segmentos genômicos que controlam proporções relevantes da herdabilidade. |
Abstract: | This doctoral thesis presents results of research in genomic selection (GS) and genome-wide associations studies (GWAS) in six Eucalyptus breeding populations, with the objective of evaluating the potential of these approaches in explaining heritability, detecting significant associations and predicting phenotypes of growth traits. In the first chapter, genomic prediction approaches and association studies for growth traits in Eucalyptus benthamii (𝑛 = 505) and Eucalyptus pellita (𝑛 = 732) breeding populations were compared. Both species are of increasing commercial interest for the development of germplasm adapted to environmental stresses. Predictive ability reached 0.16 in E. benthamii and 0.44 in E. pellita for diameter growth. Predictive abilities using either Genomic BLUP or different Bayesian methods reached similar results, indicating that growth adequately fits the infinitesimal model. No difference was detected in predictive ability when different sets of SNPs were utilized, based on position (equidistantly genome-wide, inside genes, linkage disequilibrium pruned or on single chromosomes), as long as the total number of SNPs used was above ~5,000. Predictive abilities obtained by removing relatedness between training and validation sets fell near zero for E. benthamii and were halved for E. pellita. These results corroborate the current view that relatedness is the main driver of genomic prediction, although some historical linkage disequilibrium was likely captured for E. pellita. A genome-wide association study identified only one significant association for volume growth in E. pellita, illustrating the fact that while genome-wide regression is able to account for large proportions of the heritability, very little or none is captured into significant associations using GWAS in breeding populations of the size evaluated in this study. This study provided further experimental data supporting positive prospects of using genome-wide information to capture large proportions of trait heritability and predict growth traits in trees with accuracies equal or better than those attainable by phenotypic selection. Additionally, our results documented the superiority of the wholegenome regression approach in accounting for large proportions of the heritability of complex traits, such as growth, in contrast to the limited value of the local GWAS approach toward breeding applications. Most GWAS in plants, like the one described above, have suffered from limited statistical power especially for complex traits. Larger sample sizes are needed to enhance the ability to identify variants, especially those of low-frequency and small effect. Due to the challenges and high costs of increasing sample size in GWAS, an alternative has been to implement Joint-GWAS, using the combined information from independent populations. Joint-GWAS use different statistical approaches to combine the results from multiple studies in an effort to increase detection power over individual studies, improve estimates of the size of the effect and/or to resolve uncertainty when reports from individual studies disagree. In the second chapter of this doctoral thesis, a GWAS for growth traits was performed by assembling a considerably larger association population than any previous GWAS in forest trees. Data for a total of 3,373 trees across four unrelated Eucalyptus grandis x Eucalyptus urophylla hybrid breeding populations, with samples sizes varying between 758 and 979 individuals, were used. These populations had been genotyped with a common SNP platform for Eucalyptus species, thus allowing a Joint-GWAS implementation. The impact of correcting for population structure and/or relatedness on the detection of significant associations was explored using six single-SNP GWAS models. A drastic reduction in the number of significant associations detected was observed when more stringent correction was adopted. We also evaluated the performance of different segment-based GWAS approaches involving several SNPs simultaneously in comparison to single-SNP analyses. Regional heritability mapping, in these four populations independently, pinpointed genomic regions that individually explained 3-13% of the genomic heritability. Rare variants were detected using gene and region-based Joint-GWAS approaches. Associations were detected into genes related to cell wall biosynthesis and disease resistance, suggesting potential pleiotropic effects on tree growth. In general, the increase in sample size and the application of different approaches of Joint-GWAS still revealed a limited number of associations, corroborating the complexity of growth traits and the likely participation of a large number of variants of small effect of difficult detection in the control of growth traits. However, these results further indicate that as more Eucalyptus breeding programs adopt genomics to predict phenotypes based on a common SNP platform, increasing datasets will be available and Joint-GWAS as described in this study for the first time in forest trees, will be able to contribute to the identification of SNPs or genomic segments controlling relevant portions of trait heritability. |
Informações adicionais: | Tese (doutorado)—Universidade de Brasília, Departamento de Biologia Celular, Instituto de Ciências Biológicas, Programa de Pós-Graduação em Biologia Molecular, 2017. |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições:Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.