http://repositorio.unb.br/handle/10482/36760
File | Description | Size | Format | |
---|---|---|---|---|
2019_MateusCarboneAnanias.pdf | 424,42 kB | Adobe PDF | View/Open |
Title: | Implementação de um algoritmo evolucionário multiobjetivo para clustering de dados complexos |
Authors: | Ananias, Mateus Carbone |
Orientador(es):: | Cançado, André Luiz Fernandes |
Assunto:: | Clusterização Algoritmos genéticos Agrupamento de dados Multiobjective Clustering with Automatic k-determination (MOCK) |
Issue Date: | 20-Jan-2020 |
Data de defesa:: | 10-Jul-2019 |
Citation: | ANANIAS, Mateus Carbone. Implementação de um algoritmo evolucionário multiobjetivo para clustering de dados complexos. 2019. 45 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2019. |
Abstract: | Devido ao grande volume e variedade de dados existentes atualmente, clusterizar dados tem sido um grande desafio. Este trabalho teve como objetivo implementar o MOCK (Multiobjective Clustering with Automatic k-determination) em linguagem R, estudar possíveis melhorias e aplicação em dados reais. Este algoritmo funciona através de um algoritmo genético multiobjetivo chamado de PESA-II, além de ter como funcionalidade a seleção automatizada de grupos. Os resultados apresentados por Handl and Knowles (2007) foram reproduzidos com sucesso para todos os métodos utilizados. Comparou-se o MOCK com outras técnicas de agrupamento em uma aplicação com dados reais. Estes dados constituem-se de dados genéticos com alta dimensionalidade. Mostrou-se que o MOCK conseguiu identificar os grupos desse conjunto de dados de maneira mais eficiente que os outros métodos. Conclui-se que o MOCK é uma ferramenta bastante eficaz para agrupar dados em uma grande diversidade de situações, competindo frente-a-frente com diversos métodos de agrupamento. |
Abstract: | Because of the large volume and variety of data currently available, clustering data has been a major challenge. This work aimed to implement MOCK (Multiobjective Clustering with Automatic k-determination) in R, to study possible improvements and application in real data. This algorithm works through a multiobjective genetic algorithm called PESAII, besides having as a function the automated selection of groups. The results presented by Handl and Knowles (2007) have been successfully reproduced for all methods used. MOCK was compared with other grouping techniques in an application with real data, this data consisted of genetic data with high dimensionality. It was shown that MOCK was able to identify the groups in this data set more eficiently than the other methods. It is concluded that MOCK is a very eficient tool for grouping data in a great diversity of situations, competing face-to-face with several grouping methods. |
metadata.dc.description.unidade: | Instituto de Ciências Exatas (IE) Departamento de Estatística (IE EST) |
Description: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2019. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Estatística |
Licença:: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Agência financiadora: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.