Meta aprendizado para detecção de mudança de conceito não supervisionada

Melo, Fernanda Amaral

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/49801

Arquivos associados a este item:

Arquivo	Tamanho	Formato
FernandaAmaralMelo_DISSERT.pdf	3,41 MB	Adobe PDF	Visualizar/Abrir

Título:	Meta aprendizado para detecção de mudança de conceito não supervisionada
Autor(es):	Melo, Fernanda Amaral
Orientador(es):	Garcia, Luís Paulo Faina
Assunto:	Conceitos Meta-aprendizagem Monitoramento de modelos Aprendizagem de máquina
Data de publicação:	13-Ago-2024
Data de defesa:	30-Ago-2023
Referência:	MELO, Fernanda Amaral. Meta aprendizado para detecção de mudança de conceito não supervisionada. 2023. 89 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2023.
Resumo:	O avanço tecnológico na geração e transmissão de dados impulsionou o surgimento de diversas aplicações de fluxos de dados. Esses ambientes altamente dinâmicos frequentemente enfrentam o desafio da mudança de conceito, em que as propriedades estatísticas das variáveis se alteram ao longo do tempo, resultando na perda de desempenho dos modelos de Aprendizado de Máquina. Neste estudo, é apresentada uma nova ferramenta para detecção de mudança de conceito em problemas de fluxo de dados com grande atraso na chegada da variável alvo, por meio do uso de meta aprendizado. Optou-se por empregar o meta aprendizado devido à sua capacidade de lidar adequadamente com ambientes de fluxo de dados e adaptabilidade em cenários com mudanças de conceito, dado que esta técnica é capaz de identificar padrões e tendências nos dados de forma dinâmica. No entanto, em oposição à abordagem tradicional de recomendação de algoritmos, utilizou-se um regressor no nível meta para prever o desempenho do modelo base em cada janela. Essa predição é então utilizada para gerar alertas de mudança de conceito antes da chegada da variável alvo. O treinamento do meta modelo foi realizado com base em diversos meta atributos não supervisionados descritos na literatura de meta aprendizado. Além disso, foram adicionadas medidas não supervisionadas de detecção de mudança de conceito como parte dos atributos, com o objetivo de aumentar a capacidade preditiva do modelo gerado. O algoritmo foi aplicado em bases de dados com mudança de conceito rotulada, e os alertas gerados foram comparados com métricas usuais da literatura de mudança de conceito. Ao final, foi realizado um teste de Friedman para comparação os resultados. O algoritmo proposto de meta aprendizado obteve uma precisão 15% superior à melhor baseline, com um p valor abaixo de 0.05 para os casos em que foram utilizados modelos base baseados em árvores.
Abstract:	Advances in the data generation and transmission have enhanced the existence of many data flows applications. These highly dynamic environments often face the challenge of concept drift, where the statistical properties of variables change over time, leading to performance degradation in Machine Learning models. This study presents a novel tool for concept drift detection in data stream problems with significant delay in the arrival of the target variable, using meta learning. Meta learning was chosen due to its ability to handle data stream environments effectively and its adaptability in scenarios with concept drift, given that this technique can identify patterns and trends in data dynamically. However, contrary to the traditional approach of algorithm recommendation, a meta level regressor was employed to predict the performance of the base model in each time window. This prediction is then utilized to generate concept drift alerts before the arrival of the target variable. The meta model was trained using various unsupervised meta attributes from the meta learning literature. Additionally, unsupervised concept drift detection measures were incorporated as part of the attributes to enhance the predictive capability of the generated model. The algorithm was applied to labeled concept drift datasets, and the generated alerts were compared with standard concept drift literature metrics. Finally, a Friedman test was conducted to compare the results. The proposed meta learning algorithm achieved a 15% higher precision than the best baseline, with a p-value below 0.05 for cases where base models based on trees were employed.
Unidade Acadêmica:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Informações adicionais:	Dissertação (Mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023.
Programa de pós-graduação:	Programa de Pós-Graduação em Informática
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas