Skip navigation
Veuillez utiliser cette adresse pour citer ce document : http://repositorio2.unb.br/jspui/handle/10482/43307
Fichier(s) constituant ce document :
Fichier Description TailleFormat 
2021_GustavoMedeirosFerreiradosSantos.pdf424,51 kBAdobe PDFVoir/Ouvrir
Affichage complet
Élément Dublin CoreValeurLangue
dc.contributor.advisorCajueiro, Daniel Oliveira-
dc.contributor.authorSantos, Gustavo Medeiros Ferreira dos-
dc.date.accessioned2022-04-04T18:55:38Z-
dc.date.available2022-04-04T18:55:38Z-
dc.date.issued2022-03-04-
dc.date.submitted2021-12-17-
dc.identifier.citationSANTOS, Gustavo Medeiros Ferreira dos. Machine Learning Models for Bank failure Classification using different techniques to deal with imbalanced dataset. 2021. 39 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2021.pt_BR
dc.identifier.urihttps://repositorio.unb.br/handle/10482/43307-
dc.descriptionDissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2021.pt_BR
dc.description.abstractA previsão de falência bancária não é uma tarefa trivial. Não consiste apenas em escolher o melhor modelo, mas também a melhor forma de tratar o conjunto de dados altamente desequilibrado. Dados desequilibrados referem-se a um problema em que o número de observações pertencentes a uma classe é consideravelmente maior do que o das outras classes. É um desafio relativamente novo nos campos industrial e acadêmico porque muitas técnicas de aprendizado de máquina não têm um bom desempenho. Este trabalho tem como objetivo comparar os resultados de diferentes métodos de balanceamento, ou seja, Random UnderSampling, Random OverSampling e Synthetic Minority Oversampling Techniqueem um problema de classificação de bancos saudáveis e inadimplentes usando um painel de dados filtrado. O painel de dados consiste em vinte anos de instituições financeiras brasileiras e principais características econômicas que vão de 2000 a 2019. Com configurações de validação e classificação adequadas, são treinados modelos Logit com diferentes regularizações e modelos ensemble, como Random Forest e Gradient Boost em todas as três base de dados balanceados de forma diferente. A principal contribuição deste trabalho é a utilização de um filtro em dados em painel como primeiro passo para reduzir o problema de desequilíbriopt_BR
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq).pt_BR
dc.language.isoInglêspt_BR
dc.rightsAcesso Abertopt_BR
dc.titleMachine Learning Models for Bank failure Classification using different techniques to deal with imbalanced datasetpt_BR
dc.typeDissertaçãopt_BR
dc.subject.keywordFalência bancáriapt_BR
dc.subject.keywordDados desbalanceadospt_BR
dc.subject.keywordAprendizagem de máquinapt_BR
dc.subject.keywordModelos de classificaçãopt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.pt_BR
dc.description.abstract1Bank failure prediction is not an easy task. It consists not just in chosing the best model but also the best way to treat the highly imbalanced dataset. Imbalanced data refers to a problem where the number of observations belonging to one class is considerably higher than the other classes. It is a relatively new challenge in both industrial and academic fields because many machine learning techniques do not have a good performance. This work aims to compare the results of different balancing methods namely Random UnderSampling, Random OverSampling and Synthetic Minority Oversampling Technique on a healthy and default banks classification problem using a filtered panel data. The panel data consists in twenty years of Brazilian financial institutions and major economic features ranging from 2000 to 2019. With a proper validation and classification settings it is trained Logit models with different regularizations and ensemble models such as Random Forest and Gradient Boost on all three different balanced datasets. The major contribution of this work uses a filter in panel data as first step to reduce imbalance problempt_BR
dc.description.unidadeFaculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas (FACE)pt_BR
dc.description.unidadeDepartamento de Economia (FACE ECO)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Economiapt_BR
Collection(s) :Teses, dissertações e produtos pós-doutorado

Affichage abbrégé " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/43307/statistics">



Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.