Campo DC | Valor | Idioma |
dc.contributor.advisor | Cajueiro, Daniel Oliveira | - |
dc.contributor.author | Mourão, Victor Damião Gontijo | - |
dc.date.accessioned | 2022-09-15T21:36:48Z | - |
dc.date.available | 2022-09-15T21:36:48Z | - |
dc.date.issued | 2022-09-15 | - |
dc.date.submitted | 2022-05-30 | - |
dc.identifier.citation | MOURÃO, Victor Damião Gontijo. Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas). 2022. 44 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.unb.br/handle/10482/44831 | - |
dc.description | Dissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2022. | pt_BR |
dc.description.abstract | A literatura tem mostrado que as técnicas de machine learning são bastante adequadas
no contexto de risco de crédito e muitos pesquisadores têm obtido bons resultados para
previsão da inadimplência. Nesse sentido, esta dissertação teve como objetivo a realização de
um estudo empírico, utilizando métodos de aprendizado supervisionado para a classificação
de tomadores de crédito. O trabalho foi desenvolvido a partir de uma base de dados real,
fornecida por um dos maiores bancos do Brasil, com informações de micro e pequenas
empresas contratantes de empréstimos no ano de 2020, período em que a pandemia da
COVID-19 impactava o cenário econômico. Utilizamos 3 técnicas de machine learning:
Regressão Logística, Random Forest e Gradient Boosting. E para aumentar o desempenho
dos algoritmos, diante de uma base de dados desbalanceada, utilizamos 3 técnicas de
balanceamento: NearMiss, SMOTE - Synthetic Minority Over-sampling Technique e
SMOTEENN - combinação do SMOTE com ENN - Edited Nearest Neighbours. Como
medida de sucesso, buscamos o aumento da AUC - Área Sob a Curva ROC, e, de acordo
com os resultados, o algoritmo que apresentou maior AUC foi o Random Forest com o
balanceamento SMOTE, atingindo resultado de 79,16%, e a menor AUC foi do algoritmo
Regressão Logística sem o balanceamento da base de treino, atingindo resultado de 67,99%. | pt_BR |
dc.language.iso | Português | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas) | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Aprendizagem de máquina | pt_BR |
dc.subject.keyword | Aprendizado supervisionado de máquina | pt_BR |
dc.subject.keyword | Risco de crédito | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | The literature has shown that machine learning techniques are quite suitable in the context
of credit risk and many researchers have obtained good results for default prediction.
In this sense, this dissertation aimed to carry out an empirical study, using supervised
learning methods to classify borrowers. The work was developed from a real database,
provided by one of the largest banks in Brazil, with information on micro and small
companies contracting loans in 2020, a period in which the COVID-19 pandemic impacted
the economic scenario. We used three machine learning techniques: Logistic Regression,
Random Forest and Gradient Boosting. And to increase the performance of the algorithms,
in front of an unbalanced database, we used three balancing techniques: NearMiss, SMOTE
- Synthetic Minority Over-sampling Technique and SMOTEENN - combination of SMOTE
with ENN - Edited Nearest Neighbors. As a measure of success, we sought to increase
the AUC - Area Under the ROC Curve, and, according to the results, the algorithm that
presented the highest AUC was Random Forest with SMOTE balance, reaching a result of
79.16%, and the lowest AUC was from the Logistic Regression algorithm without balancing
the training base, reaching a result of 67.99%. | pt_BR |
dc.description.unidade | Faculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas (FACE) | pt_BR |
dc.description.unidade | Departamento de Economia (FACE ECO) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Economia | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|