Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas)

Mourão, Victor Damião Gontijo

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Cajueiro, Daniel Oliveira	-
dc.contributor.author	Mourão, Victor Damião Gontijo	-
dc.date.accessioned	2022-09-15T21:36:48Z	-
dc.date.available	2022-09-15T21:36:48Z	-
dc.date.issued	2022-09-15	-
dc.date.submitted	2022-05-30	-
dc.identifier.citation	MOURÃO, Victor Damião Gontijo. Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas). 2022. 44 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2022.	pt_BR
dc.identifier.uri	https://repositorio.unb.br/handle/10482/44831	-
dc.description	Dissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2022.	pt_BR
dc.description.abstract	A literatura tem mostrado que as técnicas de machine learning são bastante adequadas no contexto de risco de crédito e muitos pesquisadores têm obtido bons resultados para previsão da inadimplência. Nesse sentido, esta dissertação teve como objetivo a realização de um estudo empírico, utilizando métodos de aprendizado supervisionado para a classificação de tomadores de crédito. O trabalho foi desenvolvido a partir de uma base de dados real, fornecida por um dos maiores bancos do Brasil, com informações de micro e pequenas empresas contratantes de empréstimos no ano de 2020, período em que a pandemia da COVID-19 impactava o cenário econômico. Utilizamos 3 técnicas de machine learning: Regressão Logística, Random Forest e Gradient Boosting. E para aumentar o desempenho dos algoritmos, diante de uma base de dados desbalanceada, utilizamos 3 técnicas de balanceamento: NearMiss, SMOTE - Synthetic Minority Over-sampling Technique e SMOTEENN - combinação do SMOTE com ENN - Edited Nearest Neighbours. Como medida de sucesso, buscamos o aumento da AUC - Área Sob a Curva ROC, e, de acordo com os resultados, o algoritmo que apresentou maior AUC foi o Random Forest com o balanceamento SMOTE, atingindo resultado de 79,16%, e a menor AUC foi do algoritmo Regressão Logística sem o balanceamento da base de treino, atingindo resultado de 67,99%.	pt_BR
dc.language.iso	Português	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas)	pt_BR
dc.type	Dissertação	pt_BR
dc.subject.keyword	Aprendizagem de máquina	pt_BR
dc.subject.keyword	Aprendizado supervisionado de máquina	pt_BR
dc.subject.keyword	Risco de crédito	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	pt_BR
dc.description.abstract1	The literature has shown that machine learning techniques are quite suitable in the context of credit risk and many researchers have obtained good results for default prediction. In this sense, this dissertation aimed to carry out an empirical study, using supervised learning methods to classify borrowers. The work was developed from a real database, provided by one of the largest banks in Brazil, with information on micro and small companies contracting loans in 2020, a period in which the COVID-19 pandemic impacted the economic scenario. We used three machine learning techniques: Logistic Regression, Random Forest and Gradient Boosting. And to increase the performance of the algorithms, in front of an unbalanced database, we used three balancing techniques: NearMiss, SMOTE - Synthetic Minority Over-sampling Technique and SMOTEENN - combination of SMOTE with ENN - Edited Nearest Neighbors. As a measure of success, we sought to increase the AUC - Area Under the ROC Curve, and, according to the results, the algorithm that presented the highest AUC was Random Forest with SMOTE balance, reaching a result of 79.16%, and the lowest AUC was from the Logistic Regression algorithm without balancing the training base, reaching a result of 67.99%.	pt_BR
dc.description.unidade	Faculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas (FACE)	pt_BR
dc.description.unidade	Departamento de Economia (FACE ECO)	pt_BR
dc.description.ppg	Programa de Pós-Graduação em Economia	pt_BR
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado