http://repositorio.unb.br/handle/10482/44753
File | Description | Size | Format | |
---|---|---|---|---|
2022_PatrickFerreiradosSantos.pdf | 568,5 kB | Adobe PDF | View/Open |
Title: | Uso de técnicas de machine learning para análise de risco de crédito |
Authors: | Santos, Patrick Ferreira dos |
Orientador(es):: | Kimura, Herbert |
Assunto:: | Aprendizagem de máquina Risco de crédito Cheque especial Floresta aleatória Árvore de decisão |
Issue Date: | 9-Sep-2022 |
Data de defesa:: | 15-Jun-2022 |
Citation: | SANTOS, Patrick Ferreira dos. Uso de técnicas de machine learning para análise de risco de crédito. 2022. 55 f., il. Dissertação (Mestrado Profissional em Economia) — Universidade de Brasília, Brasília, 2022. |
Abstract: | Este trabalho objetivou identificar um modelo preditivo de classificação de risco de crédito em operações comerciais de cheque especial para pessoa física que possibilite o devido gerenciamento de riscos e mensuração mais precisa das situações de default proporcionando a evolução financeira do credor. A variável target considera o cliente “mau” caso ultrapasse 90 dias de atraso em algum mês, durante os 12 primeiros meses após a contratação, caso contrário, o cliente será considerado “bom”. Foram utilizados os algoritmos de Machine Learning Regressão Logística, k-Nearest Neighbors (k-NN), Support Vector Machines (SVM), Árvore de Decisão, Floresta Aleatória e Gradient Boosting. Para validação dos modelos fizemos uso das métricas Precisão, Recall, Especificidade, F1-Score, Média Geométrica, IBA (Index Balanced Accuracy) e a curva ROC (AUC). Os resultados apontaram melhor desempenho para o modelo Floresta Aleatória podendo ser incremento de resultado para instituições financeiras. O que aponta melhor performance de modelos de computação inteligente sobre modelos estatísticos tradicionais como Regressão Logística. Além disso, não foram encontrados outros trabalhos sobre a temática de cheque especial. |
Abstract: | This study aimed to identify a predictive model of credit risk classification in commercial operations of overdraft for individuals that allows proper risk management and more accurate measurement of default situations, providing the financial evolution of the creditor. The target variable considers the customer “bad” if he exceeds 90 days of delay in any month, during the first 12 months after hiring, otherwise, the customer will be considered “good”. The algorithms of Machine Learning as Logistic Regression, k-Nearest Neighbors (k-NN), Support Vector Machines (SVM), Decision Tree, Random Forest and Gradient Boosting were used. To validate the models, we used the metrics Precision, Recall, Specificity, F1-Score, Geometric Mean and IBA (Index Balanced Accuracy) and the ROC curve (AUC). The results showed better performance for the Random Forest model, which could be an increase in results for financial institutions. This points to better performance of intelligent computing models over traditional statistical models such as Logistic Regression. In addition, no other works on the subject of overdraft were found. |
Description: | Dissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas, Programa de Pós-graduação em Economia, 2022. |
Licença:: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.