Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/22581
Files in This Item:
File Description SizeFormat 
2016_JoséRômulodeCastroVieira.pdf2,2 MBAdobe PDFView/Open
Title: Predição do bom e do mau pagador no Programa Minha Casa, Minha Vida
Authors: Vieira, José Rômulo de Castro
Orientador(es):: Kimura, Herbert
Assunto:: Habitações
Risco de crédito
Inadimplência (Finanças)
Habitações - créditos - Brasil
Programa Minha Casa Minha Vida (Brasil)
Issue Date: 15-Feb-2017
Citation: VIEIRA, José Rômulo de Castro. Predição do bom e do mau pagador no programa minha casa, minha vida. 2016. xiii, 88 f., il. Dissertação (Mestrado em Administração)—Universidade de Brasília, Brasília, 2016.
Abstract: Este trabalho tem como objetivo principal implementar diferentes modelos de previsão da inadimplência,a partir de métodos de creditscoring e técnicas computacionais com algoritmos deMachine Learning (Análise discriminante, regressão logística, DecisionTree, Random Forest,BootstrapAggregating e AdaptiveBoosting) e comparar a adequação dos modelos de previsão da inadimplência que melhor identifiquem o bom e o mau pagador no Programa Minha Casa, Minha Vida. Para avaliar a adequação dos modelos de Machine Learning, foram realizados três testes com a obtenção dos índices Area Under ROC Curve (AUROC), Kolmogorov–Smirnov (KS) eBRIER Score com o intuito de validar os modelos em diferentes intervalos de tempo para variável dependente default (30, 60, 90, 120 dias), validar os modelos, considerando um número menor de observações (300.000) e validar os modelos sem o uso de variáveis discriminatórias (gênero,idade e estado civil). Verifica-se que a capacidade de predição dos modelos melhorou, à medida que o número de dias de atrasos utilizados para definir a variável default, aumentava. Os melhores resultados foram obtidos com Bootstrap Aggregating (Bagging), Random Forest (RF) e Adaptive Boosting (AdaBoost). Observa-se um impacto negativo considerável nos resultados quando utilizado um número menor de observações. Verificou-se também que a retirada de variáveis discriminatórias dos modelos preserva o poder discriminatório do sistema de classificação de riscode crédito. Aplicando o algoritmo Bagging no Programa Minha Casa, Minha Vida (PMCMV) a taxa de inadimplência que é de 11,80% poderia ser reduzida para 2,95%. Logo, 197.905 mil contratos inadimplentes deixariam de existir no PMCMV resultando em uma redução nas perdas com inadimplência de aproximadamente R$ 9,8 bilhões.
Abstract: The main objective of this work is to implement different models of forecasting of default, from credit scoring methods and computational techniques with Machine Learning algorithms (discriminant analysis, logistic regression, decision tree, random forest, bootstrap aggregating and adaptive boosting) and compare The adequacy of the default models that best identify the good and the bad payer in the "Programa Minha Casa, Minha Vida"(PMCMV). In order to evaluate the suitability of the Machine Learning models, three tests were carried out to obtain the Area Under ROC curve (AUROC), Kolmogorov-Smirnov (KS) and BRIER Score indices with the aim of validating the models at different time intervals for variable (30, 60, 90, 120 days), validate the models, considering a smaller number of observations (300,000) and validate the models without the use of discriminatory variables (gender, age and marital status). It is verified that the prediction capacity of the models improved, as the number of days of delays used to define the default variable increased. The best results were obtained with bootstrap aggregating (Bagging), random forest (RF) and adaptive boosting (AdaBoost). A considerable negative impact on results is observed when a smaller number of observations are used. It was also found that the removal of discriminatory variables from the models preserves the discriminatory power of the credit risk classification system. Applying the Bagging algorithm in the "Programa Minha Casa, Minha Vida"(PMCMV) program, the default rate of 11.80% could be reduced to 2.95%. Therefore, 197,905 thousand defaulted contracts would cease to exist in the PMCMV resulting in a reduction in losses with delinquencies of approximately 9.8 billion of real.
Description: Dissertação (mestrado)—Universidade de Brasília, Faculdade de Administração, Economia, Contabilidade e Gestão Pública, Programa de Pós-Graduação em Administração, 2016.
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
DOI: http://dx.doi.org/10.26512/2016.12.D.22581
Appears in Collections:Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/22581/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.