Campo DC | Valor | Idioma |
dc.contributor.advisor | Silva, Gladston Luiz da | - |
dc.contributor.author | Santos, Marlu da Silva | - |
dc.date.accessioned | 2021-04-22T10:28:07Z | - |
dc.date.available | 2021-04-22T10:28:07Z | - |
dc.date.issued | 2021-04-22 | - |
dc.date.submitted | 2020-12-02 | - |
dc.identifier.citation | SANTOS, Marlu da Silva. Modelos de aprendizagem de máquina para identificar o risco do trabalho escravo contemporâneo em cidades brasileiras. 2020. xii, 53 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2020. | pt_BR |
dc.identifier.uri | https://repositorio.unb.br/handle/10482/40609 | - |
dc.description | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020. | pt_BR |
dc.description.abstract | O crime do trabalho escravo contemporâneo permeia por centenas de países e extinguir essa violação humana é um dever global. No Brasil, o trabalho escravo contemporâneo é caracterizado pelo código penal. Uma série de problemas são encontrados pelos agentes responsáveis pela inibição deste crime. As principais dificuldades estão relacionadas em: atender as denúncias que necessitam ser priorizadas; identificar ou antecipar aos crimes; medir o nível de erradicação do trabalho escravo; e recursos insuficientes para atender as ocorrências. A existência de um mecanismo para prever o nível de risco associado a cada cidade pode ser uma ferramenta importante para um passo na erradicação do trabalho escravo contemporâneo. Este estudo propõe o uso de modelos preditivos para identificar o risco da escravidão contemporânea em cidades brasileiras utilizando dados socioeconômicos, demográficos e registros de operações de resgate. Como existem muitas denúncias deste tipo de crime, identificar o grau do risco em cada cidade é uma ferramenta essencial para auxiliar no planejamento das fiscalizações. O estudo utiliza a técnica embedded com regularização Lasso (L1) para seleção de variáveis. Um método comparativo de técnicas para o tratamento de dados desbalanceados foi aplicado, os resultados mostraram que para o contexto do problema a técnica indicada é ROS. No total, 16 modelos são avaliados, formados por 8 diferentes conjuntos de dados e dois classificadores: LR e GBM. Os resultados indicam o modelo GBM com melhor performance, com acurácia de 77%, AUC 80% e G-mean 71%. Como validação do modelo um teste estatístico com reamostragem é aplicado utilizando Bootstrapping para 1000 iterações, cujos resultados apontam que o modelo se manteve robusto, visto que para um intervalo de confiança de 0.95, a acurácia ficou entre 87.5% e 87.8%. O melhor modelo foi validado com dados de fiscalização mais recentes, cujos resultados do levantamento revelaram estar coerentes com o teste estatístico do modelo, visto que de 96 novas ocorrências registradas para os anos de 2019 a junho de 2020, o modelo acertou 87,5% e errou 12,5%. | pt_BR |
dc.language.iso | Português | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Modelos de aprendizagem de máquina para identificar o risco do trabalho escravo contemporâneo em cidades brasileiras | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Aprendizagem de máquina | pt_BR |
dc.subject.keyword | Regressão logística | pt_BR |
dc.subject.keyword | Gradient Boosting | pt_BR |
dc.subject.keyword | Mineração de dados | pt_BR |
dc.subject.keyword | Dados desbalanceados | pt_BR |
dc.subject.keyword | Escravidão contemporânea | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | Crime of contemporary slave labor pervades hundreds of countries and extinguishing this human
violation is a global duty. In Brazil, contemporary slave labor is characterized by the penal code.
A number of problems are encountered by the agents responsible for inhibiting this crime. The
main difficulties are related to: attend to complaints that need to be prioritized; identify or anticipate
crimes; measure the level of eradication of slave labor; and insufficient resources to deal with the
occurrences. The existence of a mechanism to predict the level of risk associated with each city
can be an important step towards the eradication of contemporary slave labor. This study
proposes the use of predictive models to identify the risk of contemporary slavery in Brazilian
cities using socioeconomic, demographic and rescue operation records. As there are many
reports of this type of crime, identifying the degree of risk in each city is an essential tool to assist
in planning inspections. The study uses the embedded technique with Lasso regularization (L1)
to select variables. A comparative method of techniques for the treatment of unbalanced data
was applied, the results showed that for the context of the problem the appropriate technique is
ROS. In total, 16 models are evaluated, formed by 8 different data sets and two classifiers: LR
and GBM. The results indicate the GBM model with the best performance, with accuracy of 77%,
AUC 80% and G-mean 71%. As a validation of the model, a statistical test with resampling is
applied using Bootstrapping for 1000 iterations, which results show that the model remained
robust, seen that for a confidence interval of 0.95, the accuracy was between 87.5% and 87.8%.
The best model was validated with more recent inspection data, the results of the validation
revealed to be consistent with the statistical test of the model, since of 96 new occurrences
registered for the years 2019 to June 2020, the model got 87,5% right and 12,5% wrong. | pt_BR |
dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|