Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/47817
Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2019_CarlosEduardoMachadoPires.pdf15,68 MBAdobe PDFVisualizar/Abrir
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorSilva, João Mello da-
dc.contributor.authorPires, Carlos Eduardo Machado-
dc.date.accessioned2024-02-21T10:43:27Z-
dc.date.available2024-02-21T10:43:27Z-
dc.date.issued2024-02-21-
dc.date.submitted2019-07-31-
dc.identifier.citationPIRES, Carlos Eduardo Machado. Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão. 2019. xiv, 78 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2019.pt_BR
dc.identifier.urihttp://repositorio2.unb.br/jspui/handle/10482/47817-
dc.descriptionDissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação Profissional em Computação Aplicada, 2019.pt_BR
dc.description.abstractSegundo o Sistema Nacional de Informação sobre Saneamento - SNIS, em 2016 a perda de faturamento da Companhia de Saneamento Ambiental do Distrito Federal, Caesb, foi de 24,71% decorrentes das perdas de água. As perdas de água são, majoritariamente, combatidas por ações de engenharia para detecção e correção de vazamentos nas redes, as chamadas perdas reais. No entanto, as perdas denominadas aparentes (aquelas em que a água produzida é consumida mas não faturada) são de difícil detecção, de modo que seu combate é realizado por investigações em campo após denúncias de fraudes ou seleção aleatória ou pouco sistematizada dos locais a serem investigados. Neste contexto, a mineração de dados se mostra ferramenta fundamental na identificação de riscos ao faturamento possibilitando otimizar as investigações in loco e descoberta de possibilidades de ampliação de receita. Esta pesquisa apresenta o estudo de caso da Caesb, onde duas abordagens foram adotadas visando identificar, por meio da mineração de dados, os potenciais riscos ao faturamento da companhia. A primeira abordagem focou na criação de um modelo preditivo para identificação de potenciais fraudes no consumo de água, onde duas hipóteses foram elaboradas, testadas e refutadas por problemas de consistência nos dados. A segunda abordagem pautou-se no conceito de par perfeito. Este conceito parte da premissa que o cliente deve gerar receita para Caesb pelos serviços de abastecimento de água e coleta de esgoto. Com este pressuposto, foi elaborada, testada e confirmada a hipótese de que clientes localizados em regiões em que existem redes de abastecimento de água e/ou esgotamento sanitário mas que não pagam por quaisquer destes serviços resultam em potencial risco ao faturamento da companhia. Neste sentido, o modelo de mineração de dados criado combina dados comerciais e geoespaciais para descoberta dos clientes que violam o conceito de par perfeito e, por meio de análise geoespacial, realiza a clusterização destes clientes em quatro grupos distintos: inconsistência cadastral, problema operacional, problema de expansão e problema de extensão. O modelo de mineração de dados é executado mensalmente, de forma automática, a cada fechamento comercial e o resultado da mineração apresentado em um dashboard web que possibilita identifica a quantidade, localidade e categoria dos imóveis que violam o par perfeito, bem como estimar o impacto financeiro causado. Em maio de 2019, o modelo detectou 119.887 potenciais situações que geram impacto financeiro, entre perda de faturamento e oportunidade de aumento de receita, na ordem de R$ 120 Milhões/ano, ou seja, 7,5% do faturamento anual da empresa.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).pt_BR
dc.language.isoporpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleGeoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansãopt_BR
dc.typeDissertaçãopt_BR
dc.subject.keywordPerdas financeiraspt_BR
dc.subject.keywordCompanhia de Saneamento Ambiental do Distrito Federal (Caesb/DF)pt_BR
dc.subject.keywordMineração de dadospt_BR
dc.subject.keywordGeoprocessamentopt_BR
dc.contributor.advisorcoLadeira, Marcelo-
dc.description.abstract1According to the National Sanitation Information System - SNIS, in 2016 the loss of revenues of the Environmental Sanitation Company of the Federal District, Caesb, was 24.71% due to water losses. Water losses are mostly countered by engineering actions to detect and correct leaks in the networks, the so-called real losses. However, the so-called apparent losses (those in which the produced water is consumed but not billed) are difficult to detect, so that their combat is carried out by field investigations after allegations of fraud or random or poorly selected sites to be investigated. In this context, data mining proves to be a fundamental tool in identifying billing risks, enabling the optimization of on-site investigations and the discovery of revenue expansion possibilities. This research presents Caesb’s case study, where two approaches were adopted to identify, through data mining, the potential risks to the company’s revenue. The first approach focused on the creation of a predictive model for identifying potential water consumption frauds, where two hypotheses were elaborated, tested and refuted by data consistency problems. The second approach was based on the concept of perfect match. This concept assumes that the client must generate revenue for Caesb for water supply and sewage collection services. Based on this assumption, it was developed, tested and confirmed that customers located in regions where there are water supply and/or sewage systems but who do not pay for any of these services result in a potential risk to the company’s revenues. In this sense, the data mining model created combines business and geospatial data to discover clients that violate the perfect pair concept and, through geospatial analysis, cluster these clients into four distinct groups (cadastral inconsistency, operational problem, expansion problem and extension problem). The data mining model is automatically executed monthly at each trade close and the mining result presented in a web dashboard that identifies the number, location and category of properties that violate the perfect match, as well as estimating the impact caused. In May 2019, the model detected, 119,887 potential situations that generate financial impact were detected, such as loss of revenue and opportunity to increase revenue, in the order of R$ 120 million / year, or 7.5% of the annual revenue of the Company.pt_BR
dc.description.unidadeInstituto de Ciências Exatas (IE)pt_BR
dc.description.unidadeDepartamento de Ciência da Computação (IE CIC)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Computação Aplicada, Mestrado Profissionalpt_BR
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro simples do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.