http://repositorio.unb.br/handle/10482/47817
File | Description | Size | Format | |
---|---|---|---|---|
2019_CarlosEduardoMachadoPires.pdf | 15,68 MB | Adobe PDF | View/Open |
Title: | Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão |
Authors: | Pires, Carlos Eduardo Machado |
Orientador(es):: | Silva, João Mello da |
Coorientador(es):: | Ladeira, Marcelo |
Assunto:: | Perdas financeiras Companhia de Saneamento Ambiental do Distrito Federal (Caesb/DF) Mineração de dados Geoprocessamento |
Issue Date: | 21-Feb-2024 |
Data de defesa:: | 31-Jul-2019 |
Citation: | PIRES, Carlos Eduardo Machado. Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão. 2019. xiv, 78 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2019. |
Abstract: | Segundo o Sistema Nacional de Informação sobre Saneamento - SNIS, em 2016 a perda de faturamento da Companhia de Saneamento Ambiental do Distrito Federal, Caesb, foi de 24,71% decorrentes das perdas de água. As perdas de água são, majoritariamente, combatidas por ações de engenharia para detecção e correção de vazamentos nas redes, as chamadas perdas reais. No entanto, as perdas denominadas aparentes (aquelas em que a água produzida é consumida mas não faturada) são de difícil detecção, de modo que seu combate é realizado por investigações em campo após denúncias de fraudes ou seleção aleatória ou pouco sistematizada dos locais a serem investigados. Neste contexto, a mineração de dados se mostra ferramenta fundamental na identificação de riscos ao faturamento possibilitando otimizar as investigações in loco e descoberta de possibilidades de ampliação de receita. Esta pesquisa apresenta o estudo de caso da Caesb, onde duas abordagens foram adotadas visando identificar, por meio da mineração de dados, os potenciais riscos ao faturamento da companhia. A primeira abordagem focou na criação de um modelo preditivo para identificação de potenciais fraudes no consumo de água, onde duas hipóteses foram elaboradas, testadas e refutadas por problemas de consistência nos dados. A segunda abordagem pautou-se no conceito de par perfeito. Este conceito parte da premissa que o cliente deve gerar receita para Caesb pelos serviços de abastecimento de água e coleta de esgoto. Com este pressuposto, foi elaborada, testada e confirmada a hipótese de que clientes localizados em regiões em que existem redes de abastecimento de água e/ou esgotamento sanitário mas que não pagam por quaisquer destes serviços resultam em potencial risco ao faturamento da companhia. Neste sentido, o modelo de mineração de dados criado combina dados comerciais e geoespaciais para descoberta dos clientes que violam o conceito de par perfeito e, por meio de análise geoespacial, realiza a clusterização destes clientes em quatro grupos distintos: inconsistência cadastral, problema operacional, problema de expansão e problema de extensão. O modelo de mineração de dados é executado mensalmente, de forma automática, a cada fechamento comercial e o resultado da mineração apresentado em um dashboard web que possibilita identifica a quantidade, localidade e categoria dos imóveis que violam o par perfeito, bem como estimar o impacto financeiro causado. Em maio de 2019, o modelo detectou 119.887 potenciais situações que geram impacto financeiro, entre perda de faturamento e oportunidade de aumento de receita, na ordem de R$ 120 Milhões/ano, ou seja, 7,5% do faturamento anual da empresa. |
Abstract: | According to the National Sanitation Information System - SNIS, in 2016 the loss of revenues of the Environmental Sanitation Company of the Federal District, Caesb, was 24.71% due to water losses. Water losses are mostly countered by engineering actions to detect and correct leaks in the networks, the so-called real losses. However, the so-called apparent losses (those in which the produced water is consumed but not billed) are difficult to detect, so that their combat is carried out by field investigations after allegations of fraud or random or poorly selected sites to be investigated. In this context, data mining proves to be a fundamental tool in identifying billing risks, enabling the optimization of on-site investigations and the discovery of revenue expansion possibilities. This research presents Caesb’s case study, where two approaches were adopted to identify, through data mining, the potential risks to the company’s revenue. The first approach focused on the creation of a predictive model for identifying potential water consumption frauds, where two hypotheses were elaborated, tested and refuted by data consistency problems. The second approach was based on the concept of perfect match. This concept assumes that the client must generate revenue for Caesb for water supply and sewage collection services. Based on this assumption, it was developed, tested and confirmed that customers located in regions where there are water supply and/or sewage systems but who do not pay for any of these services result in a potential risk to the company’s revenues. In this sense, the data mining model created combines business and geospatial data to discover clients that violate the perfect pair concept and, through geospatial analysis, cluster these clients into four distinct groups (cadastral inconsistency, operational problem, expansion problem and extension problem). The data mining model is automatically executed monthly at each trade close and the mining result presented in a web dashboard that identifies the number, location and category of properties that violate the perfect match, as well as estimating the impact caused. In May 2019, the model detected, 119,887 potential situations that generate financial impact were detected, such as loss of revenue and opportunity to increase revenue, in the order of R$ 120 million / year, or 7.5% of the annual revenue of the Company. |
metadata.dc.description.unidade: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Description: | Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação Profissional em Computação Aplicada, 2019. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional |
Agência financiadora: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.