Parametric quantile regression for income data

Borges, Giovanna Valadares

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/44359

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2022_GiovannaValadaresBorges.pdf		625,28 kB	Adobe PDF	Visualizar/Abrir

Título:	Parametric quantile regression for income data
Outros títulos:	Regressão quantílica paramétrica para dados de renda
Autor(es):	Borges, Giovanna Valadares
E-mail do autor:	giovannavaladares13@gmail.com
Orientador(es):	Santos, Helton Saulo Bezerra dos
Assunto:	Distribuições de renda Regressão quantílica Dados de renda Reparametrização
Data de publicação:	28-Jul-2022
Data de defesa:	26-Abr-2022
Referência:	BORGES, Giovanna Valadares. Parametric quantile regression for income data. 2022. xiv, 33 f., il. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2022.
Resumo:	Modelos de regressão normais univariados são ferramentas estatísticas amplamente aplicadas em muitas áreas da economia. No entanto, dados de renda têm comportamento assimétrico e tem melhor performance de modelagem com distribuições não-normais. A modelagem da renda desempenha um papel importante na determinação dos ganhos dos trabalhadores, além de ser um importante tópico de pesquisa em economia do trabalho. Os modelos de regressão quantílica são alternativas robustas aos modelos tradicionais baseados em média. Isso porque, ao invés de focar na média condicional, esses modelos são baseados no quantil condicional, como a mediana. A abordagem quantílica tem a vantagem de proporcionar flexibilidade na modelagem, pois permite considerar os efeitos das variáveis explicativas em todo o espectro da variável dependente, incluindo assim também o efeito sobre a mediana, que é uma medida de tendência central melhor que a média no contexto assimétrico. A modelagem de renda começou com proposições de Vilfredo Pareto, estabelecendo uma lei sobre como funciona a distribuição de renda. Mais tarde, essas proposições sugeriram uma distribuição - conhecida como distribuição de Pareto - que estabeleceu uma referência para outras distribuições, como log-normal e gama, para mostrar seu potencial na descrição da distribuição de renda. No entanto, apesar de Pareto, Log-Normal e Gama serem as distribuições mais frequentemente aplicadas aos dados de renda devido à sua capacidade de descrever esse tipo de dado, elas têm limitações. O modelo de Pareto é mais apropriado apenas para descrever a cauda superior da distribuição. Por outro lado, as distribuições Log-Normal e Gama têm um desempenho ruim na descrição das caudas superior e inferior em distribuições reais. Distribuições de renda como Dagum e Singh-Maddala mostraram, na literatura, terem capacidade de superar as distribuições de Pareto, log-normal e gama em termos de ajuste de modelo. A distribuição Dagum tem flexibilidade para lidar com mudanças de distribuição, renda nula e negativa; faixa de renda com início de renda mínima positiva não predeterminada e funções de densidade estritamente decrescentes e unimodais. Ela também demonstra ter uma boa qualidade de ajuste, acomodando bem caudas pesadas, característica comumente encontrada em dados de renda. Já a distribuição de Singh-Maddala deriva do conceito de taxa de risco, uma abordagem amplamente utilizada na literatura de confiabilidade. Uma de suas vantagens é ser mais flexível que outras distribuições de renda. As distribuições Dagum e Singh-Maddala são casos especiais da distribuição beta generalizada do segundo tipo (GB2) e ambas obedecem à lei fraca lei de Pareto, isto é, convergem assintoticamente à distribuição de Pareto. Desta forma, o objetivo deste trabalho é propor modelos de regressão quantílicos paramétricos baseados em duas importantes distribuições de renda assimétricas, a saber, as distribuições Dagum e Singh-Maddala. Os modelos quantílicos propostos são baseados em reparametrizações das distribuições originais, através da inserção de um parâmetro de quantil. Essa abordagem leva em consideração o ganho em flexibilidade de modelagem, tornando possível analisar os modelos reparametrizados propostos a partir dos efeitos das variáveis explicativas ao longo do espectro da variável dependente, com especial foco no efeito da mediana. São apresentadas as reparametrizações, algumas importantes propriedades das distribuições, e os modelos de regressão quantílica em conjunto com o processo inferencial, levando em consideração também a inclusão do parâmetro quantílico em métricas econométricas como Índice de Gini e as Curvas de Lorenz e Bonferroni – utilizadas para avaliar o grau de desigualdade entre indivíduos, principalmente no âmbito de renda. Em seguida, apresentamos estudos de simulação de Monte Carlo, considerando a avaliação do desempenho das estimativas de máxima verossimilhança e uma análise da distribuição empírica dos resíduos para avaliar a performance geral dos modelos. Para estudar os estimadores de máxima verossimilhança, usamos o cálculo do viés, erro quadrático médio (MSE) e probabilidade de cobertura (CP). Espera-se que, à medida que o tamanho da amostra aumente, o viés e o MSE diminuam, à medida que o CP se aproxima do nível nominal de 95%. Já para o estudo dos resíduos, analisamos os resultados dos resíduos Cox-Snell Generalizado (GCS) e Quantil Randomizado (RQ) com as respectivas estatísticas descritivas (média, mediana, desvio padrão, coeficiente de assimetria e coeficiente de curtose). Foi possível notar que ambos os modelos atendem aos resultados esperados para esses estudos, com as estimativas apresentando bom desempenho e os resíduos com boa concordância em relação às suas distribuições de referência. Para a aplicação a dados reais, foram usados dados de renda familiar chilena em 2016, fornecido pelo Instituto Nacional de Estatística do Chile. Os resultados dos nossos modelos com esse conjunto de dados foram comparados ao estudo anterior que propôs um modelo de regressão quantílica Birnbaum-Saunders (Sánchez et al., 2021b). Os resultados mostram que ambos os modelos propostos tiveram um desempenho melhor que o Birnbaum-Saunders, com ajustes melhores e melhor adaptabilidade em relação aos resíduos. Assim, conclui-se que os resultados foram favoráveis ao uso dos modelos de regressão quantílica de Singh-Maddala e Dagum para dados positivos com assimetria, especialmente para dados de renda.
Abstract:	Univariate normal regression models are statistical tools widely applied in many areas of economics. Nevertheless, income data have asymmetric behavior and are best modeled by nonnormal distributions. The modeling of income plays an important role in determining workers’ earnings, as well as being an important research topic in labor economics. Thus, the objective of this work is to propose parametric quantile regression models based on two important asymmetric income distributions, namely, Dagum and Singh-Maddala distributions. The proposed quantile models are based on reparameterizations of the original distributions by inserting a quantile parameter. The quantile approach has the advantage of providing flexibility in modeling, as it allows considering the effects of explanatory variables throughout the spectrum of the dependent variable, thus also including the effect on the median, which is a measure of central tendency better than the mean in the asymmetric context. We present the reparameterizations, some important properties of the distributions, and the quantile regression models with their inferential aspects. We proceed with Monte Carlo simulation studies, considering the maximum likelihood estimation performance evaluation and an analysis of the empirical distribution of two residuals. The Monte Carlo results show that both models meet the expected outcomes. We apply the proposed quantile regression models to a household income data set provided by the National Institute of Statistics of Chile. The results to our models with this data set were compared to a previous study by Sánchez et al. (2021b) that introduced a Birnbaum-Saunders quantile regression model. We showed that both proposed models had a better performance than the Birnbaum-Saunders model. Thus, we conclude that results were favorable to the use of Singh-Maddala and Dagum quantile regression models for positive asymmetric data, such as income data.
Unidade Acadêmica:	Instituto de Ciências Exatas (IE) Departamento de Estatística (IE EST)
Informações adicionais:	Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.
Programa de pós-graduação:	Programa de Pós-Graduação em Estatística
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora:	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas