Mineração de textos para classificação de processos judiciais trabalhistas

Rocha, Ana Carolina Pereira

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/37933

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2019_AnaCarolinaPereiraRocha.pdf		26,26 MB	Adobe PDF	Visualizar/Abrir

Título:	Mineração de textos para classificação de processos judiciais trabalhistas
Autor(es):	Rocha, Ana Carolina Pereira
Orientador(es):	Ramos, Guilherme Novaes
Coorientador(es):	Valentini, Rômulo Soares
Assunto:	Justiça do trabalho Processo Judicial Eletrônico (PJe) Classificação da informação Mineração de texto Aprendizagem de máquina
Data de publicação:	2-Jun-2020
Data de defesa:	4-Dez-2019
Referência:	ROCHA, Ana Carolina Pereira. Mineração de textos para classificação de processos judiciais trabalhistas. 2019. xiv, 148 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019.
Resumo:	Atualmente existe uma grande quantidade de processos que tramitam na justiça trabalhista brasileira, o que demanda um alto esforço dos servidores do judiciário e demais envolvidos para dar tratamento a todas as demandas. É possível que a aplicação de técnicas de mineração de textos possa contribuir com a identificação automática de informações relevantes dos processos. Assim, este trabalho aplicou algoritmos de classificação em um conjunto de 241 mil documentos do tipo Recursos Ordinários, extraídos de processos do PJe instalado na Justiça do Trabalho, com o objetivo de encontrar o assunto principal de processos do 2 o grau, considerando 35 assuntos possíveis. Foram comparados os algoritmos Multinomial Naïve Bayes, Multi-Layer Perceptron, Random Forest e SVM. Identificou-se baixo desempenho dos modelos para se encontrar o assunto principal, que negocialmente, pode ser uma escolha subjetiva na maior parte dos processos. Nesta abordagem, chegouse à uma micro precisão máxima de 46,03% com o Multi-Layer Perceptron. Ao fazer uma análise considerando o acerto dos modelos visando não apenas o assunto principal, mas avaliando se o modelo acertou qualquer um dos assuntos existentes no processo, chegouse a uma micro precisão de 75,21% com o Random Forest. Assim, mostrou-se que é possível extrair conhecimento dos documentos para identificação de assuntos, embora a identificação do assunto principal tenha apresentado baixo desempenho.
Abstract:	The number of lawsuits being processed in the Brazilian Labor Court system is growing every year, demanding more and more resources. This cost may be reduced by applying text mining techniques to the automatic identification of relevant information within a process. This work applied classification algorithms to a specific set of documents extracted from the Superior Court’s system (PJe), aiming to find the main subject of a process within 35 possibilities. Multinomial Naïve Bayes, Multi-Layer Perceptron, Random Forest and SVM were compared at this task, and the best result for micro precision was 46,03%, achieved through Multi-Layer Perceptron. Extending the analysis to consider all the related subjects, instead of only the main one, Random Forest provided a micro precision of 75,21%, indicating that a machine learning approach is a feasible approach.
Unidade Acadêmica:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Informações adicionais:	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
Programa de pós-graduação:	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas