Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural

Stemler, Igor Tadeu Silva Viana

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Ladeira, Marcelo	-
dc.contributor.author	Stemler, Igor Tadeu Silva Viana	-
dc.date.accessioned	2020-02-10T18:37:19Z	-
dc.date.available	2020-02-10T18:37:19Z	-
dc.date.issued	2020-02-10	-
dc.date.submitted	2019-07-05	-
dc.identifier.citation	STEMLER, Igor Tadeu Silva Viana. Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural. 2019. xii, 50 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019.	pt_BR
dc.identifier.uri	https://repositorio.unb.br/handle/10482/36866	-
dc.description	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.	pt_BR
dc.description.abstract	Poder Judiciário Brasileiro possui um grande acúmulo de processos e um quantitativo considerável de casos repetitivos. Em 2015 o Código de Processo Civil foi reformulado e criou o Incidente de Resolução de Demandas Repetitivas (IRDR) e Incidente de Assunção de Competência (IAC). Esses institutos permitem aos tribunais de 2ª instância sobrestar o andamento de processos similares em 1ª instância, afetando um deles como processo principal para será julgado como paradigma para os demais. O julgamento nele proferido será aplicado para todos os casos sobrestados em 1ª instância, evitando a insegurança jurídica, já que reduz a chance de processos similares terem soluções judiciais diferentes por terem sido julgados por juízes distintos. Essa insegurança jurídica poderá ocorrer na 2ª instância, uma vez que tribunais diferentes podem julgar causas semelhantes de forma contrária. O objetivo deste trabalho é criar uma ferramenta para identificação automática dos Precedentes Judiciais semelhantes e testar a hipótese de que algoritmos que utilizam abordagens semânticas como o Latent Semantic Indexing (LSI) e Latent Dirichlet Allocation (LDA) apresentam resultados melhores do que aqueles que utilizam somente abordagem sintática como a função de ranqueamento Okapi Best Matching 25 (BM25). Os modelos são avaliados de forma experimental, utilizando métricas de aferição de similaridade e o auxílio de um especialista. O melhor modelo é estendido utilizando entidades nomeadas para verificar se há melhora na performance. Precedentes semelhantes podem ser identificados com a utilização de técnicas baseadas em análise semântica de texto, mas essa abordagem apresenta custo maior do que a abordagem com o modelo BM25. Há melhora nos resultados com o uso de entidades nomeadas, mas com menor precisão ao identificar novos precedentes semelhantes em relação ao modelo BM25, que mostrou ser a melhor opção para a ferramenta em produção. A ferramenta apresenta grafos contendo os precedentes judiciais semelhantes, podendo o usuário verificar se há precedentes semelhantes com decisões divergentes e precedentes que deveriam estar suspensos devido a existência de recursos aos tribunais superiores de questão de mesmo tema.	pt_BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).	pt_BR
dc.language.iso	Português	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural	pt_BR
dc.type	Dissertação	pt_BR
dc.subject.keyword	Insegurança jurídica	pt_BR
dc.subject.keyword	Abordagem semântica	pt_BR
dc.subject.keyword	Abordagem sintática	pt_BR
dc.subject.keyword	Mineração de texto	pt_BR
dc.subject.keyword	Poder Judiciário - Brasil	pt_BR
dc.subject.keyword	Precedentes judiciais	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	pt_BR
dc.contributor.advisorco	Faleiros, Thiago de Paulo	-
dc.description.abstract1	The Brazilian Judiciary has too many lawsuits and a considerable number of repetitive cases. The Code of Civil Procedure was reformulated in 2015 and created the "incident of resolution of repetitive claims" (IRDR) and "competence assumption incident" (IAC) institutes. These precedents allow the courts of Appeal to suspend similar lawsuits in the first instance, affecting one of them as the main process to be judged as a paradigm for the others. The judgment of this case has to be applied to all cases overturned in the first instance, avoiding legal uncertainty, since it reduces the chance of similar cases being judged differently. This legal uncertainty can occur in the second instance, since different courts can judge similar causes in the different way. The objective of this work is to create a tool for automatic identification of similar precedents and to test the hypothesis that algorithms that use semantic approaches such as Latent Semantic Indexing (LSI) e Latent Dirichlet Allocation (LDA) present better results than those that use only syntactic approach such as the Okapi Best Matching 25 (BM25) ranking function. The models are evaluated experimentally, using similarity gauging metrics and the assistance of a specialist. The best model is extended using named entities to check for performance improvement. Similar precedents can be identified using techniques based on text semantic analysis, but this approach is more costly than the BM25 approach. There is improvement in the results with the use of named entities, but with less precision when identifying similar new precedents in relation to the BM25 model, which appears to be the best option for the tool in production. The tool presents graphs containing similar precedents, and the user can verify if there are similar precedents with divergent decisions and precedents that should be suspended due to the existence of appeals to the higher courts of issue of the same subject.	pt_BR
dc.description.unidade	Instituto de Ciências Exatas (IE)	pt_BR
dc.description.unidade	Departamento de Ciência da Computação (IE CIC)	pt_BR
dc.description.ppg	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional	pt_BR
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado