Campo DC | Valor | Idioma |
dc.contributor.advisor | Ladeira, Marcelo | - |
dc.contributor.author | Stemler, Igor Tadeu Silva Viana | - |
dc.date.accessioned | 2020-02-10T18:37:19Z | - |
dc.date.available | 2020-02-10T18:37:19Z | - |
dc.date.issued | 2020-02-10 | - |
dc.date.submitted | 2019-07-05 | - |
dc.identifier.citation | STEMLER, Igor Tadeu Silva Viana. Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural. 2019. xii, 50 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019. | pt_BR |
dc.identifier.uri | https://repositorio.unb.br/handle/10482/36866 | - |
dc.description | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019. | pt_BR |
dc.description.abstract | Poder Judiciário Brasileiro possui um grande acúmulo de processos e um quantitativo
considerável de casos repetitivos. Em 2015 o Código de Processo Civil foi reformulado e criou o Incidente de
Resolução de Demandas Repetitivas (IRDR) e Incidente de Assunção de Competência (IAC). Esses
institutos permitem aos tribunais de 2ª instância sobrestar o andamento de processos similares em 1ª
instância, afetando um deles como processo principal para será julgado como paradigma para os demais. O
julgamento nele proferido será aplicado para todos os casos sobrestados em 1ª instância, evitando a
insegurança jurídica, já que reduz a chance de processos similares terem soluções judiciais diferentes por
terem sido julgados por juízes distintos. Essa insegurança jurídica poderá ocorrer na 2ª instância, uma vez
que tribunais diferentes podem julgar causas semelhantes de forma contrária. O objetivo deste trabalho é
criar uma ferramenta para identificação automática dos Precedentes Judiciais semelhantes e testar a
hipótese de que algoritmos que utilizam abordagens semânticas como o Latent Semantic Indexing (LSI) e
Latent Dirichlet Allocation (LDA) apresentam resultados melhores do que aqueles que utilizam somente
abordagem sintática como a função de ranqueamento Okapi Best Matching 25 (BM25). Os modelos são
avaliados de forma experimental, utilizando métricas de aferição de similaridade e o auxílio de um
especialista. O melhor modelo é estendido utilizando entidades nomeadas para verificar se há melhora na
performance. Precedentes semelhantes podem ser identificados com a utilização de técnicas baseadas em
análise semântica de texto, mas essa abordagem apresenta custo maior do que a abordagem com o modelo
BM25. Há melhora nos resultados com o uso de entidades nomeadas, mas com menor precisão ao
identificar novos precedentes semelhantes em relação ao modelo BM25, que mostrou ser a melhor opção
para a ferramenta em produção. A ferramenta apresenta grafos contendo os precedentes judiciais
semelhantes, podendo o usuário verificar se há precedentes semelhantes com decisões divergentes e
precedentes que deveriam estar suspensos devido a existência de recursos aos tribunais superiores de
questão de mesmo tema. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). | pt_BR |
dc.language.iso | Português | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Insegurança jurídica | pt_BR |
dc.subject.keyword | Abordagem semântica | pt_BR |
dc.subject.keyword | Abordagem sintática | pt_BR |
dc.subject.keyword | Mineração de texto | pt_BR |
dc.subject.keyword | Poder Judiciário - Brasil | pt_BR |
dc.subject.keyword | Precedentes judiciais | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.contributor.advisorco | Faleiros, Thiago de Paulo | - |
dc.description.abstract1 | The Brazilian Judiciary has too many lawsuits and a considerable number of repetitive cases. The
Code of Civil Procedure was reformulated in 2015 and created the "incident of resolution of repetitive claims"
(IRDR) and "competence assumption incident" (IAC) institutes. These precedents allow the courts of Appeal
to suspend similar lawsuits in the first instance, affecting one of them as the main process to be judged as a
paradigm for the others. The judgment of this case has to be applied to all cases overturned in the first
instance, avoiding legal uncertainty, since it reduces the chance of similar cases being judged differently. This
legal uncertainty can occur in the second instance, since different courts can judge similar causes in the
different way. The objective of this work is to create a tool for automatic identification of similar precedents
and to test the hypothesis that algorithms that use semantic approaches such as Latent Semantic Indexing
(LSI) e Latent Dirichlet Allocation (LDA) present better results than those that use only syntactic approach
such as the Okapi Best Matching 25 (BM25) ranking function. The models are evaluated experimentally,
using similarity gauging metrics and the assistance of a specialist. The best model is extended using named
entities to check for performance improvement. Similar precedents can be identified using techniques based
on text semantic analysis, but this approach is more costly than the BM25 approach. There is improvement in
the results with the use of named entities, but with less precision when identifying similar new precedents in
relation to the BM25 model, which appears to be the best option for the tool in production. The tool presents
graphs containing similar precedents, and the user can verify if there are similar precedents with divergent
decisions and precedents that should be suspended due to the existence of appeals to the higher courts of
issue of the same subject. | pt_BR |
dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|