http://repositorio.unb.br/handle/10482/40798
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2020_ThiagoAlencarGomes.pdf | 2,04 MB | Adobe PDF | Visualizar/Abrir |
Título: | Avaliação de técnicas de similaridade textual na uniformização de jurisprudência |
Autor(es): | Gomes, Thiago Alencar |
Orientador(es): | Ladeira, Marcelo |
Coorientador(es): | Faleiros, Thiago de Paulo |
Assunto: | Mineração de texto Linguagem natural - processamento Recuperação da informação |
Data de publicação: | 3-Mai-2021 |
Data de defesa: | 10-Dez-2020 |
Referência: | GOMES, Thiago Alencar. Avaliação de técnicas de similaridade textual na uniformização de jurisprudência. 2020. xv, 67 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2020. |
Resumo: | A uniformização de jurisprudência é de extrema importância para a sociedade. Através dela é possível garantir maior celeridade processual e estabilidade jurídica à medida que novos casos são julgados com base na mesma tese jurídica de casos similares anteriores. Para garantir o efetivo acesso às teses, as bases textuais são indexadas em ferramentas de busca textual. Este estudo tem como contexto o Superior Tribunal de Justiça (STJ) que possui uma ferramenta legada de busca textual que fornece somente buscas baseadas em consultas booleanas com operadores lógicos e de proximidade complexos. Para facilitar a busca no corpus de decisões da Corte, a Secretária de Jurisprudência (SJR) fornece diversos produtos, como consultas pré-construídas para teses importantes e decisões agrupadas que possuem as mesmas teses. Assim, é possível acessar de forma otimizada a interpretação da legislação pelo STJ e acompanhar a sua evolução. O tempo dispendido na construção das consultas e no treinamento de servidores para utilização da ferramenta motiva este trabalho na avaliação da aplicação de outras técnicas de similaridade na recuperação de decisões. Como baseline utilizamos as consultas do sistema legado e comparamos com buscas a partir de textos, que descrevem as teses, escritos pelos servidores ou textos selecionados diretamente das decisões. Os resultados indicam que a utilização direta dos textos com modelos tradicionais TF-IDF e BM25 pode substituir as consultas do sistema legado. Os modelos semânticos baseados em predição Word2Vec e BERT não apresentaram ganhos em relação aos modelos clássicos. |
Abstract: | Jurisprudence is the set of all decisions of a judicial court and when they are organized efficiently they reflect the majority interpretation of the same court and thus consolidate an legal thesis used repeatedly. Hence, it is possible to guarantee faster judgments and legal stability as new cases are judged based on the same legal thesis as previous similar cases. This research investigates the use of text retrieval techniques on the Brazilian Superior Court of Justice decisions. The Court uses a legacy textual system that only provides complex Boolean queries. The training of new analysts on the tool takes between 2 and 3 months. This scenario motivates the research of other textual retrieval techniques that use text written in natural language as a queries. Through a historical base of legal theses descriptions written by the analysts, the decisions that those theses were extracted and the legacy system queries built to retrieve decisions with the same theses this work simulates two approaches. First, recovery of decisions after a user selects paragraphs with the legal opinion. Second, recovery of decisions after a user enters the legal opinion description in free text. The legacy system is used as baseline and compared with TF-IDF, BM25 retrieval models and prediction based semantic models Word2Vec and BERT. The results indicate that it is possible to replace the legacy system using classic and semantic textual retrieval using the decisions text as queries, with minimum intervention from the user. |
Unidade Acadêmica: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Informações adicionais: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020. |
Programa de pós-graduação: | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.