Treinamento e análise de um modelo de tradução automática baseado em Transformer

Pimentel, Clóvis Henrique Martins; Pires, Thiago Blanch

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/50503

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
ARTIGO_TreinamentoAnaliseModelo.pdf		383,64 kB	Adobe PDF	Visualizar/Abrir

Título:	Treinamento e análise de um modelo de tradução automática baseado em Transformer
Outros títulos:	Training and analyzing a Transformer-based machine translation model
Autor(es):	Pimentel, Clóvis Henrique Martins Pires, Thiago Blanch
ORCID:	https://orcid.org/0009-0008-7049-7688 https://orcid.org/0000-0002-0060-6075
Afiliação do autor:	Universidade de Brasília Universidade de Brasília
Assunto:	Linguística computacional Tradutor automático Tradução automática - avaliação
Data de publicação:	14-Jun-2024
Editora:	Universidade Federal de Minas Gerais
Referência:	PIMENTEL, Clóvis Henrique Martins; PIRES, Thiago Blanch. Treinamento e análise de um modelo de tradução automática baseado em Transformer. Texto Livre, [S. l.], v. 17, e49118, 2024. DOI: https://doi.org/10.1590/1983-3652.2024.49118. Disponível em: https://www.scielo.br/j/tl/a/zgbYrQ7BRcZ9KNgthJDqQ3j/?lang=pt. Acesso em: 02 out. 2024.
Resumo:	O presente trabalho possui como objetivo a análise dos modelos de tradução automática baseados em Transformer. Em específico, a pesquisa visa ao teste da viabilidade do uso de modelos treinados a partir de corpus especializado. Para o treinamento do modelo, foi construído um corpus paralelo inglês-francês a partir de sete textos da Convenção de 25 de outubro de 1980 sobre os Aspectos Civis do Rapto Internacional de Crianças. Os resultados de tradução obtidos pelo modelo treinado foram comparados com aqueles produzidos pelo Google Tradutor. Para a etapa de avaliação foram utilizados os métodos de avaliação automática sacreBLEU e avaliação humana. Os resultados da avaliação automática de frases produzidas pelo modelo treinado foram, em média, mais positivos que aqueles gerados pelo modelo não treinado. A avaliação humana das frases revelou que houve erros de adequação no uso da linguagem específica à matéria da Convenção da Haia de 1980 tanto em frases geradas pelo modelo treinado, quanto em frases geradas pelo modelo do Google Tradutor.
Abstract:	The objective of this work is to analyze transformer-based machine translation models. It aims to test the feasibility of using trained models based on specialized corpus. For the training of such model, a parallel English-French corpus was built with seven texts related to the Convention of 25 October 1980 on the Civil Aspects of International Child Abduction. The translation results obtained by the trained model were compared with those produced by Google Translate. For the evaluation stage, sacreBLEU automatic evaluation and human evaluation methods were used. The outcome of the automatic evaluation of sentences produced by the trained model was, on average, higher than those generated by the non-trained model. The human evaluation of the sentences revealed that there were adequacy errors in the use of language specific to the subject matter of the 1980 Hague Convention both in sentences generated by the trained model and in sentences generated by the Google Translate model.
Unidade Acadêmica:	Instituto de Letras (IL) Departamento de Línguas Estrangeiras e Tradução (IL LET)
Licença:	Esta obra tem a licença “CC BY 4.0”.
DOI:	https://doi.org/10.1590/1983-3652.2024.49118
Aparece nas coleções:	Artigos publicados em periódicos e afins

Mostrar registro completo do item Visualizar estatísticas