http://repositorio.unb.br/handle/10482/50503
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ARTIGO_TreinamentoAnaliseModelo.pdf | 383,64 kB | Adobe PDF | Visualizar/Abrir |
Título: | Treinamento e análise de um modelo de tradução automática baseado em Transformer |
Outros títulos: | Training and analyzing a Transformer-based machine translation model |
Autor(es): | Pimentel, Clóvis Henrique Martins Pires, Thiago Blanch |
ORCID: | https://orcid.org/0009-0008-7049-7688 https://orcid.org/0000-0002-0060-6075 |
Afiliação do autor: | Universidade de Brasília Universidade de Brasília |
Assunto: | Linguística computacional Tradutor automático Tradução automática - avaliação |
Data de publicação: | 14-Jun-2024 |
Editora: | Universidade Federal de Minas Gerais |
Referência: | PIMENTEL, Clóvis Henrique Martins; PIRES, Thiago Blanch. Treinamento e análise de um modelo de tradução automática baseado em Transformer. Texto Livre, [S. l.], v. 17, e49118, 2024. DOI: https://doi.org/10.1590/1983-3652.2024.49118. Disponível em: https://www.scielo.br/j/tl/a/zgbYrQ7BRcZ9KNgthJDqQ3j/?lang=pt. Acesso em: 02 out. 2024. |
Resumo: | O presente trabalho possui como objetivo a análise dos modelos de tradução automática baseados em Transformer. Em específico, a pesquisa visa ao teste da viabilidade do uso de modelos treinados a partir de corpus especializado. Para o treinamento do modelo, foi construído um corpus paralelo inglês-francês a partir de sete textos da Convenção de 25 de outubro de 1980 sobre os Aspectos Civis do Rapto Internacional de Crianças. Os resultados de tradução obtidos pelo modelo treinado foram comparados com aqueles produzidos pelo Google Tradutor. Para a etapa de avaliação foram utilizados os métodos de avaliação automática sacreBLEU e avaliação humana. Os resultados da avaliação automática de frases produzidas pelo modelo treinado foram, em média, mais positivos que aqueles gerados pelo modelo não treinado. A avaliação humana das frases revelou que houve erros de adequação no uso da linguagem específica à matéria da Convenção da Haia de 1980 tanto em frases geradas pelo modelo treinado, quanto em frases geradas pelo modelo do Google Tradutor. |
Abstract: | The objective of this work is to analyze transformer-based machine translation models. It aims to test the feasibility of using trained models based on specialized corpus. For the training of such model, a parallel English-French corpus was built with seven texts related to the Convention of 25 October 1980 on the Civil Aspects of International Child Abduction. The translation results obtained by the trained model were compared with those produced by Google Translate. For the evaluation stage, sacreBLEU automatic evaluation and human evaluation methods were used. The outcome of the automatic evaluation of sentences produced by the trained model was, on average, higher than those generated by the non-trained model. The human evaluation of the sentences revealed that there were adequacy errors in the use of language specific to the subject matter of the 1980 Hague Convention both in sentences generated by the trained model and in sentences generated by the Google Translate model. |
Unidade Acadêmica: | Instituto de Letras (IL) Departamento de Línguas Estrangeiras e Tradução (IL LET) |
Licença: | Esta obra tem a licença “CC BY 4.0”. |
DOI: | https://doi.org/10.1590/1983-3652.2024.49118 |
Aparece nas coleções: | Artigos publicados em periódicos e afins |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.