Acesso e compreensão de conteúdos em português por estrangeiros em bibliotecas digitais científicas : uma proposta metodológica e sua implementação

Menezes, Francisco Cláudio Sampaio de

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/31438

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2017_FranciscoClaudioSampaioMenezes.pdf		3,21 MB	Adobe PDF	Visualizar/Abrir

Título:	Acesso e compreensão de conteúdos em português por estrangeiros em bibliotecas digitais científicas : uma proposta metodológica e sua implementação
Autor(es):	Menezes, Francisco Cláudio Sampaio de
Orientador(es):	Baptista, Dulce Maria
Assunto:	Biblioteca digital Multimodalidade Serviços bibliotecários
Data de publicação:	14-Mar-2018
Data de defesa:	29-Nov-2017
Referência:	MENEZES, Francisco Cláudio Sampaio de. Acesso e compreensão de conteúdos em português por estrangeiros em bibliotecas digitais científicas: uma proposta metodológica e sua implementação. 2017. 198 f., il. Tese (Doutorado em Ciência da Informação)—Universidade de Brasília, Brasília, 2017.
Resumo:	A sociedade do conhecimento se caracteriza pela veloz ampliação do acesso a conteúdos digitais e pelo uso das tecnologias de informação e comunicação, as quais disponibilizam instantaneamente tais acervos em qualquer parte do globo. Mercê dessa nova ecologia tecnológica, significativas transformações ocorrem nos serviços oferecidos pelas bibliotecas e no seu relacionamento com usuários, tanto presencialmente como à distância. No contexto dessa atuação, além das fronteiras clássicas das bibliotecas e de uma necessidade de maior vitalidade linguística do português no mundo digital, a pesquisa objeto desta tese identifica alguns obstáculos ao acesso e compreensão de conteúdos científicos digitais por não falantes do português e propõe uma metodologia automatizada para facilitar a compreensão de textos científicos. A identificação das necessidades de falantes estrangeiros para acessar e compreender os conteúdos de bibliotecas digitais em língua portuguesa se fundamentou em dados coletados junto a estudantes estrangeiros francófonos, da Universidade de Brasília e da Universidade Charles de Gaulle (Lille 3) na França. O arcabouço conceitual interdisciplinar da tese está baseado em diversas disciplinas: arquitetura da informação, teoria da relevância, multimodalidade e no processamento da linguagem natural. A metodologia proposta no trabalho é operacionalizada por um aplicativo, desenvolvido em software livre na linguagem de programação Python, que integra a filtragem de texto, a sumarização textual automática, a tradução por máquina e o alinhamento sentencial automático. Esse dispositivo computacional pode ser utilizado em qualquer biblioteca interessada em ofertar um serviço personalizado para seus usuários estrangeiros. Os resultados obtidos são encorajadores, possibilitam uma maior vitalidade da língua portuguesa no campo científico e oferecem um campo fértil para novas pesquisas na áreas abordadas pela tese.
Abstract:	The knowledge society is marked by the quick amplification of access to digital contents and by the use of information and communication technologies, which make available such contents everywhere in the globe. Thanks to this new technological ecology, significative transformations occur in services offered by libraries and in its relationship with users, both in face-to-face contact and at distance. In the context of such an activity beyond of the classical libray frontiers and of a necessity of greater linguistic vitality of Portuguese in the digital world, this research identifies some obstacles for access and understanding of digital scientific contents by nonportuguese speakers and proposes an automated methodology to facilitate the understanding of scientific texts. The identification of foreign speakers’ needs in accessing and understanding contents in digital libraries in Portuguese language is based on data collected with foreign francophone students, in Universidade de Brasília (in Brazil) and Université Chales de Gaulle (Lille 3, in France). The interdisciplinary conceptual framework of the thesis has its theoretical fundaments on several disciplines: information architecture, relevance theory, multimodality and natural language processing. The methodology proposed in this work is made operational through a set of computer programs, developed in the programming language Python under the concept of free software. It integrates four software devices: text filter, automatic text summarization, machine translation and automatic sentence alignment. This software can be used in any library that might be interested in offering a personalized service for its foreign users. The results achieved are very encouraging, ensure greater vitality of Portuguese language in the scientific field and offer a very fertile field for further research in this thesis subject.
Résumé:	La société de la connaissance est marquée par un très rapide enlargissement de l’accès à des contenus numériques et l’usage des technologies de l’information et communication, lesquelles mettent à disposition en ligne ce patrimoine numérique à toutes les parties du globe. Grace à cette nouvelle écologie technologique, des transformations significatives ont lieu dans les services offerts par les bibliothèques et dans son rapport avec leurs usagers, soit à distance comme de façon présentielle. Dans ce contexte, audelà des frontières classiques des bibliothèques et d´une nécessité d´une plus grande vitalité linguistique du portugais dans le monde numérique, la recherche objet de la présente thèse identifie quelques obstacles à l’accès et compréhension de contenus numériques par des non-parlants du portugais et on propose une méthodologie automatisée pour rendre plus facilie la compréhension de textes scientifiques. L’identification des besoins des parlants étrangers pour accèder et comprendre les contenus de bibliothèques numériques en langue portugaise est basé sur des données collectés auprès des étudiants étrangers francophones, à l´Université de Brasilia e à l´Université Charles de Gaulle (Lille 3), en France. Le environment conceptuel interdisciplinaire de cette thèse s’appuie en plusieurs disciplines: architecture de l’information, theorie de la pertinence, multimodalité et dans le traitement automatique de la langue. La méthodologie proposé dans ce travail est mis en fonctionnement par un outil informatique, dévéloppé en logiciel libre en language Python, lequel intègre un filtrage du texte original, la sommairisation textuelle automatique, la traduction par machine e l’alignemenet sentenciel automatique. Ce dispositif computationel peut être utilisé en n’importe quelle bibliothèque interessée pour offrir un service “à la carte” à ses utilisateurs étrangers. Les résultats obtenus sont très encourageants, permettent une plus grande vitalité linguistique de la langue portugaise dans le champ scientifique et offrent un terrain fertile pour des nouvelles recherches dans les domaines abordés para cette thèse.
Unidade Acadêmica:	Faculdade de Ciência da Informação (FCI)
Informações adicionais:	Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2017.
Programa de pós-graduação:	Programa de Pós-Graduação em Ciência da Informação
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas