Campo DC | Valor | Idioma |
dc.contributor.advisor | Martins, Dalton Lopes | - |
dc.contributor.author | Brito, Jean Carlos Borges | - |
dc.date.accessioned | 2024-07-12T19:45:31Z | - |
dc.date.available | 2024-07-12T19:45:31Z | - |
dc.date.issued | 2024-07-12 | - |
dc.date.submitted | 2023-11-21 | - |
dc.identifier.citation | BRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023. | pt_BR |
dc.identifier.uri | http://repositorio2.unb.br/jspui/handle/10482/48817 | - |
dc.description | Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023. | pt_BR |
dc.description.abstract | Introdução. Com o aumento exponencial de dados, devido a sua característica digital,
amplia-se também os problemas de ausência ou a discrepância de metadados cadastrados,
tornando um trabalho oneroso e árduo para um ser humano corrigi-los manualmente. Surge a
necessidade de investigações para melhorar a organização e facilitar recuperação da
informação. Nesse contexto, a aplicação de inteligência artificial através da aprendizagem de
máquina, utilizando ferramentas automáticas e semiautomáticas de forma complementar para
coleta de metadados e geração de assuntos, propicia a melhoria de sua indexação e buscas nos
repositórios digitais.
Objetivo. Propor um framework genérico com um conjunto de atividades e técnicas para
executar a geração e indexação automática de assuntos em um repositório digital, visando a
organização e a recuperação da informação.
Métodos. Revisão Sistemática da Literatura, estudando sobre o tema de geração automática e
semiautomática de metadados, suas ferramentas, técnicas, características e funções. Realizouse pesquisa exploratória em bases de dados científicas da Ciência da Informação,
selecionando periódicos específicos para a avaliação de acordo com as principais listas de
classificação. Utilizou-se método misto na análise dos dados, com abordagens quantitativas e
qualitativas, sendo definido um protocolo rigoroso de revisão. Identificou-se ferramentas para
auxiliar a pesquisa aplicada, através da sua customização e uso em conjunto de vários
algoritmos de aprendizagem de máquina que auxiliassem no processo de geração automática
de assuntos. Ao final, realizou-se um estudo de caso aplicado para o “modelo de pesquisa”.
Resultados. Conclui-se que as técnicas de geração automática de metadados auxiliam na
sugestão de assuntos para documentos robustos como uma tese e dissertação, ampliando o
quantitativo de descritores, de modo a facilitar a configuração de taxonomias, filtros e facetas.
Esse trabalho propôs o framework genérico validado pelo modelo de pesquisa, através do
estudo de caso aplicado. Esse framework pode ser adequado e aplicado em qualquer área do
conhecimento, com intuito de melhorar e facilitar a busca e a recuperação da informação nos
repositórios digitais pelos usuários e gestores desses acervos. | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais | pt_BR |
dc.type | Tese | pt_BR |
dc.subject.keyword | Descritores | pt_BR |
dc.subject.keyword | Repositórios Digitais | pt_BR |
dc.subject.keyword | Metadados | pt_BR |
dc.subject.keyword | Tesauros | pt_BR |
dc.subject.keyword | Indexação | pt_BR |
dc.description.abstract1 | Introduction. With the exponential increase in data, due to its digital nature, problems with
the absence or discrepancy of registered metadata also increase, making it an expensive and
arduous job for a human being to correct them manually. There is a need for investigations to
improve the organization and facilitate information retrieval. In this context, the application of
artificial intelligence through machine learning, using automatic and semi-automatic tools in a
complementary way to collect metadata and generate subjects, improves indexing and
searches in digital repositories.
Goal. Propose a generic framework with a set of activities and techniques to automatically
generate and index subjects in a digital repository, aiming at organizing and retrieving
information.
Methods. Systematic Literature Review, studying the subject of automatic and semiautomatic generation of metadata, its tools, techniques, characteristics and functions.
Exploratory research was carried out in scientific databases of Information Science, selecting
specific journals for evaluation according to the main classification lists. A mixed method was
used for data analysis, with quantitative and qualitative approaches, with a strict review
protocol being defined. Tools were identified to help applied research, through their
customization and joint use of several machine learning algorithms that would help in the
process of automatic subject generation. At the end, a case study applied to the “research
model” was carried out.
Results. It is concluded that the automatic generation of metadata techniques help in
suggesting subjects for robust documents such as a thesis and dissertation, expanding the
number of descriptors, in order to facilitate the configuration of taxonomies, filters and facets.
This work proposed the generic framework validated by the research model, through the
applied case study. This framework can be adapted and applied in any area of knowledge,
with the aim of improving and facilitating the search and retrieval of information in digital
repositories by users and managers of these collections. | pt_BR |
dc.description.unidade | Faculdade de Ciência da Informação (FCI) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Ciência da Informação | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|