Estratégias de ataques adversariais em um classificador de sentimento léxico : uma abordagem de mídia social

Oliveira Júnior, Gildásio Antonio de

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/40540

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2020_GildásioAntôniodeOliveiraJunior.pdf		5,63 MB	Adobe PDF	Visualizar/Abrir

Título:	Estratégias de ataques adversariais em um classificador de sentimento léxico : uma abordagem de mídia social
Outros títulos:	Adversarial attacks strategies in a lexical sentiment classifier : a social media approach
Autor(es):	Oliveira Júnior, Gildásio Antonio de
E-mail do autor:	jrgildasio@gmail.com
Orientador(es):	Sousa Júnior, Rafael Timóteo de
Assunto:	Mídia social Ataques adversariais Engenharia reversa Linguagem natural - processamento
Data de publicação:	14-Abr-2021
Data de defesa:	21-Dez-2020
Referência:	OLIVEIRA JÚNIOR, Gildásio Antonio de. Estratégias de ataques adversariais em um classificador de sentimento léxico: uma abordagem de mídia social. 2020. xix, 122. f., il. Tese (Doutorado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2020.
Resumo:	As mídias sociais tornaram-se fonte de informações de relevância para diversos órgãos de Governo e empresas dos mais variados tipos. Essas informações são úteis para processos de tomada de decisão e definição de estratégias de negócio. Considerando este ponto de vista, várias técnicas de análise de sentimentos são empregadas para transformar dados coletados em conhecimentos que podem ser aplicados na inteligência. Um dos problemas é que os classificadores de sentimento utilizados nestes ambientes de coleta devem ser estudados e observados com cuidado, antes de serem instalados e confiados indiscriminadamente em sistemas de apoio à decisão. Pesquisas sobre as técnicas utilizadas em classificadores de sentimento tem se tornado um ponto crítico com novos métodos de ataques adversariais, onde pequenas perturbações podem ser criadas por usuários mal-intencionados para enganar os classificadores de sentimentos, gerando percepção diferente da realmente observada no ambiente. Nesse contexto, este trabalho apresenta o desenvolvimento de ataques adversariais em um classificador léxico de linguagem natural. Esse classificador, objeto dos ataques, é utilizado para calcular o sentimento dos dados postados e coletados por usuários em diversas aplicações de mídia social. Os resultados indicam que as vulnerabilidades encontradas, se exploradas por usuários mal-intencionados em aplicações que utilizam o mesmo classificador léxico, invertem ou anulam a percepção dos classificadores, gerando informação que não corresponde à realidade para a tomada de decisão. Esse trabalho ainda propõe algumas contramedidas que, se empregadas corretamente, são capazes de mitigar os ataques implementados.
Abstract:	Social media has become a source of relevant information for various government agencies and companies of the most varied types. This information is useful for decision-making processes and the definition of business strategies. Regarding this point of view, several sentiment analysis techniques are used to transform collected data into knowledge that can be applied to intelligence. One of the problems is that the sentiment classifiers used in these collection environments must be studied and observed before indiscriminately gaining trust and being installed in decision support systems. Research on the techniques used in sentiment classifiers has become a critical point with new methods of adversarial attacks, in which small perturbations can be created by malicious users to deceive the sentiment classifiers, generating a different perception from the one observed in the environment. In this context, this work presents the development of adversarial attacks in a lexical natural language classifier. This classifier, the object of the attacks, is used to calculate the sentiment of the data posted and collected by users in various social media applications. The results indicate that the vulnerabilities found, if exploited by malicious users in applications that use the same lexical classifier, could invert or cancel the classifiers' perception, generating information that does not correspond to the reality for decision making. This work also proposes some countermeasures that, if used correctly, can mitigate the implemented attacks.
Informações adicionais:	Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2020.
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora:	Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq); Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e Fundação de Apoio a Pesquisa do Distrito Federal (FAP/DF).
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas