http://repositorio.unb.br/handle/10482/49994
File | Description | Size | Format | |
---|---|---|---|---|
AnaLuizaMoraesFernandesDaCosta_DISSERT.pdf | 7,49 MB | Adobe PDF | View/Open |
Title: | Identificaçãao de lesões da laringe à partir de imageamento por endoscopia de banda estreita utilizando redes neurais artificiais e programação visual |
Authors: | Costa, Ana Luiza Moraes Fernandes da |
Orientador(es):: | Idrobo Pizo, Gerardo Antonio |
Assunto:: | Inteligência artificial Laringe - câncer Imagem de banda estreita |
Issue Date: | 19-Aug-2024 |
Data de defesa:: | 8-May-2023 |
Citation: | COSTA, Ana Luiza Moraes Fernandes da. Identificaçãao de lesões da laringe à partir de imageamento por endoscopia de banda estreita utilizando redes neurais artificiais e programação visual. 2023. 88 f., il. Dissertação (Mestrado em Engenharia Biomédica) – Universidade de Brasília, Brasília, 2023. |
Abstract: | A presença de determinados tipos de lesões na mucosa da laringe pode sinalizar o desenvolvimento de carcinoma espinocelular laríngeo em estágio inicial, que surge a partir do desenvolvimento anormal das células escamosas que compõem a camada interna do revestimento da laringe. Essa doença corresponde a 98% das ocorrências de tumores malignos que acometem a laringe e 3% de todos os casos de câncer, frequentemente levando à óbito quando diagnosticada em estágios avançados. A detecção precoce de lesões sugestivas de desenvolvimento de tecido pré-cancerígeno ou de câncer da laringe em estágio inicial pode ser uma tarefa desafiadora mesmo para médicos experientes. A literatura cient´ıfica existente aponta que modelos baseados em aprendizado de máquina têm sido utilizados para auxiliar o diagnóstico de câncer de laringe, alcançando resultados relevantes, sendo consideradas no estado da arte para a detecção de lesões da laringe as arquiteturas de redes neurais artificiais convolucionais profundas, com precisão reportada de até 98%. Entretanto, a implementação de modelos de machine learning frequentemente exige conhecimentos avançados em linguagem de programação, tornando complexa a tarefa de treinamento e desenvolvimento dessas soluções. Há também modelos de redes neurais artificiais mais recentes, ainda não explorados para a classificação de imagens contendo lesões da laringe.O presente estudo teve por objetivo desenvolver novos métodos baseados em inteligência artificial para classificar lesões da laringe de forma automatizada, a partir de imagens digitais obtidas pela técnica de imagens de banda estreita.Relativamente à metodologia adotada, foram utilizadas 1.320 imagens digitais de tecido da laringe, saudável e em estágio inicial de câncer, obtidas por meio de laringoscopia, subdividas em 4 classes: tecido saudável, tecido com leucoplasia, tecido com vasos hipertróficos etecido com alças capilares intrapapilares. Desse conjunto, foram segregadas 132(10%) para compor o conjunto de testes. Foram implementados cinco modelos de aprendizagem de máquina diferentes, baseados em redes neurais convolucionais profundas (CNN) utilizando programação visual e redes de cápsulas (CapsNet), para classificar as 132 imagens: VGG16,VGG19, Inception V3, CapsNet sem data augmentation e CapsNet combinado a uma técnica de data augmentation utilizando imagens geradas sinteticamente por uma rede generativa adversária (GAN). As arquiteturas de rede neural foram implementadas por meio do software livre Orange Data Mining e da plataforma computacional Google Colab, em linguagem Python, com a utilização das bibliotecas Keras, openCV e Tensorflow. O uso de GAN para ampliar o conjunto de treinamento com imagens geradas sinteticamente melhor ou o desempenho do classificador de cápsula na classificação de todas os tipos de lesões.õ classificador CapsNet com aumento de dados por GAN alcançou sensibilidade, precisão e F1-Score médios de 94,7%, correspondente ao segundo melhor desempenho entre os modelos estudados, contudo ainda apresentou indícios de sobreajuste o melhor desempenho geral foi obtido como classificador CNN Inception V3, que obteve 97% de sensibilidade, precisão e F1-Score, utilizando software de programação visual. Este estudo contribuiu para o avanço do conhecimento em tecnologias relacionadas à saúde ao explorar novos métodos para o auxílio do diagnóstico de câncer da laringe. A solução de inteligência artificial baseada em Rede Neural Convolucional (do inglês Convolutional Neural Network) (CNN) com programação visual proposta alcançou resultados competitivos, permitindo detectar as lesões da laringe em todas as imagens apresentadas ao modelo, com a vantagem de ser implementada em ferramenta de fácil utilização, com menor custo de recursos computacionais e por não exigir conhecimentos avançados em programação de modelos de machine learning, comparativamente aos demais métodos já explorados. |
Abstract: | The presence of certain types of lesions in the laryngeal mucosa can signal thedevelopment of early-stage laryngeal squamous cell carcinoma, which arises from theabnormal development of the squamous cells that make up the inner layer of the laryngeal lining. This disease corresponds to 98% of the occurrences of malignant tumors thataffect the larynx and 3% of all cases of cancer, often leading to death when diagnosed inadvanced stages.Early detection of lesions suggestive of the development of precancerous tissue orearly stage laryngeal cancer can be a challenging task even for experienced physicians.The existing scientific literature points out that models based on machine learning havebeen used to aid the diagnosis of laryngeal cancer, achieving relevant results, considering the state-of-the-art architecture of deep convolutional artificial neural networks inthe detection of laryngeal lesions, with reported accuracy of up to 98%. However, theimplementation of machine learning models often requires advanced knowledge in programming language, making the task of training and developing these solutions complex.There are also more recent models of artificial neural networks, not yet explored for theclassification of images containing laryngeal lesions.The present study aimed to develop methods based on artificial intelligence to classifylaryngeal lesions in an automated way, from digital images obtained by the narrowbandimaging technique.Regarding the adopted methodology, 1,320 digital images of laryngeal tissue, healthyand in an early stage of cancer, obtained through laryngoscopy, were used, subdividedinto 4 classes: healthy tissue, tissue with leukoplakia, tissue with hypertrophic vesselsand tissue with capillary loops intrapapillary. From this set, 132(10%) were segregated tocompose the test set. Five different machine learning models, based on deep convolutionalneural networks (CNN) and capsule networks (CapsNet), were implemented to classifythe 132 images: VGG16, VGG19, Inception V3, CapsNet without data augmentationand CapsNet combined with an data augmentation technique using images generatedsynthetically by an adversarial generative network (GAN).The neural network architectures were implemented using the free software ORANGEData mining and the Google Colab computational platform, in Python language, usingthe Keras, OpenCV and Tensorflow libraries.Using GAN to augment the training set with synthetically generated images improvedthe performance of the capsule classifier in classifying all types of injuries. The CapsNetclassifier with data increase by GAN reached average recall, precision and F1-Score of 94.7%, reaching the second best performance among the studied models. The best per formance was obtained with the CNN Inception V3 classifier, which obtained 97% recall,precision and F1-Score, using visual programming software.This study contributed to the advancement of knowledge in health-related technologies by exploring new methods to aid in the diagnosis of laryngeal cancer. The artificialintelligence solution based on Rede Neural Convolucional (do inglˆes Convolutional Neural Network) (CNN) with the proposed visual programming reached competitive results,allowing the detection of laryngeal lesions in all images presented to the model, with theadvantage of being implemented in an easy-to-use tool, with a lower cost of computationalresources and because it does not require advanced knowledge in programming machinelearning models, compared to the other methods already explored. |
metadata.dc.description.unidade: | Faculdade de Ciências e Tecnologias em Engenharia (FCTE) – Campus UnB Gama |
Description: | Dissertação (Mestrado em Engenharia Biomédica) – Universidade de Brasília, Faculdade UnB Gama, Programa de pós-graduação em Engenharia Biomédica, 2023. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Engenharia Biomédica |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.