Explainable Artificial Intelligence Model for Mammogram Breast Cancer Classifiers

Jesus, Geovanni Oliveira de

Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/49972

Files in This Item:

File	Description	Size	Format
GeovanniOliveiraDeJesus_DISSERT.pdf		5,57 MB	Adobe PDF	View/Open

Title:	Explainable Artificial Intelligence Model for Mammogram Breast Cancer Classifiers
Other Titles:	Modelo de inteligência artificial explicavel para classificadores de cancer de mama em mamografias
Authors:	Jesus, Geovanni Oliveira de
metadata.dc.contributor.email:	geovannirock@gmail.com
Orientador(es)::	Mendes, Cristiano Jacques Miosso Rodrigues
Assunto::	Câncer de mamam Inteligência artificial explicável Aprendizagem profunda
Issue Date:	17-Aug-2024
Data de defesa::	30-Nov-2023
Citation:	JESUS, Geovanni Oliveira de. Explainable Artificial Intelligence Model for Mammogram Breast Cancer Classifiers. 2023. 74 f., il. Dissertação (Mestrado em Engenharia Biomédica) — Brasília, 2023.
Abstract:	Câncer de mama está associada à maior taxa de incidência de câncer entre as mulheres em todo o mundo. Assim como em outros tipos de câncer, diagnósticos mais precoces levam a tratamentos potencialmente menos invasivos e a maiores taxas de sobrevida. Uma ferramenta que auxilie a análise de mamografias para descobrir lesões mamárias e sua classificação constitui portanto um importante instrumento para o tratamento eficaz.Com desenvolvimento da tecnologia, a Inteligˆencia Artificial passou a trazer impactos cada vez maiores e mais positivos em diversas áreas, e se destaca na Engenharia biomédica por prover ferramentas de auxílio a diagnóstico cada vez mais eficazes. Em particular Machine Learning (ML) e Deep Learning a partir das duas primeiras décadas do século XX, passaram a prover cada vez mais soluções em problemas considerados complexos n s áreas de visão computacional e processamento de sinais e imagens, como os problemas de classificação de imagens e detecção de objetos.Neste contexto, a análise mamográfica, para fins de diagnósticos e classificação de câncer,pode ser descrito como um problema de classificação de imagens, e se beneficia de algumas abordagens de ML descritas na literatura. De fato, vários trabalhos já propõem a detecção de câncer e a classificação do tipo BIRADS de forma automatizada, a partir de imagens de ultrassom ou de tomografia por raios-X da mama. No entanto, a maioria das abordagens em ML para análise mamográfica encontradas focam em técnicas tidas como de caixa preta,em que não há justificativa direta, em formato compreensível para um analista humano,dos resultados de classificação ou de decisões de encaminhamento. Esta limitação reduz a aplicabilidade dos modelos, já que a ausˆencia de explicabilidade tem impactos legais em procedimentos de autorização de tratamentos, por exemplo, e reduz o potencial de novos avanços na área de oncologia e radiologia mamária, tendo em vista que os conhecimentos adquiridos se tornam menos propagáveis e generalizáveis.Por outro lado, a maior parte das soluções encontradas na literatura científica para classificação de lesões mamárias foca em abordagens de ML com redes rasas. Foram encontradas poucas abordagens utilizando algoritmos de aprendizagem profunda, que demonstram desempenho mais alto em outras aplicações de classificação de imagens, desde que o treinamento explore uma base de imagens suficientemente representativa. Além disso, são soluções consideradas caixa preta, o que significa que é fornecida uma resposta a partir de uma imagem de entrada, e não é possível determinar diretamente quais características das imagens analisadas que mais influenciaram diretamente a decisão final fornecida pela rede, ainda que esse resultado já seja conhecido. Existem modelos de ML que provˆeem explicabilidade paraas decisões, o que significa que são explicitadas as principais características das imagens ou sinais de entrada que levaram `a decisão final do sistema. Essa característica é relevante no contexto de aplicação em saúde, tanto pelo avanço de conhecimento que pode representar em termos dos aspectos relevantes ao diagnóstico. Entretanto, não foram encontrados na literatura muitos trabalhos avançados abordando o uso de modelos explicáveis em análise de imagens mamográficas com uso de ML.Um modelo explicável é capaz de se encaixar em leis e fazer com que a solução seja aplicada em um domínio real. O diagnóstico de câncer é um momento sensível, por conta disso saber como um modelo de Deep Learning ou Machine Learning chegou a um determinado resultado, pode direcionar melhor médicos a investigarem casos de maneira mais direcionada, dessa forma dando mais ˆenfase em algumas características da imagem, além de gerar mais confiabilidade nos resultados de predição de modelos.O uso de Deep Learning para tarefas de classificação de imagens tem obtido resultados surpreendentes, que se igualam e em alguns casos e até mesmo superam a capacidade humana, por isso essa abordagem vai ser discutida nessa dissertação. Aliando uma poderosa ferramenta de classificação com técnicas que permitam deixar os modelos criadoscom predições explicáveis, assim tornar uma ferramenta de classificação de lesões mamárias com alto potencial de confiabilidade para seus usuários finais, os médicos especialistas.Para atingir esses objetivos são investigados arquiteturas de Aprendizagem Profunda como VGG16 e técnicas de explicabilidade de modelos treinados como LIME que é um framework de explicabilidade de bom desempenho e de maneira simples de utilização.Essa dissertação tem o intuito de desenvolver um modelo de Deep Learning, que utilize técnicas de Ingeligˆencia Artificial Explicável (XAI, do inglˆes Explainable Artificial Intelligence) ou seja tenha predições explicáveis que classifique lesões mamárias e identifique as características importantes que levaram o modelo a atingir tal resultado.Após o treinamento do modelo usando arquitetura VGG16, as métricas analisadas foram acurácia, especificidade e sensibilidade, os resultados obtidos foram respectivamente 68%77% e 65%. Resultados maiores foram encontrados na literatura, porém não são resultados que sejam reprodutíveis. Em muitos casos as bases de dados são particulares de hospitais que a equipe fez o levantamento de mamografias dos últimos 20 anos, criou-se o conjunto de dados e os testes foram feitos. Houve uma dissertação de mestrado feita por Adam Jaamour em 2020 na Universidade de St Andrews com uma abordagem semelhante e que obteve resultados próximos aos apresentados nessa dissertação, o autor reportou o resultado da acurácia de 67%.Modelos de ML e DP tˆem um grande potencial, entretanto devem ser treinados com conjunto de dados datasets com grande quantidade de imagens, e imagens de qualidade.Com a performance melhorada, e atingindo métricas melhores do que as apresentadas neste trabalho, pode ser que esses modelos sejam aplicáveis em uso da vida real. O uso combinado de modelos de DL com frameworks de Inteligˆencia Artificial Explicável, pode ajudar no direcionamento de lesões. As marcações de áreas suspeitas são diferentes do direcionamento que médicos radiologistas procuram, entretanto são marcações com potencial direcionado para uma área da lesão em análise.
Abstract:	Breast cancer is associated with the highest cancer incidence rate among women worldwide. Just like other cancer types, early diagnosis leads to potentially less invasive treatments and higher survival rates. A tool that assists in the analysis of mammograms to discover breast lesions and their classification is, therefore, an important tool for effective treatment.With the development of technology, Artificial Intelligence has begun to bring increasingly greater and more positive impacts in several areas, and stands out in biomedical engineering for providing increasingly effective diagnostic aid tools. In particular, Machine Learning (ML) and Deep Learning (DP) from the first two decades of the 20th century began to increasingly provide solutions to problems considered complex in the areas of computer vision and signal and image processing, such as image classification problems, and object detection. In this context, mammographic analysis, for cancer diagnosis and classification, can be described as an image classification problem, and benefits from some ML approaches described in the literature. Several studies already propose the detection of cancer and classification of the BI-RADS type in an automated way, based on ultrasound images or X-ray tomography of the breast. However, most ML approaches for mammographic analysis that were found, focus on techniques considered to be black boxes, in which there is no direct justification, in a format understandable to a human analyst, of the classification results or referral decisions. This limitation reduces the applicability of the models,since the lack of explainability has legal impacts on treatment authorization procedures,for example, and reduces the potential for new advances in the area of oncology and breast radiology, considering that the knowledge acquired makes them less propagable and generalizable.On the other hand, most of the solutions found in the scientific literature for classifying breast lesions focus on ML approaches with shallow networks. Few approaches using deep learning algorithms were found, which demonstrate higher performance in other image classification applications, as long as the training explores a sufficiently representative image base. Furthermore, they are considered black box solutions, which means that an answer is provided from an input image, and it is not possible to directly determine which characteristics of the analyzed images most directly influenced the final decision provided by the network, even though this result is already known. There are ML models that provide explainability for decisions, which means that the main characteristics of the images or input signals that led to the system’s final decision are explained.This characteristic is relevant in the context of health application, for the advancement of knowledge that it can represent in terms of aspects relevant to diagnosis. However, not many advanced works were found in the literature addressing the use of explainable models in mammographic image analysis using ML.The diagnosis of cancer is a sensitive moment, with this in mind, knowing how aDeep Learning or Machine Learning model has achieved certain results can better direct physicians to investigate cases in a more directed way, thus placing more emphasis on some characteristics of the image, and it can generate more reliably in a model prediction.The use of Deep Learning for image classification tasks has obtained surprising results,some results have achieved human capacity, and in some cases, it has even surpassed human capacity, which is why this approach will be discussed in this dissertation. Combining a powerful classification tool with techniques that allow the created models to have explainable predictions, thus making a breast lesion classification tool with high potential reliability for its end users, specialist physicians. To achieve these goals, Deep Learning architectures such as VGG16 and explainability techniques for trained models such asLIME, which is an explainability framework with good performance and simple to use,are investigated. This thesis aims to develop a Deep Learning model, which uses Explainable Artificial Intelligence (XAI) techniques so that it has explainable predictions that classify breast lesions and identify the important characteristics that lead the model to achieve such a result .After training the model using VGG16 architecture, the metrics analyzed were accuracy, specificity, and sensitivity, the results obtained were respectively 68% 77%, and65%. Greater results were found in the literature, but these are not reproducible results.In many cases, the databases are private to hospitals where the team collected mammograms from the last 20 years, created the dataset, and tested them. There was a master’s thesis done by Adam Jaamour in 2020 at the University of St Andrews with a similar approach which obtained results close to those presented in this dissertation, the author reported an accuracy result of 67%.ML and DP models have great potential, however, they must be trained with datasets with a large number of images, and quality images. By improving performance and achieving better metrics than those presented in this work, these models may be applicable in real-life use. The combined use of DL models with Explainable Artificial Intelligence frameworks can help direct physicians to important areas of the lesion. The highlights of the lesions are different from what is expected to be shown in lesions by physicians, however, these lesions highlights potentially guide physicians to important areas for theML or DP model.
metadata.dc.description.unidade:	Faculdade UnB Gama (FGA)
Description:	Dissertação (mestrado) — Universidade de Brasília, Faculdade UnB Gama, Programa de Pós-Graduação em Engenharia Biomédica, 2023.
metadata.dc.description.ppg:	Programa de Pós-Graduação em Engenharia Biomédica
Appears in Collections:	Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/49972/statistics">