Resumo |
O câncer de mama é o segundo tipo de câncer mais recorrente no Brasil, com mais de 68.200 casos estimados entre 2018 e 2019. Existem diversos métodos para identificar se um tumor é maligno ou benigno, entre eles o autoexame de mama, mamografia, ressonância magnética, etc. Entretanto, o único método que permite ter certeza quanto à natureza do tumor é a biópsia, método que consiste na retirada de uma amostra do tecido da região suspeita para analise histopatológica por meio de microscopia. Tal analise consome muito tempo por parte dos patologistas e o diagnóstico pode ser comprometido pela fadiga e pela subjetividade do processo. As Redes Neurais Convolucionais (RNCs) consistem no estado da arte em tarefas de classificação e reconhecimento de imagens. Neste trabalho foram avaliadas três arquiteturas de RNCs para classificação binária de imagens histopatológicas de tumores como malignos ou benignos, sendo elas: AlexNet, ResNet101 e DenseNet121. Realizou-se a otimização dos hiperparâmetros e o impacto de estratégias de aumento de dados foi avaliado. Para a realização dos experimentos utilizou-se o conjunto de imagens BreakHis. Desenvolvido pela UFPR, o BreakHis é composto por 7.909 imagens histopatológicas obtidas de 82 pacientes com diferentes magnificações (40x, 100x, 200x e 400x) e divididas em duas classes: tumores malignos e benignos. O BreakHis fornece cinco divisões aleatórias das imagens por paciente, em conjunto de treino (58 pacientes) e de testes (24 pacientes). Os experimentos foram realizados para cada uma das arquiteturas de RNC e para cada uma das cinco divisões do conjunto de dados. Os resultados das classificações foram avaliados de acordo com média das acurácias em nível de paciente e (PLA) e acurácia em nível de imagens (ILA) para as divisões aleatórias. Os valores dos seguintes hiperparâmetros foram selecionados utilizando o método grid-search sobre o conjunto de validação, composto por 20% das imagens do conjunto de treino: a) tamanho do lote; b) taxa de aprendizagem inicial; c) momentum; d) tamanho do passo. Após a escolha dos hiperparâmeteros, um conjunto de estratégias de treinamento foi utilizado para gerar os modelos, que foram avaliados usando o conjunto de testes: i) treinamento do inicio sem aumento de dados, ii) com aumento de dados off-line, iii) com aumento de dados on-line, iv) combinando aumento de dados off-line e on-line e v) treinamento por transferência de aprendizado com aumento de dados off-line e on-line. A arquitetura ResNet treinada com transferência de aprendizado obteve os melhores resultados, com acurácia PLA de 85,76% e ILA de 86,32% considerando todas as magnificações do conjunto de testes. Considerando as imagens com magnificação de 200x, o melhor resultado foi obtido pela ResNet com a mesma estratégia de treinamento, resultando em acurácia PLA de 88,97%. Os resultados obtidos são muito próximos aos do estado da arte. |