Resumo |
A pandemia da doença de coronavírus 2019 (COVID-19) se espalhou rapidamente por todo o mundo e continua a ter um impacto intenso na vida de bilhões de pessoas, gerando colapso na saúde e economia. Um dos exames disponíveis para detecção da COVID-19 é o RT-PCR, um teste biológico molecular que detecta a doença no seu início por meio de amostras oronasais. Entretanto, a indisponibilidade de kits, dificuldade na coleta das amostras e o tempo de espera pelos resultados, ampliaram a necessidade por métodos automatizados e escaláveis. A triagem eficaz de pacientes infectados é uma importante etapa para combater a COVID-19 e o uso de imagens de raio-X do tórax combinadas com técnicas de Inteligência Artificial é uma alternativa promissora, visto que pesquisas recentes sugerem que imagens de raio-X incluem informações relevantes sobre essa doença. Além disso, o exame de radiografia possui menor custo financeiro, as imagens podem ser facilmente coletadas, compartilhadas e analisadas em todo o mundo. Este estudo tem como principal objetivo identificar pneumonias causadas por COVID-19 de outros tipos e também de pulmões saudáveis usando apenas imagens de raio-X e redes neurais profundas. Para atingir o objetivo é proposto um esquema de classificação considerando duas perspectivas: i) classificação binária (COVID-19 e saudável); ii) classificação multiclasse (COVID-19, saudável e pneumonia). Foram avaliadas duas arquiteturas de redes neurais profundas: VGG-11 e SqueezeNet, treinadas com ajuste fino e aumento de dados baseado em rotações aleatórias, inversões verticais e horizontais. Todos os experimentos foram realizados em dois conjuntos de imagens disponíveis publicamente. O primeiro conjunto de imagens foi compartilhado no repositório do Dr. Joseph Cohen da Universidade de Montreal e é constantemente atualizado com imagens compartilhadas por pesquisadores de diferentes países. A versão utilizada nesta pesquisa foi obtida em agosto/2020 e é composta por 180 imagens de COVID-19. Com o intuito de evitar o desequilíbrio entre as classes ou enviesar o desempenho da classificação foram selecionadas 500 imagens classificadas como saudáveis e 500 imagens de pneumonia, obtidas do conjunto de dados ChestX-ray8. O desempenho da classificação foi avaliado por meio da validação cruzada estratificada 10-fold. A abordagem proposta alcançou um F1-Score de 79,2% com a VGG-11 usando uma abordagem multiclasse e um F1-Score de 93,8% com a SqueezeNet para a identificação da COVID-19 no cenário de classificação binária. Em termos de acurácia, para ambos os cenários, o melhor resultado foi de 78,5% e 95,7%, obtidos pelos modelos VGG-11 e SqueezeNet. Os resultados alcançados sugerem que o uso de redes pré-treinadas e as estratégias de aumento de dados podem ser úteis para lidar com o baixo número de imagens de COVID-19 disponíveis publicamente e, também, fornece novas perspectivas para a identificação automática da COVID-19 utilizando estratégias de Inteligência Artificial. |