"A Transversalidade da Ciência, Tecnologia e Inovações para o Planeta"

5 a 7 de outubro de 2021

Trabalho 15675

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Informática
Conclusão de bolsa Não
Primeiro autor Raphael Carmo Silva Nepomuceno
Orientador MICHEL MELO DA SILVA
Título Análise de funções de perda em redes convolucionais para super-resolução de ilustrações
Resumo Conforme as tecnologias de telas evoluem e televisores e monitores de alta definição se tornam mais acessíveis, cresce também o interesse por imagens e vídeos de alta resolução de modo a fazer melhor uso desses avanços. Na ausência de exemplares originais em alta resolução, faz-se necessário o uso de métodos aproximados, tais como algoritmos de interpolação, para realçar mídias em baixa resolução. Contudo, métodos de interpolação simples podem produzir imagens com características indesejáveis, como distorção de linhas ou embaçamento. Trabalhos recentes têm mostrado sucesso na aplicação de aprendizagem profunda nesta tarefa, mas tais esforços geralmente têm como foco imagens do mundo real e não consideram as peculiaridades de ilustrações, que enfatizam linhas e empregam padrões simplificados ao invés de texturas complexas, tornando imperfeições mais salientes. Considerando tais diferenças, decidimos desenvolver este trabalho com foco em imagens de quadrinhos, desenhos animados e outros tipos de ilustrações. Avaliamos quatro funções de perda de modo a estudar como estas afetam as imagens em alta resolução produzidas por uma rede neural, observando fatores como nitidez e o quão bem elas representam suas versões em baixa-resolução perante a visão humana. A função de perda serve como objetivo no processo de otimização das redes neurais, orientando seu treinamento e, nas tarefas de reconstrução de imagem, determinando como comparar uma amostra sintetizada com sua contraparte original. Para realizar este estudo, treinamos seis redes neurais de fim-a-fim em ilustrações com diferentes configurações de função de perda. Através de avaliações quantitativas, utilizando métricas perceptualmente motivadas da literatura, e qualitativas, estas redes foram comparadas entre si, com métodos de interpolação clássicos e com uma rede neural de super-resolução treinada em fotografias. As comparações foram realizadas através de quatro conjuntos de imagens: um conjunto contendo diversos tipos de imagens ilustradas, um segundo conjunto contendo apenas imagens monocromáticas de quadrinhos e outros dois conjunto contendo imagens sintéticas de artes de linhas. A análise quantitativa dos resultados demonstrou melhorias significativas ao empregar uma função de perda que enfatiza as bordas presentes nas imagens, enquanto a análise qualitativa revelou que esta função de perda se mostrou inferior às outras em ilustrações com maior ênfase em texturas complexas. Também observamos através da análise qualitativa que uma função de perda baseada na métrica de similaridade estrutural produziu os resultados mais nítidos porém com menor acurácia nas cores. Por fim, motivados pelos resultados positivos obtidos ao explorar o uso de funções de não-convencionais, propomos uma continuação deste trabalho de modo a estudar os resultados obtidos ao aplicá-las de forma combinada, bem como o uso de funções de perda baseadas em redes neurais que aprendem características sobre o conjunto de imagens.
Palavras-chave Redes neurais convolucionais, Aprendizado profundo, Super-resolução
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,64 segundos.