"A Transversalidade da Ciência, Tecnologia e Inovações para o Planeta"

5 a 7 de outubro de 2021

Trabalho 15698

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Informática
Conclusão de bolsa Não
Primeiro autor Ricson Luiz Oliveira Vilaça
Orientador MICHEL MELO DA SILVA
Outros membros Daniel Louzada Fernandes
Título Análise de técnicas de inteligência artificial para o problema de classificação de cenas no contexto de webinários
Resumo As ferramentas de videoconferência vêm sendo amplamente empregadas, sobretudo no contexto da pandemia de COVID-19, para realização de diversos tipos de reuniões online. Tendo em vista que o home office ganhou forças, a tendência é que tais recursos continuem sendo utilizados mesmo após a pandemia. Os webinários, em especial, são videoconferências de âmbito educacional nas quais o palestrante se expressa e outras pessoas assistem. Normalmente contam com uma plateia impremeditada, o que torna necessária uma preparação inclusiva para atender aos mais diversos públicos, em particular os deficientes visuais. São vários os obstáculos enfrentados por estes como espectadores de um webinário, como, por exemplo, assimilar características físicas do apresentador e do ambiente no qual ele se encontra, o que, por diversas questões sociais, pode mudar totalmente a interpretação de uma mesma fala. Técnicas de Inteligência Artificial podem ser aplicadas nesse contexto, agregando em diversas funcionalidades de ferramentas que buscam melhorar a acessibilidade desses eventos. A Visão Computacional, uma subárea da Inteligência Artificial, estuda formas de dar aos computadores a capacidade de interpretar visualmente informações contidas em imagens. Os obstáculos encontrados por deficientes visuais são naturalmente associados às estratégias de Visão Computacional, e uma possível aplicação desse tipo de recurso no contexto dos webinários é a classificação do ambiente no qual o palestrante se encontra. A classificação de cenas consiste no processo de extração de informações em uma imagem a fim de reconhecer padrões e gerar um rótulo para ela, definindo qual é o tipo de cena retratada. Diferente da classificação de objetos, é um problema ainda em aberto na literatura, sobretudo, quando se trata de ambientes internos, pois, em muitos casos, não há padrões suficientes e bem definidos que distinguem facilmente imagens pertencentes a categorias distintas. O objetivo geral deste trabalho é fazer o treinamento de modelos de Redes Neurais Convolucionais e Transformers Visuais, buscando aperfeiçoar os resultados da classificação de cenas internas através de modificações na arquitetura, nos hiperparâmetros e nos dados de treinamento. Para isso, foi realizada uma busca e filtragem de um conjunto apropriado de cenas, descartando categorias de ambientes externos e/ou inadequados para o contexto dos webinários e alterando a estrutura dos dados restantes, a fim de reduzir as ambiguidades e torná-los mais consistentes para o aprendizado dos modelos. Uma vez comparados e discutidos os resultados, será selecionado o modelo com o melhor desempenho no conjunto de cenas para realizar experimentos sobre cenas reais retiradas de webinários. Os resultados parciais mostram que a qualidade e a consistência das imagens fornecidas no treinamento dos modelos são mais importantes do que a própria arquitetura utilizada. Logo, é preciso analisá-las cautelosamente para obter resultados aceitáveis.
Palavras-chave Inteligência Artificial, Visão Computacional, Classificação de Cenas
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,65 segundos.