“Inteligência Artificial: A Nova Fronteira da Ciência Brasileira”

19 a 24 de outubro de 2020

Trabalho 13007

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Engenharia elétrica
Setor Departamento de Engenharia Elétrica
Bolsa FAPEMIG
Conclusão de bolsa Sim
Apoio financeiro FAPEMIG
Primeiro autor Vitor Thinassi Basílio
Orientador ALEXANDRE SANTOS BRANDAO
Outros membros Kevin Braathen de Carvalho
Título Rastreamento de esqueleto e reconhecimento de gestos utilizando o sensor Kinect
Resumo O reconhecimento de ações é um dos métodos utilizados para comunicação entre usuário e máquina. Esse recurso tem ganhado espaço em pesquisas devido ao seu grande leque de aplicações. O presente trabalho utiliza essa motivação para seu desenvolvimento e aplicação. Ele é composto por cinco seções: escolha do sensor a ser utilizado, criação do banco de dados, tratamento e estudo de dados, classificação de gestos e simulação de aplicação em tempo real. Os sensores escolhidos para estudo foram Microsoft Kinect de primeira e de segunda geração, devido à disponibilidade e praticidade de utilização. Assim, deu-se inicio à coleta de ações para criação dos bancos de dados. Os gestos são descritos por uma matriz que representa a posição de cada junta do corpo no momento da coleta. Com isso, foram criados os bancos com 10 ações, sendo uma delas neutra. Um possui 450 amostras coletadas pelo sensor de primeira geração; o outro, 100 amostras pelo de segunda geração. Tal diferença pode ser explicada em pelo fato de a precisão do Kinect de segunda geração ser maior que a do de primeira. Ao analisar os dados coletados, notou-se que, em todos gestos, apenas os braços se moviam. Assim, o restante do corpo pôde ser descartado. Além disso, todos os esqueletos foram centralizados, para evitar erros por causa da posição do usuário. Por fim, realizou-se a redução de dimensionalidade dos gestos, convertendo-se a matriz que representa o esqueleto em autovalores. Para a realização das classificações, aplicaram-se três métodos: Espaço Vetorial, Dynamic Time Warping e Rede Neural Artificial (RNA). Primeiramente, utilizaram-se nove gestos, reduzidos até três, a fim de se encontrar a melhor classificação e combinação de ações. Para tal, foi criado um teste para todas as combinações, até encontrar as com maiores taxas de acerto, obtendo, assim, a técnica que utiliza Rede Neural Artificial com maior média de acertos, comparada com as outras. A partir do resultado anterior, o método de RNA foi utilizado para simulação de aplicação em tempo real, e, considerando as vantagens e as funções disponíveis da segunda versão do sensor - contraposto com a primeira versão - a segunda foi empregada. Além disso, para evitar possíveis erros na execução da ação em tempo real, adicionou-se ao banco de dados a classe neutra, também chamada de "não gestos". Assim, o teste final se deu utilizando 30 amostras de gestos de cada classe com dois corpos diferentes, obtendo uma taxa de acerto de 88,2% na classificação.
Palavras-chave Reconhecimento de Ações, Robótica, Kinect
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,62 segundos.