Resumo |
A interação entre humanos e veículos autônomos ocorre por meio de fala, movimentos, gestos e outros meios. Um estudo realizado por de Carvalho et al. (2021), foi proposto uma solução para o controle remoto de robôs móveis, utilizando gestos de alto nível e um classificador de Rede Neural Artificial (RNA) treinado com dados capturados por câmera RGB-D. Essa abordagem permitiu a execução de tarefas de inspeção, emergência e transporte de cargas. Os mesmos autores exploraram técnicas de aprendizado de máquina para identificação e controle de gestos em veículos autônomos, reduzindo a dimensão dos dados de entrada. Neste trabalho, busca-se implementar um algoritmo para captura e classificação de gestos em tempo real, visando criar uma ferramenta de reconhecimento de ações de fácil execução. No entanto, desafios como normalização de amostras, aquisição suficiente para cada ação e extração de características para classificação das ações motoras humanas precisam ser superados. O classificador K-Nearest Neighbors (KNN) foi escolhido devido à facilidade de implementação e baixa exigência de processamento. Para o controle de um veículo aéreo autônomo (VANT), foram propostos cinco gestos: voar, pousar, seguir operador, parar e capturar imagem. Será necessário criar uma base de dados com pontos de referência tridimensionais do corpo do operador para elaboração dos gestos. O processo de classificação utilizará o KNN, treinando a RNA para identificar os gestos e controlar o VANT. A construção da base de dados foi realizada com um algoritmo em Python, utilizando as bibliotecas MediaPipe e OpenCV para capturar frames do sensor Intel RealSense D435 e obter os pontos de referência (landmarks) do esqueleto. Essa estratégia facilitará a implementação no controle de veículos autônomos. A base de dados foi formulada para cada subetapa, extraindo os landmarks (5 pontos de referência) para a classificação dos gestos. Este trabalho se concentra na interação entre humanos e veículos autônomos por meio de gestos, com o objetivo de implementar um algoritmo para captura e classificação em tempo real. Resultados preliminares mostram uma estratégia promissora para controle de veículos autônomos, aplicável em áreas como inspeção, emergência e transporte de cargas. A interação por gestos oferece uma comunicação natural e intuitiva, eliminando interfaces complexas e comandos de voz. A personalização dos gestos permite adaptá-los às preferências do operador. |