"A Transversalidade da Ciência, Tecnologia e Inovações para o Planeta"

5 a 7 de outubro de 2021

Trabalho 15014

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Engenharia Elétrica
Conclusão de bolsa Não
Primeiro autor Hugo Gonçalves Lopes
Orientador RODOLPHO VILELA ALVES NEVES
Outros membros LEONARDO BONATO FELIX, Lucas Ferreira Paiva
Título Ajustes de hiperparâmetros para estimação de compasso musical do forró para um modelo de rede neural artificial
Resumo A dança é um dos grandes momentos de interação social na natureza, seja na busca de um parceiro ou em momentos de descontração. Para os seres humanos, a dança está altamente associada à musicalidade e ao ritmo das canções, o que implica que os participantes da dança precisam ouvir a música para interagir entre si. Entretanto, pessoas surdas ou com alguma deficiência auditiva são muitas vezes excluídas deste tipo de ambiente de interação social, dificultando ainda mais a convivência delas na sociedade. Esta dificuldade de inserção social pode resultar em problemas ainda mais graves, como a depressão, chegando até a tendências suicidas. Portanto, este projeto faz o uso de técnicas baseadas em redes neurais artificiais para determinar o tempo do passo base de músicas de forró a partir da extração de características da música no tempo. A partir da estimação do tempo base das músicas, estímulos sensoriais podem informar às pessoas com deficiência o ritmo que deve ser dançado. Para determinar o tempo, a música é dividida em amostras as quais serão aplicadas a transformada de fourier. O espectro de interesse é separado para as entradas da rede neural perceptron multicamadas de única camada oculta, tendo como saída o tempo medido da dança da música. Há trabalhos que já utilizam essa metodologia na literatura com sucesso, sendo necessário uma alteração na extração de características da música para a rede atingir erros menores de estimação. Ao substituir a transformada de fourier pela transformada wavelet, espera-se que o erro da estimação da rede diminua comparado à literatura, visto que a mesma preserva tanto a informação de frequência como a informação temporal. Após alterar a extração de características para transformada em wavelet, o erro percentual absoluto médio foi de 0,8% com 41 neurônios na camada oculta para músicas gravadas em um ambiente de dança de forró. Para músicas sem ruído o erro foi de 1,1%, com 31 neurônios na camada oculta. Em comparação com a literatura, o valor era de 3,4% para o mesmo banco de dados de músicas gravadas, representando uma redução de 76,5% no erro. O erro maior para músicas sem ruído se deve ao fato de haver mais músicas nesse banco de dados, o que leva a rede a generalizar melhor. Com isso, obteve-se uma rede mais eficiente do que a literatura. Reduzindo o erro na estimação do tempo, reduz-se também a defasagem no estimulo sensorial repassado, resultando em uma rede mais adaptada à implementação. Portanto, a partir da investigação de extração de características, foi possível aumentar a eficiência da rede, tornando-a mais adequada para que dispositivos que possam auxiliar surdos a dançar forró, permitindo maior inserção destas pessoas dentro de mais ambientes de interação social.
Palavras-chave Forró, Rede neural, Hiperparâmetros
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,63 segundos.