Resumo |
A dança é um dos grandes momentos de interação social na natureza, seja na busca de um parceiro ou em momentos de descontração. Para os seres humanos, a dança está altamente associada à musicalidade e ao ritmo das canções, o que implica que os participantes da dança precisam ouvir a música para interagir entre si. Entretanto, pessoas surdas ou com alguma deficiência auditiva são muitas vezes excluídas deste tipo de ambiente de interação social, dificultando ainda mais a convivência delas na sociedade. Esta dificuldade de inserção social pode resultar em problemas ainda mais graves, como a depressão, chegando até a tendências suicidas. Portanto, este projeto faz o uso de técnicas baseadas em redes neurais artificiais para determinar o tempo do passo base de músicas de forró a partir da extração de características da música no tempo. A partir da estimação do tempo base das músicas, estímulos sensoriais podem informar às pessoas com deficiência o ritmo que deve ser dançado. Para determinar o tempo, a música é dividida em amostras as quais serão aplicadas a transformada de fourier. O espectro de interesse é separado para as entradas da rede neural perceptron multicamadas de única camada oculta, tendo como saída o tempo medido da dança da música. Há trabalhos que já utilizam essa metodologia na literatura com sucesso, sendo necessário uma alteração na extração de características da música para a rede atingir erros menores de estimação. Ao substituir a transformada de fourier pela transformada wavelet, espera-se que o erro da estimação da rede diminua comparado à literatura, visto que a mesma preserva tanto a informação de frequência como a informação temporal. Após alterar a extração de características para transformada em wavelet, o erro percentual absoluto médio foi de 0,8% com 41 neurônios na camada oculta para músicas gravadas em um ambiente de dança de forró. Para músicas sem ruído o erro foi de 1,1%, com 31 neurônios na camada oculta. Em comparação com a literatura, o valor era de 3,4% para o mesmo banco de dados de músicas gravadas, representando uma redução de 76,5% no erro. O erro maior para músicas sem ruído se deve ao fato de haver mais músicas nesse banco de dados, o que leva a rede a generalizar melhor. Com isso, obteve-se uma rede mais eficiente do que a literatura. Reduzindo o erro na estimação do tempo, reduz-se também a defasagem no estimulo sensorial repassado, resultando em uma rede mais adaptada à implementação. Portanto, a partir da investigação de extração de características, foi possível aumentar a eficiência da rede, tornando-a mais adequada para que dispositivos que possam auxiliar surdos a dançar forró, permitindo maior inserção destas pessoas dentro de mais ambientes de interação social. |