Resumo |
Por meio da Lei Nº 13.409 de 2016, que altera a “Lei das Cotas” (Lei Nº 12.711 de 2012), tem-se a reserva de vagas para pessoas surdas no ensino superior, garantindo maior acesso desses estudantes à universidade. Ao mesmo tempo, existem vários projetos que promovem aulas de dança e eventos culturais de forró no ambiente universitário, que contam com a participação de alunos surdos. O forró é marcado por instrumentos de percussão, como zabumba que ao longo compassos musicais ditam a velocidade de movimento da dança. Trabalhos atuais mostram que é possível potencializar o contato do surdo com a música através de estímulos visuais e táteis. Para a implementação de uma aplicação que passe o ritmo de músicas a partir de estímulos sensoriais alternativos à audição, é necessário estimar parâmetros que indiquem o ritmo em tempo real. Visando a inclusão do público surdo em atividades culturais envolvendo o forró, este trabalho propõe um método capaz de estimar duração de um compasso musical de músicas de forró com baixo custo computacional. Foram selecionadas 37 músicas das vertentes Forró Pé-de-serra e Forró Universitário para compor o banco de dados, as músicas foram reproduzidas no espaço “Forró do Itaú” e gravadas com celular no bolso ao longo da dança, captando além da música os ruídos do espaço. As gravações tiveram os tempos de silêncio do início e fim retirados e foram segmentadas em trechos de 3s com sobreposição de 1s. A duração do compasso esperado das músicas foi obtido indiretamente a partir do passo base mensurado com ajuda de uma instrutora de forró. Para o treinamento da rede neural, as entradas foram as componentes espectrais da gravação entre 50 e 300 Hz, responsáveis pelo som mais grave da zabumba. Foram avaliadas 40 variações de perceptron multicamadas (PMC) com uma camada oculta, alterando o número de neurônios 11 a 51 na camada oculta. A escolha da melhor rede foi feita mediante validação cruzada K-Fold com K=7, o critério de escolha foi o erro percentual médio (EPM) da fase de teste entre as 7 distribuições do banco de dados. As 37 músicas segmentadas totalizaram 3200 amostras com durações dos compassos variando de 1,090s até 1,892s. A rede que melhor se adaptou ao problema contou com 31 neurônios na camada oculta e obteve EPM = 5,709±0,085%. Foi possível estimar o tempo de execução do passo base de músicas de forró a partir do espectro de frequências da música utilizando uma rede PMC com uma única camada oculta com poucos neurônios, o que facilita a implementação do modelo em um dispositivo móvel. O experimento buscou criar um modelo apto a ser utilizado no mundo real “open world”, visto que muitos modelos simulados em ambientes altamente controlados “closed world’’ apresentam baixo desempenho na prática. O próximo passo é avaliar se o erro encontrado é suficientemente baixo para permitir a pessoas surdas experiência de dança significativa. |