“Inteligência Artificial: A Nova Fronteira da Ciência Brasileira”

19 a 24 de outubro de 2020

Trabalho 14312

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Engenharia Elétrica
Conclusão de bolsa Não
Primeiro autor Lucas Ferreira Paiva
Orientador RODOLPHO VILELA ALVES NEVES
Outros membros Hugo Gonçalves Lopes, LEONARDO BONATO FELIX, Priscila da Silva Maradini
Título Uso de inteligência artificial para estimar a duração do compasso de músicas de forró
Resumo Por meio da Lei Nº 13.409 de 2016, que altera a “Lei das Cotas” (Lei Nº 12.711 de 2012), tem-se a reserva de vagas para pessoas surdas no ensino superior, garantindo maior acesso desses estudantes à universidade. Ao mesmo tempo, existem vários projetos que promovem aulas de dança e eventos culturais de forró no ambiente universitário, que contam com a participação de alunos surdos. O forró é marcado por instrumentos de percussão, como zabumba que ao longo compassos musicais ditam a velocidade de movimento da dança. Trabalhos atuais mostram que é possível potencializar o contato do surdo com a música através de estímulos visuais e táteis. Para a implementação de uma aplicação que passe o ritmo de músicas a partir de estímulos sensoriais alternativos à audição, é necessário estimar parâmetros que indiquem o ritmo em tempo real. Visando a inclusão do público surdo em atividades culturais envolvendo o forró, este trabalho propõe um método capaz de estimar duração de um compasso musical de músicas de forró com baixo custo computacional. Foram selecionadas 37 músicas das vertentes Forró Pé-de-serra e Forró Universitário para compor o banco de dados, as músicas foram reproduzidas no espaço “Forró do Itaú” e gravadas com celular no bolso ao longo da dança, captando além da música os ruídos do espaço. As gravações tiveram os tempos de silêncio do início e fim retirados e foram segmentadas em trechos de 3s com sobreposição de 1s. A duração do compasso esperado das músicas foi obtido indiretamente a partir do passo base mensurado com ajuda de uma instrutora de forró. Para o treinamento da rede neural, as entradas foram as componentes espectrais da gravação entre 50 e 300 Hz, responsáveis pelo som mais grave da zabumba. Foram avaliadas 40 variações de perceptron multicamadas (PMC) com uma camada oculta, alterando o número de neurônios 11 a 51 na camada oculta. A escolha da melhor rede foi feita mediante validação cruzada K-Fold com K=7, o critério de escolha foi o erro percentual médio (EPM) da fase de teste entre as 7 distribuições do banco de dados. As 37 músicas segmentadas totalizaram 3200 amostras com durações dos compassos variando de 1,090s até 1,892s. A rede que melhor se adaptou ao problema contou com 31 neurônios na camada oculta e obteve EPM = 5,709±0,085%. Foi possível estimar o tempo de execução do passo base de músicas de forró a partir do espectro de frequências da música utilizando uma rede PMC com uma única camada oculta com poucos neurônios, o que facilita a implementação do modelo em um dispositivo móvel. O experimento buscou criar um modelo apto a ser utilizado no mundo real “open world”, visto que muitos modelos simulados em ambientes altamente controlados “closed world’’ apresentam baixo desempenho na prática. O próximo passo é avaliar se o erro encontrado é suficientemente baixo para permitir a pessoas surdas experiência de dança significativa.
Palavras-chave Rede perceptron multicamadas, Inclusão de surdos, Open World
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,67 segundos.