ISSN |
2237-9045 |
Instituição |
Universidade Federal de Viçosa |
Nível |
Graduação |
Modalidade |
Pesquisa |
Área de conhecimento |
Ciências Exatas e Tecnológicas |
Área temática |
Informações geográficas, processamento de imagens e planejamento do espaço |
Setor |
Departamento de Engenharia Elétrica |
Bolsa |
PIBIC/CNPq |
Conclusão de bolsa |
Sim |
Apoio financeiro |
CNPq |
Primeiro autor |
Lucas Graciano Cardoso |
Orientador |
KETIA SOARES MOREIRA |
Outros membros |
ANDRE GOMES TORRES, Lídia da Silva Freitas, Vinicius Leonardo Gadioli da Silva |
Título |
Aperfeiçoamento do estudo do Movimento Facial por meio de Fluxo Óptico |
Resumo |
O estudo da relação existente entre o movimento facial e a acústica da fala é importante para a compreensão do processo de produção da fala. O objetivo deste trabalho é estudar os movimentos faciais em ambientes com e sem ruído, ou seja, com e sem a presença do Efeito Lombard, e sua relação com a acústica da fala através de estimadores lineares. Na representação do movimento facial, a extração dos vetores de velocidade deste movimento é feita por meio do fluxo óptico através do método iterativo de Horn e Schunk. O fluxo óptico é obtido respeitando com rigor as restrições advindas do método utilizado de modo a se obter os melhores vetores de movimento possíveis, isto é, vetores de velocidade que indiquem mais fielmente o movimento da face durante a fala e com o mínimo de erros. De posse dos vetores de movimento é observado que as cinco primeiras componentes principais extraídas após o uso do método iterativo representam cerca de 90% da variância observada nos dados do movimento facial e que são suficientes para representar o fluxo óptico do movimento facial. Para a acústica da fala são calculados os parâmetros LSP, que estão relacionados com a geometria do trato vocal. Técnicas de estimação são aplicadas a palavras isoladas retiradas de um discurso onde locutores proferem frases e estão submetidos a diferentes tipos de ruídos que são classificados em nenhum ruído, ruído baixo, médio e alto. Os dados obtidos dos vídeos onde o locutor é submetido a um ruído alto foram utilizados para treinamento do modelo matemático pelo fato do mesmo movimentar mais a boca para proferir as palavras quando comparado com as outras situações de ruído. Com as cinco componentes principais são determinados os parâmetros LSP por meio dos estimadores modelados. Os resultados numéricos mostram que a predição das faixas de frequência dos parâmetros LSP feitas pelo modelo matemático obtiveram uma similaridade com os dados esperados que chegou a atingir 97% na faixa de frequências em torno de 2033 Hz, melhor caso; e 55% na faixa de frequências em torno de 3552 Hz, pior caso. Espera-se que tanto a metodologia utilizada neste trabalho quanto os resultados obtidos possam ajudar em trabalhos futuros e fornecer contribuições para a área de Visão Computacional. |
Palavras-chave |
Movimento facial, Acústica da fala, Estimadores lineares |
Forma de apresentação..... |
Painel |