Simpósio de Integração Acadêmica - Universidade Federal de Viçosa

Ciência e Tecnologia: bases para o Desenvolvimento Social

20 a 25 de outubro de 2014

Trabalho 2849

ISSN	2237-9045
Instituição	Universidade Federal de Viçosa
Nível	Graduação
Modalidade	Pesquisa
Área de conhecimento	Ciências Exatas e Tecnológicas
Área temática	Informações geográficas, processamento de imagens e planejamento do espaço
Setor	Departamento de Engenharia Elétrica
Bolsa	PIBIC/CNPq
Conclusão de bolsa	Sim
Apoio financeiro	CNPq
Primeiro autor	Lucas Graciano Cardoso
Orientador	KETIA SOARES MOREIRA
Outros membros	ANDRE GOMES TORRES, Lídia da Silva Freitas, Vinicius Leonardo Gadioli da Silva
Título	Aperfeiçoamento do estudo do Movimento Facial por meio de Fluxo Óptico
Resumo	O estudo da relação existente entre o movimento facial e a acústica da fala é importante para a compreensão do processo de produção da fala. O objetivo deste trabalho é estudar os movimentos faciais em ambientes com e sem ruído, ou seja, com e sem a presença do Efeito Lombard, e sua relação com a acústica da fala através de estimadores lineares. Na representação do movimento facial, a extração dos vetores de velocidade deste movimento é feita por meio do fluxo óptico através do método iterativo de Horn e Schunk. O fluxo óptico é obtido respeitando com rigor as restrições advindas do método utilizado de modo a se obter os melhores vetores de movimento possíveis, isto é, vetores de velocidade que indiquem mais fielmente o movimento da face durante a fala e com o mínimo de erros. De posse dos vetores de movimento é observado que as cinco primeiras componentes principais extraídas após o uso do método iterativo representam cerca de 90% da variância observada nos dados do movimento facial e que são suficientes para representar o fluxo óptico do movimento facial. Para a acústica da fala são calculados os parâmetros LSP, que estão relacionados com a geometria do trato vocal. Técnicas de estimação são aplicadas a palavras isoladas retiradas de um discurso onde locutores proferem frases e estão submetidos a diferentes tipos de ruídos que são classificados em nenhum ruído, ruído baixo, médio e alto. Os dados obtidos dos vídeos onde o locutor é submetido a um ruído alto foram utilizados para treinamento do modelo matemático pelo fato do mesmo movimentar mais a boca para proferir as palavras quando comparado com as outras situações de ruído. Com as cinco componentes principais são determinados os parâmetros LSP por meio dos estimadores modelados. Os resultados numéricos mostram que a predição das faixas de frequência dos parâmetros LSP feitas pelo modelo matemático obtiveram uma similaridade com os dados esperados que chegou a atingir 97% na faixa de frequências em torno de 2033 Hz, melhor caso; e 55% na faixa de frequências em torno de 3552 Hz, pior caso. Espera-se que tanto a metodologia utilizada neste trabalho quanto os resultados obtidos possam ajudar em trabalhos futuros e fornecer contribuições para a área de Visão Computacional.
Palavras-chave	Movimento facial, Acústica da fala, Estimadores lineares
Forma de apresentação.....	Painel

Universidade Federal de Viçosa

Gerado em 0,68 segundos.