“Inteligência Artificial: A Nova Fronteira da Ciência Brasileira”

19 a 24 de outubro de 2020

Trabalho 13160

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Engenharia Elétrica
Conclusão de bolsa Não
Primeiro autor Iure Rosa Lima de Oliveira
Orientador ALEXANDRE SANTOS BRANDAO
Título Aplicação de Técnicas Q-Rounting no Planejamento de Caminhos de Robôs Móveis
Resumo A Inteligência Artificial (IA) é um campo de estudo que permite que sistemas simulem uma inteligência similar à humana, onde os chamados agentes inteligentes vão além de uma programação de ordens específicas, tomando decisões de forma autônoma, baseadas em padrões de enormes bases de dados. Pode-se então, de modo geral, definir IA como a capacidade das máquinas de pensarem como seres humanos: aprender, perceber e decidir quais caminhos seguir, de forma racional, diante de determinadas situações. No entanto, ensinar computadores a pensar não é algo tão simples, essa questão passa por várias áreas da ciência da computação como Aprendizado de Máquinas (ML – Machine Learning, do inglês), que por sua vez engloba o conceito de Aprendizagem por Reforço (RL – Reinforcement Learning, do inglês). Em termos formais, RL é um método de aprendizado de máquina em que o agente de software aprende, por meio de repetidas tentativas, a executar certas ações em um ambiente, levando-o a uma recompensa máxima. Dado a dinamicidade do ambiente, a aplicação dessas técnicas em robótica móvel torna-se bastante interessantes, afinal, o robô será capaz de interagir constantemente com o ambiente, de modo que, caso haja alguma alteração, o agente inteligente, nesse caso o robô, possa se adaptar aquela mudança. Muitas vezes, em robótica navegacional, o interesse é encontrar a melhor rota dado uma configuração inicial e final, sendo assim, é necessário uma metodologia eficiente, capaz de encontrar essa(s) rotas(s) ótima(s) a partir de um dataset que contém informações sobre a localização de obstáculos no ambiente em questão. No problema de Aprendizagem por Reforço, tem-se ação, recompensas, estados e taxas de descontos. Para resolver o problema tradicional, tem-se o Q-Learning, que pode ser usado para encontrar uma política de seleção de ação ideal para qualquer processo de decisão Markov (MDP – Markov Decision Process, do inglês). Da mesma forma, para resolver o problema de localização da melhor rota, tem-se o Q-Rounting. A diferença entre Q-Learning e Q-Rounting é que o último não tem uma taxa de desconto e, para cada estado, escolherá o custo futuro mínimo em vez da recompensa futura máxima. Neste trabalho, é desenvolvido um algoritmo, baseado em RL, capaz de fazer a leitura de uma matriz de dados que contém as informações extraídas do ambiente e, através dela, encontrar a melhor rota dado dois nós, inicial e final, considerando todos os outros nós como pontos livres, ou seja, não há obstáculo presente naquele ponto.
Palavras-chave Q-Rounting, Reinforcement Learning, Robótica Móvel.
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,64 segundos.