Ciência e Tecnologia: bases para o Desenvolvimento Social

20 a 25 de outubro de 2014

Trabalho 1845

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Teoria e Tecnologia da informação
Setor Instituto de Ciências Exatas e Tecnológicas
Conclusão de bolsa Não
Primeiro autor Victor Hugo Andrade Soares
Orientador MURILO COELHO NALDI
Outros membros Joelson Antonio dos Santos, Victor Hugo Andrade Soares
Título Investigação sobre tecnologias de Big Data para agrupamento e mineração de dados em fluxo contínuo
Resumo A evolução das tecnologias trouxe consigo uma geração massiva de dados a todo instante. Publicações em redes sociais, compras pela internet, consultas, etc. Tudo isso constitui um dos mais novos conceitos da tecnologia da informação, o Big Data. Além disso, existem dados que são gerados em tempo real, como é caso de vídeos, áudio, investimentos em ações na bolsa de valores, informações climáticas. Esses tipos de dados são chamados de fluxos contínuos. Atualmente, empresas tendem a analisar os dados de seus clientes visando encontrar padrões que possam maximizar seus lucros. Os processos de análise necessitam garantir respostas imediatas para as empresas. Sistemas computacionais de análise de dados em fluxos contínuos e a mineração de dados são mecanismos primordiais para execução dessa tarefa.
Contudo, esta área de conhecimento demonstra-se um tanto quanto complexa. Plataformas vem sendo desenvolvidas e algoritmos são implementados e aperfeiçoados diariamente. Porém, nem todas as necessidades são atendidas devido a diversidade de formatos de dados existentes. A falta de padrões na geração desses dados exige que diversas técnicas de pré-processamento sejam criadas para ajustá-los de maneira que possam ser processados por algoritmos de aprendizado de máquina. Além da já desafiadora missão de se processar grande quantidade de dados armazenados, o processamento de dados em fluxo é ainda mais desafiador. No processamento de fluxo contínuo, os dados são lidos em uma pequena fração de tempo, processados e descartados para que novos dados possam ser recebidos. Apenas o conhecimento é mantido, impossibilitando o re-processamento dos dados que já passaram.
Os objetivos desse trabalho são: investigar dentro das tecnologias de Big Data, ferramentas e algoritmos voltados para análise de dados em fluxos contínuos; examinar minuciosamente uma das tecnologias e algoritmos escolhidos, a fim de encontrar pontos que possam ser melhorados; realizar a implementação de umas das tradicionais técnicas de agrupamento de dados na tecnologia escolhida. Posteriormente, comparar a técnica implementada com a técnica já existente em uma determinada tecnologia.
Palavras-chave fluxos contínuos de dados, mineração de dados, Big Data
Forma de apresentação..... Painel
Gerado em 0,64 segundos.