ISSN | 2237-9045 |
---|---|
Instituição | Universidade Federal de Viçosa |
Nível | Graduação |
Modalidade | Pesquisa |
Área de conhecimento | Ciências Exatas e Tecnológicas |
Área temática | Teoria e Tecnologia da informação |
Setor | Instituto de Ciências Exatas e Tecnológicas |
Conclusão de bolsa | Não |
Primeiro autor | Victor Hugo Andrade Soares |
Orientador | MURILO COELHO NALDI |
Outros membros | Joelson Antonio dos Santos, Victor Hugo Andrade Soares |
Título | Investigação sobre tecnologias de Big Data para agrupamento e mineração de dados em fluxo contínuo |
Resumo | A evolução das tecnologias trouxe consigo uma geração massiva de dados a todo instante. Publicações em redes sociais, compras pela internet, consultas, etc. Tudo isso constitui um dos mais novos conceitos da tecnologia da informação, o Big Data. Além disso, existem dados que são gerados em tempo real, como é caso de vídeos, áudio, investimentos em ações na bolsa de valores, informações climáticas. Esses tipos de dados são chamados de fluxos contínuos. Atualmente, empresas tendem a analisar os dados de seus clientes visando encontrar padrões que possam maximizar seus lucros. Os processos de análise necessitam garantir respostas imediatas para as empresas. Sistemas computacionais de análise de dados em fluxos contínuos e a mineração de dados são mecanismos primordiais para execução dessa tarefa. Contudo, esta área de conhecimento demonstra-se um tanto quanto complexa. Plataformas vem sendo desenvolvidas e algoritmos são implementados e aperfeiçoados diariamente. Porém, nem todas as necessidades são atendidas devido a diversidade de formatos de dados existentes. A falta de padrões na geração desses dados exige que diversas técnicas de pré-processamento sejam criadas para ajustá-los de maneira que possam ser processados por algoritmos de aprendizado de máquina. Além da já desafiadora missão de se processar grande quantidade de dados armazenados, o processamento de dados em fluxo é ainda mais desafiador. No processamento de fluxo contínuo, os dados são lidos em uma pequena fração de tempo, processados e descartados para que novos dados possam ser recebidos. Apenas o conhecimento é mantido, impossibilitando o re-processamento dos dados que já passaram. Os objetivos desse trabalho são: investigar dentro das tecnologias de Big Data, ferramentas e algoritmos voltados para análise de dados em fluxos contínuos; examinar minuciosamente uma das tecnologias e algoritmos escolhidos, a fim de encontrar pontos que possam ser melhorados; realizar a implementação de umas das tradicionais técnicas de agrupamento de dados na tecnologia escolhida. Posteriormente, comparar a técnica implementada com a técnica já existente em uma determinada tecnologia. |
Palavras-chave | fluxos contínuos de dados, mineração de dados, Big Data |
Forma de apresentação..... | Painel |