Ciência e Tecnologia: bases para o Desenvolvimento Social

20 a 25 de outubro de 2014

Trabalho 1837

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Teoria e Tecnologia da informação
Setor Instituto de Ciências Exatas e Tecnológicas
Bolsa PIBIC/CNPq
Conclusão de bolsa Não
Apoio financeiro CNPq
Primeiro autor Joelson Antonio dos Santos
Orientador MURILO COELHO NALDI
Título Suporte para o desenvolvimento de uma plataforma em nuvem para mineração de dados
Resumo O avanço tecnológico e a necessidade de comunicação das pessoas contribuíram para a produção de grandes quantidades de dados a todo instante. Publicações de fotos e mensagens em redes sociais, compras pela internet, ou até mesmo a quantidade de cliques e buscas feitas por um determinado conteúdo na internet constituíram uma quantidade exorbitante de dados produzida que é conhecida como Big Data. O Big Data não é constituído apenas pelo seu volume, ele é também caracterizado por sua variedade de formatos dos dados, vídeos, músicas, textos, tuítes e outros tipos de dados, denotam o que se conhece como dados não estruturados. A velocidade em que os dados são criados e armazenados nos grandes armazéns de dados dão ao Big Data outra característica fundamental. O armazenamento de dados é uma tarefa relativamente trivial devido à facilidade que os dispositivos de armazenamento atuais oferecem. Entretanto, é interessante para as diversas áreas do conhecimento entender o que é armazenado constantemente, tudo isso a fim de encontrar padrões e informações úteis nesse oceano de dados. Porém, analisar Big Data não é uma atividade fácil devido suas características complexas, isso exige um amaranhado de tecnologias e técnicas para esse fim. Neste contexto, a junção de tecnologias tais como Apache Hadoop e Apache Mahout, com técnicas de mineração de dados, podem se tornar um mecanismo fundamental para facilitar a busca por informações valiosas em meio a tantos dados. Parece que os problemas foram resolvidos, mas não foram, existem dificuldades enfrentadas por analistas de Big Data. A instabilidade de sistemas de análises de Big Data é uma grande inimiga do tempo de resposta necessário para as organizações, uma vez que elas procuram otimizar e maximizar seus lucros, e na maioria das vezes em períodos curtos de tempo. A ociosidade de recursos computacionais também tornou-se um grande dilema, isso ocorre devido ao crescimento desenfreado das tecnologias. A virtualização neste contexto, tem como função de melhorar o tempo gasto para recuperar sistemas de análises de Big Data com falhas, e também melhorar a utilização de recursos computacionais a fim de diminuir a ociosidade desses recursos. O objetivo principal deste trabalho é desenvolver ambientes virtualizados flexíveis e confiáveis que possam dar suporte para a plataforma Apache Hadoop e também para a biblioteca de algoritmos de mineração de dados Apache Mahout.
Palavras-chave Big Data, Virtualização, Mineração de Dados
Forma de apresentação..... Painel, Oral
Gerado em 0,64 segundos.