Resumo |
A disseminação de dispositivos móveis tem aumentado em uma proporção significativa entre a população brasileira. Isso acontece porque os smartphones servem de fonte de dados sobre os usuários e o ambiente onde estão inseridos. Sendo assim, as empresas têm buscado extrair conhecimento útil desses dados com o intuito de conhecer seus clientes e oferecer serviços personalizados. Com isso, é esperado que os usuários de serviços móveis se sintam mais satisfeitos com a qualidade dos mesmos. Este trabalho pode ajudar às empresas a conhecerem melhor seus usuários e oferecerem melhores serviços. Ao obter informações sobre o usuário tem-se dados sobre sua preferência de dispositivos e com isso, obtendo a localização de sua residência, pode-se desvendar características específicas daquela região. Para obter informações daquela unidade de território pôde-se utilizar dados do censo disponibilizado pelo órgão de pesquisa IBGE (Instituto Brasileiro de Geografia e Estatística). O objetivo deste trabalho é explorar dados de dispositivo móvel e setor censitário de milhares de usuários no Brasil para verificar se seu local de residência está correlacionado com as características de seus smartphones. Para isso, utilizamos a linguagem Python, IDE Jupyter Notebook e bibliotecas como Sklearn, matplotlib e seaborn para a fazer as análises do banco de dados, composto por mais de 60.000 usuários de várias partes do Brasil. Com objetivo no resultado, dentre as análises feitas, podemos citar: caracterização, a fim de conhecer melhor os dados com o qual trabalhamos, análises de regressão, com o intuito de encontrar correlações entre os dados, e também aplicações de modelos de machine learning para tentar prever o preço dos dispositivos móveis. Ao se tentar várias combinações de variáveis explicativas, verificou-se que não existe uma correlação clara e, consequentemente, não foi possível estabelecer com precisão um modelo de regressão para prever o preço médio dos smartphones com base em características da região de residência. Nesse sentido, houve um impacto também na aplicação dos modelos, pois ao fazer uso das métricas como acurácia, precisão e curva ROC, pode-se ter outra visão dos resultados. Logo, ao aplicar as métricas dentre os modelos pode-se notar que há um resultado significante em um dos modelos, porém ainda assim, não foi possível treinar um modelo eficiente para realizar a classificação de preços. |