Resumo |
Com o crescente avanço tecnológico, em termos de hardware e de software, as empresas que desejam permanecer no mercado devem buscar desenvolver software de qualidade, dentro do orçamento e cronograma estimados. Porém, realizar estimativas confiáveis de esforço, custo e tempo ainda representa um desafio. Neste contexto várias pesquisas têm sido realizadas a fim de propor e avaliar técnicas e modelos de estimativas de esforço, a fim de obter estimativas mais precisas de custo de software. Porém, muitas empresas preferem realizar estimativas baseado em experiência em projetos passados. Isso pode ser devido à complexidade dos modelos ou pela falta de resultados que comprovem a precisão das estimativas realizadas utilizando modelos algorítmicos. Desta forma, o presente trabalho tem como objetivo investigar a precisão de estimativas, que utilizam modelos de predição de esforço, gerados a partir de um conjunto de técnicas estatísticas combinadas: análise de regressão, análise de variância e análise de resíduos. Para a geração dos modelos foi utilizado o conjunto de dados ISBSG - Software Benchmarking Standards Group (ISBSG), que possui mais de 4100 projetos da área de desenvolvimento de software, de empresas localizadas em 24 países diferentes. Primeiramente, foi realizado o pré-processamento dos dados, posteriormente foram gerados os modelos e por último a análise de precisão, utilizando a métrica MMRE- Magnitude Média do Erro Relativo. Após o pré-processamento a base de dados resultante inclui registros de projetos e onze variáveis que são prováveis de ter influencia sobre o esforço. O conjunto original foi dividido, seguindo o procedimento da análise de dados não balanceados de KITCHENHAM (1998), onde dividiu-se a base de dados em dois conjuntos, sendo um conjunto de dados de teste e outro conjunto de dados de treinamento, sendo que para o conjunto de teste obteve-se 5 subconjuntos com 62 projetos e 1 com 61 projetos e para o conjunto de treinamento obteve-se 5 subconjuntos com 310 projetos e 1 com 309 projetos . Através da análise de variância (ANOVA) e análise de resíduos sobre as variáveis independentes do conjunto de teste, pôde-se identificar quais delas influenciavam mais no esforço e considerá-las para a estimativa final. Após esta etapa identificou-se a precisão dos modelos de estimativa de software gerados através do MMRE para cada um dos subconjuntos de teste, comparando-se os esforços estimados e os observados (reais). Os valores do MMRE para os conjuntos 1, 2, 3, 4, 5 e 6 foram respectivamente, 109,36; 100,24; 105,12; 256,72; 113,36 e 154,34. Sendo assim, o trabalho oferece uma contribuição relevante para pesquisas futuras, pois percebe-se que quanto melhor e miniciosa é a fase de processamento dos dados menor é o valor do MMRE e consequentemente a confiança de se usar o modelo será maior. |