Resumo |
A correta classificação de indivíduos é de extrema importância para fins de preservação da variabilidade genética existente bem como para a maximização dos ganhos no melhoramento. As técnicas de estatística multivariada comumente utilizada nessas situações são as funções discriminantes de Fisher e de Anderson, que permitem alocar um indivíduo inicialmente desconhecido em uma das g populações prováveis ou grupos pré-definidos. Entretanto, para altos níveis de similaridade como é o caso de populações de retrocruzamentos esses métodos tem se mostrado pouco eficientes. Atualmente, muito se fala de um novo paradigma de computação, as redes neurais artificiais, que podem ser utilizadas para resolver diversos problemas da Estatística, como agrupamento de indivíduos similares, previsão de séries temporais e em especial, os problemas de classificação. O objetivo desse trabalho foi realizar um estudo comparativo entre as funções discriminantes de Fisher e de Anderson e as redes neurais artificiais quanto ao número de classificações incorretas de indivíduos sabidamente pertencentes a diferentes populações simuladas de retrocruzamento, com crescentes níveis de similaridade. A dissimilaridade, medida pela distância de Mahalanobis, foi um conceito de fundamental importância na utilização das técnicas de discriminação, pois quantificou o quanto as populações eram divergentes. A obtenção dos dados foi feita através de simulação utilizando o programa computacional Genes. Cada população, gerada por simulação, foi caracterizada por um conjunto de elementos mensurados por características de natureza contínua. Foram geradas considerados 50 locos independentes, cada qual com dois alelos. As relações de parentescos e a estruturação hierárquica foram estabelecidas considerando populações genitoras geneticamente divergentes, híbrido F1 e cinco gerações de retrocruzamento em relação a cada um dos genitores, permitindo estabelecer parâmetros de eficácia das metodologias testadas. Os dados fenotípicos das populações foram utilizados para estabelecimento da função discriminante de Fisher e Anderson e para o cálculo da taxa de erro aparente (TEA), que mede o número de classificações incorretas. As estimativas de TEA foram comparadas com as obtida por meio das Redes Neurais Artificiais. As redes neurais artificiais mostraram-se uma técnica promissora no que diz respeito a problemas de classificação, uma vez que apresentaram um número de classificações incorretas de indivíduos menor que os dados obtidos pelas funções discriminantes. |