“Bicentenário da Independência: 200 anos de ciência, tecnologia e inovação no Brasil e 96 anos de contribuição da UFV”.

8 a 10 de novembro de 2022

Trabalho 17356

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Pós-graduação
Modalidade Pesquisa
Área de conhecimento Ciências Agrárias
Área temática Inteligência Artificial
Setor Departamento de Estatística
Bolsa FAPEMIG
Conclusão de bolsa Não
Primeiro autor Noé Mitterhofer Eiterer Ponce de Leon da Costa
Orientador MOYSES NASCIMENTO
Outros membros Antonio Carlos Baião de Oliveira, Eveline Teixeira Caixeta Moura, Victória Manhago Salvador
Título Redes Neurais Artificiais Regularizadas para predição genômica da resistência a cercosporiose em Coffea arabica
Resumo O café apresenta um processo de melhoramento genético demorado e oneroso. Pouco explorado pelas inciativas privadas, o melhoramento do café é mais desenvolvido pelas instituições públicas. Uma das formas de se acelerar o processo de identificar variedades com características agronomicamente superiores é através da Seleção Genômica (SG). A SG basicamente utiliza das informações moleculares para predizer o desempenho dos genótipos avaliados. Entre vários métodos utilizados para predição genômica, as Redes Neurais Artificiais (RNA) apresentam a grande vantagem de conseguir capturar, a partir dos marcadores moleculares, as relações lineares e não-lineares de maneira natural sem a necessidade de se estabelecer um modelo a priori. Portanto, a utilização de RNA vem crescendo ao passar do tempo pela sua melhor capacidade preditiva frente a métodos estatísticos em algumas situações, como por exemplo, na presença de efeitos não aditivos. Porém, as RNA podem sofrer com o overfitting, ou seja, a rede memoriza aquele conjunto de dados e perde sua capacidade preditiva em outros conjuntos de dados. Uma forma de evitar o overfitting é através do uso de RNA Regularizadas (RNAR), como por exemplo a do tipo L1. A regularização L1 basicamente modifica a função de custo da rede para penalizar grandes pesos e tendendo a fazer com que a rede prefira pequenos pesos. Assim, o objetivo desse trabalho foi de comparar a capacidade preditiva de diferentes arquiteturas de RNAR do tipo L1 na predição do mérito de genótipos quanto a resistência a cercosporiose em Coffea arabica. Os dados utilizados foram de resistência a cercosporiose de 156 genótipos de Coffea arabica genotipados para 3824 marcadores. Do conjunto total de dados (156 indivíduos), 80% foram utilizados para treinamento da rede e o restante para teste. Foram utilizadas RNA do tipo Perceptron de Múltiplas Camadas, com duas camadas ocultas, cada uma variando 1 a 20 neurônios. Foram consideradas 50 iterações e valores do parâmetro de regularização (k) iguais à 2, 4, 8 ou 10. Como métrica de comparação foi utilizada a capacidade preditiva da rede. Considerando k=2 a maior capacidade preditiva foi de 0,12 com 8 neurônios na primeira camada e 1 neurônio na segunda camada. Com k=4, o resultado obtido de capacidade preditiva foi de 0,35 quando utilizou 3 neurônios na primeira e 8 na segunda camada. Já considerando k=8 regularizações, o maior valor de capacidade preditiva da rede foi de 0,51 quando se utilizou 11 neurônios na primeira camada e 15 na segunda camada oculta. Finalmente, com k=10, a maior capacidade preditiva foi de 0,44 com 2 neurônios em ambas as camadas. Assim, mantendo o número de iterações em 50, podemos verificar que o aumento de regularizações em até 8 resultou em aumento da capacidade preditiva da rede. Isso pode ser explicado pela capacidade das regularizações em evitar o overfitting. Elevados valores do parâmetro de regularização, neste trabalho, igual à 8 ocorre redução da capacidade preditiva.
Palavras-chave seleção genômica, inteligência artificial, overfitting.
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,70 segundos.