Das Montanhas de Minas ao Oceano: Os Caminhos da Ciência para um Futuro Sustentável

20 a 25 de outubro de 2025

Trabalho 21013

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Agrárias
Área temática Dimensões Ambientais: ODS13
Setor Departamento de Biologia Geral
Bolsa Não se Aplica
Conclusão de bolsa Não
Apoio financeiro CNPq
Primeiro autor Paulo César Lima Sousa
Orientador LEONARDO LOPES BHERING
Outros membros Alexandre Lima Oliveira, Hernandes Peres Panichi, João Amaro Ferreira Vieira Netto, Marco Antonio Peixoto
Título Uso de inteligência computacional para predição de produtividade de batata (Solanum tuberosum L.) em anos futuros a partir de dados genéticos e ambientais
Resumo Com a intensificação das alterações ambientais projetadas pelas mudanças climáticas, a capacidade de predizer a produtividade de culturas como a da batata (Solanum tuberosum L.) em anos futuros tem papel fundamental. Sob tal ótica, é crucial utilizar ferramentas que otimizem a busca pelos melhores indivíduos, como o uso de inteligência computacional (IC). Dessa forma, o objetivo do trabalho foi desenvolver um modelo preditivo baseado em Extreme Gradient Boosting (XGBoost) para predizer a produtividade total (PT) de batata, unindo dados genéticos, ensaios de campo e covariáveis ambientais (COVAMB) em um intervalo de anos. Especificamente, buscou-se demonstrar a capacidade do modelo em predizer PT em um determinado ano. Os dados utilizados neste estudo foram coletados de ensaios experimentais de batata conduzidos nos Estados Unidos da América (EUA). Ao todo foram observados 376 genótipos em 10 locais distintos durante o período de 2019 a 2023, o total de ambientes são uma combinação de ano e local. Buscando reduzir a dimensionalidade do quadro de dados, a variável PT foi ajustada, obtendo-se Best Linear Unbiased Estimates (BLUES) de cada genótipo em cada ambiente, paralelamente, COVAMB foi reduzida de 464 em 20 componentes principais utilizando Singular Value Decomposition (SVD). Além disso, usou-se a matriz de Van Raden como relacionamento genético. Empregou-se o pacote caret na linguagem de programação R para execução do algoritmo XGBoost. O modelo foi treinado a partir dos anos de 2019 a 2022 para predizer 2023, empregando Cross Validation (CV) com K-fold = 5, na grade de parâmetros do modelo foi utilizado o número de árvores = 600; profundidade máxima das árvores = 6; taxa de aprendizado = 0.001; regularização mínima de perda por split = 0.5; proporção de colunas para construir cada árvore = 0.5; soma mínima do peso da instancia necessária em um nó filho = 0.25; proporção das instâncias de treinamento = 0.5. Após a predição, utilizou-se da correlação Pearson (r) para comparar os valores preditos com os valores reais ajustados de PT. A correlação observada de 0.647, demonstra a capacidade do modelo em explicar uma parte significativa de PT, mesmo em um cenário de predição para um ano não visualizado durante o treinamento (2023). A integração das COVAMB reduzidas se tornou fundamental para o desenvolvimento do modelo, com SVD foi possível representar de forma eficiente as interações complexas com o ambiente. Conclui-se a eficácia do algoritmo na predição da produtividade em múltiplos ambientes em um determinado ano futuro, utilizando uma abordagem que integra dados genéticos, fenotípicos e ambientais. Portanto, a capacidade de predizer a produtividade em diferentes ambientes por metodologias à base de IC, se mostra eficaz e necessária frente as grandes mudanças climáticas.
Palavras-chave Extreme Gradient Boosting, Covariáveis ambientais, Singular Value Decomposition.
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,64 segundos.