| Resumo |
As queimadas constituem um fenômeno mundial com profundos impactos nas funções dos ecossistemas, nas mudanças climáticas, na qualidade do ar, na saúde e na propriedade humana (CHEN; MORTON; RANDERSON, 2024). No Brasil a história não é diferente, especialmente nas regiões da Amazônia e no Cerrado, sendo grande parte devido à expansão agrícola e ao uso inadequado do solo. Neste contexto, o presente trabalho visa aplicar e comparar a importância das variáveis espectrais, climáticas, topográficas e índices espaciais aplicando os algoritmos de aprendizado supervisionado, Random Forest (RF) e XGBoost (Extreme Gradient Boosting), na previsão da ocorrência de queimadas para o ano de 2023, com foco no município de São Félix do Xingu (PA), um dos mais afetados com as queimadas em 2023 e líder do ranking nacional em 2024 (MAPBIOMAS, 2024). A coleção de imagens orbitais adquiridas para compor as variáveis preditivas e alvo para o ano de 2023 foi obtida a partir das fontes Landsat 8, ERA5-Land, SRTM e MapBiomas Fire, por meio da API do Google Earth Engine e processados no ambiente Google Colaboratory. Dessa forma, as variáveis resultantes foram: NDVI, NBR, banda Termal, banda do Vermelho, Infravermelho Próximo, Infravermelho de Ondas Curtas 1, Infravermelho de Ondas Curtas 2, banda Verde, banda Azul, Temperatura Máxima, Temperatura Média, Temperatura Mínima, Precipitação, Declividade e Elevação. A partir da construção de um conjunto balanceado de amostras, foram extraídos os valores de cada banda da coleção de imagens criada para as variáveis preditoras e alvo. A avaliação dos modelos foi realizada utilizando o processo de validação cruzada de 5 pastas, analisando as métricas F1-score, precision, recall, matriz de confusão e exatidão global (EG), além do índice de separatibilidade. Ambos os modelos apresentaram desempenho consistente, com destaque para o RF, que obteve maior recall (0,90) e F1-score (0,85) médios, mantendo o mesmo precision médio do XGBoost (0,82). O modelo XGBoost, por sua vez, apresentou menor variação no recall e F1-score, demonstrando maior estabilidade na detecção de áreas queimadas. Dentre as variáveis analisadas, o NBR, banda Termal e banda do Vermelho apresentaram os maiores índices de separatibilidade, indicando maior capacidade de discriminação entre áreas queimadas e não queimadas. Por outro lado, as variáveis Temperatura Média, Elevação e Precipitação foram as que apresentaram os menores índices, sugerindo influência limitada na diferenciação espectral das áreas analisadas. A análise da importância das variáveis para os modelos RF e XGBoost revelou a predominância das informações espectrais na modelagem da ocorrência de queimadas. O modelo RF obteve melhor desempenho geral, com EG de 84%, enquanto o XGBoost alcançou 78%. Por fim, o modelo RF demonstrou menor número de falsos positivos e negativos, indicando que o modelo foi mais eficiente em identificar corretamente áreas queimadas, com menor erro de omissão e comissão. |