Utilizando redes neurais profundas para predizer abundância de espécies no contexto do Gran Chaco
Data
2025-05-21
Autores
Oliveira Junior, Admir Cesar de
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Os Modelos de Distribuição de Espécies (SDMs) tornaram-se importantes ferramentas, não só para a biologia da conservação como também para a ecologia e biogeografia. Entretanto, os SDM apresentam limitações por ignorarem aspectos ecológicos como tendência e distribuição espacial da abundância de espécies. Recentemente vêm sendo propostos os Modelos de Distribuição Baseados em Abundância (ADM). Como os SDM, estes são modelos correlativos, mas modelam e predizem ao longo do espaço geográfico a abundância das espécies. Entretanto, os ADM permanecem pouco desenvolvidos em comparação com os SDMs, com poucos trabalhos na literatura que explorem os ADM, em questões como algoritmos e validação, e poucos pacotes ou ferramentas desenvolvidas para suas construções. A capacidade dos ADM pode significar ganhos expressivos para a conversação biológica, resultando em melhores decisões e planejamento, especialmente em áreas ameaçadas, como o Gran Chaco. O Gran Chaco é uma região que se estende pelo norte da Argentina, oeste do Paraguai, sudeste da Bolívia e em uma pequena parte do centro-oeste Brasil. Apresenta vegetação predominantemente aberta e xeromórfica e clima semiárido e alta biodiversidade, mas possui poucas áreas protegidas e grande taxa perda de cobertura natural. Esta dissertação está estruturada em dois capítulos. No primeiro capítulo, apresenta-se o pacote para R adm, desenvolvido com o intuito de possibilitar fluxos de trabalho concisos e flexíveis para a construção de ADMs. Com este pacote objetiva-se alavancar o estado de desenvolvimento e a pesquisa dos ADMs fornecendo uma ferramenta útil para sua fácil construção e validação. No segundo capítulo, apresenta-se a aplicação deste pacote em um experimento que teve como objetivo avaliar e comparar o desempenho de nove algoritmos, com ênfase em diferentes tipos de Redes Neurais Artificiais, em múltiplos cenários de tratamento dos dados, com a construção de ADMs para 117 espécies arbóreas nativas do Gran Chaco. Os dados de abundância destas espécies foram compilados de inventários florestais do Brasil, Paraguai e Argentina. Os resultados do experimento mostram que decisões como o particionamento dos dados de treinamento e o balanço entre quantidade de pontos de ausência e abundância são importantes para o desempenho dos modelos. Além disso, Redes Neurais Profundas, com múltiplas camadas, tendem a ter melhor desempenho que Redes Neurais Rasas, com apenas uma camada.
Abstract
Species Distribution Models (SDMs) have become important tools not only for conservation biology but also for ecology and biogeography. However, SDMs have limitations because they ignore ecological aspects such as the trend and spatial distribution of species abundance. Abundance-based distribution models (ADM) have recently been proposed. Like SDMs, these are correlative models, but they model and predict the abundance of species over geographical space. However, ADMs remain underdeveloped compared to SDMs, with few papers in the literature exploring ADMs, on issues such as algorithms and validation, and few packages or tools developed for their construction. The capacity of ADMs could mean significant gains for biological conversation, resulting in better decisions and planning, especially in threatened areas such as the Gran Chaco. The Gran Chaco is a region that stretches across northern Argentina, western Paraguay, southeastern Bolivia, and a small part of Brazil. It has predominantly open, xeromorphic vegetation, a semi-arid climate, and high biodiversity, but few protected areas and a high rate of natural cover loss. This dissertation is structured in two chapters. The first chapter presents the R adm package, developed to enable concise and flexible workflows for building ADMs. Thish package aims to leverage the state of development and research of ADMs by providing a useful tool for their easy construction and validation. The second chapter presents the application of this package in an experiment that aimed to evaluate and compare the performance of nine algorithms, with an emphasis on different types of Artificial Neural Networks, in multiple data processing scenarios, with the construction of ADMs for 117 tree species native to the Gran Chaco. The abundance data for these species was compiled from forest inventories in Brazil, Paraguay, and Argentina. The results of the experiment show that decisions such as the partitioning of the training data and the balance between the number of absence and abundance points are important for the performance of the models. In addition, Deep Neural Networks with multiple layers tend to perform better than Shallow Neural Networks with only one layer.
Descrição
Dissertação apresentada ao Programa de Pós-Graduação em Biodiversidade Neotropical, do Instituto Latino-Americano de Ciências da Vida e da Natureza da Universidade Federal da Integração Latino-Americana, como requisito parcial à obtenção do título de Mestre em Biodiversidade Neotropical.
Palavras-chave
Gran Chaco, aprendizado do computador, redes neurais (computação), espécies