Aprendizado de máquina aplicado ao prognóstico de estado de saúde de células de armazenamento de energia
Carregando...
Data
2026-03-20
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
O rápido crescimento dos veículos elétricos (EVs) intensifica a demanda por armazenamento e torna estratégica a reutilização de baterias em “segundo uso” para aplicações estacionárias. A viabilidade depende de estimativas confiáveis do estado de saúde (State of Health, SOH) e da vida útil remanescente (Remaining Useful Life, RUL) a partir de sinais de sensores em sistemas de gerenciamento. Esta pesquisa investiga abordagens baseadas em dados para diagnóstico e prognóstico de baterias e propõe um pipeline completo de modelagem para estimação de indicadores de saúde. A pesquisa avança em três eixos: (i) revisão sistemática com a metodologia Proknow-C, mapeando tendências recentes em machine learning (ML) e deep learning (DL) para SOH, consolidando um panorama de bases públicas; (ii) framework escalável e reprodutível de engenharia e seleção de atributos, com mais de 40 mil variáveis em sete grupos (carga/descarga gerais, corrente constante (CC), tensão constante (CV) e análises derivadas de capacidade incremental e tensão diferencial), combinando seleção univariada e multivariada para formar subconjuntos interpretáveis e de valor preditivo; e (iii) predição de RUL com histórico curto (6 ciclos) no MIT Battery Dataset (LiFePO₄/grafite), avaliando 12 arquiteturas DL multibranch/multicanal (CNN-LSTM/GRU) diretamente nas curvas de dados e em modelo tabular baseado em boosting de árvores de decisão, além de fusão por stacking. As principais contribuições incluem: (a) síntese crítica e replicável do campo de pesquisa com Proknow-C e levantamento de bases públicas; (b) pipeline de grande escala para extração e seleção com ênfase em janelas deslizantes e interpretabilidade; (c) demonstração de que a combinação boosting e DL permite estimar RUL de forma robusta com histórico curto de ciclos. Como resultados obteve-se: framework capaz de extrair um conjunto robusto de 773 atributos finalistas ao longo de 40 modelos, com predominância de janelas deslizantes (~88%); modelos de previsão de capacidade em múltiplos horizontes com MAPE (Mean Absolute Percentage Error) < 1%; e, com histórico curto, o ensemblepor stacking alcançou MAPE ~6,0% e RMSE ~40,6 ciclos, superando modelos isolados e posicionando a abordagem no patamar superior da literatura recente. Esses resultados reforçam a aplicabilidade prática do método para acelerar triagem de segundo uso e apoiar decisões de manutenção com menor tempo de ensaio.
Resumen
El rápido crecimiento de los vehículos eléctricos (EVs) intensifica la demanda de almacenamiento de energía y vuelve estratégica la reutilización de baterías en “segundo uso” para aplicaciones estacionarias. La viabilidad depende de estimaciones confiables del estado de salud (State of Health, SOH) y de la vida útil remanente (Remaining Useful Life, RUL) a partir de señales de sensores en sistemas de gestión de baterías. Esta investigación analiza enfoques basados en datos para el diagnóstico y el pronóstico de baterías y propone un pipeline completo de modelado para estimar indicadores de salud. El estudio avanza en tres ejes: (i) una revisión sistemática con Proknow-C, que mapea tendencias recientes en aprendizaje de máquina (ML) y aprendizaje profundo (DL) para SOH y sintetiza bases públicas; (ii) un marco escalable y reproducible de ingeniería y selección de atributos, con más de 40.000 variables en siete grupos (carga/descarga, corriente constante (CC), voltaje constante (CV), y análisis derivados de capacidad incremental y voltaje diferencial), combinando selección univariada y multivariada para formar subconjuntos interpretables; y (iii) predicción de RUL con historial corto (6 ciclos) en el MIT Battery Dataset (LiFePO₄/grafito), evaluando 12 arquitecturas DL multirrama/multicanal (CNN-LSTM/GRU) sobre curvas de datos y un modelo tabular con boosting de árboles, además de fusión por stacking. Las contribuciones incluyen una síntesis replicable del campo y un pipeline a gran escala con énfasis en ventanas deslizantes e interpretabilidad, mostrando que la combinación de boosting y DL permite estimar RUL con historial corto. Los resultados incluyen 773 atributos finalistas (predominio de ventanas deslizantes, ~88%), predicción de capacidad en múltiples horizontes con MAPE < 1% y, con historial corto, un ensemble por stacking con MAPE ~6,0% y RMSE ~40,6 ciclos, superando modelos individuales y situando el enfoque entre los mejores de la literatura reciente. Estos hallazgos refuerzan la aplicabilidad del método para acelerar la clasificación de segundo uso y apoyar decisiones de mantenimiento con menor tiempo de ensayo.
Abstract
The rapid growth of electric vehicles (EVs) intensifies the demand for energy storage and makes the reuse of batteries in “second-life” applications for stationary systems a strategic option. Feasibility depends on reliable estimates of State of Health (SOH) and Remaining Useful Life (RUL) derived from sensor signals collected by battery management systems. This research investigates data-driven approaches for battery diagnosis and prognostics and proposes a complete modeling pipeline for estimating health indicators. The study advances along three axes: (i) a systematic review using the Proknow-C methodology, mapping recent trends in machine learning (ML) and deep learning (DL) for SOH and consolidating an overview of public datasets; (ii) a scalable and reproducible framework for feature engineering and selection, with more than 40,000 variables across seven groups (general charge/discharge, constant current (CC), constant voltage (CV), and analyses derived from incremental capacity and differential voltage), combining univariate and multivariate selection to form interpretable, predictive feature subsets; and (iii) short-history (6 cycles) RUL prediction on the MIT Battery Dataset (LiFePO₄/graphite), evaluating 12 multibranch/multichannel DL architectures (CNN-LSTM/GRU) directly on the data curves and a tabular model based on decision-tree boosting, as well as fusion via stacking. The main contributions include: (a) a critical and reproducible synthesis of the research field using Proknow-C and a survey of public datasets; (b) a large-scale extraction and selection pipeline emphasizing sliding windows and interpretability; and (c) evidence that combining boosting and DL enables robust RUL estimation with short cycle histories. Results include: a framework capable of extracting a robust set of 773 finalist features across 40 models, with a predominance of sliding-window features (~88%); multi-horizon capacity forecasting models with Mean Absolute Percentage Error (MAPE) < 1%; and, under short-history conditions, a stacking ensemble achieving MAPE ~6.0% and RMSE ~40.6 cycles, outperforming standalone models and placing the approach among the top tier of recent literature. These results reinforce the practical applicability of the method to accelerate second-life screening and support maintenance decisions with reduced testing time.
Descrição
Palavras-chave
baterias, aprendizagem de máquina, engenharia de atributos, inteligência artificial - redes profundas