Novo método de recomendação de classificadores de séries temporais com meta-learning e extração de características usando CATCH22

Carregando...
Imagem de Miniatura

Data

2025

Autores

Palma, Wallace Pannace

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

O grande volume de dados temporais e sua crescente complexidade exige o desenvolvimento de técnicas avançadas para a sua visualização, agrupamento, classificação e detecção de padrões. A classificação de séries temporais por meio de algoritmos de aprendizado de máquina tem sido amplamente explorada na literatura para atender a tais demandas. Como resultado, verifica-se o aumento da quantidade e da diversidade de algoritmos aplicados na solução de uma grande gama de problemas envolvendo dados temporais. Contudo, a adequada identificação do melhor algoritmo para cada domínio tornou-se um desafio em termos de desempenho e custo de tempo computacional. Nesse contexto, neste trabalho desenvolvemos e avaliamos um novo método de recomendação de classificadores de séries temporais ao extrair atributos das séries e empregar técnicas de meta-learning. É proposto a extração de atributos temporais por meio da ferramenta Catch22 combinado com técnicas de extração de meta-features para criar uma base de meta-knowledge. A avaliação experimental conduzida neste estudo empregou 112 conjuntos de dados de séries temporais do repositório da University of California, Riverside, envolveu a avaliação do método proposto para a recomendação dentre 34 diferentes classificadores de séries temporais e 7 meta-learners para o mapeamento da meta-knowledge. Por meio dos resultados gerados foi possível constatar que o método proposto possibilitou redução significativa no tempo de construção de meta-features, mantendo um desempenho competitivo, em termos de acurácia, aos métodos da literatura. Nos experimentos, dentre os algoritmos testados, o algoritmo Random Forest obteve o melhor desempenho como meta-learner para o método proposto. Em comparação com a literatura destaca-se o baixo custo computacional do método proposto. Resumen El gran volumen de datos temporales y su creciente complejidad exigen el desarrollo de técnicas avanzadas para su visualización, agrupamiento, clasificación y detección de patrones. La clasificación de series temporales mediante algoritmos de aprendizaje automático ha sido ampliamente explorada en la literatura para atender tales demandas. Como resultado, se observa un aumento en la cantidad y diversidad de algoritmos aplicados en la solución de una amplia gama de problemas que involucran datos temporales. Sin embargo, la adecuada identificación del mejor algoritmo para cada dominio se ha convertido en un desafío en términos de rendimiento y costo de tempo computacional. En este contexto, en este trabajo desarrollamos y evaluamos un nuevo método de recomendación de clasificadores de series temporales al extraer atributos de las series y emplear técnicas de meta-learning. Se propone la extracción de atributos temporales mediante la herramienta Catch22 combinada con técnicas de extracción de meta-características para crear una base de meta-conocimiento. La evaluación experimental realizada en este estudio empleó 112 conjuntos de datos de series temporales del repositorio de la University of California, Riverside, e involucró la evaluación del método propuesto para la recomendación entre 34 diferentes classificadores de series temporales y 7 meta-learners para el mapeo del meta-conocimiento. A través de los resultados generados, fue posible constatar que el método propuesto permitió uma reducción significativa en el tiempo de construcción de meta-características, manteniendo un rendimiento competitivo, en términos de precisión, con los métodos de la literatura. Em los experimentos, entre los algoritmos probados, el algoritmo Random Forest obtuvo el mejor rendimiento como meta-learner para el método propuesto. En comparación con la literatura, se destaca el bajo costo computacional del método propuesto.

Abstract

The large volume of temporal data and its increasing complexity demand the development of advanced techniques for its visualization, clustering, classification, and pattern detection. The classification of time series through machine learning algorithms has been widely explored in the literature to address such demands. As a result, there has been an increase in the quantity and diversity of algorithms applied to solving a wide range of problems involving temporal data. However, the proper identification of the best algorithm for each domain has become a challenge in terms of performance and computational time cost. In this context, in this work, we developed and evaluated a new method for recommending time series classifiers by extracting attributes from the series and employing meta-learning techniques. The extraction of temporal attributes is proposed using the Catch22 tool combined with meta-feature extraction techniques to create a meta-knowledge base. The experimental evaluation conducted in this study used 112 time series datasets from the University of California, Riverside repository and involved assessing the proposed method for recommending among 34 different time series classifiers and 7 meta-learners for mapping the meta-knowledge. Through the generated results, it was possible to verify that the proposed method enabled a significant reduction in the time required to build meta-features while maintaining competitive performance, in terms of accuracy, compared to methods in the literature. In the experiments, among the tested algorithms, the Random Forest algorithm achieved the best performance as a meta-learner for the proposed method. Compared to the literature, the low computational cost of the proposed method stands out.

Descrição

Palavras-chave

aprendizado do computador, séries temporais, algoritmos computacionais, University of California, Riverside

Citação