Hay una gran cantidad de reportes en la literatura en los que se realizan experimentos sobre distintos conjuntos de datos verificando la performance de las redes neuronales para tareas predictivas. Los estudios coinciden en que los resultados son muy prometedores pero las conclusiones obtenidas al comparar este tipo de métodos con los estadísticos son inconsistentes entre sí. Un problema con la literatura asociada a las predicciones de series temporales con aprendizaje automático es que la mayoría de los estudios publicados proveen predicciones aclamando precisiones satisfactorias sin compararlas con métodos estadísticos o inclusive simples puntos de referencia. Este hecho crea altas expectativas con respecto a la capacidad predictiva de las técnicas de aprendizaje automático, pero sin una prueba empírica de que este sea el caso, habilitando conclusiones que podrían no ser sostenibles. La motivación por la realización del presente Trabajo Final Integrador surge a partir de las posiciones encontradas en la literatura las cuales ameritan su investigación y análisis.
El objetivo general del presente Trabajo Final Integrador es comparar distintos métodos de aprendizaje automático basados en redes neuronales con el método estadístico vectorial autorregresivo (VAR, por su sigla en inglés) para la predicción de series temporales multivariadas. Los objetivos específicos a realizar para alcanzar el objetivo general son los siguientes:
- Analizar el desempeño del método VAR para la predicción de una serie temporal multivariada.
Trabajo Final completo
- Analizar el desempeño de distintos métodos de aprendizaje automático para la predicción de una serie temporal multivariada.
- Identificar posibles causas de las diferencias en la literatura respecto de la precisión de los distintos modelos predictivos.
Los aportes del presente Trabajo Final Integrador se resumen a continuación:
- La comparación numérica y visual entre los resultados obtenidos con cada modelo sobre la misma serie temporal, destacando sus principales diferencias, debilidades y fortalezas.
- La obtención de una opinión objetiva y fundamentada al respecto de las diferencias y contradicciones entre las publicaciones que comparan los diferentes métodos predictivos.
Como posibles líneas de investigación a futuro se propone lo siguiente:
- Trabajar con series temporales con mayor cantidad de observaciones por variable, lo cual sin dudas mejoraría los modelos de aprendizaje automático, no tanto así a los estadísticos.
- Aumentar la diversidad de modelos, que interpreten los datos de forma diferente. Hay una gran cantidad de modelos estadísticos, y de alternativas de aprendizaje automático diferentes y de estrategias de generación de ensambles que podrían obtener y potenciar lo mejor de cada uno.
- Validar los resultados y conclusiones obtenidas utilizando conjuntos de datos diferentes. En el presente Trabajo Final Integrador se utilizó un conjunto de datos con información climática que fue grabada con el objetivo de ser analizada en la estación climática en el Instituto de Biogeoquímica Max Planck en Jena, Alemania. Luego sería esperable que para datos relacionados con fenómenos meteorológicos en un entorno real, pero de distinta zona geográfica, se obtengan resultados similares. A su vez, para datos procedentes de un origen distinto, por ejemplo de la lectura de sensores de maquinaria industrial, se podría obtener una nueva percepción sobre cada modelo.