Pronóstico de series temporales con TensorFlow: componentes, modelos y pasos
Publicado: 2021-05-02Tabla de contenido
¿Qué es el pronóstico de series de tiempo?
¿Sabe que Asia Pacífico es el mercado de aprendizaje profundo de mayor crecimiento a nivel mundial con una CAGR (tasa de crecimiento anual compuesta) de más del 40 %? La predicción de series temporales de TensorFlow es un concepto importante en el aprendizaje profundo y el aprendizaje automático. Todos los modelos de aprendizaje profundo/ML tienen un conjunto de datos respectivo que es una colección de observaciones. Estas observaciones a menudo incluyen un componente de tiempo. Las series de tiempo organizan las observaciones secuencialmente en el tiempo, agregando así una nueva dimensión al conjunto de datos, es decir, el tiempo.
Uno puede pensar en lo que se logrará al aumentar la dimensionalidad de su conjunto de datos. Bueno, agregar una dimensión de tiempo a su conjunto de datos creará un nivel detallado de dependencia entre las observaciones. Luego se predice el resultado con la ayuda de pronósticos de series de tiempo de observaciones previas.
El uso de datos de series temporales (datos históricos) para predecir el futuro se denomina pronóstico de series temporales. También se debe asegurar que el futuro sea completamente desconocido y solo se pueda predecir en base a datos históricos.
Los datos de series de tiempo se analizan para desarrollar modelos que describan los datos de manera efectiva. La serie temporal se descompone en varios componentes para desarrollar modelos aptos. Una vez que se desarrollan los modelos que mejor describen los datos históricos, se utilizan para realizar pronósticos. No se debe confundir el análisis de series de tiempo con el pronóstico de series de tiempo, ya que este último entra en acción solo cuando se completa el primero.
Componentes de series temporales
Antes de conocer el pronóstico de series temporales de TensorFlow , uno debe estar familiarizado con el componente de una serie temporal. Una serie temporal se descompone en cuatro componentes durante el análisis de series temporales. Estos componentes ayudan a comprender correctamente el conjunto de datos. Los cuatro componentes de una serie temporal son los siguientes:
- Tendencias : las tendencias explican el comportamiento de una serie/conjunto de datos a lo largo del tiempo. El comportamiento creciente y decreciente de una serie de tiempo se explica por las tendencias.
- Nivel – Nivel es el valor base de la serie de tiempo, considerando que la representación de la serie es una línea recta. Muchos expertos también definen el nivel como el valor medio de la serie.
- Estacionalidad – Los comportamientos de las series que se repiten en el tiempo se denominan estacionalidad. Algunos expertos también denominan estacionalidad a las fluctuaciones periódicas.
- Ruido : cada conjunto de datos contiene algunos puntos de datos/valores atípicos que el modelo de serie temporal no puede explicar. Estos conjuntos de datos poseen propiedades impredecibles y no se pueden mapear a través de análisis/pronósticos de series temporales.
Cabe señalar que una serie de tiempo debe tener un nivel y algo de ruido. Sin embargo, las tendencias y la estacionalidad en una serie temporal son opcionales.
¿Por qué TensorFlow?
Si bien hay muchos marcos disponibles en el mercado para la previsión de series temporales, los profesionales de la tecnología profunda prefieren TensorFlow entre todos los marcos disponibles. TensorFlow está escrito en Python, C++ y CUDA, que se encuentran entre los lenguajes de programación más utilizados. TensorFlow es una biblioteca de software de código abierto diseñada especialmente para el aprendizaje automático y el aprendizaje profundo.
TensorFlow nos ayuda a crear modelos de aprendizaje automático durante el análisis de series temporales que se utilizarán para la previsión. Ofrece a los usuarios la creación de varios tipos de modelos como CNN (red neuronal convolucional), RNN (red neuronal recurrente), etc. TensorFlow puede ayudarlo a pronosticar un paso de tiempo único o múltiple según el usuario y el conjunto de datos. Durante la previsión de series temporales de TensorFlow , puede:
- Pronostique una sola característica/dimensión para un solo paso de tiempo.
- Pronostique todas las dimensiones del conjunto de datos para un solo paso de tiempo.
- Pronóstico para múltiples pasos en un solo disparo (haciendo todas las predicciones a la vez).
- Pronóstico para múltiples pasos donde se realiza una predicción a la vez (autoregresivo).
Configuración de datos para la previsión de series temporales
Antes de pronosticar series de tiempo, debemos preparar los datos en consecuencia. La configuración para el pronóstico de series de tiempo incluye varios procesos como extracción de datos, visualización, exploración , limpieza, etc. Veamos los pasos para configurar los datos para el pronóstico de series de tiempo:
- El paso básico es importar los datos o extraer los datos. Debe tener un conjunto de datos del cual se extraerán conocimientos valiosos mediante el pronóstico de series temporales.
- El siguiente paso es la limpieza de datos, donde elimina los puntos de datos duplicados o irrelevantes. Los datos faltantes también se manejan en este paso. Si se descubren valores atípicos antes de tiempo, elimínelos del conjunto de datos. Los errores estructurales también se pueden corregir con la limpieza de datos.
- Las cantidades en una serie de tiempo que varían con el tiempo se denominan señales. Estas señales también representan varios eventos físicos en una serie de tiempo. Por ejemplo, si hay una serie de tiempo de descripciones meteorológicas de cualquier lugar durante diferentes días, entonces las señales serían los eventos físicos como la temperatura, la lluvia, etc. Continúe convirtiendo las señales en formato sin coseno.
- Junto con la conversión de señales en formato sin coseno, convierta la hora y la fecha en segundos. Una vez que haya terminado, grafique el tiempo y la función sen cos.
- Antes de pronosticar y entrenar nuestros datos, dividiremos los datos en función del tiempo para una mayor simplificación.
- Los datos ahora se normalizarán antes del entrenamiento. El paso más simple para la normalización de datos es restar la media del conjunto de datos de cada punto de datos y luego dividirlo por la desviación estándar.
- Una vez que haya terminado con la normalización de datos, debe verificar el sesgo de datos. El sesgo de datos se define como una condición en la que algunos elementos del conjunto de datos están muy representados en comparación con otros elementos. Los datos sesgados dan como resultado una menor precisión junto con análisis sesgados. Puede trazar un diagrama de violín para eliminar cualquier sesgo de datos presente en su conjunto de datos.
Ventanas de datos
Debe estarse preguntando si hay muchos procesos involucrados antes de la previsión de series de tiempo. Bueno, los jóvenes entusiastas de la tecnología deben saber que la preparación de datos es un paso crucial antes de entrenar o analizar los datos. La creación de ventanas de datos es el último paso para configurar los datos para la previsión de series temporales de TensorFlow . Las ventanas de datos ayudan a usar los datos con varios modelos sin preocupaciones.
Por ejemplo, si un modelo predice 1 hora en el futuro, necesita una ventana de 6 horas de datos históricos para predecir de manera efectiva. La ventana de datos históricos se denomina "ancho de entrada", mientras que la ventana de datos que se va a predecir se denomina "compensación" durante la ventana de datos.
Pago : Proyectos de Tensorflow más populares
Modelos de un solo paso de TensorFlow
Cuando tenga el conjunto de datos en su forma más simple y prediga solo para un paso de tiempo en el futuro, usará los modelos de un solo paso de TensorFlow. Por ejemplo, si ha creado una ventana de datos de 'horas', entonces predice para un paso de tiempo, lo que significa que está prediciendo una hora en el futuro. Se crea un objeto 'WindowGenerator' en TensorFlow para desarrollar pares de un solo paso, es decir, entrada y etiqueta.
También se sugiere crear un modelo de referencia antes de entrenar su modelo. La creación de un modelo de referencia lo ayudará a comparar el modelo inicial de un solo paso con futuros modelos complicados. Por ejemplo, si está pronosticando la temperatura para 1 hora en el futuro, cree un modelo de referencia que devuelva la temperatura actual como una predicción (sin cambios).
Dado que las temperaturas cambian lentamente con el tiempo, es posible que no haya cambios de temperatura después de una hora. Tenga en cuenta que el modelo de línea de base no será efectivo al predecir múltiples períodos de tiempo.
Otro ejemplo de cómo crear un modelo de un solo paso de tiempo con TensorFlow es insertar una transformación lineal entre la entrada y la salida. Asegúrese de que el resultado dependa solo del paso de tiempo único que se va a evaluar al crear un modelo lineal con TensorFlow. El modelo denso es otro modelo de un solo paso que se crea con TensorFlow.
Las redes neuronales de convolución a través de TensorFlow también se pueden usar para predecir un solo paso de tiempo. Una capa de convolución en TensorFlow tomará varios pasos de tiempo como entrada para predecir un paso de tiempo. Los RNN también se utilizan ampliamente para la predicción de series temporales.
El estado interno de la máquina también salta de un paso de tiempo a otro porque RNN procesa una serie de tiempo paso a paso (por defecto). La previsión de series temporales de TensorFlow a través de RNN es una buena opción, ya que los modelos de RNN tienden a recordar un largo historial de entradas (datos históricos).
Modelos de varios pasos de TensorFlow
En los modelos de varios pasos, la predicción se realiza en un rango de pasos de tiempo. A diferencia de un modelo de un solo paso, un modelo de varios pasos predice un rango de valores futuros utilizando datos históricos. Los modelos de varios pasos pueden predecir toda la serie temporal futura a la vez a través de la predicción de un solo disparo. También puede usar la predicción autorregresiva, donde el modelo hace una predicción de un solo paso a la vez. El resultado de la predicción de un solo paso en la predicción autorregresiva funciona como la entrada para la próxima predicción del paso de tiempo.
Conclusión
La predicción de series temporales de TensorFlow proporciona resultados precisos en comparación con otros marcos. Discutimos algunos de los modelos de un solo paso (CNN, RNN, Dense, etc.) que se pueden usar para la predicción de un solo paso a través de TensorFlow.
También puede predecir un rango de valores futuros mediante el uso de modelos de varios pasos. También se debe tener en cuenta que la preparación de datos es un paso clave antes de la predicción de series temporales de TensorFlow . Puede obtener más información sobre la predicción de series temporales en DL (aprendizaje profundo) y ML al optar por el programa de certificación avanzada de upGrad en DL y ML . ¡Comienza a aprender sobre pronósticos de series temporales con TensorFlow!
¿Cuáles son las limitaciones de usar TensorFlow?
Aunque TensorFlow reduce la longitud del código, también hace que el código sea un poco complejo. En comparación con sus competidores, TensorFlow es lento y también menos útil. TensorFlow está atrasado cuando se trata de ofrecer bucles simbólicos para secuencias indefinidas. TensorFlow solo tiene soporte para GPU NVIDIA y soporte para programación de GPU Python. No tiene otras formas de apoyo. No tiene muchas ventajas para los usuarios del Sistema Operativo Windows.
La amplitud de las discontinuidades en los bordes de cada secuencia finita registrada por el digitalizador se reduce mediante ventanas. Un sistema de ventanas permite que muchas aplicaciones compartan la pantalla gráfica y los recursos de presentación de una computadora al mismo tiempo. Es posible que desee utilizar muchas aplicaciones a la vez en una computadora con una interfaz gráfica de usuario (GUI).
¿Es difícil aprender TensorFlow?
TensorFlow es fácil para algunas personas, mientras que otras lo consideran difícil de aprender. Si tiene conocimientos previos de varios lenguajes de programación y está familiarizado con varias técnicas de aprendizaje automático, aprender TensorFlow le resultará fácil. Sin embargo, el nivel de dificultad también depende de tu interés. Si está realmente interesado en TensorFlow, aprenderlo no será una tarea muy difícil.