Introducción: qué nos enseña una ola de calor 🌡️
La ola de calor que ha disparado los termómetros por encima de los 40 grados no es solo una noticia meteorológica: es una mina de oro para enseñar estadística en el aula. Cuando hablamos de una ola de calor, hablamos de temperaturas extremas, de tendencias que crecen año tras año y de variables que se relacionan entre sí. Y precisamente esa relación entre variables es el corazón de una de las técnicas más elegantes y comprensibles de la estadística: la regresión lineal simple. En este artículo convertimos el calor del verano en una lección de análisis de datos clara, amena y rigurosa. 📊
La idea es sencilla pero poderosa: ¿podemos predecir la temperatura máxima de un día a partir de una sola variable medible? Spoiler: sí, y el camino para lograrlo es perfecto para alumnado de secundaria, bachillerato y primeros cursos universitarios.
Contexto: del titular a los datos
Según la Agencia Estatal de Meteorología (AEMET), la temperatura media en España ha aumentado en torno a 1,5 °C en las últimas cinco décadas. Una ola de calor se define, de forma técnica, como un episodio de al menos tres días consecutivos en los que un porcentaje amplio de estaciones registra máximas dentro del 5 % más caluroso de su serie histórica.
Detrás del titular —ese "cóctel perfecto" de factores que eleva los termómetros— se esconden ingredientes medibles: la radiación solar acumulada, la masa de aire cálido, la humedad, la ausencia de viento y la insolación diaria. Cada uno de esos ingredientes es una variable, y las variables son la materia prima de cualquier análisis estadístico. 🔎
Relevancia para el análisis de datos en una ola de calor
¿Por qué una ola de calor es tan didáctica? Porque ofrece datos abundantes, públicos y emocionalmente cercanos al alumnado. Trabajar con la temperatura permite practicar todo el ciclo del dato: recogerlo, limpiarlo, explorarlo, modelarlo y comunicarlo.
En esta ocasión vamos a centrarnos en una pregunta concreta y motivadora: ¿cuánto sube la temperatura máxima por cada hora extra de insolación? Responderla nos lleva directamente a la regresión lineal simple, una técnica que dibuja la mejor recta posible entre dos variables y nos permite hacer predicciones. Si te interesan más propuestas como esta, en la sección de recursos para profesores encontrarás material complementario para llevar la estadística aplicada al aula.
Variables: identificar qué medimos
Para aplicar la regresión lineal simple necesitamos distinguir con claridad dos papeles:
- Variable independiente (X): las horas de insolación diarias. Es la variable que usamos para predecir.
- Variable dependiente (Y): la temperatura máxima del día (°C). Es la que queremos explicar o anticipar.
También conviene reconocer otras variables que influyen en la ola de calor aunque hoy no las modelemos: humedad relativa, velocidad del viento o altitud de la estación. Identificarlas ayuda al alumnado a entender que un modelo simple es una simplificación útil, no la realidad completa. 🧠
KPIs: los indicadores que vigilamos
Aunque la estrella sea la regresión, conviene fijar indicadores clave (KPIs) que resuman el fenómeno:
- 📈 Temperatura máxima diaria (°C).
- 🔢 Número de días consecutivos por encima de 40 °C.
- 🎯 Pendiente del modelo (°C ganados por cada hora extra de sol).
- ✅ Coeficiente de determinación R², que mide cuánta variación explica la recta.
Tabla didáctica: datos para entrenar el modelo
A continuación, una tabla con datos ilustrativos para uso docente (no son registros oficiales) que simulan una semana de ola de calor:
| Día | Horas de insolación (X) | Temperatura máxima °C (Y) |
|---|---|---|
| Lunes | 8 | 34 |
| Martes | 9 | 36 |
| Miércoles | 10 | 38 |
| Jueves | 11 | 41 |
| Viernes | 12 | 43 |
| Sábado | 11 | 40 |
| Domingo | 13 | 45 |
Datos ilustrativos para uso docente. Lo interesante es que el alumnado puede teclearlos directamente en una hoja de cálculo, en R o en Python.
Análisis estadístico de la ola de calor con regresión lineal simple
La regresión lineal simple busca la recta Y = a + b·X que minimiza la suma de los errores al cuadrado (método de mínimos cuadrados). Aquí:
aes la ordenada en el origen (temperatura teórica con 0 horas de sol).bes la pendiente: cuántos grados sube la máxima por cada hora extra de insolación.
Con los datos ilustrativos, la recta estimada se aproxima a Y ≈ 16 + 2,2·X, con un R² cercano a 0,95. Interpretación: cada hora adicional de sol añade unos 2,2 °C a la máxima, y el modelo explica alrededor del 95 % de la variación observada. 🧮
Modelo: cómo se calcula paso a paso
En R bastan dos líneas:
modelo <- lm(temp_max ~ insolacion, data = datos)
summary(modelo)
En Python con scikit-learn:
from sklearn.linear_model import LinearRegression
modelo = LinearRegression().fit(X, y)
print(modelo.coef_, modelo.intercept_)
La salida nos da la pendiente, la ordenada y el R². Conviene recordar al alumnado que un modelo simple no demuestra causalidad: el sol y el calor están relacionados, pero intervienen más factores en una ola de calor real.
Visualización: el gráfico que lo cuenta todo
El gráfico ideal para la regresión lineal simple es el diagrama de dispersión con la recta ajustada:
- Eje X: horas de insolación.
- Eje Y: temperatura máxima (°C).
- Puntos azules para cada día y una línea de tendencia roja superpuesta.
Añadir una banda de confianza alrededor de la recta ayuda a visualizar la incertidumbre de la predicción. 📈
Aplicación didáctica en el aula
Propuesta de sesión de 50 minutos: el profesorado reparte la tabla, el alumnado calcula la media, dibuja el diagrama de dispersión a mano o en hoja de cálculo, traza "a ojo" la recta y después la compara con la que ofrece el software. El contraste entre la intuición y el cálculo es un momento de aprendizaje memorable. 📚 Para reforzar conceptos previos de funciones lineales, viene bien repasar la temario PEVAU de matemáticas aplicadas.
Preguntas y retos para el aula 💡
- Con la recta
Y ≈ 16 + 2,2·X, ¿qué máxima predice el modelo para 14 horas de sol? - ¿Qué significa que el R² sea 0,95 y no 1? 🎯
- ¿Por qué la ordenada en el origen (16 °C) no debe interpretarse literalmente como "temperatura con 0 horas de sol"?
- Añade un día atípico (X=6, Y=44) y observa cómo cambia la recta. ¿Qué es un valor influyente?
- ¿Qué otra variable propondrías como predictor de la ola de calor y por qué?
- Dibuja el diagrama de dispersión: ¿la relación es positiva o negativa?
- ¿Sirve este modelo para predecir temperaturas en invierno? Justifica los límites del modelo.
Conclusión
Una ola de calor es mucho más que un titular incómodo: es un laboratorio estadístico al alcance de cualquier aula. Con una técnica tan accesible como la regresión lineal simple, el alumnado aprende a transformar datos reales en predicciones y, sobre todo, a interpretar con espíritu crítico lo que un modelo puede —y no puede— decirnos. Te invitamos a seguir explorando ideas como esta en más artículos del blog. El verano sube los grados; aprovechémoslo para subir también el nivel de pensamiento analítico. ✅