El caso: el Resurrection Fest en cifras récord
Cada verano, el Resurrection Fest convierte la localidad gallega de Viveiro (Lugo) en la capital europea del metal. 🤘 Pero más allá de los riffs y los circle pits, el Resurrection Fest es también una máquina logística de dimensiones asombrosas: según publicó EL PAÍS, en la última edición se vendieron 25.000 hamburguesas y 21.000 pizzas. ¿Y la cerveza? Ahí llega lo interesante: la organización mantiene los litros servidos como información top secret. 🔎 Ese pequeño misterio, que parece una anécdota periodística, es en realidad un regalo para cualquier clase de estadística: nos plantea el problema clásico de estimar una cantidad que nadie nos va a revelar.
El problema estadístico que esconde
Cuando un dato es secreto, la estadística no se rinde: lo estima. 💡 En la vida real, casi nunca podemos medirlo todo: no podemos pesar todos los peces del océano, encuestar a todos los votantes… ni contar todos los barriles de cerveza de un festival. Lo que sí podemos hacer es observar una muestra y, a partir de ella, construir un rango de valores plausibles para el total.
El problema tiene tres ingredientes muy didácticos:
- 🎯 Un parámetro desconocido: los litros totales de cerveza servidos.
- 🧮 Una muestra observable: lo que registran algunas barras del recinto.
- 🧠 Una pregunta clave: ¿cuánta incertidumbre tiene nuestra estimación y cómo la comunicamos con honestidad?
Ese tercer punto es el que separa una cifra lanzada al aire de una estimación rigurosa. Y para responderlo existe una herramienta elegante y muy examinable: el intervalo de confianza.
Los datos disponibles del Resurrection Fest
Del Resurrection Fest conocemos dos cifras oficiales publicadas por la prensa: 25.000 hamburguesas y 21.000 pizzas. La cerveza, en cambio, hay que estimarla. Imaginemos el escenario siguiente, perfectamente realista: el recinto cuenta con 40 barras y un equipo de estudiantes consigue los registros de 10 barras elegidas al azar, con los litros servidos durante todo el fin de semana. La variable de estudio es cuantitativa continua (litros por barra) y la unidad muestral es cada barra.
Tabla 1. Litros de cerveza servidos por barra durante el festival (datos ilustrativos para uso docente):
| Barra muestreada | Litros servidos |
|---|---|
| B1 | 5.200 |
| B2 | 4.800 |
| B3 | 6.100 |
| B4 | 5.600 |
| B5 | 4.900 |
| B6 | 5.400 |
| B7 | 6.300 |
| B8 | 5.100 |
| B9 | 5.800 |
| B10 | 4.800 |
| Media muestral | 5.400 |
La metodología: el intervalo de confianza
Un intervalo de confianza es un rango de valores, construido a partir de una muestra, que con un nivel de confianza dado (habitualmente el 95 %) pretende capturar el verdadero valor del parámetro poblacional. En lugar de decir «cada barra sirve 5.400 litros» (una afirmación demasiado segura), diremos «la media por barra está, con un 95 % de confianza, entre tal y tal valor». ✅
Como nuestra muestra es pequeña (n = 10) y no conocemos la desviación típica poblacional, no usamos la normal estándar sino la distribución t de Student con n − 1 = 9 grados de libertad. La fórmula del intervalo para la media es:
IC = x̄ ± tα/2, n−1 · s / √n
donde x̄ es la media muestral, s la desviación típica muestral y t el valor crítico que deja un 2,5 % de probabilidad en cada cola. Es exactamente la metodología que se pide en bachillerato y en cursos introductorios de universidad, aplicada aquí a un caso con olor a hamburguesa y sonido de doble bombo. 📚
La solución paso a paso
- Diseño muestral: seleccionamos al azar 10 de las 40 barras del recinto (muestreo aleatorio simple).
- Media muestral: x̄ = 54.000 / 10 = 5.400 litros por barra.
- Desviación típica muestral: s = √(2.600.000 / 9) ≈ 537,5 litros.
- Error estándar: s / √n = 537,5 / √10 ≈ 170 litros.
- Valor crítico: para un 95 % de confianza con 9 grados de libertad, t = 2,262.
- Margen de error: 2,262 × 170 ≈ 385 litros.
- Intervalo por barra: 5.400 ± 385 → [5.015 ; 5.785] litros.
- Extrapolación al festival: con 40 barras, el total estimado es 40 × 5.400 = 216.000 litros, con intervalo [200.600 ; 231.400] litros.
En el aula, todo el cálculo se resuelve con una sola línea de R usando la función t.test de la documentación oficial de R:
litros <- c(5200, 4800, 6100, 5600, 4900, 5400, 6300, 5100, 5800, 4800)
t.test(litros, conf.level = 0.95)$conf.int
Resultados e interpretación: la cerveza del Resurrection Fest, acotada
El secreto del Resurrection Fest ya no es tan secreto: nuestro modelo estima que se sirvieron en torno a 216.000 litros de cerveza, y con un 95 % de confianza el total estaría entre 200.600 y 231.400 litros (recordemos: partiendo de datos ilustrativos). 📈 Para visualizarlo, el gráfico ideal es una estimación puntual con barras de error: en el eje vertical los litros por barra, a la izquierda la nube de los 10 datos muestrales y a la derecha la media con su intervalo.
Ojo a la interpretación, que es donde caen los exámenes: el 95 % no significa que «hay un 95 % de probabilidad de que la media esté en [5.015 ; 5.785]». Significa que, si repitiéramos el muestreo muchas veces con este método, aproximadamente el 95 % de los intervalos construidos capturarían la verdadera media. 🧠 Y conviene señalar dos matices avanzados: la extrapolación exige que la muestra sea realmente aleatoria (si las barras de la zona VIP venden distinto, necesitaríamos muestreo estratificado), y al muestrear 10 de solo 40 barras un docente exigente podría aplicar la corrección por población finita, que estrecharía el intervalo.
Trasladar al aula
Este caso funciona de maravilla como práctica de inferencia en 2.º de bachillerato o en un primer curso universitario, y combina muy bien con los recursos interactivos de canaldocente para simular muestreos en directo. Retos propuestos: 🎯
- ¿Por qué usamos la t de Student y no la normal estándar en este problema? ¿Cuándo sería razonable usar z?
- Recalcula el intervalo con niveles de confianza del 90 % y del 99 %. ¿Qué le ocurre a la anchura y por qué?
- Si en lugar de 10 barras muestreáramos 20 (con la misma media y desviación), ¿cuánto se estrecharía el intervalo? Compruébalo.
- Debate: explica con tus palabras por qué es incorrecto decir «la media tiene un 95 % de probabilidad de estar en el intervalo».
- Diseña un muestreo estratificado suponiendo que 8 de las 40 barras están en zona VIP y venden un 30 % más.
- Con el dato real de 25.000 hamburguesas del Resurrection Fest y una asistencia estimada que tú propongas, calcula e interpreta el indicador «hamburguesas por asistente».
- Reto de simulación: en R o en una hoja de cálculo, genera 100 muestras de una población conocida, construye sus 100 intervalos y cuenta cuántos capturan la media verdadera. ¿Se acerca al 95 %?
Cierre
Una noticia de festival con hamburguesas, pizzas y un dato «prohibido» se ha convertido en una lección completa de inferencia estadística: muestreo, t de Student, margen de error e interpretación honesta de la incertidumbre. Esa es la gran moraleja del Resurrection Fest para el aula: cuando alguien esconde un número, la estadística no lo adivina, lo acota con rigor. ✅ Si te ha gustado este enfoque de aprender análisis de datos con noticias reales, encontrarás muchos más casos como este entre los artículos del blog de canaldocente.