← Volver al blog

Resurrection Fest

Análisis de datos en el Resurrection Fest, un festival de música con grandes cifras.

Resurrection Fest

El caso: el Resurrection Fest en cifras récord

Cada verano, el Resurrection Fest convierte la localidad gallega de Viveiro (Lugo) en la capital europea del metal. 🤘 Pero más allá de los riffs y los circle pits, el Resurrection Fest es también una máquina logística de dimensiones asombrosas: según publicó EL PAÍS, en la última edición se vendieron 25.000 hamburguesas y 21.000 pizzas. ¿Y la cerveza? Ahí llega lo interesante: la organización mantiene los litros servidos como información top secret. 🔎 Ese pequeño misterio, que parece una anécdota periodística, es en realidad un regalo para cualquier clase de estadística: nos plantea el problema clásico de estimar una cantidad que nadie nos va a revelar.

Público disfrutando de un concierto multitudinario, como el del Resurrection Fest en Viveiro
Un festival multitudinario genera miles de datos de consumo cada hora. Imagen decorativa de contexto (Unsplash).

El problema estadístico que esconde

Cuando un dato es secreto, la estadística no se rinde: lo estima. 💡 En la vida real, casi nunca podemos medirlo todo: no podemos pesar todos los peces del océano, encuestar a todos los votantes… ni contar todos los barriles de cerveza de un festival. Lo que sí podemos hacer es observar una muestra y, a partir de ella, construir un rango de valores plausibles para el total.

El problema tiene tres ingredientes muy didácticos:

  • 🎯 Un parámetro desconocido: los litros totales de cerveza servidos.
  • 🧮 Una muestra observable: lo que registran algunas barras del recinto.
  • 🧠 Una pregunta clave: ¿cuánta incertidumbre tiene nuestra estimación y cómo la comunicamos con honestidad?

Ese tercer punto es el que separa una cifra lanzada al aire de una estimación rigurosa. Y para responderlo existe una herramienta elegante y muy examinable: el intervalo de confianza.

Los datos disponibles del Resurrection Fest

Del Resurrection Fest conocemos dos cifras oficiales publicadas por la prensa: 25.000 hamburguesas y 21.000 pizzas. La cerveza, en cambio, hay que estimarla. Imaginemos el escenario siguiente, perfectamente realista: el recinto cuenta con 40 barras y un equipo de estudiantes consigue los registros de 10 barras elegidas al azar, con los litros servidos durante todo el fin de semana. La variable de estudio es cuantitativa continua (litros por barra) y la unidad muestral es cada barra.

Tabla 1. Litros de cerveza servidos por barra durante el festival (datos ilustrativos para uso docente):

Barra muestreadaLitros servidos
B15.200
B24.800
B36.100
B45.600
B54.900
B65.400
B76.300
B85.100
B95.800
B104.800
Media muestral5.400
Litros de cerveza servidos por barra en el Resurrection Fest (muestra de 10 barras) Litros servidos por barra (muestra de 10 barras) 0 2.000 4.000 6.000 Litros de cerveza servidos Barra muestreada 5.200 B1 4.800 B2 6.100 B3 5.600 B4 4.900 B5 5.400 B6 6.300 B7 5.100 B8 5.800 B9 4.800 B10
📊 Figura 1. Litros de cerveza servidos por cada barra muestreada en el Resurrection Fest. Datos ilustrativos para uso docente (los de la Tabla 1).

La metodología: el intervalo de confianza

Un intervalo de confianza es un rango de valores, construido a partir de una muestra, que con un nivel de confianza dado (habitualmente el 95 %) pretende capturar el verdadero valor del parámetro poblacional. En lugar de decir «cada barra sirve 5.400 litros» (una afirmación demasiado segura), diremos «la media por barra está, con un 95 % de confianza, entre tal y tal valor». ✅

Como nuestra muestra es pequeña (n = 10) y no conocemos la desviación típica poblacional, no usamos la normal estándar sino la distribución t de Student con n − 1 = 9 grados de libertad. La fórmula del intervalo para la media es:

IC = x̄ ± tα/2, n−1 · s / √n

donde es la media muestral, s la desviación típica muestral y t el valor crítico que deja un 2,5 % de probabilidad en cada cola. Es exactamente la metodología que se pide en bachillerato y en cursos introductorios de universidad, aplicada aquí a un caso con olor a hamburguesa y sonido de doble bombo. 📚

La solución paso a paso

  1. Diseño muestral: seleccionamos al azar 10 de las 40 barras del recinto (muestreo aleatorio simple).
  2. Media muestral: x̄ = 54.000 / 10 = 5.400 litros por barra.
  3. Desviación típica muestral: s = √(2.600.000 / 9) ≈ 537,5 litros.
  4. Error estándar: s / √n = 537,5 / √10 ≈ 170 litros.
  5. Valor crítico: para un 95 % de confianza con 9 grados de libertad, t = 2,262.
  6. Margen de error: 2,262 × 170 ≈ 385 litros.
  7. Intervalo por barra: 5.400 ± 385 → [5.015 ; 5.785] litros.
  8. Extrapolación al festival: con 40 barras, el total estimado es 40 × 5.400 = 216.000 litros, con intervalo [200.600 ; 231.400] litros.

En el aula, todo el cálculo se resuelve con una sola línea de R usando la función t.test de la documentación oficial de R:

litros <- c(5200, 4800, 6100, 5600, 4900, 5400, 6300, 5100, 5800, 4800)
t.test(litros, conf.level = 0.95)$conf.int

Resultados e interpretación: la cerveza del Resurrection Fest, acotada

El secreto del Resurrection Fest ya no es tan secreto: nuestro modelo estima que se sirvieron en torno a 216.000 litros de cerveza, y con un 95 % de confianza el total estaría entre 200.600 y 231.400 litros (recordemos: partiendo de datos ilustrativos). 📈 Para visualizarlo, el gráfico ideal es una estimación puntual con barras de error: en el eje vertical los litros por barra, a la izquierda la nube de los 10 datos muestrales y a la derecha la media con su intervalo.

Intervalo de confianza del 95 % para la media de litros por barra en el Resurrection Fest La metodología en acción: media ± intervalo de confianza (95 %) 4.600 5.000 5.400 5.800 6.200 Litros de cerveza por barra Muestra (10 barras) 5.785 L 5.015 L Media = 5.400 L Media ± IC 95 %
📈 Figura 2. La metodología en acción: intervalo de confianza del 95 % para la media de litros por barra, calculado sobre los mismos datos de la Figura 1 (ilustrativos para uso docente).

Ojo a la interpretación, que es donde caen los exámenes: el 95 % no significa que «hay un 95 % de probabilidad de que la media esté en [5.015 ; 5.785]». Significa que, si repitiéramos el muestreo muchas veces con este método, aproximadamente el 95 % de los intervalos construidos capturarían la verdadera media. 🧠 Y conviene señalar dos matices avanzados: la extrapolación exige que la muestra sea realmente aleatoria (si las barras de la zona VIP venden distinto, necesitaríamos muestreo estratificado), y al muestrear 10 de solo 40 barras un docente exigente podría aplicar la corrección por población finita, que estrecharía el intervalo.

Trasladar al aula

Este caso funciona de maravilla como práctica de inferencia en 2.º de bachillerato o en un primer curso universitario, y combina muy bien con los recursos interactivos de canaldocente para simular muestreos en directo. Retos propuestos: 🎯

  1. ¿Por qué usamos la t de Student y no la normal estándar en este problema? ¿Cuándo sería razonable usar z?
  2. Recalcula el intervalo con niveles de confianza del 90 % y del 99 %. ¿Qué le ocurre a la anchura y por qué?
  3. Si en lugar de 10 barras muestreáramos 20 (con la misma media y desviación), ¿cuánto se estrecharía el intervalo? Compruébalo.
  4. Debate: explica con tus palabras por qué es incorrecto decir «la media tiene un 95 % de probabilidad de estar en el intervalo».
  5. Diseña un muestreo estratificado suponiendo que 8 de las 40 barras están en zona VIP y venden un 30 % más.
  6. Con el dato real de 25.000 hamburguesas del Resurrection Fest y una asistencia estimada que tú propongas, calcula e interpreta el indicador «hamburguesas por asistente».
  7. Reto de simulación: en R o en una hoja de cálculo, genera 100 muestras de una población conocida, construye sus 100 intervalos y cuenta cuántos capturan la media verdadera. ¿Se acerca al 95 %?

Cierre

Una noticia de festival con hamburguesas, pizzas y un dato «prohibido» se ha convertido en una lección completa de inferencia estadística: muestreo, t de Student, margen de error e interpretación honesta de la incertidumbre. Esa es la gran moraleja del Resurrection Fest para el aula: cuando alguien esconde un número, la estadística no lo adivina, lo acota con rigor. ✅ Si te ha gustado este enfoque de aprender análisis de datos con noticias reales, encontrarás muchos más casos como este entre los artículos del blog de canaldocente.