Nota docente sobre las listas de exclusión: en esta entrega todas las estructuras disponibles figuraban como "usadas recientemente". Siguiendo la regla de honestidad, se ha elegido la que mejor encaja con un contraste de independencia —la estructura de mini-investigación— y se declara de forma transparente. La metodología (chi-cuadrado de independencia) sí estaba libre de restricciones. 🧠
Hipótesis de partida sobre la audiencia de Pasapalabra 📊
La audiencia de Pasapalabra ha vuelto a ser noticia: el concurso de Antena 3 lideró su franja con un 21,9 % de cuota de pantalla, y lo hizo en una jornada singular, sin que nadie se llevara El Rosco y con la incorporación del concursante apodado AlaZ. Para un aula de estadística, ese titular es oro: detrás de "lidera la audiencia" se esconde una pregunta investigable. Nuestra hipótesis de partida es deliberadamente provocadora: la elección de ver Pasapalabra (frente a la competencia) no es uniforme, sino que depende del perfil del espectador. 🎯
En lenguaje estadístico, esto se traduce en dos hipótesis enfrentadas que guiarán toda la mini-investigación:
- H₀ (hipótesis nula): la decisión de sintonizar Pasapalabra es independiente del grupo de edad del espectador.
- H₁ (hipótesis alternativa): existe asociación entre el grupo de edad y la preferencia por el programa.
Si conseguimos rechazar H₀, podremos afirmar (con un riesgo de error controlado) que el éxito del programa no es un fenómeno "plano", sino que se concentra en determinados públicos. Y esa es exactamente la lógica del test chi-cuadrado de independencia, la herramienta que vertebra este artículo. 🔎
Datos que necesitamos para estudiar la cuota de pantalla 🧮
Una buena pregunta merece datos bien definidos. Para contrastar la independencia entre perfil de espectador y elección de programa necesitamos información categórica cruzada, no medias sueltas. En concreto:
- Variable 1 — Grupo de edad: categórica ordinal (13–34, 35–54, 55+). Es nuestra variable de segmentación.
- Variable 2 — Programa elegido: categórica nominal (Pasapalabra / Competencia / No ve TV en esa franja).
- Unidad de observación: el espectador individual durante la franja access prime time.
- Frecuencias: el número de personas en cada combinación de categorías (lo que llena la tabla de contingencia).
Conviene distinguir bien estos datos de los que aparecían en la nota original (media de 2,5 millones de espectadores, cuota del 21,9 %). Esas cifras son descriptivas y agregadas; el chi-cuadrado, en cambio, necesita el reparto interno de la audiencia por categorías. Es el salto de "cuánta gente ve Pasapalabra" a "quién ve Pasapalabra", y ese matiz es justo lo que hace interesante el análisis. 💡
Las mediciones reales de cuota proceden de paneles de audimetría; el alumnado puede consultar marcos metodológicos oficiales de estadística pública, como los del Instituto Nacional de Estadística (INE), para entender cómo se construye y pondera una muestra representativa.
Diseño del estudio: la tabla de contingencia 📚
El corazón del diseño es una tabla de contingencia: una matriz que cruza las dos variables categóricas y registra frecuencias observadas. A partir de ella calcularemos las frecuencias esperadas bajo independencia y mediremos cuánto se desvía la realidad de ese escenario teórico.
Veamos un ejemplo de tabla con datos ilustrativos para uso docente (no son cifras oficiales de audimetría, sino una distribución inventada que conserva un orden de magnitud realista para practicar el cálculo):
| Grupo de edad | Ven Pasapalabra | Ven la competencia | No ven TV (franja) | Total fila |
|---|---|---|---|---|
| 13–34 | 180 | 260 | 360 | 800 |
| 35–54 | 420 | 330 | 250 | 1.000 |
| 55+ | 600 | 340 | 260 | 1.200 |
| Total columna | 1.200 | 930 | 870 | 3.000 |
Datos ilustrativos para uso docente. A simple vista, el público 55+ parece concentrar mucha más adhesión a Pasapalabra que el público joven. Pero "parece" no es estadística: necesitamos cuantificar si esa diferencia es lo bastante grande como para descartar el azar. ✅
Análisis propuesto: cómo funciona el chi-cuadrado de independencia 📈
El test compara las frecuencias observadas (O) con las frecuencias esperadas (E) que tendríamos si la edad y la elección de programa fueran independientes. La esperada de cada celda se calcula así:
E(fila, columna) = (Total de la fila × Total de la columna) / Total general
Por ejemplo, para la celda "55+ × Ven Pasapalabra": E = (1.200 × 1.200) / 3.000 = 480. Como observamos 600 y esperábamos 480, esa celda aporta mucho a la asociación. El estadístico global se obtiene sumando, celda a celda, la discrepancia relativa:
χ² = Σ (O − E)² / E
Después se compara ese valor con la distribución chi-cuadrado con (filas − 1) × (columnas − 1) grados de libertad —aquí (3−1)×(3−1) = 4— y se obtiene un p-valor. La interpretación es la misma lógica de riesgo controlado que en cualquier contraste: si el p-valor es muy pequeño (típicamente < 0,05), rechazamos la independencia. En R bastaría una línea, chisq.test(tabla), cuya documentación oficial de la función chisq.test detalla supuestos y salidas. 🧮
Una métrica imprescindible que el chi-cuadrado no da por sí solo es el tamaño del efecto: la V de Cramér. El p-valor dice "hay asociación"; la V de Cramér dice "y es de esta intensidad" (de 0 = nula a 1 = total). Enseñar ambas a la vez vacuna al alumnado contra el error de confundir significación con relevancia.
Resultados esperables e interpretación 🔎
Con la tabla ilustrativa anterior, el cálculo arroja un χ² ≈ 173 con 4 grados de libertad, lo que corresponde a un p-valor prácticamente nulo (< 0,001). La lectura para el aula sería:
| Elemento | Resultado (datos ilustrativos) | Interpretación didáctica |
|---|---|---|
| Estadístico χ² | ≈ 173 | Gran desviación respecto a la independencia |
| Grados de libertad | 4 | (3−1) × (3−1) |
| p-valor | < 0,001 | Rechazamos H₀: hay asociación edad–programa |
| V de Cramér | ≈ 0,17 | Efecto pequeño-moderado, pero real |
Datos ilustrativos para uso docente. Conclusión: la audiencia de Pasapalabra de nuestro ejemplo no se reparte por igual entre edades; el liderazgo se apoya con fuerza en el público de 55 años o más. 📊
Visualización recomendada: el gráfico ideal aquí es un diagrama de mosaico (mosaic plot), donde el ancho de cada bloque representa el tamaño del grupo de edad y la altura, la proporción que elige cada programa; las celdas se colorean según sus residuos estandarizados (rojo = más de lo esperado, azul = menos). Como alternativa más sencilla, un gráfico de barras apiladas al 100 % con la edad en el eje X y el porcentaje de elección en el eje Y comunica la asociación de un vistazo. Quien quiera practicarlo de forma guiada encontrará apoyo en los recursos interactivos de canaldocente. 📈
Limitaciones y sesgos del análisis ⚠️
Ningún contraste es mágico, y enseñar sus límites es tan formativo como aplicarlo:
- Frecuencias esperadas pequeñas: el chi-cuadrado pierde fiabilidad si alguna celda esperada es < 5; en ese caso se recurre al test exacto de Fisher.
- Independencia ≠ causalidad: que la edad se asocie a ver Pasapalabra no significa que la edad cause el zapeo; puede haber variables ocultas (hábitos de cena, fidelidad histórica al formato).
- Sesgo de medición: los paneles de audimetría son muestras; una muestra mal ponderada distorsiona la cuota de pantalla real.
- Efecto del acontecimiento: una jornada "sin Rosco" o el tirón mediático de AlaZ pueden inflar puntualmente la audiencia de Pasapalabra y romper la representatividad del día.
- Significación vs. relevancia: con muestras enormes, casi cualquier diferencia sale "significativa"; por eso acompañamos siempre el p-valor con la V de Cramér.
Aplicación al aula: retos para investigar la audiencia 🎯
Propuestas listas para llevar a clase, de menor a mayor dificultad (elige 5–8 según el nivel):
- Calcula a mano la frecuencia esperada de la celda "13–34 × Ven Pasapalabra" y compárala con la observada. 🧮
- Identifica qué celda de la tabla aporta más al χ² y explica por qué.
- Diseña tu propia tabla de contingencia con una encuesta real en el centro: ¿la elección de serie favorita depende del curso?
- Programa
chisq.test()en R (oscipy.stats.chi2_contingencyen Python) con los datos del artículo y verifica el p-valor. - Dibuja el gráfico de barras apiladas al 100 % y justifica qué eje usas para cada variable. 📊
- Debate: ¿por qué un p-valor minúsculo no demuestra que la edad "cause" la audiencia de Pasapalabra?
- Investiga cuándo sustituir el chi-cuadrado por el test exacto de Fisher y pon un ejemplo del aula.
- Reto avanzado: calcula la V de Cramér e interpreta si el efecto es trivial o relevante. 🧠
Cierre crítico 📚
Un titular tan simple como "Pasapalabra lidera con un 21,9 %" puede convertirse en una investigación completa: formular hipótesis, construir una tabla de contingencia, aplicar el chi-cuadrado de independencia, medir el tamaño del efecto y, sobre todo, discutir límites. El alumnado descubre así que la estadística no es solo "calcular medias", sino interrogar a los datos con honestidad. La próxima vez que veas una cifra de audiencia de Pasapalabra, pregúntate no solo cuánta gente mira, sino quién mira y por qué —y tendrás media clase de estadística resuelta. Puedes seguir explorando estos enfoques en más artículos del blog. ✅