¿Qué ha ocurrido con los resultados del Bonoloto? 🔎
Cada tarde, miles de personas comprueban los resultados del Bonoloto con la esperanza de acertar los seis números premiados. El sorteo del martes 30 de junio de 2026 volvió a repartir ilusión, pero para quien mira el mundo con ojos de estadística, cada combinación es también un pequeño conjunto de datos esperando ser analizado. En este artículo no vamos a prometerte una fórmula mágica para ganar la Bonoloto —eso sería mentir—, sino a usar el sorteo como excusa perfecta para aprender una técnica potentísima de análisis de datos: el clustering o agrupamiento. 📊
La idea es sencilla y honesta: convertir el histórico de números en una tabla, describir cada bola con unas pocas variables y dejar que un algoritmo los agrupe por sí solo en familias —"calientes", "templados" y "fríos"—. Verás que la estadística no adivina el futuro, pero organiza el pasado de una forma reveladora y muy didáctica. 🧠
¿Por qué es interesante para la estadística?
El Bonoloto es un laboratorio de probabilidad casi ideal para el aula: 49 números, se extraen 6 en cada sorteo y —si el bombo es justo— todos tienen exactamente la misma probabilidad de salir. Ese detalle es oro puro para enseñar el sesgo del jugador (o falacia del apostador): la creencia errónea de que un número "atrasado" tiene más papeletas de aparecer. No es así. El bombo no tiene memoria.
Entonces, ¿para qué agrupar los números si el juego es aleatorio? Precisamente para mostrar la diferencia entre describir y predecir. El clustering nos permite describir con elegancia qué ha pasado en el histórico (qué números han salido mucho y hace poco, cuáles poco y hace tiempo) sin caer en la trampa de creer que eso anticipa el próximo sorteo de la Bonoloto. Aprender a marcar esa frontera es una de las lecciones estadísticas más valiosas que existen. 💡
¿Qué variables hay en juego en el Bonoloto?
Para poder agrupar los 49 números necesitamos describir a cada uno con variables numéricas. En análisis de datos, elegir buenas variables (lo que llamamos ingeniería de características) es la mitad del trabajo. Para este ejercicio con la Bonoloto usaremos dos, fáciles de entender y de calcular:
- 🔥 Frecuencia: cuántas veces ha salido cada número en los últimos 100 sorteos.
- ⏳ Recencia: cuántos sorteos han pasado desde su última aparición.
Como en 100 sorteos se extraen 600 bolas repartidas entre 49 números, la frecuencia media esperada ronda las 12 apariciones. Esa referencia teórica nos vendrá muy bien para interpretar la tabla. Aquí tienes una muestra de 12 números con sus dos variables:
| Número | Frecuencia (en 100 sorteos) | Sorteos desde su última aparición | Grupo asignado |
|---|---|---|---|
| 7 | 17 | 1 | Caliente |
| 23 | 16 | 2 | Caliente |
| 34 | 18 | 1 | Caliente |
| 3 | 15 | 3 | Caliente |
| 45 | 12 | 8 | Templado |
| 19 | 13 | 6 | Templado |
| 27 | 11 | 9 | Templado |
| 12 | 12 | 7 | Templado |
| 40 | 8 | 15 | Frío |
| 2 | 7 | 18 | Frío |
| 48 | 9 | 14 | Frío |
| 31 | 8 | 16 | Frío |
Datos ilustrativos para uso docente (inspirados en el formato del histórico real). El histórico verdadero de los resultados del Bonoloto puede descargarse desde la web oficial de Loterías y Apuestas del Estado. Empecemos viendo la frecuencia de cada número: 📈
¿Qué técnica utilizaríamos para agrupar los números del Bonoloto?
La técnica estrella aquí es el clustering (agrupamiento), un método de aprendizaje no supervisado: no le decimos al algoritmo cuáles son las etiquetas correctas, sino que él descubre solo los grupos naturales que hay en los datos. Es lo contrario de la clasificación, donde ya conocemos las categorías de antemano. 🧮
El algoritmo más popular es k-medias (k-means), y funciona con una receta muy intuitiva:
- Estandarizar las variables (frecuencia y recencia) para que ninguna pese más solo por tener números más grandes.
- Elegir cuántos grupos queremos (la famosa k). Aquí
k = 3: calientes, templados y fríos. - Colocar 3 centroides al azar y asignar cada número al centroide más cercano.
- Recalcular cada centroide como la media de su grupo y repetir hasta que ya no cambien.
Para decidir el número de grupos se usa el método del codo, que mide cómo se reduce la variación interna al añadir clústeres. Todo esto se implementa en tres líneas con KMeans de la documentación oficial de scikit-learn. Al aplicarlo a nuestros datos de la Bonoloto, el algoritmo separa limpiamente tres nubes de puntos: 👇
El resultado es nítido: los números calientes (arriba a la derecha en el eje horizontal) aparecen mucho y hace poco; los fríos, poco y hace tiempo; los templados quedan en medio. Ojo con la interpretación honesta: esto describe el pasado del Bonoloto, no predice el próximo sorteo. ✅
¿Qué tabla o gráfico funcionaría mejor?
Para comunicar un análisis de agrupamiento, el gráfico de dispersión con colores por grupo (nuestra Figura 2) es imbatible: en un solo golpe de vista el ojo humano detecta las tres nubes. En el eje X colocamos la frecuencia, en el eje Y la recencia, y cada color representa un clúster. Añadir los centroides ayuda a ver el "centro de gravedad" de cada familia.
El diagrama de barras (Figura 1) cumple otra función distinta y complementaria: muestra el dato crudo, número a número, antes de agrupar. Es la fotografía de partida. Una buena práctica docente es enseñar los dos juntos: primero las barras ("esto es lo que tenemos") y después la dispersión ("esto es lo que el algoritmo ha descubierto"). Para tablas, basta con ordenar los números por grupo, como hicimos arriba, para que la estructura salte a la vista sin necesidad de leer todos los valores.
¿Cómo lo llevamos al aula? 📚
Este caso da muchísimo juego con alumnado de secundaria, bachillerato o ciclos de datos. Aquí tienes una batería de retos listos para usar; puedes prolongar la actividad con los recursos interactivos de canaldocente para que el alumnado manipule los datos en directo:
- 🎯 Reto 1. Calcula la frecuencia media esperada de un número en 100 sorteos del Bonoloto y compárala con la media real de la tabla. ¿Se parecen?
- 🧮 Reto 2. Estandariza a mano las dos variables (resta la media y divide por la desviación típica). ¿Por qué es imprescindible antes de aplicar k-medias?
- 🔎 Reto 3. Asigna "a ojo" cada número a su grupo y comprueba si coincides con el algoritmo. ¿Dónde dudas más?
- 🧠 Reto 4. Repite el clustering con
k = 2y conk = 4. ¿Cambian mucho las conclusiones? Debate el método del codo. - 💡 Reto 5. Explica con tus palabras por qué un número "frío" NO tiene más probabilidad de salir en el próximo sorteo. Nombra la falacia implicada.
- 📈 Reto 6. Propón una tercera variable (por ejemplo, si el número es par o impar) y discute cómo afectaría al agrupamiento.
¿Qué se llevan los estudiantes?
Que detrás de algo tan cotidiano como comprobar los resultados del Bonoloto se esconde una lección de análisis de datos de primer nivel. El clustering enseña a encontrar estructura donde parece que solo hay ruido, a elegir variables con criterio y a interpretar los grupos con sentido común. 🎯
Pero la moraleja más importante es de alfabetización estadística: agrupar los números de la Bonoloto en calientes y fríos es un ejercicio descriptivo precioso, no una bola de cristal. Un buen analista sabe describir el pasado con rigor y, a la vez, resistir la tentación de proyectarlo ciegamente sobre el futuro. Si quieres seguir explorando cómo convertir noticias en clase de datos, encontrarás muchas más ideas en los artículos del blog de canaldocente. 📊