¿Qué ha ocurrido?
La burbuja hotelera ha vuelto a la conversación: Marriott acaba de superar los 10.000 hoteles en todo el mundo y Hilton aspira a alcanzar esa misma cifra a lo largo de este año 🏨. Dos gigantes creciendo a la vez, en mercados muy distintos y a un ritmo acelerado, hacen inevitable la pregunta que da título a la noticia de Cinco Días: ¿estamos ante una expansión sostenible o ante una posible burbuja en el sector hotelero? Para un aula de estadística, esta noticia es oro 📊: detrás de un titular llamativo se esconde un problema clásico de análisis de datos que podemos diseccionar paso a paso.
En lugar de quedarnos en el debate periodístico, vamos a usar la expansión de Marriott y Hilton como excusa para enseñar una técnica concreta: el análisis de grupos o clustering. La idea es sencilla y potente: en vez de mirar 10.000 hoteles uno a uno, los agrupamos en perfiles que se comportan parecido, y observamos si aparece algún grupo "sospechoso" de estar inflando la burbuja.
¿Por qué es interesante para estadística?
Porque el sector hotelero genera muchísimos datos y de naturaleza muy diversa: ocupación, precio medio por noche, ingreso por habitación disponible, antigüedad del establecimiento, categoría, ubicación… Cuando tenemos miles de unidades (hoteles) descritas por varias variables a la vez, el ojo humano se pierde. La estadística nos ofrece herramientas para reducir el caos a estructura.
El concepto de "burbuja" es, en el fondo, una hipótesis sobre los datos: sugiere que existe un grupo de hoteles cuya valoración o expansión no está respaldada por su rendimiento real (baja ocupación, márgenes ajustados, sobreoferta en su zona). Si ese grupo existe y es grande, hay señales de burbuja; si no aparece, el crecimiento parece más saludable. Detectar grupos ocultos es precisamente lo que hace el clustering, y por eso esta noticia es un ejemplo perfecto para entender cuándo y por qué importa esta familia de métodos no supervisados. 💡
¿Qué variables hay en juego?
Antes de agrupar nada, hay que decidir qué medimos. Estas son las variables más relevantes para estudiar la posible burbuja hotelera, con su tipo estadístico:
- Tasa de ocupación (%): variable cuantitativa continua. Indica cuántas habitaciones se llenan respecto a la capacidad total.
- ADR — precio medio por noche (€): cuantitativa continua. El Average Daily Rate.
- RevPAR (€): ingreso por habitación disponible (ocupación × ADR). Resume rentabilidad.
- Tasa de crecimiento de aperturas (%): ritmo de expansión en la zona.
- Densidad de oferta: hoteles por cada 1.000 habitantes o turistas. Mide saturación.
- Categoría: variable categórica ordinal (de 1 a 5 estrellas).
Para un clustering bien hecho conviene estandarizar las variables numéricas (por ejemplo con la puntuación z), porque un precio en euros y una ocupación en porcentaje viven en escalas muy diferentes y, sin tipificar, el precio dominaría artificialmente las distancias. Este detalle es clave y suele ser el primer error que cometen los estudiantes. 🔎
¿Qué técnica utilizaríamos?
La técnica protagonista es el análisis de grupos (clustering), y dentro de ella el algoritmo k-means por su sencillez didáctica. El clustering es un método no supervisado: no le decimos al algoritmo cuáles son los hoteles "buenos" o "malos"; él mismo encuentra agrupaciones a partir de la similitud entre observaciones.
El funcionamiento intuitivo de k-means es este:
- Elegimos un número de grupos
k(por ejemplo, 3 perfiles de hotel). - El algoritmo coloca
kcentros al azar y asigna cada hotel al centro más cercano (distancia euclídea sobre las variables tipificadas). - Recalcula cada centro como la media de su grupo y vuelve a reasignar. Repite hasta que los grupos se estabilizan.
¿Cómo decidir el número de grupos? Con el método del codo (graficando la inercia frente a k) o con el coeficiente de silueta. En Python bastan unas líneas con scikit-learn (KMeans) y en R con la función kmeans(); puedes consultar la documentación oficial de scikit-learn sobre clustering para los parámetros. Lo importante para el aula no es el código, sino entender que aquí la "burbuja" se traduce en un clúster concreto: aquel con alta densidad de oferta y crecimiento acelerado, pero ocupación y RevPAR bajos. 🧮
¿Qué tabla o gráfico funcionaría mejor?
Una vez ejecutado el clustering, conviene presentar los centroides (el perfil medio de cada grupo) en una tabla. Aquí tienes un ejemplo con datos ilustrativos para uso docente (no son cifras oficiales de Marriott ni Hilton; sirven solo para practicar la interpretación):
| Clúster | Ocupación media (%) | ADR (€) | RevPAR (€) | Crecimiento aperturas (%) | Densidad oferta |
|---|---|---|---|---|---|
| 1 · Consolidados rentables ✅ | 78 | 140 | 109 | 3 | Media |
| 2 · Premium estable 📈 | 71 | 260 | 185 | 5 | Baja |
| 3 · Expansión arriesgada ⚠️ | 52 | 95 | 49 | 18 | Muy alta |
La lectura es inmediata: el clúster 3 combina crecimiento desbocado y saturación de oferta con la peor ocupación y el RevPAR más bajo. Es el candidato a "burbuja". 🎯
Para la visualización gráfica, la recomendación es doble:
- Un diagrama de dispersión con la ocupación en el eje X y el RevPAR en el eje Y, coloreando cada punto según su clúster. Los grupos sanos se sitúan arriba a la derecha; la nube del clúster de riesgo cae abajo a la izquierda.
- Un gráfico de radar por clúster para comparar de un vistazo los perfiles medios en todas las variables tipificadas.
Si el alumnado domina más dimensiones, puede proyectarse el resultado en 2D para "ver" cómo de separados están los grupos. La clave didáctica es que un buen gráfico convierte un algoritmo abstracto en una historia visible.
¿Cómo lo llevamos al aula?
Esta noticia da para una unidad completa sobre burbuja hotelera y análisis no supervisado. Aquí van entre cinco y ocho retos graduados para el alumnado, del más guiado al más abierto:
- 🧠 Conceptual: explica con tus palabras por qué el clustering es "no supervisado" y en qué se diferencia de clasificar hoteles en buenos/malos de antemano.
- 📊 Preparación de datos: dado el conjunto ilustrativo, tipifica (puntuación z) las variables numéricas y justifica por qué es necesario antes de aplicar k-means.
- 🧮 Elección de k: dibuja un método del codo a partir de unos valores de inercia dados y argumenta cuántos grupos elegirías.
- 🔎 Interpretación: mirando la tabla de centroides, identifica qué clúster sugiere riesgo de burbuja y defiende tu respuesta con al menos dos variables.
- 📈 Visualización: propón qué variable pondrías en cada eje de un diagrama de dispersión para que la burbuja "salte a la vista".
- 💡 Crítica del método: ¿qué pasaría si añadimos una variable irrelevante (por ejemplo, el color de la fachada)? ¿Cómo afectaría a las distancias?
- 📚 Datos reales: busca en la Encuesta de Ocupación Hotelera del INE la ocupación por comunidad autónoma y debate si tu región se parece a algún clúster del ejercicio.
- 🎯 Proyecto abierto: en grupos, reformulad la pregunta "¿hay burbuja?" como una hipótesis comprobable con datos y diseñad cómo la responderíais.
Como apoyo, puedes complementar la sesión con otros materiales prácticos publicados en más artículos del blog de canaldocente, donde encontraréis casos similares de análisis de datos aplicados a noticias de actualidad.
¿Qué se llevan los estudiantes?
Al terminar, el alumnado debería haber comprendido que un titular sobre una posible burbuja hotelera no se valida con opiniones, sino con datos bien estructurados y técnicas adecuadas 📊. Aprenden que el clustering permite descubrir perfiles ocultos sin etiquetas previas, que estandarizar las variables es imprescindible, y que la verdadera dificultad no está en ejecutar el algoritmo —apenas unas líneas en R o Python— sino en elegir las variables correctas e interpretar los grupos con sentido crítico.
Y, sobre todo, se llevan una idea transferible a cualquier otro debate económico o social: detrás de casi toda noticia que habla de "crecimiento", "saturación" o "burbuja" hay un problema de segmentación esperando ser analizado. Convertir esa curiosidad en preguntas estadísticas concretas es, quizá, la competencia más valiosa que una clase de análisis de datos puede regalar. 🧠✅