El número favorito del estudiante de TFM es el R cuadrado. Cuanto más alto, mejor — eso es lo que repite todo el mundo. Pero un R² = 0.87 puede ser un trabajo brillante o un fraude estadístico, dependiendo del contexto, del número de variables y de cómo lo hayas calculado.
¿Qué te dice realmente el R²?
El R² es la fracción de la varianza de Y que tu modelo explica. Va de 0 a 1. Si R² = 0, tu modelo no aporta nada sobre la media. Si R² = 1, tu modelo lo explica todo… o has cometido un error grave.
Esa frase final es la clave. R² = 1 en datos reales es prácticamente imposible, así que normalmente significa data leakage (el target se ha colado entre los predictores) o estás evaluando sobre los mismos datos que has usado para entrenar.
El benchmark depende del campo
- Ciencias físicas e ingeniería: R² > 0.95 es lo esperable. 0.87 suena flojo.
- Economía y finanzas: R² > 0.30 ya es publicable. 0.87 prediciendo precios es muy sospechoso.
- Psicología y educación: R² ~ 0.10–0.40 es realista para variables humanas. 0.87 puede indicar una variable redundante (predictor que ya «contiene» al target).
- Biomedicina con variables fisiológicas: 0.60–0.85 es lo habitual. 0.87 cuadra.
Cuatro preguntas antes de presumir de tu R²
- ¿Es R² ajustado? El R² normal SIEMPRE sube al añadir variables, aunque sean ruido. El ajustado penaliza el exceso de predictores. Reporta SIEMPRE el ajustado en regresión múltiple.
- ¿Lo has calculado en train o en test? El R² en train mide ajuste; el de test mide generalización. La diferencia entre ambos es tu indicador de sobreajuste.
- ¿Has hecho validación cruzada? Un k-fold de 5 o 10 te da R² más honestos que un único split 80/20. Reporta la media y la desviación.
- ¿Cómo se comportan los residuos? Un R² alto con residuos no aleatorios (patrón en banano, embudo o autocorrelación) significa que tu modelo está mal especificado, no que sea bueno.
Cuando R²=0.87 es un éxito real
Si tu R² ajustado en validación cruzada repetida da 0.87 ± 0.04, los residuos parecen ruido blanco, las variables tienen interpretación causal, y el RMSE es razonable comparado con la desviación de Y, entonces sí: has hecho un buen modelo. Apúntalo en la tesis con orgullo.
Cuando R²=0.87 es un fraude (involuntario)
Si tu R² es 0.87 en train pero 0.31 en test, o si una de tus variables predictoras es básicamente Y disfrazada (un índice que se construye con Y, una métrica futura, una variable post-tratamiento), tu modelo no sirve para predecir. El R² alto solo está midiendo el truco.
Conclusión
El R² es una de las métricas más fáciles de inflar y por tanto la más peligrosa. Acompáñalo siempre de RMSE, MAE, validación cruzada y diagnóstico de residuos. Y cuando lo reportes, di el ajustado, di el split, y di cuántas variables tiene tu modelo. Sin esos cuatro datos, R² = 0.87 no significa nada.