Docencia 23 Jun 2026 3 min Canaldocente

Euskera examen

Análisis de los resultados del examen de euskera y su relación con la evaluación de un solo profesor

Hipótesis de partida: ¿puede un solo evaluador distorsionar el examen de euskera? 🔎

El dato que ha encendido el debate es contundente: el 47% de los ceros del examen de euskera procede de las evaluaciones de un único profesor. Antes de indignarnos o de defender a nadie, conviene tratar la noticia como lo que es para nosotros: una hipótesis estadística que podemos poner a prueba. Nuestra conjetura de partida es sencilla de enunciar y difícil de demostrar a ojo: el comportamiento evaluador de ese docente es un valor atípico (outlier) multivariante respecto al resto del profesorado. Es decir, no se diferencia solo en una métrica, sino en la combinación de muchas a la vez.

Para destapar ese patrón sin perdernos entre decenas de indicadores usaremos una de las herramientas más elegantes de la analítica de datos: el análisis de componentes principales (PCA), una técnica de reducción de dimensionalidad que comprime muchas variables en pocos ejes y nos deja ver quién se sale de la nube. 📊

Estudiantes realizando un examen de euskera en un aula, contexto para analizar la evaluación con estadística — El examen de euskera como caso real para enseñar reducción de dimensionalidad y detección de evaluadores atípicos. Imagen ilustrativa (Unsplash).

Datos que necesitamos 🧮

Una hipótesis sobre el examen de euskera no se contrasta con titulares, sino con una matriz de datos. Para aplicar PCA necesitamos que cada fila sea un profesor evaluador y cada columna una métrica de su comportamiento corrector. Cuantas más dimensiones describamos, mejor capturará el PCA la "huella" de cada docente.

Porcentaje de ceros sobre el total de exámenes que corrige.
Nota media otorgada y desviación típica de sus calificaciones (¿es duro, blando o errático?).
Tasa de suspensos y tasa de notables/sobresalientes.
Severidad relativa: diferencia entre la nota que pone y la que ponen otros correctores a alumnos de perfil similar.
Concordancia inter-jueces en exámenes de doble corrección (acuerdo con un segundo evaluador).
Volumen de exámenes corregidos (para no confundir a un corrector con pocos casos).

Estas variables están medidas en escalas distintas (porcentajes, notas de 0 a 10, índices), así que el preprocesado es obligatorio: tipificaremos cada columna (media 0, desviación 1) antes del PCA. Si no, la variable con números más grandes dominaría los componentes y el análisis del examen de euskera quedaría sesgado de raíz. 💡

Diseño del estudio 📚

Planteamos un estudio observacional y retrospectivo sobre las correcciones de una convocatoria completa. El diseño tiene tres decisiones clave:

Unidad de análisis: el evaluador, no el alumno. Queremos perfilar correctores, así que agregamos los exámenes por profesor.
Estandarización: aplicamos StandardScaler a las seis métricas para que todas pesen igual.
Reducción con PCA: proyectamos las seis dimensiones sobre 2 o 3 componentes principales que concentren la mayor parte de la varianza, y representamos a cada docente como un punto.

La idea central de la reducción de dimensionalidad es que, aunque describamos al profesorado con muchas métricas, esas métricas están correlacionadas y "viven" en realidad en un espacio más pequeño. El PCA encuentra ese espacio. Documentación oficial y reproducible está en la implementación de PCA de scikit-learn, ideal para llevar el caso del examen de euskera a un cuaderno de Python en clase.

Tabla de datos (perfil de evaluadores)

Datos ilustrativos para uso docente (no son cifras reales del caso; sirven para practicar el método):

Evaluador	% ceros	Nota media	Desv. típica	% suspensos	Concordancia inter-jueces	Exámenes
Prof. A	4%	6,2	1,4	22%	0,81	180
Prof. B	3%	6,5	1,3	19%	0,84	205
Prof. C	5%	5,9	1,5	27%	0,78	160
Prof. D	6%	6,1	1,6	25%	0,80	175
Prof. X	31%	3,8	2,9	58%	0,42	190

A simple vista el Prof. X "canta", pero en un claustro de 60 correctores y con una decena de métricas el ojo humano se pierde. Ahí es donde el PCA convierte el caos en una imagen legible. 🎯

Análisis propuesto: PCA aplicado al examen de euskera 📈

El procedimiento, paso a paso, para analizar los ceros del examen de euskera es el siguiente:

Tipificar las seis variables.
Calcular la matriz de covarianzas y sus autovalores y autovectores: cada autovector es un componente principal, y su autovalor indica cuánta varianza explica.
Examinar el gráfico de sedimentación (scree plot) para decidir cuántos componentes retener (regla del codo o varianza acumulada > 80%).
Proyectar a cada profesor sobre PC1 y PC2.
Interpretar los pesos (loadings): normalmente PC1 capturará un eje de "severidad global" (% ceros, % suspensos, baja concordancia) y PC2 algo como la "erraticidad" (alta desviación típica).

Visualización recomendada: un biplot o diagrama de dispersión con PC1 en el eje X y PC2 en el eje Y; cada punto es un evaluador y, superpuestas, las flechas de las variables originales (loadings). El Prof. X aparecerá disparado hacia la zona de alta severidad y baja concordancia, claramente separado de la nube del resto. Complementa con un scree plot (componentes en X, % de varianza explicada en Y) para justificar cuántos ejes conservas. Este doble gráfico es oro puro para explicar el examen de euskera en términos visuales. 🧠

Resultados esperables ✅

Si la hipótesis es correcta, esperamos:

Que dos componentes principales expliquen el grueso de la varianza (pongamos un 70–85% ilustrativo), lo que valida resumir el comportamiento corrector en un plano.
Una nube compacta de profesores "normales" y uno o dos puntos alejados (el Prof. X), cuya distancia al centroide es enorme.
Que la distancia de Mahalanobis o el residuo de reconstrucción del PCA marque a ese evaluador como outlier estadísticamente notable, coherente con que concentre buena parte de los ceros del examen de euskera.

Conviene insistir en la lectura: el PCA no demuestra mala fe ni error; demuestra diferencia de patrón. Señala dónde mirar, no dicta el veredicto.

Limitaciones y sesgos ⚠️

Un buen analista desconfía de su propio gráfico. Las trampas más habituales al estudiar el examen de euskera con PCA son:

Confusión por asignación no aleatoria: quizá a ese profesor le tocaron los grupos más débiles. Sin aleatorización, "atípico" no equivale a "injusto".
PCA es lineal: solo captura relaciones lineales entre variables; relaciones curvas podrían escapársele.
Sensibilidad a la escala: olvidar tipificar arruina el resultado.
Componentes ≠ realidad: los ejes son combinaciones matemáticas; su interpretación ("severidad", "erraticidad") es una historia que contamos nosotros y hay que validarla.
Tamaño muestral: con pocos exámenes por corrector, el ruido finge ser señal.

Aplicación al aula: retos para tu clase 🎓

Este caso del examen de euskera es un laboratorio perfecto para que el alumnado de Bachillerato, FP o universidad practique pensamiento estadístico. Propón estos retos (puedes ampliarlos con más recursos en la zona de recursos para profesores del propio canaldocente):

📊 Construir la matriz evaluador×métrica con la tabla de datos ilustrativos y tipificarla a mano (media 0, desviación 1).
🧮 Calcular en Python o R los dos primeros componentes y dibujar el biplot PC1–PC2.
🔎 Identificar al outlier y argumentar, con números, por qué se separa del grupo.
📈 Interpretar los loadings: ¿qué significa moverse a la derecha en PC1?
🧠 Debatir el riesgo de variable de confusión: ¿cómo distinguirías un profesor "duro" de un profesor con "grupos difíciles"?
💡 Comparar el PCA con mirar las métricas de una en una: ¿qué ganamos al reducir dimensiones?
📚 Redactar una conclusión de 5 líneas que un equipo directivo pudiera leer sin saber estadística.

Cierre crítico

La noticia de que el 47% de los ceros del examen de euskera sale de un solo corrector no es, por sí sola, una sentencia: es una invitación a medir mejor. El análisis de componentes principales nos enseña una lección que va mucho más allá del País Vasco o Navarra: cuando una decisión afecta a personas, no basta con un número aislado; hay que mirar el perfil completo y compararlo con sus iguales. Reducir dimensiones para ver lo invisible, sin confundir un patrón atípico con una culpa probada, es exactamente el tipo de criterio que queremos cultivar en el aula. Si te interesa seguir convirtiendo titulares en lecciones de datos, encontrarás más casos en más artículos del blog. 🚀

Compartir: Twitter / X LinkedIn WhatsApp