¿Son fiables los profesores cuando evalúan el dominio oral de una lengua?

Examinar oralmente a los estudiantes es un sistema habitual en los distintos niveles de la enseñanza, desde Educación Primaria a la universidad. Y parece obligado hacerlo cuando se trata de estimar el grado en el que un estudiante domina un idioma, pues manejar una lengua conlleva necesariamente comprender y expresarse oralmente en ella. Ahora bien, todo se vuelve muy complejo cuando hay que evaluar a una gran cantidad de alumnos, por ejemplo, imaginemos que en España pretendiésemos evaluar oralmente de un idioma a todos los aspirantes a entrar en la universidad. Ello plantearía, entre otros, dos problemas prácticos de gran calado, por un lado habría que disponer de una gran cantidad de profesores para realizar esta evaluación, y por otro, habría que garantizar que los profesores utilizasen criterios equiparables, de lo contrario se podría violar el principio sacrosanto de la equidad evaluativa, es decir, el de evaluar a todos por el mismo rasero.

Supongamos que no tenemos problema a la hora de disponer de suficientes profesores, que ya es mucho suponer, ¿podemos estar seguros de que los profesores funcionan con criterios comparables a la hora de evaluar? Pues bien, para responder a esta y otras cuestiones relacionadas el Instituto Nacional de Evaluación Educativa (INEE), con muy buen criterio y deontología profesional, ha llevado a cabo un estudio piloto sumamente interesante. Participaron 1194 estudiantes pertenecientes a siete comunidades autónomas, con una edad media de 18,04 años, de los cuales el 57,4% eran mujeres y el 42,6% hombres. Cada estudiante fue evaluado por tres profesores. Se utilizaron 30 tribunales distintos, compuestos por tres profesores cada uno de ellos, lo que hace un total de 90 profesores participantes. Cada profesor puntuaba el nivel de Inglés de los estudiantes de forma independiente a los otros dos. La pregunta clave era si los profesores participantes eran coincidentes en sus evaluaciones, o cada uno iba por su lado. Los resultados detallados pueden verse en un artículo de la Revista de Educación (http://www.mecd.gob.es/revista-de-educacion/), si bien vamos a comentar aquí los más sobresalientes.

Los resultados obtenidos muestran que las puntuaciones asignadas por los distintos profesores a los estudiantes tienen unas altas correlaciones, lo que indica una elevada fiabilidad inter-profesores.  El gráfico I muestra que prácticamente en el 95% de las ocasiones la correlación de las puntuaciones de dos correctores era superior a 0,82.

GRÁFICO I. Porcentaje por rango de correlaciones entre correctores

GRÁFICO I. Porcentaje por rango de correlaciones entre correctores

Esto está muy bien, pero la convergencia correlacional no significa que todos los profesores operen con los mismos criterios de exigencia, ya que se encuentran diferencias estadísticamente significativas entre las medias de las puntuaciones asignadas por los distintos profesores. En pocas palabras, los profesores tienden a coincidir en la ordenación que hacen de los estudiantes, pero eso no quiere decir que utilicen el mismo criterio a la hora de asignarles la calificación, así, lo que para uno puede ser un notable, para otro es un sobresaliente. El estudio muestra la viabilidad técnica de examinar la expresión oral en inglés en la PAU, si bien quedan aún bastantes aspectos que habría que pulir. Por ejemplo, los profesores deberían de ser entrenados de forma sistemática y rigurosa en los materiales de evaluación y en las guías de calificación para unificar criterios y así minimizar las diferencias entre ellos a la hora de calificar.

Javier Suárez Álvarez. Universidad de Oviedo

Más información en: Evaluación psicométrica de la expresión oral en inglés de las Pruebas de Acceso a la Universidad

Imagen de cabecera en flickr.com. Autor: Leo Hidalgo

Te puede interesar…