Date:July 12, 2018

Las “pruebas objetivas” y su escasa relevancia para evaluar formativamente

Por: Iván Montes Iturrizaga

Los test mentales de inteligencia (CI) desarrollados a inicios del siglo XX introdujeron una forma rápida, económica y estadísticamente objetiva para realizar mediciones masivas. En especial, se desarrolló una teoría y práctica psicométrica (Teoría Clásica de los Test) encaminada generar alcances de importancia para conocer, de forma válida y confiable, constructos tales como inteligencia, personalidad, actitudes y habilidades, entre otros. Sin embargo, este auge precisaba que las preguntas (ítems) sean de selección de respuesta (las mal llamadas “pruebas objetivas”) operar estadísticamente para determinar los puntajes con prontitud.

A la luz de lo mencionado, se gestó todo un movimiento psicométrico con importantes realizaciones para las diferentes áreas de la psicología profesional y la investigación misma. Tal es así, que en la actualidad, todo psicólogo es formado en la elaboración y aplicación responsable de test especializados. Asimismo, y por ejemplo en área clínica, se tiene bien en claro (al menos en teoría) que los resultados obtenidos constituyen insumos que se deben sumar a otras aproximaciones como la entrevista, la observación, otras pruebas y la historia personal si es que se desea establecer un diagnóstico. Es más, constituiría una violación a la ética el emitir un juicio de valor si solo nos apoyamos en los resultados de un test; una a gran imprudencia a la que se le conoce como “diagnóstico ciego”.

A la luz de lo anterior, tenemos que el ítem del tipo selección de respuesta juega un papel fundamental pues permite computar con plantillas, lectoras ópticas o manualmente los puntajes totales de cada cual para su posterior interpretación. De esta manera, dos o más evaluadores (o máquinas) podrían llegar a idénticos resultados si es que manejan la clave de respuestas. Por este motivo, y en el ámbito de la educación con insistencia, se le llama “pruebas objetivas” a estos instrumentos que contienen estas formas de ítems de selección. En otras palabras, la objetividad a la que se alude se asocia a la confiabilidad en la corrección o calificación – siempre la misma – pero no a si estamos realmente evaluando algo relevante de manera significativa.

Este tipo de pruebas (con ítems de selección de respuesta) pasó rápidamente al terreno educativo para evaluar externamente los aprendizajes desde instancias de gestión territorial como ministerios, boards, estados, regiones u oficinas encargadas de velar por los servicios que ofrecen las escuelas. Estas evaluaciones han estado ligadas – casi siempre – a la necesidad de conocer el logro académico para luego tomar decisiones de política en el nivel macro. En otros casos, los resultados tienen implicancias individuales, como por ejemplo, el decidir si un estudiante está apto para iniciar sus estudios secundarios. O también, los resultados obtenidos en estas pruebas suelen ser usados – erróneamente según nuestro parecer – para otorgar incentivos a las escuelas que les va mejor. De todas formas, estas pruebas son externas a las escuelas y no tienen finalidad formativa alguna puesto que su interés no es la retroalimentación directa a los estudiantes.

De la psicometría a las aulas

Quizá, el problema se inició en los años 70’s del siglo pasado bajo el influjo de la tecnología educativa y las pretensiones de convertir a la educación en una especie de ciencia de la acción de la mano de didácticas de rígida aplicación. Claro está, se empezaron a popularizar este tipo de pruebas en los maestros quienes se interesaron por aprender la redacción de estos ítems; llegando incluso a capacitarse en el cálculo de la validez y la confiabilidad estadística. Una muestra de esto se puede apreciar en gran parte de los manuales de evaluación de la época; que reducen este proceso a la confección sofisticada de instrumentos donde los estudiantes se deben de limitar a una marca, un check, una palabra o unir con flechas.

Es innegable que las pruebas con estos ítemes (selección de respuesta) facilitan el trabajo de corrección por parte de los maestros. También, se reducen los reclamos y los problemas asociados a la determinación de las calificaciones. Sin embargo, los defensores de estas pruebas no perciben su escasa pertinencia contextual; ya que en el mundo real las demandas cognitivas son más complejas y exigen respuestas más elaboradas que el simple hecho de hacer marcas en una hoja de papel. Por otro lado, recordemos que la evaluación formativa pretende que los estudiantes alcancen las metas de aprendizaje y por consiguiente le interesa conocer de manera constante los despliegues de los estudiantes para retroalimentar (feedback formativo) los procesos de enseñanza y aprendizaje.

Lamentablemente, el hablar de evaluación formativa se ha convertido en un slogan en buena parte del profesorado (y autoridades) pues por un lado abogan por ella y por el otro sus prácticas se centran en constatar, contemplar y medir a los estudiantes con pruebas de escasa relevancia. Pero también, existen casos en que se abandona la intencionalidad formativa de la evaluación (o sea sin retroalimentación) a pesar de que se gatillaron evidencias importantes muy alejadas de las pruebas de selección de respuesta. Todo esto nos hace suponer que muy probablemente aún no se ha comprendido a cabalidad lo que implica evaluar formativamente en la práctica pedagógica. Ante esto, es probable que en las capacitaciones docentes los énfasis hubieran girado en torno al aprendizaje del concepto y en desmedro de la dimensión aplicada ¡Todo un renovado, atractivo y potente discurso escasamente aterrizado en el aula donde al parecer predominarían las mismas prácticas de siempre!

La evaluación formativa como realista

Pero bueno. Si hablamos de evaluación formativa, y si nuestra intención es desarrollar competencias, debemos instaurar en los estudiantes experiencias complejas y con un elevado realismo. Viendo las cosas así, los resultados de las pruebas de selección de respuesta no brindarían suficiente evidencia para retroalimentar. Esto en vista a que este formato de prueba no se diseñó en primera instancia para su aplicación corriente en las aulas. Por consiguiente estas pruebas bien podrían servir para explorar conocimientos, comprensión o análisis en situaciones especiales; más no nos darán luces para intervenir con solvencia. Más aún, el abuso de las pruebas de selección de respuesta estaría condicionado pobres hábitos de estudio. Esto es bastante lógico ya que una cosa es prepararse para seleccionar la respuesta correcta y otra muy diferente el anticiparse – por ejemplo – a que se tendrá que analizar un caso o redactar un texto argumentativo. Debe comprenderse que esta distinción no es algo trivial y que nos jugamos el cómo condicionamos el cerebro de los estudiantes para procesar y responder ante diversas situaciones.

Imaginemos ahora el daño neuropsicológico que se produciría en gran parte de los colegios autodenominados pre universitarios con su distorsionada oferta encaminada a que sus estudiantes ingresen a la universidad: simulacros, rankings y memorización mecánica en abierto desmedro de forjar competencias. A propósito de esto bien podríamos preguntarnos: ¿qué competencia está comprometida en seleccionar la respuesta correcta dentro de un listado de alternativas?

La evaluación formativa para ser tal necesita que los estudiantes estén expuestos a exigencias de elevado nivel y que los maestros sobre la base de las mismas tomen decisiones optimizadoras. Esto nos conduce directamente a una enseñanza – evaluación realista con pruebas de desempeño; orales, de respuesta extendida (las llamadas pruebas de desarrollo), de casos, de debate y de proyectos, entre otras. Cabe señalar, que esta forma de realismo se juega en procurar la máxima correspondencia entre lo que sucede en el aula y fuera de los muros de la escuela. No se vaya a pensar que se pretende desterrar por completo las pruebas de selección de respuesta; solo advertimos que el abuso de las mismas colisiona con las intencionalidades de los currículos actuales y estándares de aprendizaje (mapas de progreso). Tal vez estas pruebas podrían servir para explorar algunos contenidos, el vocabulario o para introducir a los estudiantes para que luego resuelvan un estudio de caso. De todos modos, cuesta percibir a estos ítemes de selección como alternativas pedagógicas favorecedoras de competencias o desempeños.

Reflexión final

Al parecer, constituirá una decisión siempre saludable el privilegiar las pruebas de desempeño por encima de cualquier otra manera de evaluar. Asimismo, y para que esto tan favorable sea posible se precisarían de liderazgos pedagógicos entendidos que sepan comprender el trabajo de los maestros y la gran exigencia que supone el apostar por una evaluación realística (desempeños). Una exigencia que demandaría más tiempo para enseñar, evaluar con pertinencia y ofrecer a cada estudiante la retroalimentación (feedback) oportuna que necesita para superarse; un repertorio quizá más profesional que supondría el descargar a los maestros de toda la carga burocrática innecesaria y papeleos sin justificación racional que tanto desgaste ocasionan. Vemos así, que cambiar la evaluación para mejor y ponerla al servicio del aprendizaje y la formación integral, amerita la presencia de líderes pedagógicos capaces de pensar las problemáticas escolares críticamente para desde ahí desarrollar inteligentes políticas internas.