Herramientas de usuario

Herramientas del sitio


es:manual:analisis:test:filtrado

¡Esta es una revisión vieja del documento!


Selección y filtrado de datos

Siette es un sistema de evaluación de abierto, con distintas posibilidades de acceso según el propósito de la evaluación. No es lo mismo una evaluación sumativa, con un acceso restringido y realizado en un entorno controlado, que una evaluación formativa en la que el acceso al test queda al libre albedrío del usuario.

El análisis de los resultados permite al profesor conocer cual es el conocimiento de los alumnos y como se comportan las preguntas que se han planteado, pero para ello, especialmente en los casos en los que el acceso al test no esta completamente controlado es necesario realizar previamente un proceso de filtrado o selección del conjunto de dato que se consideran válidos o representativos de la evaluación, especialmente si estos on los datos de partida para la calibración del sistema o para tomar decisiones acerca de la dificultad o relevancia de las preguntas que lo componen.

A partir de los datos estadísticos obtenidos Siette permite establecer criterios para seleccionar o filtrar las sesiones de test realizadas.

Datos del test

Un test en Siette esta compuesto por un conjunto de preguntas que se presentan al alumno para que responda. Cada vez que se plantea un test a un alumno se dice que éste realiza una sesión del test. Las preguntas que se plantean se seleccionan sobre un conjunto de potenciales preguntas que cumplen una serie de condiciones, y el test termina cuando se verifica un determinado criterio de finalización.

Hay que tener en cuenta que opcionalmente, si no se han establecido reglas en contra, puede ocurrir lo siguiente:

  • Un mismo alumno puede realizar mas de una sesión del mismo test.
  • El número de preguntas puede variar de una sesión a otra.
  • Las preguntas planteadas pueden ser distintas de una sesión a otra.
  • Puede haber sesiones incompletas, contestadas en blanco o no finalizadas por el alumno.

Datos de sesiones

Por todo ello, la primera operación que debe realizarse al analizar los resultados de un test es comprobar cuál ha sido el uso que se ha hecho del test, y descartar las sesiones que no ofrecen información válida. Para ello Siette proporciona un análisis previo de los siguientes valores:

  • Numero de sesiones del test: Corresponde al total de sesiones que se han hecho.
  • Número de sesiones completadas: Son las sesiones en las que se ha llegado al final del test, es decir son sesiones que han terminado porque el criterio de finalización se ha cumplido, y no por otra razón (abandono del test, falta de preguntas a la hora de seleccionar, etc.)
  • Número de sesiones vacias: Son sesiones en las que el alumno ha intentado entrar para realizar el test y posiblemente ha leido las instrucciones iniciales, pero, o bien no ha querido continuar, o bien el sistema no le ha dejado al no cumplir alguno de los criterios de acceso.
  • Número de alumnos: Es el número de usuarios distintos que han realizado el test

En el siguiente ejemplo se muestra un test del cual se han realizado 343 sesiones, aunque en realidad solo se han completado 283. Hay 16 sesiones completamente vacías, y solo hay 219 usuarios diferentes que han hecho el test.

 Datos de las sesiones

A la vista de estos datos, para realizar el análisis se podría optar por filtrar los datos para quedarse solo con las sesiones completas realizadas por alumnos diferentes, escogiendo por ejemplo la primera sesión de cada alumno. Para realizar este filtrado hay que acceder a la pestaña Sesiones y seleccionar la subpestaña Selección por criterios. En este caso se seleccionan las sesiones:

 Selección por criterios

En este punto hay dos opciones:

  1. Seleccionar directamente las sesiones que cumplan estos criterios.
  2. Seleccionar las sesiones que NO cumplan estos criterios (invirtiendo la selección) y ocultarlas del listado de sesiones o borrarlas definitivamente. Ocultarlas tiene la ventaja de que las sesiones permanecen en la base de datos y que si se quiere se podrían volver a recuperar deshaciendo la selección. Borrar las sesiones implica que se descartan para siempre, pero tiene la ventaja de que se facilita el análisis.

La imagen anterior muestra los resultados de este criterio de filtrado. Se obtienen 283 sesiones al seleccionar solo las sesiones completas, y 223 al seleccionar solo la primera sesión de cada alumno. Se indica que la selección debe cumplir TODOS los criterios, por lo que finalmente resultan solo 183 sesiones seleccionadas. Al invertir la selección y pulsar el botón ocultar, el resto de sesiones que no cumplen estos criterios se eliminan de temporalmente del listado de sesiones.

Los criterios de filtrado se guardan en la base de datos de Siette, de manera que se mantengan al conectar nuevamente. No solo eso, sino que si se realizan nuevas sesiones del test, se aplicarán los criterios de filtrado a las nuevas sesiones y no se mostrarán en los listados si no los cumplen.

Una vez filtradas las sesiones, por ejemplo ocultándolas, si se vuelve a la pestaña Analizado y se recargan los datos se mostrará como ha quedan estos valores:

 Datos de las sesiones

Según esto, y tras actualizar los datos del analizador, se ha conseguido filtrar las sesiones y quedan 183 primeras sesiones todas ellas completas. El resto de los datos tambien hará referencia a este conjunto de sesiones.

Datos de preguntas

En esta sección se analizan los datos relativos a las preguntas. En concreto, y siguiendo con el ejemplo anterior:

 Datos de las preguntas

  • Número de preguntas usadas alguna vez: Es el número de preguntas distintas que en alguna ocasión han sido usadas en alguna sesión de este test.
  • Número mínimo y máximo de preguntas que han compuesto alguna de las sesiones del test. Merece la pena fijarse en este intervalo para saber si realmente las sesiones que se están analizando son las que se quiere. En el ejemplo anterior se indica que hay sesiones completadas con tan solo 6 preguntas. Esto pude deberse a algún tipo de problema durante la ejecución del test, por ejemplo, que se hubiera alcanzado el tiempo máximo, o que el profesor por alguna razón cerrara la sesión. Conviene quizás incluir un nuevo criterio de filtrado que solo seleccione sesiones con al menos 12 preguntas.
  • Numero medio de preguntas: Es la media aritmética del número de preguntas de cada sesión.

Al aplicar nuevamente el filtrado:

 Selección por criterios

y actualizando los datos del analizador se obtiene como resultado:

 Datos de las preguntas

Tiempos de realización

Interesa tambien saber a la hora de analizar los resultados de un test, el tiempo que ha tardado el alumno en realizar la prueba. Un tiempo por debajo de un cierto umbral indicará que el alumno no ha prestado la debida atención al test, y simplemente ha respondido al azar o ha dejado todas las preguntas en blanco. Igualmente, si el tiempo de respuesta ha sido excesivo, podría darse el caso de que el alumno hubiera realizado el ejercicio con la ayuda de apuntes o de otros medios devaluando los resultados. Dependiendo del test el profesor podrá establecer la duración mínima y máxima descartar sesiones que solo aportan ruido.

Siguiendo con el ejemplo anterior, Siette presenta los siguientes resultados:

  • Tiempo de realización mínimo y máximo.
  • Percentiles, Se basa en ordenar las sesiones en orden creciente de duración y dividirla en cuatro partes iguales, hallando el tiempo medio de realización para cada una de estas cuatro partes.
  • Media y desviación típica
  • Media en intervalo de confianza del 95%, es decir, el intervalo de duración del test que comprende al 95% de los alumnos.

 Datos de tiempo de realización

si se descartan las sesiones de duración menor de 5 min, y las de mas de 40 minutos, se obtienen estos nuevos datos sobre el tiempo de realización:

 Datos de tiempo de realización

Puntuaciones obtenidas

Es la puntuación observada, segun el criterio de evaluación del test y ajustada a la escala fijada en la asignatura. Cuando se utiliza el criterio de evaluación por puntos, la puntuación final puede estar por debajo de la puntuación mínima, al aplicarse las penalizaciones por respuestas incorrectas. Siette muestra los siguientes valores:

  • Puntuaciones máxima y mínima obtenidas por algún alumno.

Discretización

Cualquier test con un número finito de ítems siempre dará unos valores discretos. Por ejemplo un test con 10 ítems dicotómicos de evaluación porcentual solo podrá resultar en un once valores 0%, 10%, 20% hasta 100%. Sin embargo, cuando la evaluación de los ítems es mas fina o hay muchos ítems, la combinación de valores da lugar a números que se asimilan a un valor real.

En el caso de la teoría de respuesta al ítem, al utilizar curvas características contínuas se obtienen valores reales en el intervalo $[-\infty, +\infty]$, aunque en la práctica se considera el intervalo $[-3,+3]$.

Siette esta diseñado desde un principio para trabajar con un número relativamente pequeño de valores discretos, en los que se resumen las puntuaciones de los test. Estos intervalos equivalen constituyen un conjunto de clases ordenadas en las que se coloca a cada uno de los alumnos. De esta forma, la tarea de Siette consiste en “clasificar” a los alumnos dependiendo de sus resultados en el test, lo que da cabida al uso de diversas técnicas de clasificación basadas en Inteligencia Artificial, como las redes neuronales, los árboles de decisión o la clasificación bayesiana 1).

Esta clasificación facilita en cierta forma la toma de decisiones. Por ejemplo, podrían establecerse solo dos clases como resultado de un test “Suspenso” o “Aprobado”. Para muchas otras aplicaciones es conveniente incrementar el número de clases, aunque siguen siendo necesarias, por ejemplo si el resultado del test determina una acción tutorial, un refuerzo específico o una asignación a un grupo determinado 2)

En la sección Analizador, en la pestaña Frecuencias absolutas, se muestra la distribución del test discretizada según el número de niveles del test. Los valores del eje de abscisas corresponden a la “marca de clase” o valor medio del intervalo.

 Frecuencias absolutas

Debajo de este gráfico se muestran los valores de la distribución, es decir el número de alumnos que ha terminado el test en cada nivel de conocimiento.

 Valores numéricos de la dsitribución

En la pestaña Frecuencias relativas, se utiliza una discretización mucho más fina (50 valores), es decir mas parecida al caso contínuo. Sobre esta distribución se muestra también el ajuste de una función de Gauss (normal), lo que permite apreciar a simple vista si la distribución empírica se asemeja o no a la normal.

 Frecuencias relativas

Valores medios, cuartiles y desviaciones típicas

1)
Al fin y al cabo uno de los métodos mas empleados en la TRI es la inferencia bayesiana, que es el que implementa Siette
2)
por ejemplo para determinar el grupo en el que colocar a un alumno en una academia de idiomas según los resultados de un. test preliminar
es/manual/analisis/test/filtrado.1653475305.txt.gz · Última modificación: 2022/05/25 10:41 por root

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki