Herramientas de usuario

Herramientas del sitio


es:manual:analisis:test:filtrado

¡Esta es una revisión vieja del documento!


Selección y filtrado de datos

Siette es un sistema de evaluación de abierto, con distintas posibilidades de acceso según el propósito de la evaluación. No es lo mismo una evaluación sumativa, con un acceso restringido y realizado en un entorno controlado, que una evaluación formativa en la que el acceso al test queda al libre albedrío del usuario.

El análisis de los resultados permite al profesor conocer cual es el conocimiento de los alumnos y como se comportan las preguntas que se han planteado, pero para ello, especialmente en los casos en los que el acceso al test no esta completamente controlado es necesario realizar previamente un proceso de filtrado o selección del conjunto de dato que se consideran válidos o representativos de la evaluación, especialmente si estos on los datos de partida para la calibración del sistema o para tomar decisiones acerca de la dificultad o relevancia de las preguntas que lo componen.

A partir de los datos estadísticos obtenidos Siette permite establecer criterios para seleccionar o filtrar las sesiones de test realizadas. Para realizar esta selección o filtrado debe accederse a la pestaña Sesiones y a continuación a la subpestaña “Selección por criterios”. En esta página hay dos operaciones diferentes: (1) Selección de sesiones; y (2) Filtrado.

Selección de sesiones

Operaciones sobre la selección

Filtrado de sesiones

Ejemplo

El filtrado de datos es un proceso iterativo. A continuación se propone un ejemplo de este proceso a partir de los resultados de un test de practicas realizado a lo largo de varios años de la asignatura Procesadores de Lenguajes

El primer paso es comprobar los datos de las sesiones

 Datos de las sesiones

En este ejemplo se muestra un test del cual se han realizado 343 sesiones, aunque en realidad solo se han completado 283. Hay 16 sesiones completamente vacías, y solo hay 219 usuarios diferentes que han hecho el test.

A la vista de estos datos, para realizar el análisis se podría optar por filtrar los datos para quedarse solo con las sesiones completas realizadas por alumnos diferentes, escogiendo por ejemplo la primera sesión de cada alumno. Para realizar este filtrado hay que acceder a la pestaña Sesiones y seleccionar la subpestaña Selección por criterios. En este caso se seleccionan las sesiones:

 Selección por criterios

En este punto hay dos opciones:

  1. Seleccionar directamente las sesiones que cumplan estos criterios.
  2. Seleccionar las sesiones que NO cumplan estos criterios (invirtiendo la selección) y ocultarlas del listado de sesiones o borrarlas definitivamente. Ocultarlas tiene la ventaja de que las sesiones permanecen en la base de datos y que si se quiere se podrían volver a recuperar deshaciendo la selección. Borrar las sesiones implica que se descartan para siempre, pero tiene la ventaja de que se facilita el análisis.

La imagen anterior muestra los resultados de este criterio de filtrado. Se obtienen 283 sesiones al seleccionar solo las sesiones completas, y 223 al seleccionar solo la primera sesión de cada alumno. Se indica que la selección debe cumplir TODOS los criterios, por lo que finalmente resultan solo 183 sesiones seleccionadas. Al invertir la selección y pulsar el botón ocultar, el resto de sesiones que no cumplen estos criterios se eliminan de temporalmente del listado de sesiones.

Los criterios de filtrado se guardan en la base de datos de Siette, de manera que se mantengan al conectar nuevamente. No solo eso, sino que si se realizan nuevas sesiones del test, se aplicarán los criterios de filtrado a las nuevas sesiones y no se mostrarán en los listados si no los cumplen.

Una vez filtradas las sesiones, por ejemplo ocultándolas, si se vuelve a la pestaña Analizador y se recargan los datos se mostrará como ha quedan estos valores:

 Datos de las sesiones

Según esto, y tras actualizar los datos del analizador, se ha conseguido filtrar las sesiones y quedan 183 primeras sesiones todas ellas completas. El resto de los datos tambien hará referencia a este conjunto de sesiones.

A continuación se analizan los datos relativos a las preguntas. En concreto, y siguiendo con el ejemplo anterior:

 Datos de las preguntas

Merece la pena fijarse en el intervalo del número de preguntas para saber si realmente las sesiones que se están analizando son las que se quiere. En el ejemplo anterior se indica que hay sesiones completadas con tan solo 6 preguntas. Esto pude deberse a algún tipo de problema durante la ejecución del test, por ejemplo, que se hubiera alcanzado el tiempo máximo, o que el profesor por alguna razón cerrara la sesión. Conviene quizás incluir un nuevo criterio de filtrado que solo seleccione sesiones con al menos 12 preguntas.

Al aplicar nuevamente el filtrado:

 Selección por criterios

y actualizando los datos del analizador se obtiene como resultado:

 Datos de las preguntas

Tiempos de realización

Interesa tambien saber a la hora de analizar los resultados de un test, el tiempo que ha tardado el alumno en realizar la prueba. Un tiempo por debajo de un cierto umbral indicará que el alumno no ha prestado la debida atención al test, y simplemente ha respondido al azar o ha dejado todas las preguntas en blanco. Igualmente, si el tiempo de respuesta ha sido excesivo, podría darse el caso de que el alumno hubiera realizado el ejercicio con la ayuda de apuntes o de otros medios devaluando los resultados. Dependiendo del test el profesor podrá establecer la duración mínima y máxima descartar sesiones que solo aportan ruido.

Siguiendo con el ejemplo anterior, Siette presenta los siguientes resultados:

  • Tiempo de realización mínimo y máximo.
  • Percentiles, Se basa en ordenar las sesiones en orden creciente de duración y dividirla en cuatro partes iguales, hallando el tiempo medio de realización para cada una de estas cuatro partes.
  • Media y desviación típica
  • Media en intervalo de confianza del 95%, es decir, el intervalo de duración del test que comprende al 95% de los alumnos.

 Datos de tiempo de realización

si se descartan las sesiones de duración menor de 5 min, y las de mas de 40 minutos, se obtienen estos nuevos datos sobre el tiempo de realización:

 Datos de tiempo de realización

Puntuaciones obtenidas

Es la puntuación observada, segun el criterio de evaluación del test y ajustada a la escala fijada en la asignatura. Cuando se utiliza el criterio de evaluación por puntos, la puntuación final puede estar por debajo de la puntuación mínima, al aplicarse las penalizaciones por respuestas incorrectas. Siette muestra los siguientes valores:

  • Puntuaciones máxima y mínima obtenidas por algún alumno.

Discretización

Cualquier test con un número finito de ítems siempre dará unos valores discretos. Por ejemplo un test con 10 ítems dicotómicos de evaluación porcentual solo podrá resultar en un once valores 0%, 10%, 20% hasta 100%. Sin embargo, cuando la evaluación de los ítems es mas fina o hay muchos ítems, la combinación de valores da lugar a números que se asimilan a un valor real.

En el caso de la teoría de respuesta al ítem, al utilizar curvas características contínuas se obtienen valores reales en el intervalo $[-\infty, +\infty]$, aunque en la práctica se considera el intervalo $[-3,+3]$.

Siette esta diseñado desde un principio para trabajar con un número relativamente pequeño de valores discretos, en los que se resumen las puntuaciones de los test. Estos intervalos equivalen constituyen un conjunto de clases ordenadas en las que se coloca a cada uno de los alumnos. De esta forma, la tarea de Siette consiste en “clasificar” a los alumnos dependiendo de sus resultados en el test, lo que da cabida al uso de diversas técnicas de clasificación basadas en Inteligencia Artificial, como las redes neuronales, los árboles de decisión o la clasificación bayesiana 1).

Esta clasificación facilita en cierta forma la toma de decisiones. Por ejemplo, podrían establecerse solo dos clases como resultado de un test “Suspenso” o “Aprobado”. Para muchas otras aplicaciones es conveniente incrementar el número de clases, aunque siguen siendo necesarias, por ejemplo si el resultado del test determina una acción tutorial, un refuerzo específico o una asignación a un grupo determinado 2)

En la sección Analizador, en la pestaña Frecuencias absolutas, se muestra la distribución del test discretizada según el número de niveles del test. Los valores del eje de abscisas corresponden a la “marca de clase” o valor medio del intervalo.

 Frecuencias absolutas

Debajo de este gráfico se muestran los valores de la distribución, es decir el número de alumnos que ha terminado el test en cada nivel de conocimiento.

 Valores numéricos de la dsitribución

En la pestaña Frecuencias relativas, se utiliza una discretización mucho más fina (50 valores), es decir mas parecida al caso contínuo. Sobre esta distribución se muestra también el ajuste de una función de Gauss (normal), lo que permite apreciar a simple vista si la distribución empírica se asemeja o no a la normal.

 Frecuencias relativas

Valores medios, cuartiles y desviaciones típicas

1)
Al fin y al cabo uno de los métodos mas empleados en la TRI es la inferencia bayesiana, que es el que implementa Siette
2)
por ejemplo para determinar el grupo en el que colocar a un alumno en una academia de idiomas según los resultados de un. test preliminar
es/manual/analisis/test/filtrado.1653476308.txt.gz · Última modificación: 2022/05/25 10:58 por root

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki