Herramientas de usuario

Herramientas del sitio


es:manual:analisis:test:fiabilidad

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Próxima revisión
Revisión previa
es:manual:analisis:test:fiabilidad [2022/05/21 08:43] – creado rootes:manual:analisis:test:fiabilidad [2022/05/28 20:07] (actual) – [Alfa de Cronbach] root
Línea 1: Línea 1:
-==== Fiabilidad ====+===== Fiabilidad =====
  
 El concepto de fiabilidad informalmente equivale al concepto de precisión de la medida. Un test será mas fiable cuando el error de la madida sea menor, es decir, cuando la medida que da sea lo mas cercana posible a la medida real. Sin embargo, a diferencia de la validez que es dificil de medir y cuantificar dentro de la teória clasica de los test (TCT) se han desarrollado definiciones matemáticas precisas de este concepto. Así pues, cuando se habla de //fiabilidad de un test// no nos referimos a algo abstracto o a la precisión en sentido general, sino a un valor estadístico que se puede definirse formalmente. El concepto de fiabilidad informalmente equivale al concepto de precisión de la medida. Un test será mas fiable cuando el error de la madida sea menor, es decir, cuando la medida que da sea lo mas cercana posible a la medida real. Sin embargo, a diferencia de la validez que es dificil de medir y cuantificar dentro de la teória clasica de los test (TCT) se han desarrollado definiciones matemáticas precisas de este concepto. Así pues, cuando se habla de //fiabilidad de un test// no nos referimos a algo abstracto o a la precisión en sentido general, sino a un valor estadístico que se puede definirse formalmente.
  
-La TCT se basa en el supuesto de que el nivel real de conocimiento de un alumno $V$ puede medirse mediante un número real (vease la introducción sobre modelos del conocimiento)$X$ obtenido por ejemplo como porcentaje de preguntas acertadas, pero que por efecto del azar y otros factores desconocidos ambos valores no coinciden, ya que hay siempre un cierto error $E$ en la medida, es decir:  $$V = X+E$$ +En la TCT, el coeficiente de fiabilidad se define como el cuadrado del coeficiente de correlación entre la puntuación verdadera y la observada. Aplicando la definición de correlación, con la hipotesis de que los errores son aleatorios e insesgados, en este caso resulta ser proporcional a la relación entre las varianzas del error y la puntuación observada. A mayor error, menor fiabilidad.
-El modelo asume que los errores $E$ son aleatorios, que el valor medio de la suma de los errores tiende a ser 0, y que no se correlaciona ni con el valor real de conocimiento, ni con el error en otros test lo que implica que las medias son insesgadas: $$E(X) = E(V) + E(E); E(E) = \mu_X = \mu_V$$ y que el cálculo de las varianzas puede simplificarse $$\sigma_{X}^{2} = \sigma_{V}^{2} + \sigma_{E}^{2} + 2\sigma_{EV}^{2} = \sigma_{V}^{2} + \sigma_{E}^{2}$$ $$\sigma_{XV}^{2} = E((V*E)V) + E(V+E)E(V) = \sigma_{V}^{2}$$ +
- +
-El coeficiente de fiabilidad $\rho$ se define como el cuadrado del coeficiente de correlación entre la puntuación verdadera y la observada. Aplicando la definición de correlación, con la hipotesis de que los errores son aleatorios e insesgados, en este caso resulta ser proporcional a la relación entre las varianzas del error y la puntuación observada. A mayor error, menor fiabilidad.+
  
 $$\rho_{XV}^2=\frac{\sigma_{XV}^2}{\sigma_X^2\sigma_V^2}=\frac{(\sigma_V^2)^2}{\sigma_X^2\sigma_V^2}=\frac{\sigma_V^2}{\sigma_X^2}=\frac{\sigma_X^2-\sigma_E^2}{\sigma_X^2}= 1-\frac{\sigma_E^2}{\sigma_X^2}$$ $$\rho_{XV}^2=\frac{\sigma_{XV}^2}{\sigma_X^2\sigma_V^2}=\frac{(\sigma_V^2)^2}{\sigma_X^2\sigma_V^2}=\frac{\sigma_V^2}{\sigma_X^2}=\frac{\sigma_X^2-\sigma_E^2}{\sigma_X^2}= 1-\frac{\sigma_E^2}{\sigma_X^2}$$
Línea 12: Línea 9:
 Sin embargo, como las puntuaciones verdaderas no se conocen, ni los errores tampoco, este coeficiente de correlación no puede hallarse directamente por lo que se recurre a estimaciones basadas en distintos supuestos. Sin embargo, como las puntuaciones verdaderas no se conocen, ni los errores tampoco, este coeficiente de correlación no puede hallarse directamente por lo que se recurre a estimaciones basadas en distintos supuestos.
  
-=== Test paralelos ===+==== Test paralelos ====
 Consiste en hacer dos test con preguntas equivalentes, las puntuaciones verdaderas deben ser las mismas, pero las puntuaciones observadas pueden diferir por causa del error.  Consiste en hacer dos test con preguntas equivalentes, las puntuaciones verdaderas deben ser las mismas, pero las puntuaciones observadas pueden diferir por causa del error. 
  
Línea 30: Línea 27:
  
  
-=== $\lambda_4$ de Gutman ===+==== $\lambda_4$ de Gutman ====
  
 En el caso en que se planteen dos test diferentes a un mismo alumno, en el caso hipotético de que los dos test fueran perfectamente paralelos, el coeficiente de correlación entre ambos sería exactamente la fiabilidad, ya que las discrepancias solo serían debidas a los errores aleatorios. En el caso en que se planteen dos test diferentes a un mismo alumno, en el caso hipotético de que los dos test fueran perfectamente paralelos, el coeficiente de correlación entre ambos sería exactamente la fiabilidad, ya que las discrepancias solo serían debidas a los errores aleatorios.
Línea 46: Línea 43:
  
  
-=== Fórmula de Spearman-Brown ===+==== Fórmula de Spearman-Brown ====
  
 En general, la fiabilidad de un test aumenta al aumentar el número de preguntas que lo componen. Suponiendo que los test sean realmente paralelos, combinando dos test la fiabilidad aumenta según la conocida como fórmula de Spearman-Brown: $$\rho_{XX'}=\frac{2\rho_{12}}{1+\rho_{12}}$$ En general, la fiabilidad de un test aumenta al aumentar el número de preguntas que lo componen. Suponiendo que los test sean realmente paralelos, combinando dos test la fiabilidad aumenta según la conocida como fórmula de Spearman-Brown: $$\rho_{XX'}=\frac{2\rho_{12}}{1+\rho_{12}}$$
Línea 53: Línea 50:
 En la práctica aumentar el número de preguntas aumenta la fiabilidad, pero hasta un cierto punto, pero en el mejor de los casos el aumento no es ni mucho menos lineal. En la práctica aumentar el número de preguntas aumenta la fiabilidad, pero hasta un cierto punto, pero en el mejor de los casos el aumento no es ni mucho menos lineal.
  
-=== Fórmula de Kuder-Richardson (KR-20) ===+==== Fórmula de Kuder-Richardson (KR-20) ====
  
 Un valor propuesto para medir la fiabilidad de un test se calcula mediante la fórmula:  Un valor propuesto para medir la fiabilidad de un test se calcula mediante la fórmula: 
Línea 62: Línea 59:
 en donde, $K$ es el número de ítems; $p_i$ es la proporción de aciertos del ítem $i$-esimo, y $q_i$ la proporción de fallos $(p_i + q_i  = 1)$ y $\sigma_X^2$ es la varianza de las puntuaciones del test. en donde, $K$ es el número de ítems; $p_i$ es la proporción de aciertos del ítem $i$-esimo, y $q_i$ la proporción de fallos $(p_i + q_i  = 1)$ y $\sigma_X^2$ es la varianza de las puntuaciones del test.
  
-=== Alfa de Cronbach ===+==== Alfa de Cronbach ====
  
 Es otro indicador de la coherencia interna de un test. Suponiendo que la puntuación $X$ de un test depende de las puntuaciones obtenidas en $K$ items $X = Y_1 + Y_2 + ... + Y_K$, se define el valor estadístico $\alpha_{raw}$ como: Es otro indicador de la coherencia interna de un test. Suponiendo que la puntuación $X$ de un test depende de las puntuaciones obtenidas en $K$ items $X = Y_1 + Y_2 + ... + Y_K$, se define el valor estadístico $\alpha_{raw}$ como:
Línea 71: Línea 68:
 en donde  $\sigma_X^2$ es la varianza de las puntuaciones del test y  $\sigma_{Y_i}^2$ la varianza de los resultados del ítem $i$-esimo. en donde  $\sigma_X^2$ es la varianza de las puntuaciones del test y  $\sigma_{Y_i}^2$ la varianza de los resultados del ítem $i$-esimo.
  
-En el caso de variables dicotómicas (verdadero/falso), esta fórmula coincide con la de Kuder-Richardson. Alternativamente est valor puede calcularse mediante la formula:+En el caso de variables dicotómicas (verdadero/falso), esta fórmula coincide con la de Kuder-Richardson. Alternativamente este valor puede calcularse mediante la formula:
 $$\alpha_{raw}=\frac{K\bar{c}}{\bar{\nu}+(K-1)\bar{c}}$$ en donde $\bar\nu$ es la media de la varianza de cada item y $\bar{c}$ es la media de la covarianza entre cada dos ítems.  $$\alpha_{raw}=\frac{K\bar{c}}{\bar{\nu}+(K-1)\bar{c}}$$ en donde $\bar\nu$ es la media de la varianza de cada item y $\bar{c}$ es la media de la covarianza entre cada dos ítems. 
  
 Alternativamente se define el $\alpha$ de Cronbach estandar en función de la media de los $K(K-1)/2$ coeficientes de correlación $\bar{r}$, entre las respuestas a cada dos ítems. Alternativamente se define el $\alpha$ de Cronbach estandar en función de la media de los $K(K-1)/2$ coeficientes de correlación $\bar{r}$, entre las respuestas a cada dos ítems.
 $$\alpha_{standard}=\frac{K\bar{r}}{1+(K-1)\bar{r}}$$ es decir de la media de los coeficientes de correlación no repetidos (el triangulo inferior de la matriz de correlaciones). $$\alpha_{standard}=\frac{K\bar{r}}{1+(K-1)\bar{r}}$$ es decir de la media de los coeficientes de correlación no repetidos (el triangulo inferior de la matriz de correlaciones).
- 
-El coeficiente $\alpha$ de Cronbach mide la coherencia interna de un test y teóricamente toma valores entre -1 y +1, aunque en la práctica nunca da valores negativos. Como referencia suelen usarse estos valores para interpretar los resultados: 
- 
-^ $\alpha$ de Cronbach ^ Consistencia interna ^ 
-| 0.9 $\leq$ $\alpha$ | Excelente | 
-| 0.7 $\leq$ $\alpha$ < 0.9 | Buena | 
-| 0.6 $\leq$ $\alpha$ < 0.7 | Aceptable | 
-| 0.5 $\leq$ $\alpha$ < 0.6 | Pobre | 
-| $\alpha$ < 0.5 | Inaceptable | 
  
  
es/manual/analisis/test/fiabilidad.1653122605.txt.gz · Última modificación: 2022/05/21 08:43 por root

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki