2.3.2.. Fiabilidad

La puntuación que un sujeto obtiene en un test está afectada por un error de medida, que se puede estimar a cierto nivel de confianza. Para ello, sirve el estudio de la fiabilidad. Si desconocemos la fiabilidad de un test, sabemos que su medida no es precisa, pero no sabemos la magnitud de su imprecisión. Por el contrario, si la conocemos, podemos averiguar en qué medida es impreciso y hasta qué punto podemos fiarnos de sus resultados.

La fiabilidad de un test puede abordarse desde dos puntos de vista: Por un lado podemos considerarla como la inexactitud de sus medidas. Cuando un sujeto responde a un test, obtiene una puntuación empírica que viene afectada por un error. Si no hubiera tal error, obtendría su auténtica puntuación verdadera. Pero en la práctica, la puntuación empírica no coincide con la verdadera. El test será tanto más impreciso cuanto mayor sea esta diferencia, y es lo que se llama "error muestral" (Diferencia entre un estadístico y su parámetro correspondiente) en estadística. Nosotros lo llamaremos el "error de medida" de nuestro test. A la desviación típica de estos errores de medida la llamamos "error típico de medida". Nos indica la precisión absoluta del test, porque permite estimar la diferencia entre la medida obtenida y la que se obtendría si no hubiera ningún error.

La otra forma de abordar el problema de la fiabilidad consiste en referirla a la estabilidad de las medidas que proporciona. El test será tanto más fiable cuanto más constantes o estables se mantengan sus resultados en dos ocasiones, más alta será la correlación entre ellos. Esta correlación es lo que se llama coeficiente de fiabilidad, y expresa directamente no la cuantía del error, sino la coherencia del test consigo mismo y la relativa constancia de la información que proporciona. Digamos que expresa la fiabilidad relativa del test.
.
Analizaremos el test de detección de biendotados desde ambas perspectivas, aunque ambas son en el fondo, una misma cosa, a mayor error, menor correlación y viceversa. Un test no tiene, en rigor, un coeficiente de fiabilidad, tiene muchos. Tanto como las muestras distintas en que se calcule. Depende de la homogeneidad del grupo en el rango que mide el test. Cuanto más homogéneo sea el grupo menor será el coeficiente. Esto es evidente: si los sujetos varían mucho en el test, es difícil que al repetirlo, se altere su ordenación, pues son muy distintos entre sí, mientras que si varían poco, es fácil que, al repetirlo, se altere esta ordenación. En el primer caso, la correlación entre las dos aplicaciones (el coeficiente de fiabilidad será alta). En el segundo, será más baja. Sin embargo, el error típico de medida no varía. Este error afecta a la puntuación de un sujeto, depende de la precisión intrínseca del test, y no se altera porque consideremos la puntuación del sujeto incluida en uno u otro grupo.

Para interpretar el valor e importancia del coeficiente de fiabilidad de un test, es, pues, necesario tener en cuenta la variabilidad del grupo en que se ha sido hallado. Lo decisivo para interpretar la precisión del test, en un grupo determinado, es comparar la desviación típica del grupo en el test con el error típico de medida. Si la desviación típica es considerablemente mayor que el error típico, poseemos una garantía fuerte de la precisión del test. En cambio, si la desviación típica del grupo es del mismo orden de magnitud que el error típico, los errores serán de tan grandes respecto a la variabilidad de las puntuaciones, que se corre el riesgo de que gran parte de las diferencias individuales que se aprecian con el test se deban únicamente a errores de medida.

Estas consideraciones no han sido tomadas en cuenta por algunas investigaciones sobre niños biendotados, con lo que los resultados por ellas ofrecidos son ciertamente muy discutibles. Así, por ejemplo, sería metodológicamente incorrecto (queremos insistir sobre ello), detectar mediante el test de detección de biendotados cierto número de sujetos bien dotados y a continuación, buscar la correlación de esa muestra así seleccionada, con un criterio externo, tal como sus correlaciones con las calificaciones en un test de creatividad. Los sujetos seleccionados tendrían una desviación típica poco mayor que el error típico mismo, con lo que su correlación con cualquier medida de la creatividad resultaría muy rebajada, falsamente baja. Por ello, en estos casos, el test de detección de biendotados no debe ser empleado. En todo caso, antes de hacerlo, es aconsejable mejorar su fiabilidad y reducir su error típico de medida.

En el apartado correspondiente expondremos la técnica que hemos empleado para realizar los cálculos de la fiabilidad y por qué motivos.

 
retroceder avanzar