2.3.2..
Fiabilidad
La puntuación que un sujeto obtiene en un test está afectada por
un error de medida, que se puede estimar a cierto nivel de confianza.
Para ello, sirve el estudio de la fiabilidad.
Si desconocemos la fiabilidad de un test, sabemos que su medida
no es precisa, pero no sabemos la magnitud de su imprecisión. Por
el contrario, si la conocemos, podemos averiguar en qué medida es
impreciso y hasta qué punto podemos fiarnos de sus resultados.
La fiabilidad de un test puede abordarse desde dos puntos de vista:
Por un lado podemos considerarla como la inexactitud de sus medidas.
Cuando un sujeto responde a un test, obtiene una puntuación empírica
que viene afectada por un error. Si no hubiera tal error, obtendría
su auténtica puntuación verdadera. Pero en la práctica, la puntuación
empírica no coincide con la verdadera. El test será tanto más impreciso
cuanto mayor sea esta diferencia, y es lo que se llama "error muestral"
(Diferencia entre un estadístico y su parámetro correspondiente)
en estadística. Nosotros lo llamaremos el "error de medida" de nuestro
test. A la desviación típica de estos errores de medida la llamamos
"error típico de medida". Nos indica la precisión absoluta del test,
porque permite estimar la diferencia entre la medida obtenida y
la que se obtendría si no hubiera ningún error.
La otra forma de abordar el problema de la fiabilidad consiste en
referirla a la estabilidad de las medidas que proporciona. El test
será tanto más fiable cuanto más constantes o estables se mantengan
sus resultados en dos ocasiones, más alta será la correlación entre
ellos.
Esta correlación es lo que se llama coeficiente de fiabilidad, y
expresa directamente no la cuantía del error, sino la coherencia
del test consigo mismo y la relativa constancia de la información
que proporciona. Digamos que expresa la fiabilidad relativa del
test.
.
Analizaremos el test de detección de biendotados desde ambas perspectivas,
aunque ambas son en el fondo, una misma cosa, a mayor error, menor
correlación y viceversa.
Un test no tiene, en rigor, un coeficiente de fiabilidad, tiene
muchos. Tanto como las muestras distintas en que se calcule. Depende
de la homogeneidad del grupo en el rango que mide el test. Cuanto
más homogéneo sea el grupo menor será el coeficiente.
Esto es evidente: si los sujetos varían mucho en el test, es difícil
que al repetirlo, se altere su ordenación, pues son muy distintos
entre sí, mientras que si varían poco, es fácil que, al repetirlo,
se altere esta ordenación. En el primer caso, la correlación entre
las dos aplicaciones (el coeficiente de fiabilidad será alta).
En el segundo, será más baja.
Sin embargo, el error típico de medida no varía. Este error afecta
a la puntuación de un sujeto, depende de la precisión intrínseca
del test, y no se altera porque consideremos la puntuación del sujeto
incluida en uno u otro grupo.
Para interpretar el valor e importancia del coeficiente de fiabilidad
de un test, es, pues, necesario tener en cuenta la variabilidad
del grupo en que se ha sido hallado. Lo decisivo para interpretar
la precisión del test, en un grupo determinado, es comparar la desviación
típica del grupo en el test con el error típico de medida. Si la
desviación típica es considerablemente mayor que el error típico,
poseemos una garantía fuerte de la precisión del test. En cambio,
si la desviación típica del grupo es del mismo orden de magnitud
que el error típico, los errores serán de tan grandes respecto a
la variabilidad de las puntuaciones, que se corre el riesgo de que
gran parte de las diferencias individuales que se aprecian con el
test se deban únicamente a errores de medida.
Estas consideraciones no han sido tomadas en cuenta por algunas
investigaciones sobre niños biendotados, con lo que los resultados
por ellas ofrecidos son ciertamente muy discutibles.
Así, por ejemplo, sería metodológicamente incorrecto (queremos insistir
sobre ello), detectar mediante el test de detección de biendotados
cierto número de sujetos bien dotados y a continuación, buscar la
correlación de esa muestra así seleccionada, con un criterio externo,
tal como sus correlaciones con las calificaciones en un test de
creatividad. Los sujetos seleccionados tendrían una desviación típica
poco mayor que el error típico mismo, con lo que su correlación
con cualquier medida de la creatividad resultaría muy rebajada,
falsamente baja.
Por ello, en estos casos, el test de detección de biendotados no
debe ser empleado. En todo caso, antes de hacerlo, es aconsejable
mejorar su fiabilidad y reducir su error típico de medida.
En el apartado correspondiente expondremos la técnica que hemos
empleado para realizar los cálculos de la fiabilidad y por qué motivos.
|