Fiabilidad y validez en la investigación

Medición de la fiabilidad y la validez en la investigación

La fiabilidad se refiere a la consistencia o fiabilidad de una técnica de medición, y tiene que ver con la consistencia o estabilidad de la puntuación obtenida de una medida o evaluación a lo largo del tiempo y en todos los entornos o condiciones. Si la medición es fiable, entonces hay menos posibilidades de que la puntuación obtenida se deba a factores aleatorios y a un error de medición.

Entonces, ¿cómo sabemos si un método o instrumento de medición es fiable?

En su forma más simple, la fiabilidad se refiere a la relación entre conjuntos de puntuaciones derivadas independientemente, como las puntuaciones de un instrumento de evaluación en dos ocasiones distintas. En consecuencia, la fiabilidad se expresa normalmente como una correlación coefﬁcient, que es un análisis estadístico que nos dice algo sobre la relación entre dos conjuntos de puntuaciones o variables. Existe una fiabilidad adecuada cuando la correlación coefﬁcient es de 0,80 o más.

Estrategias para aumentar la fiabilidad y minimizar el error de medición

Estas sugerencias deben considerarse durante la fase de diseño del estudio y deben centrarse en la reunión de datos y en las estrategias de medición utilizadas para medir las variables independientes y dependientes. En primer lugar, la administración del instrumento o la estrategia de medición debe estar normalizada; todas las mediciones deben realizarse de la manera más coherente posible. En otras palabras, la administración de las estrategias de medición debe ser coherente en todos los participantes que toman parte en el estudio. En segundo lugar, los investigadores deben asegurarse de que los participantes comprenden las instrucciones y el contenido del instrumento o la estrategia de medición. Si los participantes tienen difﬁculty que comprenden el propósito o las instrucciones de la medición, es posible que no respondan de manera precisa, lo que podría sesgar los datos. En tercer lugar, todo investigador que participe en la reunión de datos
debe ser entrenado a fondo en el uso de la estrategia de medición.

También debe haber amplias oportunidades de práctica antes de que comience el estudio y entrenamiento repetido durante el curso del mismo para mantener la consistencia. Por último, debe hacerse todo lo posible para asegurar que los datos se registren, compilen y analicen con precisión. La entrada de datos debe ser supervisada de cerca y se deben realizar auditorías de forma regular.

Evaluación de la fiabilidad

La fiabilidad y la validez de las investigaciones pueden determinarse por diversos métodos:

La fiabilidad de la prueba se refiere a la estabilidad de los resultados de la prueba a lo largo del tiempo e implica la repetición de la misma prueba al menos en otra ocasión. Por ejemplo, la administración de la misma medida de rendimiento académico en dos ocasiones distintas con seis meses de diferencia es un ejemplo de este tipo de fiabilidad. El intervalo de tiempo entre administraciones debe considerarse con esta forma de fiabilidad porque las correlaciones prueba-repetición tienden a disminuir a medida que aumenta el intervalo de tiempo.
La fiabilidad de la mitad dividida se refiere a la administración de una sola prueba que se divide en dos mitades iguales. Por ejemplo, una prueba de aptitud de 60 preguntas que pretende medir un aspecto del rendimiento académico podría dividirse en dos pruebas separadas pero iguales de 30 ítems cada una. Teóricamente, los ítems de ambas formas miden el mismo constructo. Este enfoque es mucho menos susceptible a los efectos del intervalo de tiempo porque todos los ítems se administran al mismo tiempo y luego se dividen en grupos de ítems separados.
La fiabilidad de la forma alternativa se expresa como la correlación entre diferentes formas de la misma medida en que los elementos de cada medida representan el mismo contenido y construcción de elementos. Este enfoque requiere dos formas diferentes del mismo instrumento, que luego se administran en momentos diferentes. Las dos formas deben abarcar un contenido idéntico y tener un nivel similar difﬁculty. Luego se correlacionan los resultados de las dos pruebas.
La fiabilidad entre los calificadores se utiliza para determinar el acuerdo entre los diferentes jueces o calificadores cuando observan o evalúan el rendimiento de otros. Por ejemplo, suponga que tiene dos evaluadores que evalúan el comportamiento de un niño, y que opera el «comportamiento de actuación» como el número de veces que el niño se niega a hacer sus tareas escolares en clase. La medida en que los evaluadores están de acuerdo en si el comportamiento se produce o cuando se produce reﬂects este tipo de fiabilidad.

Recuerde que el concepto de validez se refiere a lo que mide el test o la estrategia de medición y a lo bien que lo hace. En otras palabras, trata de responder a la siguiente pregunta: «¿Mide el instrumento o el enfoque de medición lo que se supone que debe medir?»

Tipos de validez en la investigación

Validez del contenido

La validez del contenido se refiere a la pertinencia del instrumento o de la estrategia de medición para el constructo que se está midiendo.

Validez del criterio

La validez del criterio se determina por la relación entre una medida y el rendimiento en un criterio o medida exterior. La validez de criterio concurrente se refiere a la relación entre las medidas tomadas al mismo tiempo. La validez de criterio predictivo se refiere a la relación entre medidas que se toman en momentos diferentes.

Construir la validez

La validez del constructo evalúa la medida en que la estrategia de prueba o medición mide un constructo o rasgo teórico. Hay una variedad de enfoques para determinar la validez del constructo, que se centran en la medida en que la medición de un determinado constructo converge o se desvía de la medición de constructos similares o diferentes.

Instrumentos y estrategias de medición disponibles en el mercado

Los investigadores disponen de un gran número de instrumentos de medición comercialmente disponibles, que son particularmente abundantes en las esferas de la investigación psicológica y educativa. Los investigadores deben tener cuidado de considerar una serie de factores al decidir si una prueba existente es apropiada para la reunión de datos en un estudio de investigación. La consideración de las propiedades psicométricas (fiabilidad y validez en la investigación) es siempre un paso esencial ﬁrst.

A continuación se presenta una lista no exhaustiva de otros factores que deben considerarse al evaluar una prueba: