Misurare l’affidabilità e la validità nella ricerca

L’affidabilità si riferisce alla coerenza o all’affidabilità di una tecnica di misurazione, e riguarda la coerenza o la stabilità del punteggio ottenuto da una misurazione o valutazione nel tempo e attraverso le impostazioni o le condizioni. Se la misurazione è affidabile, allora ci sono meno possibilità che il punteggio ottenuto sia dovuto a fattori casuali ed errori di misurazione.

Quindi come facciamo a sapere se un metodo di misurazione o uno strumento è affidabile?

Nella sua forma più semplice, l’affidabilità si riferisce alla relazione tra serie di punteggi derivati in modo indipendente, come i punteggi su uno strumento di valutazione in due occasioni separate. Di conseguenza, l’affidabilità è solitamente espressa come coefficiente di correlazione, che è un’analisi statistica che ci dice qualcosa sulla relazione tra due serie di punteggi o variabili. Un’affidabilità adeguata esiste quando il coefficiente di correlazione è 0,80 o più.

Strategie per aumentare l’affidabilità e minimizzare l’errore di misurazione

Questi suggerimenti dovrebbero essere considerati durante la fase di progettazione dello studio e dovrebbero concentrarsi sulla raccolta dei dati e sulle strategie di misurazione utilizzate per misurare le variabili indipendenti e dipendenti. In primo luogo, la somministrazione dello strumento o la strategia di misurazione dovrebbe essere standardizzata; tutte le misurazioni dovrebbero essere condotte nel modo più coerente possibile. In altre parole, la somministrazione delle strategie di misurazione dovrebbe essere coerente per tutti i partecipanti che prendono parte allo studio. In secondo luogo, i ricercatori devono assicurarsi che i partecipanti comprendano le istruzioni e il contenuto dello strumento o della strategia di misurazione. Se i partecipanti hanno difficoltà a capire lo scopo o le istruzioni della misurazione, potrebbero non rispondere accuratamente, il che potrebbe falsare i dati. In terzo luogo, ogni ricercatore coinvolto nella raccolta dei dati
dovrebbe essere accuratamente addestrato all’uso della strategia di misurazione.

Ci dovrebbe essere anche un’ampia opportunità di fare pratica prima dell’inizio dello studio e un allenamento ripetuto durante il corso dello studio per mantenere la coerenza. Infine, ogni sforzo dovrebbe essere fatto per garantire che i dati siano accuratamente registrati, compilati e analizzati. L’inserimento dei dati dovrebbe essere strettamente monitorato e gli audit dovrebbero essere condotti su base regolare.

Valutazione dell’affidabilità

L’affidabilità e la validità della ricerca possono essere determinate con vari metodi:

  1. L’affidabilità del test si riferisce alla stabilità dei risultati del test nel tempo e implica la ripetizione dello stesso test in almeno un’altra occasione. Per esempio, somministrare la stessa misura del rendimento accademico in due occasioni separate a sei mesi di distanza è un esempio di questo tipo di affidabilità. L’intervallo di tempo tra le somministrazioni dovrebbe essere considerato con questa forma di affidabilità perché le correlazioni test-retest tendono a diminuire all’aumentare dell’intervallo di tempo.
  2. L’affidabilità split-half si riferisce alla somministrazione di un singolo test che è diviso in due metà uguali. Per esempio, un test attitudinale di 60 domande destinato a misurare un aspetto della performance accademica potrebbe essere diviso in due test separati ma uguali di 30 item ciascuno. Teoricamente, gli item in entrambe le forme misurano lo stesso costrutto. Questo approccio è molto meno suscettibile agli effetti dell’intervallo di tempo perché tutti gli item sono somministrati allo stesso tempo e poi divisi in gruppi di item separati.
  3. L’affidabilità della forma alternativa è espressa come la correlazione tra diverse forme della stessa misura in cui gli item di ogni misura rappresentano lo stesso contenuto e costrutto di item. Questo approccio richiede due forme diverse dello stesso strumento, che vengono poi somministrate in momenti diversi. I due moduli devono coprire un contenuto identico e avere un livello di difficoltà simile. I risultati dei due test sono poi correlati.
  4. L’affidabilità inter-rater è usata per determinare l’accordo tra diversi giudici o raters quando osservano o valutano la performance di altri. Per esempio, supponiamo di avere due valutatori che valutano il comportamento di un bambino, e si operazionalizza il “comportamento di performance” come il numero di volte che il bambino si rifiuta di fare i compiti in classe. La misura in cui i valutatori sono d’accordo su se o quando il comportamento si verifica riflette questo tipo di affidabilità.

Ricordate, il concetto di validità si riferisce a ciò che il test o la strategia di misurazione misura e quanto bene lo fa. In altre parole, cerca di rispondere alla seguente domanda: “Lo strumento o l’approccio di misurazione misura ciò che dovrebbe misurare?”

Tipi di validità nella ricerca

Validità del contenuto

La validità del contenuto si riferisce alla pertinenza dello strumento o della strategia di misurazione al costrutto misurato.

Validità del criterio

La validità del criterio è determinata dalla relazione tra una misura e la performance su un criterio o una misura esterna. La validità del criterio concorrente si riferisce alla relazione tra le misure prese allo stesso tempo. La validità del criterio predittivo si riferisce alla relazione tra le misure prese in tempi diversi.

Validità del costrutto

La validità costruttiva valuta la misura in cui il test o la strategia di misurazione misura un costrutto teorico o un tratto. Ci sono una varietà di approcci per determinare la validità del costrutto, che si concentrano sulla misura in cui la misurazione di un dato costrutto converge o si discosta dalla misurazione di costrutti simili o diversi.

Strumenti e strategie di misurazione disponibili in commercio

I ricercatori hanno un gran numero di strumenti di misurazione disponibili in commercio, che sono particolarmente abbondanti nelle aree della ricerca psicologica ed educativa. I ricercatori dovrebbero fare attenzione a considerare una serie di fattori quando decidono se un test esistente è appropriato per la raccolta di dati in uno studio di ricerca. La considerazione delle proprietà psicometriche (affidabilità e validità nella ricerca) è sempre un primo passo essenziale.

La seguente è una lista non esaustiva di altri fattori da considerare quando si valuta un test:

  • Affidabilità
  • Validità
  • Costo
  • Tempo necessario per amministrare
  • Livello di lettura
  • Durata del test
  • Solidità teorica
  • Standard
  • Procedura di somministrazione standardizzata
  • Un manuale ben documentato