Tillförlitlighet och konsistens i psykometri

När vi kallar någon eller något tillförlitligt menar vi att de är konsekventa och pålitliga. Tillförlitlighet är också en viktig del av ett bra psykologiskt test. Ett test skulle trots allt inte vara mycket värdefullt om det var inkonsekvent och producerade olika resultat varje gång. Hur definierar psykologer tillförlitlighet? Vilket inflytande har det på psykologisk provning?

Tillförlitlighet hänvisar till en åtgärds konsistens. Ett test anses pålitligt om vi upprepade gånger får samma resultat. Till exempel, om ett test är utformat för att mäta ett drag (som introversion ), ska resultaten ungefär lika är varje gång testet administreras till ett ämne. Tyvärr är det omöjligt att beräkna tillförlitligheten exakt, men det kan beräknas på ett antal olika sätt.

Test-Retest Pålitlighet

Test-retest pålitlighet är ett mått på konsekvensen av ett psykologiskt test eller bedömning. Denna typ av tillförlitlighet används för att bestämma konsekvensen av ett test över tiden. Test-retest pålitlighet används bäst för saker som är stabila över tiden, till exempel intelligens .

Test-retest driftsäkerhet mäts genom att administrera ett test två gånger vid två olika tidpunkter. Denna typ av tillförlitlighet förutsätter att det inte kommer att förändras i kvaliteten eller konstruktionen som mäts.

I de flesta fall blir tillförlitligheten högre när det inte har gått mycket tid mellan testen.

Test-retest-metoden är bara ett av de sätt som kan användas för att bestämma mätens tillförlitlighet. Andra tekniker som kan användas inkluderar inter-rater tillförlitlighet, intern konsistens och parallellformer tillförlitlighet.

Det är viktigt att notera att test-retest-tillförlitlighet endast avser testets konsistens, inte nödvändigtvis resultatet av giltigheten .

Inter-rater Reliability

Denna typ av tillförlitlighet bedöms genom att två eller flera oberoende domare presterar testet. Poängen jämförs sedan för att bestämma konsistensen hos raters uppskattningar.

Ett sätt att testa inter-rater tillförlitlighet är att ha varje rater tilldela varje testartikel ett poäng. Till exempel kan varje rater få poäng på en skala från 1 till 10. Därefter skulle du beräkna korrelationen mellan de två värdena för att bestämma nivån av inter-rater-tillförlitlighet.

Ett annat sätt att testa inter-rater tillförlitlighet är att få räknarna bestämma vilken kategori varje observation faller i och sedan beräkna procentandelen av överenskommelsen mellan ratarna. Så, om räknarna är överens 8 av 10 gånger, har testet en 80% inter-rater tillförlitlighet.

Parallell-Forms Tillförlitlighet

Tillförlitligheten i parallellformerna mätas genom att jämföra två olika test som skapades med samma innehåll. Detta uppnås genom att skapa en stor grupp testämnen som mäter samma kvalitet och sedan slumpmässigt dela in föremålen i två separata test. De två testen ska sedan administreras till samma ämnen samtidigt.

Intern konsistensförtroende

Denna form av tillförlitlighet används för att bedöma konsekvensen av resultat över objekt på samma test. I huvudsak jämför du testobjekt som mäter samma konstruktion för att bestämma testens interna konsistens. När du ser en fråga som verkar väldigt lik en annan testfråga, kan det tyda på att de två frågorna används för att mäta tillförlitligheten. Eftersom de två frågorna är likartade och utformade för att mäta samma sak, borde provtagaren svara på båda frågorna på samma sätt, vilket skulle indikera att testet har intern konsistens.

Faktorer som kan påverka tillförlitligheten

Det finns ett antal olika faktorer som kan påverka tillförlitligheten av en åtgärd.

Först och kanske självklart är det viktigt att den sak som mäts är ganska stabil och konsekvent. Om den uppmätta variabeln är något som ändras regelbundet, kommer resultaten av testet inte att vara konsekventa.

Aspekter av testläget kan också påverka tillförlitligheten. Till exempel, om testet administreras i ett extremt varmt rum, kan respondenterna distraheras och inte kunna fullborda testet så gott som möjligt. Detta kan påverka tillförlitligheten av åtgärden. Andra saker som trötthet, stress, sjukdom, motivation, dåliga instruktioner och miljödistraheringar kan också skada tillförlitligheten.

Tillförlitlighet vs Giltighet

Det är viktigt att notera att bara för att ett test har tillförlitlighet betyder det inte att det har giltighet. Giltighet avser huruvida ett test verkligen mäter vad det hävdar att mäta. Tänk på tillförlitlighet som ett mått på precision och validitet som ett mått på noggrannhet. I vissa fall kan ett test vara tillförlitligt men inte giltigt. Tänk dig att jobbsökande tar ett test för att avgöra om de har en viss personlighet . Även om testet kan ge konsekventa resultat, kan det faktiskt inte mäta egenskapen som den avser att mäta.