Psychometria1.pdf

(133 KB) Pobierz
PSYCHOMERTIA – WYKŁADY
WY 1 – 6.10.2010
Testy psychologiczne
Testy psychologiczne są narzędziami – musimy pamiętać o tym podstawowym fakcie jeśli
chcemy rzeczywiście odnosić korzyści z ich stosowania. Każde narzędzie może być pożyteczne lub
szkodliwe, w zależności od tego jak się go używa.
Musimy wiedzieć jak oceniać testy:
w jakim stopniu test nadaje się do tego celu w jakim ma być zastosowany;
jakiego rodzaju informacji może dostarczyć o danej osobie;
jak można jego rezultaty zintegrować z innymi danymi, by mieć podstawy do podjęcia
właściwej decyzji.
Kiedy mówi się o pomiarze psychologicznym nie wystarczy określenie badanego
konstruktu. Właściwe zinterpretowanie wyniku testu wymaga:
1. Znajomości teorii, na gruncie której został zdefiniowany. Ten sam wynik uzyskany za
pomocą różnych narzędzi ma zupełnie inne znaczenie psychologiczne.
2. Świadomości, że oparty jest na ograniczonej próbce zachowań, tych najbardziej
adekwatnych do badanej cechy.
3. Wiedzy, że wyniki pomiaru psychologicznego są zawsze obarczone określonym błędem.
Istota psychometrii
Psychometria to ten dział psychologii, który zajmuje się teorią i opracowywaniem testów
psychologicznych.
Jako dział metodologii psychologii zajmuje się pomiarem zachowań ludzkich w aspekcie
psychologicznym.
Dotyczy badań psychometrycznych różnych procesów psychicznych (osobowości,
inteligencji, zdolności).
Nazywana teorią testów (za Magnussonem) ma za zadanie określenie warunków, jakie
powinien spełniać dobry test psychologiczny.
Opracowuje również ogólne modele łączenia wyników pomiaru (efektu badania testem
psychologicznym) z cechą psychologiczną, którą odzwierciedlają wyniki badania.
Psychometria jest niezbędnym elementem świadomości metodologicznej każdego
psychologa, ponieważ jest podstawą konstruowania i formalnie poprawnego interpretowania
wyników testów.
Test psychologiczny
T. p. to jest jakieś zadanie do wykonania dla osoby badanej. Ze sposobu wykonania
badający wnioskuje o natężeniu, w jakim dana cecha występuje u badanej osoby.
T. p. jest to narzędzie, pozwalające na uzyskanie takiej reprezentatywnej próbki zachowań, o
których można powiedzieć, że są wskaźnikiem interesującej nas cechy psychologicznej.
Jest to narzędzie: obiektywne, wystandaryzowane, trafne, rzetelne i znormalizowane.
Wyposażone w reguły obliczania wartości mierzonej cechy oraz jasno określające zakres i
rodzaj dopuszczalnych zachowań ze strony diagnosty.
Ponadto badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie,
świadoma celu, jakim jest jej ocena.
Klasyfikacja testów
standaryzowane i niestandaryzowane
indywidualne i grupowe
szybkości i mocy
obiektywne i nieobiektywne
słowne i bezsłowne
właściwości poznawczych i właściwości afektywnych
zorientowane na normy i zorientowane na kryterium (na standard wykonania)
WY 2 – 13.10.2010
Analiza parametrów pozycji testowej
Analiza jakościowa pozycji testu dotyczy trafności treściowej, jak również oceny pozycji z
punktu widzenia efektywności procedur ich konstruowania.
Analiza jakościowa to przede wszystkim pomiar trudności pozycji i testu oraz mocy
dyskryminacyjnej poszczególnych pozycji.
Dzięki temu, że potrafimy normalizować pozycje, możemy wbudować w test wysoką
rzetelność i trafność; można też dokonać skrócenia testu z jednoczesnym zwiększeniem jego
trafności i rzetelności.
Moc dyskryminacyjna – mówi nam o dobroci pozycji testowych, które chcemy włączyć do
konstruowanego testu. Współczynnik mocy dyskryminacyjnej to stopień, w jakim każda pozycja
testu różnicuje osoby wykonujące ten sam test w zakresie zachowania, które ma on mierzyć. W
ujęciu operacyjnym m. d. najczęściej wyraża się współczynnikiem korelacji między pozycją i
wynikiem ogólnym testu lub skali.
Idealny test powinien dawać następujący efekt: osoby z niskim wynikiem ogólnym powinny
rzadziej odpowiadać diagnostycznie (poprawnie) na daną pozycję testową (a te z wynikiem
wysokim – odwrotnie). Do ostatecznej wersji testu powinny wejść pozycje o dodatniej i wysokiej
mocy dyskryminacyjnej.
Stosowane w praktyce odrzucanie pozycji, które nisko korelują z wynikiem ogólnym jest
sposobem na uczynienie testu homogenicznym (zwiększa więc wewnętrzną zgodność testu).
Ta metoda wyboru pozycji zwiększa również trafność zewnętrzną testu, ale tylko wtedy,
kiedy pierwotna pula pozycji mierzy pojedynczą cechę, którą ma badać konstruowany test.
Testy, które mierzą kombinację cech, bo kryterium którego dotyczą jest złożone, wymagają
innego doboru pozycji, aby zapewnić zarówno zewnętrzną jak i wewnętrzną zgodność.
Procedura podziału utworzonych itemów powoduje, że nie odrzuca się pozycji, które mają
niskie wskaźniki zgodności wewnętrznej (czyli nisko korelują między sobą), ale przydziela się je do
oddzielnych testów.
Statystyczne wskaźniki mocy dyskryminacyjnej pozycji testu to:
wskaźnik dyskryminacji
współczynniki oparte na różnicy między skrajnymi grupami
korelacyjne współczynniki mocy dyskryminacyjnej
1. Wskaźnik dyskryminacji
Analizuje wyniki badanych osób, podzielonych na grupę dolną i górną (niskie i wysokie
wyniki w teście):
D = p g – p d
p – proporcja poprawnych (diagnostycznych) odpowiedzi na daną pozycję
Stosowany jedynie do odpowiedzi dwukategorialnych.
2. Różnice między skrajnymi grupami
Współczynnik różnic pomiędzy skrajnymi grupami to wynik testu-t różnicy między średnim
wynikiem danej pozycji w górnej i dolnej grupie.
Do ostatecznej wersji testu wejdą te pozycje testowe, które w istotny sposób różnicują
badanych z grupy normalizacyjnej.
3. Współczynniki dyskryminatywności
Współczynnik mocy dyskryminacyjnej to korelacja między wynikiem danej pozycji a
ogólnym wynikiem w teście.
Pomiar mocy dyskryminacyjnej zwykle obejmuje zmienną dychotomiczną (pozycja) i
zmienną ciągłą (kryterium, cecha).
Korelacją właściwą dla takich zmiennych jest korelacja dwuwierszowa. Współczynniki tej
korelacji to:
r bi – korelacja dwuseryjna
r pbi – korelacja punktowo-dwuseryjna
Współczynniki korelacji punktowo-czteropolowej (φ – phi)
Korelacja właściwa dla takich zmiennych, gdzie również kryterium jest zmienną
dychotomiczą (powodzenie – niepowodzenie w pracy) lub zmienną ciągłą, ale zdychotomizowaną
do celów analizy.
Wymaga podziału badanych osób na dolną i górną grupę i obliczenia w lażdej z nich
proporcji osób odpowiadających zgodnie z kluczem.
Dla każdej pozycji testu moc dyskryminacyjną oblicza się w taki sposób:
φ = p g – p d ⁄ √( p g – p d ) (2- p g – p d )
p g i p d – proporcje osób odpowiadających zgodnie z kluczem w górnej i dolnej grupie
[/ - kreska ułamkowa; √ - pod pierwiastkiem znajdują się wyrażenia w obu nawiasach]
Ten rodzaj analizy opiera się na założeniu liniowego charakteru związku między pozycją a
testem.
Istotność współczynnika φ obliczamy, korzystając ze statystyki chi-kwadrat lub związku phi
z krzywą normalną.
χ² = φ√n
n – suma osób w obu grupach skrajnych łącznie
φ 0,05 = 1,96 / √n
φ 0,01 = 2,58 / √n
p g + p d = 50 + 50 = 100
√n = √100 = 10
1,96 : 10 = 0,196
Wyższe oszacowanie mocy dyskryminacyjnej dają współczynniki korelacji dwuwierszowej:
r bi i r pbi , ponieważ do analizy biorą wszystkie odpowiedzi (zgodne i niezgodne z kluczem). Oba
wymagają odpowiedzi zero-jedynkowych.
W każdym z nich bierzemy pod uwagę:
średnie wyniki kryterialne osób, które na dany item odpowiedziały zgodnie i niezgodnie z
kluczem
odchylenie standardowe dla całej grupy
proporcję osób, które odpowiedziały zgodnie i niezgodnie na daną pozycję testu
istotność obu można sprawdzić pośrednio, korzystając z testu t i jego tablic
df = n – 2
obliczając współczynnik korelacji (między wynikiem danej pozycji a ogólnym wynikiem w
teście) zaleca się wyłączenie wyniku analizowanej pozycji z ogólnego wyniku testowego,
szczególnie przy krótkich testach
dla współczynników korelacji dwuwierszowej można zamienić na Z – Fischera, co ma
znaczenie przy obliczaniu rzetelności testu
! Dotyczy to klasycznego podejścia do budowy testu, które nadal jest dominująca choć coraz
większym zainteresowaniem zaczyna cieszyć się podejście alternatywne – teoria odpowiadająca za
Przykład:
428441993.001.png 428441993.002.png
pozycje testu (IRT).
WY 3 – 20.10.2010
Kryteria dobroci testu:
1. Obiektywność – niezależność wyników testowych od tego kto, gdzie i kiedy dokonuje ich
oceny;
2. Standardyzacja – jednolitość reguł badania danym testem;
3. Rzetelność – precyzja realizowanego pomiaru;
4. Trafność – dokładność, z jaką test realizuje założone cele pomiarowe;
5. Normalizacja – procedura wyposażania testu w statystyczne kryteria interpretacji wyniku
testowego (normy);
6. Adaptacja kulturowa – przystosowanie oryginalnego testu do nowych warunków
kulturowych.
Rzetelność testu i pozycji
Rzetelność – to dokładność z jaką test mierzy to, co mierzy (precyzja pomiaru). W
psychometrii rzetelność to powtarzalność otrzymanych wyników. Oznacza zgodność wyników
otrzymanych przez te same osoby badane kilkakrotnie tym samym testem, badane różnymi
zestawami równoważnych zadań lub badane w różnych, zmiennych warunkach.
Wynik testu danej osoby badanej nigdy nie jest całkowitym obrazem rzeczywistej wartości
mierzonej cechy jej zachowania – jest tylko wynikiem pewnej próbki zachowań ze wszystkich
możliwych pozycji danego testu.
Dlatego wynik testu to tylko wynik aktualny w momencie badania, a nie wynik prawdziwy.
Jest on zawsze obciążony błędem pomiaru.
Błąd pomiaru
Błąd systematyczny nie ma związku z badaną cechą, natomiast mogą spowodować go stałe
cechy badanej osoby lub właściwości testu.
Błąd losowy powstaje w wyniku działania przyczyn przypadkowych. Może on zarówno
zwiększać jak i zmniejszać wynik testu.
Źródła błędów losowych w badaniach testowych:
1. Konstrukcja testu
2. Sytuacja testowania
3. Ocena wyników
Klasyczna teoria testów (klasyczna teoria wyniku prawdziwego)
Dotyczy ona wyniku prawdziwego, wyniku otrzymanego i błędu pomiaru. Dzisiaj znana
jako klasyczny model wyniku prawdziwego Gulliksena.
Równanie klasycznej teorii testów:
X = T + E
Zgłoś jeśli naruszono regulamin