Dwuczynnikowa analiza wariancji.doc

(11479 KB) Pobierz
Dwuczynnikowa analiza wariancji

Dwuczynnikowa analiza wariancji

Wprowadzenie

Dwuczynnikowa analiza wariancji pozwala na badanie hipotezy o równości średnich ze zmiennej zależnej w grupach wyróżnionych na podstawie dwóch czynników (zmiennych niezależnych). Przykłądem takiej analizy może być sprawdzanie, czy średni dochód jest taki sam w każdej z grup wyróżnionych na podstawie płci respondenta oraz jego wykształcenia. Jeśli wyróżniono na przykład 4 grupy na podstawie wykształcenia oraz 2 grupy na podstawie płci, to łącznie porównywanych będzie grup (w każdej z 4-rech wyróżnionych na podstawie wykształcenia są 2 podgrupy wyróżnione na podstawie płci).

W dwuczynnikowej analizie wariancji oprócz weryfikacji równości wszystkich średnich grupowych oceniane są dwa rodzaje efektów: efekty główne  każdego z czynników oddzielnie i efekt interakcji między czynnikami.

 

Założenia dwuczynnikowej analizy wariancji

Aby móc przeprowadzić dwuczynnikową analizę wariancji, muszą być spełnione następujące założenia:

·         zmienna zależna musi być mierzona na skali co najmniej przedziałowej (czynniki mogą być mierzone na dowolnych skalach);

·         porównywane grupy powinny być równoliczne (wyróżnione na podstawie obu czynników łącznie branych pod uwagę – na przykład, jeśli rozpatrujemy analizę wariancji z czynnikami płeć oraz rasa (Czarna vs. Biała), to musimy mieć tyle samo kobiet rasy Czarnej, co kobiet rasy Białej i po tyle samo mężczyzn z każdej z ras);

·         rozkład zmiennej zależnej w każdej z grup wyróżnionych na podstawie obu czynników łącznie powinien być normalny, a wariancje w każdej z tych grup powinny być równe;

·         pomiary zmiennej zależnej powinny być statystycznie niezależne.

 

Rodzaje efektów w dwuczynnikowej analizie wariancji

We wprowadzeniu do tego rodzaju analizy wariancji powiedziano już, że w przypadku dwuczynnikowej analizy wariancji weryfikuje się trzy rodzaje hipotez:

  1. równość wszystkich średnich grupowych – analogicznie, jak w przypadku analizy jednoczynnikowej sprawdzamy, czy którekolwiek ze średnich grupowych wykazują istotne statystycznie różnice;
  2. równość średnich ze zmiennej zależnej w grupach wyróżnionych jedynie na podstawie wartości przyjmowanych przez jeden z czynników – w przypadku analizy z czynnikami odpowiadającymi płci i wykształceniu osób badanych porównywalibyśmy średnie ze zmiennej zależnej w grupach wyróżnionych na podstawie płci, bez uwzględnienia poziomu wykształcenia (czyli analizowalibyśmy istnienie istotnego statystycznie efektu głównego zmiennej płeć) oraz średnie ze zmiennej zależnej w grupach wyróżnionych na podstawie samego poziomu wykształcenia (efekt główny zmiennej wykształcenie);
  3. różnice między średnimi grupowymi w podziale ze względu na wartości obu czynników wynikają jedynie z efektów głównych – sprawdzamy, czy informacje na temat samych efektów głównych tłumaczą wszystkie różnice między średnimi grupowymi w podziale z uwzględnieniem obu czynników; jeśli istnieją jakieś niewyjaśnione w ten sposób różnice między faktycznymi średnimi, a przewidywanymi na podstawie analizy efektów głównych, to mówimy o efekci interakcji czynników. Z taką sytuacją możemy mieć na przykład do czynienia, jeśli z efektów głównych wynika, że kobiety zarabiają średnio o 100$ mniej niż mężczyźni, osoby rasy Białej zarabiają o 200$ więcej niż osoby rasy Czarnej, ale porównując kobiety rasy Białej z mężczyznami rasy Czarnej zamiast przewidywanej różnicy 100$ (+100$ dla mężczyzn i –200$ dla rasy Czarnej) obserwujemy różnicę wysokości na przykład 150$. W tym przykładzie powiedzielibyśmy, że nastąpiła interakcja czynnika płeć z czynnikiem rasa.

 

Zajmiemy się teraz dokładniejszym omówieniem poszczególnych rodzajów efektów.

 

Ad. I. W pierwszym przypadku analiza przebiega identycznie jak w sytuacji analizy jendoczynnikowej. W miejsce czynnika z jednoczynnikowej analizy wariancji należało by stworzyć zmienną, która w każdej z wyróżnionych na podstawie obu zmiennych niezależnych grup przyjmuje inną wartość. Testowi podlega hipoteza zerowa o równości wszystkich średnich grupowych. Podobnie, jak w sytuacji analizy jednoczynnikowej, do weryfikacji tej hipotezy wykorzystywana jest statystyka F, czyli iloraz oszacowania wariancji międzygrupowej (rozproszenia średnich w grupach wyróżnionych na podstawie obu czynników) i oszacowania wariancji wewnątrzgrupowej (miary rozproszenia wyników w obrębie grup wokół ich średnich grupowych). Zasady postępowania są takie same, jak w przypadku analizy jednoczynnikowej – jeśli otrzymana w teście istotność stastystyki F jest niższa od założonego poziomu istotności, to mamy podstawy do odrzucenia hipotezy zerowej; w przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy zerowej.

Ad. II. Efekty główne są związane z przeprowadzeniem odpowiednika analizy jednoczynnikowej z uwzględnieniem każdego z dwóch czynników oddzielnie. Tak więc moglibyśmy przeprowadzić dwie analizy jednoczynnikowe – najpierw z pierwszym czynnikiem, jako zmienną niezależną, aby móc ocenić istotność efektu głównego tego czynnika, a następnie z drugim czynnikiem jako zmienną niezależną, aby sprawdzić, czy wystąpi efekt główny drugiego czynnika. Należy jednak w tym miejscu podkreślić, że nie jest to identyczna, a jedynie podobna analiza. W obu przypadkach, aby odpowiedzieć na pytanie, czy średnie grupowe wykazują istotne zróżnicowanie, wykorzystuje się statystykę F, czyli iloraz wariancji międzygrupowej (rozproszenia średnich z grup wyłanianych na podstawie wartości jednego, aktualnie testowanego, czynnika wokół średniej ogólnej) do wariancji wewnątrzgrupowej. Wariancja międzygrupowa jest liczona tak samo zarówno w jedno- jak i w dwuczynnikowej analizie wariancji, natomiast wariancja wewnątrzgrupowa inaczej. W analizie jednoczynnikowej wariancja wewnątrzgrupowa jest liczona jako miara rozproszenia wyników w grupach wyróżnionych na podstawie jednego czynnika wokół ich średnich grupowych, natomiast w teście efektów  głównych analizy dwuczynnikowej jest to miara rozproszenia wyników w grupach wyróżnionych na podstawie obu czynników wokół ich średnich grupowych. Poniżej zamieszczone są tabelki z hipotetycznymi wynikami osób badanych – porównajmy różnicę w wyliczaniu statystyki F przy liczeniu efektu głównego wykształcenia (dwuczynnikowa analiza wariancji z czynnikami wykształcenie i płeć) z sytuacją w jednoczynnikowej analizie wariancji z czynnikiem wykształcenie. W przypadku analizy jednoczynnikowej informacja o płci osoby badanej nigdzie nie jest wykorzystywana, mamy do czynienia z taką sytuacją, jak gdyby taka informacja nie była dostępna – zarówno średnie grupowe są wyliczane jedynie na podstawie przynależności do różnych kategorii ze względu na poziom wykształcenia, jak i odchylenia wyników od średnich. Natomiast w przypadku analizy dwuczynnikowej wariancja wewnątrzgrupowa jest liczona jako odchylenia wyników od średnich w grupach wyróżnionych na podstawie obu czynników jednocześnie.

Analiza jednoczynnikowa – grupy i średnie grupowe wyliczane wyłącznie na podstawie wartości czynnika wykształcenie:

 

podstawowe

zawodowe

średnie

wyższe

 

Kobiety

200

100

100

150

150

200

200

220

120

120

170

170

220

220

250

150

150

200

200

250

250

450

300

300

400

400

500

500

230

Mężczyźni

200

200

250

250

300

300

220

220

270

270

320

320

250

250

300

300

350

350

400

400

500

500

600

600

330

 

200

220

250

450

280

 

Analiza dwuczynnikowa – grupy wyznaczane na podstawie przynależności do kategorii obu czynników jednocześnie. Średnie do wyliczania wariancji wewnątrzgrupowej wyznaczane w każdej z tych grup oddzielnie. Średnie do wyznaczania wariancji międzygrupowej wyznaczana wyłącznie na podstawie czynnika wykształcenie:

 

podstawowe

zawodowe

średnie

wyższe

 

Kobiety

150

100

100

150

150

200

200

170

120

120

170

170

220

220

200

150

150

200

200

250

250

400

300

300

400

400

500

500

230

Mężczyźni

250

200

200

250

250

300

300

270

220

220

270

270

320

320

300

250

250

300

300

350

350

...
Zgłoś jeśli naruszono regulamin