Ekonomia 
Zastosowanie testu Kruskalla-Wallisa jako alternatywy analizy wariancji w badaniach ekonomiczno-społecznych (11 Października 2007)

Agnieszka Majka, Dorota Jankowska - pobierz plik w formacie pdf

Testy analizy wariancji (ANOVA) były pierwotnie podstawowym narzędziem statystyki eksperymentalnej, tj. szeroko rozbudowanej dla potrzeb doświadczalnictwa rolnego czy medycznego, statystycznej metody planowania i oceny wyników eksperymentów naukowych. Obecnie testy te są powszechnie stosowane we wszystkich dyscyplinach naukowych: ekonomii, marketingu, socjologii jako narzędzie do wykrywania różnic między średnimi w populacjach.
Powszechność stosowania tego testu wynika zarówno z nieskomplikowanej interpretacji jego wyników, jak też z dostępności tego narzędzia w większości programów komputerowych, np. w arkuszu kalkulacyjnym Excel. Należy jednak zwrócić uwagę na fakt, że bardzo często dochodzi do nadużycia stosowania analizy wariancji wynikającego z niespełnienia podstawowych założeń do jej stosowania.
W niniejszym artykule przypomniano założenia, które muszą być spełnione do zastosowania analizy wariancji oraz zaprezentowano jej nieparametryczny odpowiednik, tj. testu sumy rang Kruskala-Wallisa.

Podstawowa zasada i założenia analizy wariancji.
Mimo, że celem analizy wariancji jest wykrywanie różnic pomiędzy średnimi w kilku populacjach, to wymaga ona zbadania wariancji ujawniającej się w odpowiednio dobranych próbach losowych. Wariancja jest miarą odchylenia wartości empirycznych od średniej arytmetycznej. W analizie wariancji porównywana jest wariancja mierząca zmienność między próbami z wariancją mierzącą zmienność wewnątrz prób (wariancją resztową). Podstawowa zasada analizy wariancji głosi, że „jeżeli średnie w k populacjach są różne (tzn. co najmniej dwie z tych średnich są różne), to jest prawdopodobne, że odchylenia wyników obserwacji od odpowiadających im średnich z prób będą małe w porównaniu z odchyleniami k średnich z prób od średniej ogólnej” .
Zastosowanie analizy wariancji wymaga spełnienia następujących założeń:
1. Próby są pobrane losowo i niezależnie od siebie z k populacji;
2. W każdej z k badanych populacji rozkład zmiennej jest normalny;
3. Wariancje  porównywanych populacji są jednorodne:


Spełnienie założenia o losowości i niezależności prób zależy przede wszystkim od sposobu przeprowadzenia doświadczenia. Z praktycznego punktu widzenia oznacza ono, że obserwacja uzyskana w doświadczeniu na jakiejkolwiek jednostce eksperymentalnej nie może w żaden sposób determinować obserwacji na pozostałych jednostkach.
Założenie normalności rozkładu prawdopodobieństwa warto rozważyć w świetle tzw. centralnego twierdzenia granicznego, odgrywającego w statystyce matematycznej rolę kluczową. Orzeka ono, że standaryzowane sumy n dowolnych niezależnych zmiennych losowych, o skończonych wartościach oczekiwanych i o ograniczonych wariancjach, dążą wraz ze wzrostem n do standaryzowanego rozkładu normalnego. Oznacza to, że nawet jeśli w populacji rozkład nie jest normalny, to rozkład średniej z próby prostej jest w przybliżeniu normalny, przy czym dokładność tej aproksymacji wzrasta wraz ze wzrostem liczebności próby. W efekcie zasadność stosowania analizy wariancji pozostaje w mocy, jeśli odstępstwo od normalności w postaci asymetrii rozkładu nie jest zbyt duże, a jednocześnie liczebności prób nie są zbyt małe .
Zgodność danego rozkładu z rozkładem normalnym można sprawdzić za pomocą testów nieparametrycznych, tzw. testów zgodności np. test zgodności c2, test zgodności l-Kołmogorowa.
Założenie o jednorodności wariancji ma duże znaczenie ma duże znaczenie dla zastosowania testu ANOVA i jest szczególnie ważne, gdy liczebności obranych prób znacznie się różnią. Poważne odstępstwa od tego założenia działają w kierunku podwyższenia wartości statystyki testu ANOVA, prowadząc w rezultacie do zbyt wielu odrzuceń hipotezy zerowej, zakładającej równość wszystkich k średnich .
Założenie o jednorodności wariancji można zweryfikować za pomocą testu Bartletta lub Cohrana lub Hartleya. W przypadku, gdy jednorodność wariancji nie jest zachowana najprostszym rozwiązaniem jest usunięcie z dalszych badań tych obiektów, których średnie odchylenia kwadratowe najbardziej odbiegają od pozostałych lub dokonanie transformacji danych (np. poprzez logarytmowanie), w efekcie której następuje „stabilizacja” wariancji.
W wielu pracach wykorzystujących analizę wariancji można zaobserwować,
iż istotność różnicy pomiędzy średnimi jest oceniana na podstawie prób małych (liczących niejednokrotnie mniej niż 10 obserwacji). W praktyce, w takiej sytuacji, nie można przeprowadzić testu zgodności rozkładu populacji z rozkładem normalnym, gdyż ograniczeniem dla zastosowania takiego testu jest duża liczebność próby . Błędem jest założenie a priori, dla potrzeb (czy wygody) stosowania analizy wariancji, istnienia rozkładu normalnego w populacjach.
Ponadto badanie jednorodności wariancji na podstawie prób małych, nawet przy założeniu, że pochodzą one z populacji o rozkładzie normalnym, często wskazuje na występowanie istotnych różnic pomiędzy wariancjami.
W przypadku niespełnienia jednego z założeń zastosowanie analizy wariancji jest błędne. Istnieją jednak inne narzędzia statystyczne dające odpowiedź na pytanie czy pomiędzy średnimi w populacjach występują różnice statystycznie istotne, których stosowanie nie wymaga spełnienia powyższych założeń. Jednym z nich jest test Kruskala-Wallisa.

Test Kruskala-Wallisa  nieparametryczny odpowiednik analizy wariancji.

Jednym z nieparametrycznych odpowiedników analizy wariancji jest test Kruskala-Wallisa. Jedynym założeniem do zastosowania tego testu jest losowość i niezależność prób pobranych z odpowiednich populacji.
W teście tym formułowane są następujące hipotezy:
H0: wszystkie k populacji mają takie same rozkłady;
H1: nie wszystkie k populacji mają takie same rozkłady.
Chociaż hipotezy testu są wyrażone poprzez rozkłady badanych populacji, test ten jest najbardziej wrażliwy na różnice w położeniu populacji. Dlatego może być on używany do testowania hipotezy o równości wartości średnich k populacji. W teście Kruskala-Wallisa, w odróżnieniu od analizy wariancji, zamiast samych wartości obserwacji używa się ich rang.
W celu nadania rang porządkujemy wszystkie dane w całym zbiorze od najmniejszej do największej bez względu na to, z których prób pochodzą. Tak uporządkowanym danym nadajemy kolejne rangi przyjmujące wartości 1, 2, …, n. W przypadku wystąpienia dwóch lub więcej obserwacji o tych samych wartościach, przypisujemy im rangi będące średnią arytmetyczną z ich kolejnych rang.
Wartość testu Kruskala – Wallisa oblicza się następująco:


 
n – liczebność całej próby; n = n1 + n2 + ... + nk
nj – liczebność próby z danej populacji
Rj – suma rang w obrębie próby z danej populacji

Dla prób, z których żadna nie liczy mniej niż 5 obserwacji, rozkład statystyki testu H jest dobrze przybliżony przez rozkład chi-kwadrat z k-1 stopniami swobody.
Obliczoną wartość testu H porównujemy z wartością krytyczną rozkładu dla przyjętego poziomu istotności  i dla k–1 stopni swobody i podejmujemy jedną z dwóch możliwych decyzji:

W przypadku odrzucenia hipotezy zerowej tj. stwierdzenia, że nie wszystkie średnie są jednakowe zachodzi potrzeba wskazania pomiędzy którymi średnimi (populacjami) występują różnice statystycznie istotne. W klasycznej analizie wariancji korzysta się wówczas np. z metody Tukey’a lub z testu NIR. Dalsza analiza różnic pomiędzy średnimi zidentyfikowanych testem Kruskala-Wallisa opiera się na średnich rangach z prób obliczanych dla każdej z par populacji, które chcemy porównać (np. populacja i-ta i j-ta):

Sprawdzianem hipotezy zerowej, głoszącej, że średnie populacji i oraz j są identyczne jest statystyka D:


 
Test przeprowadzamy przez porównanie wartości statystyki D z wartością punktu krytycznego obliczoną wg następującej formuły:


 
W przypadku, gdy D>D* odrzucamy hipotezę zerową twierdząc, ze pomiędzy średnimi z populacji i i j występują różnice statystycznie istotne .

Poniższy przykład obrazuje procedurę obliczeniową testu Kruskala-Wallisa.
W badaniach ankietowych przeprowadzonych wśród mieszkańców Rzeszowa pytano m.in. o wielkość przeciętnych miesięcznych wydatków (w zł/osobę) na cele rekreacyjno-kulturalne oraz o poziom wykształcenia. Zebrane wyniki badań pogrupowano i zestawiono w tabeli 1.

W celu stwierdzenia, czy pomiędzy średnimi wydatkami na cele rekreacyjno-kulturalne w grupach wyodrębnionych wg wykształcenia istnieją różnice istotne statystycznie zastosowano nieparametryczny test Kruskala-Wallisa, ponieważ klasyczne narzędzie do wykrywania różnic pomiędzy średnimi jakim jest analiza wariancji nie mogło być zastosowane ze względu na niejednorodność wariancji w poszczególnych grupach.

Postawiono następujące hipotezy:
H0: wszystkie k populacji mają takie same rozkłady (średnie wydatki na cele rekreacyjno-kulturalne są takie same we wszystkich grupach, bez względu na wykształcenie).
H1: nie wszystkie k populacji mają takie same rozkłady (co najmniej dwie grupy respondentów są zróżnicowane pod względem średnich wydatków na cele rekreacyjno-sportowe).
Wartość statystyki testowej obliczamy następująco:

Ponieważ wartość obliczona wpadła w obszar krytyczny, dlatego H0 odrzucono na rzecz H1, która zakładała, że w co najmniej w dwóch grupach (wyodrębnionych ze względu na poziom wykształcenia) średnie wydatki na cele rekreacyjno-kulturalne są różne.
Aby wskazać pomiędzy którymi grupami (populacjami) występują statystycznie istotne różnice pod względem średnich wydatków na cele rekreacyjno kulturalne obliczono wartości bezwzględne z różnic pomiędzy wszystkimi parami średnich: 

Ponieważ różnice D1 oraz D2 są większe niż wartość krytyczna D*, wobec tego hipotezy zerowe, zakładające, że różnica pomiędzy poszczególnymi parami średnich jest statystycznie nieistotna odrzucamy. Wartość różnicy D3 jest mniejsza niż wartość krytyczna, dlatego też w tym przypadku twierdzimy, że brak jest podstaw do odrzucenia hipotezy zerowej. Można zatem stwierdzić, że średnie wydatki na cele rekreacyjno-kulturalne osób z wykształceniem zawodowym różnią się istotnie od wydatków osób z wykształceniem średnim oraz wyższym. Nie stwierdzono natomiast istotnych różnic pomiędzy średnimi wydatkami osób z wykształceniem średnim i wyższym. Osoby z wykształceniem średnim i wyższym tworzą jednorodną grupę pod względem średnich wydatków na cele rekreacyjno-kulturalne.

Omówiony powyżej i zaprezentowany na przykładzie test jest mało popularny i rzadko stosowany jako narzędzie statystycznej analizy danych empirycznych. Jednak jako narzędzie niewymagające spełnienia licznych założeń (jak ma to miejsce w klasycznej analizie wariancji) jest on z całą pewnością godny zainteresowania i wykorzystania. Rangę jego wartości powinien też podkreślić fakt, że jest to test niewymagający żmudnych i pracochłonnych obliczeń. Ponadto może być przeprowadzony przy użyciu popularnych programów komputerowych, np. STATISTICA, gdzie znajdziemy go w module Statystyki nieparametryczne/Porównanie wielu prób niezależnych.

Literatura:
1. Aczel A. D. 2007. Statystyka w zarządzaniu. Wydawnictwo Naukowe PWN, Warszawa.
2. Ferguson G. A., Takane Y. 2004. Analiza statystyczna w psychologii i pedagogice. Wydawnictwo Naukowe PWN, Warszawa.
3. Greń J. 1972. Modele i zadania statystyki matematycznej. Wydawnictwo Naukowe PWN, Warszawa.
4. Kala R.2002. Statystyka dla przyrodników. Wydawnictwo Akademii Rolniczej
im. A. Cieszkowskiego w Poznaniu.
5. Koronacki J., Mielniczuk J. 2004. Statystyka. Wydawnictwo Naukowo-Techniczne, Warszawa.


Streszczenie:
W artykule przypomniano założenia, które muszą być spełnione, aby można było zastosować analizę wariancji oraz zaprezentowano jej nieparametryczny odpowiednik, tj. test Kruskala-Wallisa. Pokazano również dalszą analizę, którą należy wykonać po odrzuceniu hipotezy zerowej zakładającej równość wszystkich średnich w celu wyznaczenia grup jednorodnych pod względem średniej wartości badanej cechy.
Zastosowanie testu zobrazowano przykładem, dla którego stosowanie analizy wariancji było merytorycznie nieuzasadnione (brak homogeniczności wariancji). Zaprezentowano tok postępowania i schemat obliczeń niezbędnych do przeprowadzenia testu Kruskala-Wallia, dowodząc, iż rozstrzygnięcie kwestii istnienia różnicy pomiędzy średnimi jest możliwe również za pomocą testów nieparametrycznych.

Słowa kluczowe:
Analiza wariancji, testy nieparametryczne, test Kruskala-Wallisa.