Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 8)
21.06.2009
JEDNOCZYNNIKOWA ANALIZA WARIANCJI ANOVA
ANOVA ma na celu badanie istotności różnic między kilkoma średnimi.
Założenia modelowe:
- badamy, co najmniej dwie niezależne populacje
- z każdej populacji mamy po jednej próbie reprezentatywnej
- liczebność prób dowolna, ale identyczna w grupach
- mierzymy jedna cechę ilościową wyrażoną na skali stosunkowej lub przedziałowej
- brak istotnych różnic między wariancjami
- rozkład normalny cechy w populacji
Hipoteza zerowa: między średnimi nie ma istotnych różnic
Hipoteza alternatywna: przynajmniej 1 średnia różni się istotnie od pozostałych
Zmienne niezależne w analizie wariancji stanowią kryterium podziału na niezależne grupy.
Zmienna niezależna nosi nazwę czynnika, a jej wartości nazwane są poziomami czynnika.
Podstawa teoretyczną analizy wariancji jest równość wariancyjna.
RÓWNOŚĆ WARIANCYJNA
Suma kwadratów odchyleń średnich grupowych od średniej ogólnej.
Suma kwadratów odchyleń wartości cechy w grupach od odpowiednich średnich grupowych.
Całkowita suma kwadratów odchyleń badanej zmiennej od średniej ogólnej
SS total = SS between + SS within
Zmienność Zmienność Zmienność
Całkowita = międzygrupowa + wewnątrzgrupowa
Analiza wariancji wyjaśnia tylko zmienność międzygrupową, natomiast zmienność wewnątrz grupowa pozostaje niewyjaśniona.
Wartość testowa analizy wariancji :
k - liczba w populacji
n - liczba kostek
SSm – zmienność międzygrupowa
SSw – zmienność wewnątrzgrupowa
wynik istotny, czyli przynajmniej jedna średnia różni się istotnie od pozostałych.
Uwaga!
Anova nie rozstrzyga, które średnie różnią się istotnie od średniej ogólnej.
To należy sprawdzić dodatkowo.
Dwuczynnikowa analiza wariancji
Pozwala zbadać wpływ dwóch niezależnych zmiennych nominalnych, oraz interakcji między nimi na ilościową zmienną zależną.
Zmienne nominalne – każdy czynnik może działać sam (pojedynczo) ich działanie może być łączne, sumujące się (addytywne) lub interakcyjne, czyli ich łączny wpływ jest nieprzewidywalny, jeżeli znamy działania każdego z osobna.
Do tego testu stawia się 3 hipotezy zerowe oraz 3 hipotezy alternatywne.
- brak wpływu czynnika C
- brak wpływu czynnika R
- brak wpływu interakcji obu czynników
W efekcie przeprowadzenia tego testu dostajemy 3 wartości testowe:
- dla efektu głównego czynnika C
- dla efektu głównego czynnika R
- dla interakcji
2
chomik-lukasz2