Statistica2.pdf
(
177 KB
)
Pobierz
708201134 UNPDF
POLITECHNIKALSKA
wGliwicach
WYDZIAŁ AUTOMATYKI, ELEKTRONIKI i INFORMATYKI
Instytut Elektroniki
Zakład Elektroniki Biomedycznej
INSTRUKCJADOLABORATORIUM
OBLICZEINYNIERSKICH
ZastosowaniepakietuStatistica2
Opracowała: mgr in». Monika Bugdol
Gliwice, 10 kwietnia 2011
1Cel¢wiczenia
2
1Cel¢wiczenia
Celem ¢wiczenia jest rozszerzenie umiej¦tno±ci korzystania z programu Statistica. W ramach
zaj¦¢ uczestnicy powinni naby¢ poni»sze umiej¦tno±ci:
dopasowywanie parametrów modelu;
rysowanie oraz edycja wykresów 3D;
wykonywanie testów t-studenta.
2Modelowanienieliniowe
W Statistice mo»na w łatwy sposób wyznaczy¢ nieznane parametry modelu, który minimali-
zuje sum¦ kwadratów odległo±ci danych od modelowej krzywej. Poszukuj¡c wzoru funkcji, która
najlepiej estymuje zale»no±¢ jednej zmiennej od drugiej nale»y klikn¡¢ „Statystyka” ! „Za-
awansowane modele liniowe i nieliniowe” ! „Estymacja nieliniowa”. Nast¦pnie nale»y upewni¢
si¦, »e zaznaczona jest opcja „Regresja u»ytkownika, najmn. kwadratów” i klikn¡¢ OK. Teraz
nale»y klikn¡¢ „Funkcja estymowana”, po czym w nowo otwartym oknie wpisa¢ wzór na za-
le»no±¢. Wszystkie wyst¦puj¡ce w nim współczynniki, nie b¦d¡ce zmiennymi, traktowane b¦d¡
jako parametry modelu i b¦d¡ bra¢ udział w procesie optymalizacji. W definicji funkcji mo»na
u»ywa¢ ró»nych kombinacji funkcji trygonometrycznych, wykładniczych, wielomianów itd. Na
przykład szukaj¡c zale»no±ci pomi¦dzy zmiennymiv1,v2iv3mo»na wpisa¢ mi¦dzy innymi
v3=a+bexp(v1)v2
3
+v1
p
+csin(v1v2)+d
v
1- w tym przypadku program wyznaczy
takiea;b;p;c;d, które najlepiej dopasowuj¡ proponowany model do danych. Warto pami¦ta¢,
»e cz¦sto najlepsze rezultaty daj¡ funkcje, które nie s¡ „przekombinowane”. Po wpisaniu funkcji
klikn¡¢ OK, po zamkni¦ciu okna z funkcj¡ znowu klikn¡¢ OK. Teraz nale»y przej±¢ do zakładki
„Wi¦cej” i tam podwy»szy¢ liczb¦ iteracji do około 200 (Rys. 1), a nast¦pnie klikn¡¢ OK. Teraz
nale»y klikn¡¢ „Dopasowana funkcja 2W i wart. obser.”, czego efektem jest wygenerowanie
wykresu danych z naniesion¡ »¡dan¡ krzyw¡ wyznaczon¡ przez program. Stopie« dopasowania
wyznaczonej funkcji do danych okre±la warto±¢ tzw. funkcji kary, która w tym przypadku jest
sum¡ kwadratów odległo±ci danych od krzywej. Warto±¢ ta wy±wietla si¦ w ostatnim pojawia-
j¡cym si¦ oknie (w tym, w którym jest opcja utworzenia wykresu) pod nazw¡ „Wart. ko«cowa”
(Rys. 2). W szczególnych przypadkach mo»e okaza¢ si¦, »e wybrana przez u»ytkownika funkcja
jest tak skomplikowana, »e nale»y jeszcze podwy»szy¢ liczbe iteracji, np. do 1000.
3Rysowaniewykresów3D 3
Rys. 1: Ustalanie liczby iteracji
Rys. 2: Warto±¢ funkcji kary
3Rysowaniewykresów3D
Statistica umo»liwia generowanie wykresów trójwymiarowych powierzchni. Mo»na wybra¢ opcj¦
rysowania powierzchni przechodz¡cych najbli»ej punktów z danymi lub zdefiniowanych przez
siebie funkcji, na któr¡ mo»na rzutowa¢ punkty danych. Nale»y klikn¡¢ „Wykresy” ! „Wy-
kresy XYZ 3W” ! „Wykresy powierzchniowe”. Najpierw nale»y wybra¢ zmienne do analizy,
nast¦pnie zaznaczy¢ „Poka» punkty danych” i zaznaczy¢ jedn¡ z opcji „NKWO” lub „NKWW”,
które dotycz¡ metody dopasowywania powierzchni, po czym klikn¡¢ OK.
4Testyt-Studenta
4
Klikni¦cie prawym klawiszem myszy na wykresie skutkuje wy±wietleniem si¦ niewielkiego
menu, z którego warto wybra¢ opcj¦ „Opcje wykresu”. W podpunkcie „Dopasowanie” mo»na
z listy rozwijanej wybra¢ typ dopasowania, co nale»y potwierdzi¢, klikaj¡c OK.
Podpunkt „Punkt widzenia” odpowiada za perspektyw¦, z której u»ytkownik widzi wygene-
rowany wykres. Za pomoc¡ suwaków mo»na regulowac k¡t widzenia w pionie i poziomie oraz
pozorn¡ odległo±¢ od wykresu. Klikni¦cie w przycisk „Obracanie eksploracyjne” uprzyjemni
dzie« widokiem ładnie obracaj¡cego si¦ wykresu. Klikni¦cie „Stop” ko«czy obracanie. W trak-
cie obracania si¦ wykresu mo»na regulowa¢ suwakami ustawienie wykresu.
4Testyt-Studenta
4.1Testdlapojedynczejpróby
Chc¡c sprawdzi¢, czy ±rednia warto±¢ danej cechy jest równa pewnej ustalonej liczbie nale»y
wykona¢ test t-studenta dla pojedynczej próby. Nale»y wcze±niej upewni¢ si¦, »e spełniony jest
co najmniej jeden z warunków: cecha ma rozkład normalny lub liczno±¢ próbek przekracza 30.
W tym celu nale»y klikn¡¢ „Statystyka” ! „Statystyki podstawowe i tabele” ! „Test t dla
pojedynczej próby”, po czym klikn¡¢ OK. W nowo otwartym oknie prosz¦ wybra¢ zmienn¡,
a nast¦pnie klikn¡¢ w zakładk¦ „Opcje”, w której nale»y wpisa¢ warto±¢, z któr¡ porównywana
jest ±rednia warto±¢ nadanej cechy. Nale»y upewni¢ si¦, »e wybrana jest opcja „Testuj ±rednie
wzgl¦dem:”, po czym wpisa¢ w pole obok sprawdzan¡ warto±¢. Kolejny krok to klikni¦cie „Pod-
sumowanie”. Ostatnia kolumna powstałego arkusza zawiera zmienn¡p, której warto±¢ poni»ej
0;05oznacza, »e warto±¢ ±rednia badanej cechy nie jest porównywalna z testowan¡ warto±ci¡.
4.2Testdlapróbniezale»nych
rednie warto±ci dwóch parametrów, które s¡ od siebie niezale»ne (np. wzrost i wiek), mog¡ by¢
porównywane przy u»yciu testu t-Studenta dla prób niezale»nych. Porównywane próby musz¡
nie ró»ni¢ si¦ znacz¡co pod wzgl¦dem liczebno±ci (liczebno±¢ bardziej licznej grupy nie mo»e
by¢ wi¦ksza ni» dwukrotna liczebno±¢ drugiej grupy). Ponadto porównywane próby musz¡ mie¢
rozkład normalny i mie¢ zbli»one wariancje. Analiza taka powinna by¢ zatem poprzedzona
sprawdzeniem liczebno±¢i grup i testem normlano±ci. Test dla wariancji (tzw. test Levene’a)
przeprowadzany jest razem z testem t-Studenta. Aby uruchomi¢ tak¡ analiz¦ nale»y klikn¡¢
„Statystyka” ! „Statystyki podstawowe i tabele” ! „Test t dla prób niezale»nych”. Je»eli
porównywane s¡ ±rednie warto±ci dwóch osobnych zmiennych, nale»y wybra¢ opcj¦ „(wzgl.
zmn.)”. Mo»na tak»e porównywa¢ warto±ci ±rednie jednej zmiennej, która rozdzielane s¡ na dwie
grupy za pomoc¡ innej zmiennej, tzw. zmiennej grupuj¡cej (np. wzrost - zmienna analizowana,
płe¢ - zmienna grupuj¡ca). Wówczas odpowiedni¡ opcj¡ jest „wzgl. grup”. W obu przypadkach
nale»y po wybraniu »¡danej opcji klikn¡¢ OK, po czym wybra¢ zmienne do analizy, w zakładce
4.3Testdlapróbzale»nych 5
„Opcje” zaznaczy¢ „Test Levene’a”, a nast¦pnie klikn¡¢ „Podsumowanie” w prawym górnym
rogu.
4.3Testdlapróbzale»nych
Test t-Studenta dla prób zale»nych u»ywany jest, gdy celem analizy jest sprawdzenie, czy prze-
wa»nie w populacji zmienna pierwsza przyjmuje wy»sze warto±ci ni» zmienna druga (np. waga
przed diet¡ i po diecie). Test ten uruchamiany jest poprzez klikni¦cie „Statystyka” ! „Staty-
styki podstawowe i tabele” ! „Test t dla prób zale»nych”, po czym klikn¡¢ OK. Kolejny krok to
wybranie zmiennych, pomi¦dzy którymi sprawdzana jest zale»no±¢ i wybranie „Podsumowanie”
w prawym górnym rogu.
5Program¢wiczenia
UWAGA!
Wszystkie arkusze, wykresy i obliczenia, wykonane w trakcie laboratorium musz¡
znale¹¢ si¦ w raporcie!
W trakcie laboratorium nale»y zrealizowa¢ nast¦puj¡ce zadania w podanej kolejno±ci:
1. Uruchomi¢ program Statistica. Zamkn¡¢ DataMiner.
2. Wczyta¢ arkusz
smiertelnoscnoworodkow
z pliku dane2.xls wiedz¡c, »e pierwszy wiersz
arkusza zawiera nazwy zmiennych.
3. Prosz¦ spróbowa¢ dopasowa¢ nast¦puj¡ce modele estymuj¡ce ±miertelno±¢ niemowl¡t
w pierwszym roku »ycia w szpitalu w Koziwólce Dolnej:
liczba
=a+b*exp(
tydzien
*c) oraz
liczba
=b*exp(
tydzien
*c). Który model lepiej aproksymuje umieralno±¢ dzieci? O ile le-
piej? Uwaga! Nale»y pami¦ta¢ o odpowiednim oznaczeniu zmiennych w programie (np.
nie istnieje taka zmienna, jak
liczba
).
4. Wczyta¢ arkusz
nowylek
z pliku dane2.xls wiedz¡c, »e pierwszy wiersz arkusza zawiera
nazwy zmiennych, a pierwsza kolumna zawiera nazwiska pacjentów.
5. Prosz¦ spróbowa¢ wyznaczy¢ model, okre±laj¡cy zale»no±¢ liczby lat prze»ytych od chwili
postawienia diagnozy od sumarycznej przyjmowanej miesi¦cznej dawki leku oraz wagi
pacjenta. Prosz¦ spróbowa¢ 4 dowolnie wybrane przez siebie postacie funkcji.
6. Narysuj wykres 3D zale»no±ci prze»ytych lat od wagi i dawki leku. Wybierz najpierw
opcj¦ „NKWO”. UWAGA! Prosz¦ zwróci¢ uwag¦ na to, która zmienna powinna by¢
zmienn¡Z! Teraz prosz¦ spróbowa¢ dobra¢ powierzchni¦ innymi typami dopasowania.
Który sprawdził si¦ Pani/-a zdaniem najlepiej?
7. Prosz¦ wykona¢ 4 zdj¦cia wykresów z ró»nych punktów widzenia.
Plik z chomika:
aankaa452
Inne pliki z tego folderu:
05_kohonen_2011.zip
(76 KB)
07_ANN2_funkcje5.zip
(123 KB)
3.doc
(487 KB)
Arkusik (1).sta
(3 KB)
Arkusik.sta
(3 KB)
Inne foldery tego chomika:
07_ANN2_funkcje5
Anna_Zielinska
Baza danych
BI
Biochemia
Zgłoś jeśli
naruszono regulamin