SPSS_wprowadzenie-tworzenie bazy danych.pdf

(610 KB) Pobierz
Microsoft Word - SPSS-wprowadzenie2.doc
SPSS – wprowadzenie
SPSS (Statistical Package for the Social Sciences – nazwy tej si ħ ju Ň raczej nie u Ň ywa) to
stworzony w 1968 roku pakiet do analiz statystycznych. Jego autorami s Ģ :
Norman H. Nie:
C. Hadlai (Tex) Hull:
oraz Dale H. Bent:
Panowie ci postanowili stworzy ę program, który surowe dane statystyczne konwertowałby
przy u Ň yciu łatwego w obsłudze pakietu do postaci, na podstawie której mo Ň na podejmowa ę
decyzje (w zało Ň eniu biznesowe).
298489837.003.png 298489837.004.png 298489837.005.png
Program si ħ przyj Ģ ł i od momentu powstania jest stale rozbudowywany, umo Ň liwiaj Ģ c coraz
wszechstronniejsz Ģ i bardziej zaawansowan Ģ analiz ħ danych statystycznych. Teraz SPSS to
pr ħŇ nie działaj Ģ ca korporacja, która posiada znaczn Ģ cz ħĻę rynku oraz której zaufało wielu
du Ň ych klientów (np. American Airlines, a w Polsce: BZ WBK). SPSS doczekał si ħ ju Ň
swojej szesnastej odsłony, a zapowiadana jest siedemnasta.
Pakiet (podobnie do wielu innych znanych programów do zastosowa ı statystycznych) składa
si ħ z podstawy (SPSS Base) oraz dodatkowych modułów (SPSS Modules). Moduły to
zestawy narz ħ dzi statystycznych tworz Ģ cych w ramach modułu pewn Ģ tematyczn Ģ cało Ļę .
Przykładem mo Ň e by ę moduł ‘Trends’ do analizy szeregów czasowych lub ‘Maps’
pozwalaj Ģ cy na prezentacj ħ danych na mapach.
Z uwagi na ró Ň ne wersje SPSSa oraz mo Ň liwo Ļę rozbudowania go za pomoc Ģ modułów, mo Ň e
si ħ zdarzy ę , Ň e prezentowane wydruki nie b ħ d Ģ identyczne z uzyskiwanymi przez nas w
trakcie zaj ħę . Materiały przygotowywane s Ģ przy u Ň yciu polskiej wersji SPSS 12.0 (do
niedawna ostatnia osi Ģ galna wersja SPSSa, któr Ģ dyspnował WNE), za Ļ pracujemy na
angielskiej wersji 15.0. Jednak sposób poruszania si ħ w Ļ rodowisku programu, metody
analizy statystycznej oraz interpretacja wyników pozostan Ģ aktualne.
Dodatkowo, z uwagi na fakt, Ň e w wielu miejscach w Polsce, w których mo Ň na si ħ
potencjalnie spotka ę z SPSSem, u Ň ywana jest polska wersja (najcz ħĻ ciej wła Ļ nie 12.0),
sposóby przeprowadzania analiz statystycznych b ħ d Ģ prezentowanaye dla wersji polskiej,
jednak bezpo Ļ rednio po nich podawane b ħ d Ģ równie Ň odpowiedniki dla angielskiej wersji
15.0 (w nawiasach).
SPSS – organizacja programu
Po uruchomieniu SPSSa wy Ļ wietla si ħ główne okno programu (wy Ļ wietla ę si ħ równie Ň mo Ň e
okno z zadaniami, którymi najcz ħĻ ciej rozpoczynamy prac ħ w pakiecie statystycznym (typu
‘Otwórz dane’ (‘Open an existing data source’), ‘Uruchom tutorial ’ (‘Run the tutorial’) ), ale
cz ħ sto usuwa si ħ mo Ň liwo Ļę pojawiania si ħ tego okna przy starcie programu).
Okno główne wygl Ģ da tak:
Mamy w nim dwie zakładki: ‘Dane’ (‘Data View’) oraz ‘Zmienne’ (‘Variable View’).
Zakładki te słu ŇĢ do przeł Ģ czania si ħ odpowiednio pomi ħ dzy edytorem pokazuj Ģ cym warto Ļ ci
zmiennych (‘Dane’ (‘Data View’)), a edytorem z nazwami zmiennych i ich typem (‘Zmienne’
(‘Variable View’)).
W głównym menu SPSSa mamy do wyboru wiele pozycji (‘Plik’ (‘File’), ‘Edycja’ (‘Edit’),
‘Widok’ (‘View’),…), z których ka Ň da posiada dodatkowe rozwijane menu, a niektóre
pozycje tego ostatniego jeszcze dodatkowe menu. Wszystkie elementy tego menu realizuj Ģ
pewne zadania, za Ļ pozycje głównego menu to uporz Ģ dkowanie zada ı w ten sposób, Ň e
stanowi Ģ one zbiory zada ı poł Ģ czonych tematycznie (np. ‘Analiza’ (‘Analyze’) pozwala
przeprowadza ę Ň nego rodzaju wnioskowanie statystyczne).
Do wyników analiz statystycznych otwierane jest dodatkowe okno (‘Raport’ (‘Output’)).
Zapisuj Ģ si ħ w nim wyniki wszystkich analiz prowadzonych w bie ŇĢ cej sesji SPSSa.
298489837.006.png
Wczytywanie / import / eksport danych
Tworzenie własnej bazy danych
W SPSSie mo Ň emy stworzy ę własn Ģ baz ħ danych – przykładowo wpisa ę w postaci bazy
danych wyniki ankiety, któr Ģ zebrali Ļ my. Powiedzmy, Ň e w ankiecie pytali Ļ my studentów o
płe ę , wag ħ , wzrost i wydział i dostali Ļ my nast ħ puj Ģ ce odpowiedzi:
płeę
waga
wzrost wydział
K
61
168
WZ
K
52
171
WNE
K
?
170
WZ
M
92
181
WNE
K
48
165
WZ
K
58
173
WNE
M
70
172
WZ
M
84
188
WNE
M
87
195
WZ
K
51
176
WNE
M
95
180
WNE
K
?
177
WZ
M
81
183
WNE
M
75
177
WZ
Taka baza danych, oczywi Ļ cie w bardziej rozbudowanej postaci, mo Ň e przykładowo słu Ň y ę do
porównania wagi i wzrostu studentów (wzgl ħ dnie stworzonego na podstawie tych dwóch
współczynnika BMI (body mass index)) pomi ħ dzy kobietami i m ħŇ czyznami oraz pomi ħ dzy
wydziałami.
ņ eby wprowadzi ę tak Ģ baz ħ do SPSSa, powinni Ļ my otworzy ę Ļ wie ŇĢ ” jego sesj ħ , lub wybra ę
Plik ã Nowy ã Dane (File ã New ã Data). Dobrze jest zacz Ģę od zakładki ‘Zmienne’
(‘Variable View’) i w polu ‘Nazwa’ (‘Name’) wpisa ę nazwy naszych zmiennych.
Przykładowo w pierwsze pole kolumny ‘Nazwa’ (‘Name’) wpiszmy ‘płe ę ’, klikaj Ģ c
uprzednio na to pole. Po naci Ļ ni ħ ciu ‘Enter’ domy Ļ lnymi warto Ļ ciami wypełniaj Ģ si ħ inne
pola. Mo Ň emy oczywi Ļ cie zmienia ę ich warto Ļ ci. Prosz ħ równie Ň zwróci ę uwag ħ , Ň e po
edytorze SPSSa mo Ň emy si ħ porusza ę podobnie jak po znanym wielu Excelu.
Pozostaj Ģ do rozwi Ģ zania dwa problemy: co robimy z dyskretnymi zmiennymi zbieranymi
jako tekstowe (‘płe ę ’ i ‘wydział’) oraz jak potraktowa ę braki danych wyst ħ puj Ģ ce w zmiennej
‘waga’? Pierwszy z problemów standardowo rozwi Ģ zuje si ħ przez ustalenie liczb naturalnych,
które b ħ d Ģ oznaczały poszczególne kategorie (np. dla zmiennej ‘płe ę ’ niech 1 oznacza
kobiet ħ , a 2 m ħŇ czyzn ħ ; dla zmiennej wydział niech 1 oznacza WNE, a 2 - WZ).
Drugi problem to odpowiednie uwzgl ħ dnienie braków danych. Mo Ň emy te braki danych
zakodowa ę jak ĢĻ liczb Ģ (np. bardzo du ŇĢ 99999999 albo bardzo mał Ģ -99999999). Problemem
jest to, Ň e SPSS b ħ dzie widział te warto Ļ ci jako tak samo wa Ň ne warto Ļ ci zmiennych, jak
ka Ň de inne, chyba Ň e zdefiniujemy je jako braki danych.
298489837.001.png
Nasza baza przygotowana do wpisania do SPSSa wygl Ģ da wi ħ c tak:
płeę
waga
wzrost wydział
1
61
168
2
1
52
171
1
1
99999999 170
2
2
92
181
1
1
48
165
2
1
58
173
1
2
70
172
2
2
84
188
1
2
87
195
2
1
51
176
1
2
95
180
1
1
99999999 177
2
2
81
183
1
2
75
177
2
Prosz ħ zwróci ę uwag ħ , Ň e po klikni ħ ciu na niektóre komórki, pokazuje si ħ na ich ko ı cu
prostok Ģ t z kropkami lub .
Klikni ħ cie na prostok Ģ t wy Ļ wietla okno opcji, a rozwija dodatkowe menu.
Edycja atrybutów zmiennych
W zakładce ‘Zmienne’ (‘Variable View’) mo Ň emy jeszcze zmienia ę atrybuty zmiennej – od
deklarowania jej typu przez nadawanie jej etykiety, do okre Ļ lania jej skali pomiarowej. W
kolumnie ‘Etykieta’ (‘Label’) mo Ň emy opisa ę zmienne, np. ‘płe ę ’ jako ‘płe ę studenta’. Wa Ň na
jest kolejna kolumna (‘Warto Ļ ci’ (‘Values’) ), która nadaje etykiety poszczególnym
kategoriom zmiennych dyskretnych (u nas ‘płe ę ’ i ‘wydział’). Bez nadania tych etykiet, w
wynikach analiz te zmienne b ħ d Ģ si ħ pojawiały jako liczby oznaczaj Ģ ce ich kategorie (u nas
‘1’ i ‘2’), po ich nadaniu kategorie b ħ d Ģ si ħ wy Ļ wietlały zgodnie z nadanymi im etykietami.
Nadajmy warto Ļ ciom ‘1’ zmiennej ‘płe ę ’ etykiet ħ ‘kobieta’, a ‘2’ m ħŇ czyzna. Klikamy na
prostok Ģ t z kropkami w polu ‘Warto Ļ ci’ (‘Values’) dla zmiennej ‘płe ę ’ i wypełniamy
wyskakuj Ģ ce okno wpisuj Ģ c warto Ļę zmiennej oraz jej etykiet ħ i klikaj Ģ c ‘Dodaj’ (‘Add’).
Analogicznie zróbmy z warto Ļ ciami zmiennej ‘wydział’ (‘1’=’WNE’, ‘2’=’WZ’).
Kolejna kolumna to ‘Braki danych’ (‘Missing’). W tej kolumnie wpisujemy wszystkie braki
danych, które w Ļ ród zmiennych wyst ħ puj Ģ (je Ļ li nie wpiszemy braku danych to kody tych
braków b ħ d Ģ brały udział w analizie – b ħ d Ģ w bazie danych istniały osoby wa ŇĢ ce
99999999kg..).
Wa Ň na jest równie Ň ostatnia kolumna ‘Poziom’ (‘Measure’), przede wszystkim ze wzgl ħ du na
jej warto Ļę informacyjn Ģ dla u Ň ytkownika, który pierwszy raz widzi baz ħ danych. W
kolumnie tej mo Ň emy ustali ę jaka jest skala pomiarowa poszczególnych zmiennych.
Teraz mo Ň emy si ħ przenie Ļę do zakładki ‘Dane’ (‘Data View’) i wpisa ę w ni Ģ warto Ļ ci
zmiennych, dokładnie tak, jakby Ļ my to robili w Excelu.
298489837.002.png
Zgłoś jeśli naruszono regulamin