1.Badanie statystyczne, zbiorowość statystyczna, podział cech statystycznych, skale pomiaru cech mierzalnych i niemierzalnych.
BADANIE STATYSTYCZNE- ogół prac mających na celu poznanie prawidłowości występujących w procesach masowych. Przedmiotem badań statystycznych są określone zbiorowości statystyczne jednostek powiązanych ze sobą logicznie a różniących się między sobą wartościami cech.
Wyróżniamy badania :
PEŁNE:
ü obejmują wszystkie jednostki z badanej zbiorowości
ü np. rejestry urodzeń, zgonów
ü spisy statystyczne
ü sprawozdawczość statystyczna
CZĘŚCIOWE:
ü obejmują tylko niektóre jednostki z badanej zbiorowości
ü wyróżniamy tu badania:
· reprezentatywne (pobieranie z populacji reprezentatywnej próby reprezentatywnej dla całej populacji)
· monograficzne (polega na badaniu indywidualnego przypadku, np. jednego regionu, jednego przypadku medycznego
· ankietowe (respondencji, wypełnianie ankiet)
Badania pełne i częściowe możemy jeszcze podzielić na:
a) ciągłe:
Zmieniające się w czasie zjawiska są obserwowane i analizowane sukcesywnie oraz nieprzerwanie.
→ Przykłady: ewidencja urodzeń i zgonów, ewidencja pracowników w przedsiębiorstwie
b) okresowe:
Podejmowane w pewnych, zazwyczaj ściśle określonych odstępach czasu.
→ Przykłady: coroczne spisy rolne, powszechne spisy ludności co 10 lat
c) doraźne:
Przeprowadzane w pewnych szczególnych okolicznościach, spowodowanych z reguły nieprzewidzianymi przyczynami.
→ Przykłady: badanie dotyczące start czasu pracy wywołanych epidemią grypy, badanie strat materialnych spowodowanych powodzią lub pożarem
OSERWACJA STATYSTYCZNA- proces zbierania informacji statystycznej.
ZBIOROWOŚĆ STATYSTYCZNA –zbiór elementów (osób, przedmiotów, zdarzeń) podobnych lecz nie identycznych pod względem określonej cechy, poddanych badaniom statystycznym.
Rodzaje:
Zbiorowość generalna (populacja) - ogól obiektów, przedmiotów, osobników które mogą być poddane badaniom statystycznym.
Zbiorowość próbna (populacja próbna) –część populacji, wybrana w sposób losowy, tj. taki , że każdy element populacji ma jednakowe szanse dostanie się do próby. uzyskane wyniki uogólniamy na zbiorowość generalną.
· mała – N < 30; liczebność jednostek statystycznych, wchodzących w skład próby wynosi mniej niż 30 (do 29)
· duża – N » 30; liczebność jednostek statystycznych, wchodzących w skład próby wynosi więcej niż 30 (od 30)
Próba reprezentatywna- wybrana część populacji podlegająca badaniu, jest reprezentatywna, gdy jej
· struktura ze względu na interesujące nas cechy statystyczne jest zbliżona do struktury populacji, z której ona pochodzi, czyli wnioski wyciągnięte z próby można uogólnić na całą populację
· elementy populacji są pobierane do próby w sposób losowy
· próba jest dostatecznie liczna.
POPULACJA GENERALNA A PRÓBA REPREZENTATYWNA:
Prawie nigdy nie możemy badać całej zbiorowości, bo na przykład takie badanie byłoby zbyt kosztowne lub długotrwałe. Toteż jednym z głównych celów statystyki jest wyciąganie wniosków odnoszących się do zbiorowości generalnej na podstawie informacji otrzymanych w wyniku przebadania grupy próbnej (np. wypróbowanie nowego leku przed wprowadzeniem na rynek). Jeśli decydujemy się na badanie częściowe, to trzeba bardzo starannie dobrać tę grupę do badania.
PODZIAŁ CECH STATYSTYCZNYCH
CECHĄ STATYSTYCZNĄ nazywamy własność charakteryzującą obiekty(jednostki, osoby , przedmioty) chodzące w skład populacji.
Podział:
ILOŚCIOWE (mierzalne)
a) ciągłe: mogą przyjąć każdą wartość z określonego przedziału liczbowego, np. waga, wzrost
b) skokowe (dyskretne):przyjmują skończoną liczbę wartości, np. liczba województw w Polsce
c) quasi-ilościowe(porządkowe) określają natężenie badanej cechy, np. oceny , rangi
JAKOŚCIOWE (niemierzalne) np. płeć, zawód
SKALE POMIARU CECH MIERZALNYCH I NIEMIERZALNYCH
Skalowanie to odwzorowanie danej cechy za pomocą wybranej skali.
1. Nominalna
ü relacja: równe lub różne
ü dotyczy cech jakościowych
ü zastosowanie liczby jako nazwy (Liczby pełnią rolę umownych symboli)
ü Skala słaba, najmniej precyzyjny sposób pomiaru
2. Porządkowa (rangowa)
ü relacja: większe lub mniejsze
ü dotyczy cech jakościowych i ilościowych
ü stosujemy kiedy jednostki statystyczne można uporządkować (od najmniejszej do największej lub odwrotnie)
ü rangi porządkują zbiór statystyczny
ü kierunek rangowania jest dowolny, natomiast jeżeli dwie zbiorowości to kierunek rangowania musi być taki sam
ü występują rangi wiązane:
gdy w zbiorowości statystycznej występują jednostki statystyczne o tej samej wartości cechy ilościowej lub o tym samym natężeniu cechy jakościowej
(jest to średnia arytmetyczna rang jednostek statystycznych o tej samej wartości cechy )
3. Interwałowo-podziałowa
ü relacja: większe o tyle
ü Skala mocna, bardziej precyzyjna od skali porządkowej
ü zero w tej skali nie ma interpretacji fizycznej, jest ustalane dowolnie, umownie
ü Np. skala Celciusza , skala Fahrenheita , lata kalendarzowe
ü 0 C-32 w skali Fahrenheita
5.Ilorazowa
ü relacja: tyle razy większe
ü Skala mocna, najprecyzyjniejsza skala
ü istniej jednostka skali
ü zero ma interpretacje fizyczną
ü np. ciśnienie tętnicze, temperatura bezwzględna , wiek, dochody, długość, ciężar, koszty,
2.Charakterystki liczbowe, tabelaryczne i graficzne metody prezentacji pary cech (X ,Y)
DLA CECH JAKOŚCIOWYCH
Współczynnik V-Cramera
· dla dwóch zmiennych jakościowych (skala nominalna) w tabelach wielodzielczych ( tabeli 2x2)
· przyjmuje wartości z przedziału <0,1>
· Nie informuje o kierunku zależności, tylko o sile zależności
Współczynnik Yule’a( Φ )
· mierzy siłę związku między dwiema zmiennymi, mierzonymi w skalach niemetrycznych nominalnych
· cechy jakościowe w tabeli 2x2
· Nie informuje o kierunku zależności, tylko o sile zależności.
DLA CECH ILOŚCIOWYCH
KORELACJA daje możliwość stwierdzenia, czy istnieje związek (niekoniecznie przyczynowo-skutkowy) miedzy badanymi cechami (zmiennymi) oraz jaka jest jego siła i kierunek.
Zależność korelacyjna (statystyczna) polega na tym, że określonym wartościom jednej zmiennej odpowiadają ściśle określone średnie wartości drugiej zmiennej. Można zatem ustalić, jak zmieni się - średnio biorąc - wartość zmiennej zależnej Y w zależności od wartości zmiennej niezależnej X.
Współczynnik korelacji r Pearsona
· określa poziom zależności liniowej między zmiennymi losowymi
· dla zmiennych mierzalnych-ilościowych (w skali ilorazowej)
· cecha zależna (y) ma mieć rozkład zbliżony do rozkładu normalnego i zależności prostoliniowej
· wartość współczynnika korelacji mieści się w przedziale domkniętym [-1, 1]
ü rxy = 0 oznacza brak liniowej zależności między cechami,
ü rxy = 1 oznacza dokładną dodatnią liniową zależność między cechami,
ü rxy = − 1 oznacza dokładną ujemną liniową zależność między cechami, tzn. jeżeli zmienna x rośnie, to y maleje i na odwrót.
· znak współczynnika korelacji informuje nas o kierunku korelacji
· natomiast jego bezwzględna wartość - o sile związku
· do określenia siły zależności między cechami stosujemy skalę od 0-1
rXY = 0 zmienne nie są skorelowane
0 <rXY <0,1 korelacja nikła
0,1 =<rXY <0,3 korelacja słaba
0,3 =<rXY <0,5 korelacja przeciętna
0,5 =<rXY <0,7 korelacja wysoka
0,7 =<rXY <0,9 korelacja bardzo wysoka
0,9 =<rXY <1 korelacja prawie pełna
Współczynnik Determinacji
· jest to współczynnik Persona do kwadratu (r²)
· informuje nas jaki procent ogólnej zmienności cechy zależnej (y) wyjaśnione jest zmiennością cecha niezależnej (x)
ü 0 - zupełny brak dopasowania funkcji regresji do danych rzeczywistych
ü 1 - idealne dopasowanie funkcji regresji do danych rzeczywistych
· Im większe R2 tym dopasowanie jest lepsze i tym większe można mieć zaufanie do regresji
DLA CECH JAKOŚCIOWYCH I ILOŚCIOWYCH
Współczynniki rang Spearmana (ρ)
...
ekorkosz