Statystyka_WYKLADY_.doc

(58 KB) Pobierz
Wykład 23

Wykład 23.04.2006 Statystyka GWSH

 

Wartość średniej cechy y

 

Reszta  yi    ŷi

Zmienność wyjaśniona regresją –

Zmienność ogólna – jest to suma dwóch składników wyjaśniona regresją.

 

-

Y – ŷ =

                Wartość teoretyczna          reszta ( wartość empiryczna – wartość teoretyczna)

 

Metoda najmniejszych kwadratów – polega na …………. a obliczaniu sumy kwadratów reszt.

 

 

Dla opisu wpływy zmian wartości cechy x na zmiany wartości cechy y w przypadku zależności korelacyjnej liniowej wyznaczamy równanie regresji:

 

Ŷ= 

W=

( niewidome w tym zadaniu są współczynniki równania regresji a1 i a0, które wyznaczamy rozwiązując następujący układ równań

 

 

 

 

 

 

 

Układ równań normalnych

N·a0 +a1·Σ = Σ

a 0 = Σ

 

 

W wyznaczonym równaniu regresję interpretujemy; wartość współczynnika a1 ( współczynnika kierunkowego), który informuje jak średnio zmienia się wartość cechy y jeżeli cecha x wzrośnie o jedną jednostkę.

 

Dla opisu wpływu zmian wartości cechy y na zmiany wartości cechy x w przypadku zależności korelacyjnej liniowej wyznaczamy równanie regresji                                      , wyznaczając minimum następujących funkcji:

 

W = Σ

Układ równań normalnych (rozwiązujemy b i a)

 

 

 

 

 

 

Interpretacja: W wyznaczonym równaniu interpretujemy wartości współczynnika kierunkowego  ( b1), który informuje jak średnio zmienia się wartość cechy x, jeżeli cecha rośnie o jedną jednostkę.

 

 

Na przykład, zadanie:

 

Wyznaczanie parametrów regresji funkcji regresji, opisując wpływ liczby zatrudnionych osób (xi) na obroty w tys. zł. ( yi) w sklepach branży spożywczej.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x ma mieć wpływ na y to wynika z pierwszego rodzaju równań!!!)

N

 

 

 

 

 

Równanie regresji ŷ = 6,91xi + 1,99

Komentarz: współczynnik regresji informuje że wraz ze zwiększeniem zatrudnienia o jedną osobę, wielkość obrotów rośnie średnio o 6, 91 tys. zł.

 

 

 

 

Zadanie ( symetryczne)

Wyznaczenie parametrów funkcji regresji opisującej wpływ wielkości obrotów na liczbę zatrudnionych osób.

 

N

 

 

 

 

 

 

Równanie regresji x – 0,124 yi + 1,33

Interpretacja: Za y wstawiamy 10. współczynnik regresji informuje że wraz ze wzrostem obrotó o 10.000 tys. zł. Zatrudnienie rośnie o jedną osobę.

 

ZWIĄZKI WSPÓŁCZYNNIKÓW REGRESJI I WSPÓŁCZYNNIKÓW KORELACJI

 

 

 

 

 

 

 

Z powyższych równań wynika że:

- dla zależności korelacyjnej dotatniej pomiędzy badanymi zmiennymi r>0

 

 

 

 

-dla zależności korelacyjnej ujemnej pomiędzy badanymi zmiennymi r

 

 

 

 

-brak zależności korelacyjnej

 

 

 

Komentarz wynikający z tych rysunków – siłę zależności korelacyjnej liniowej można odnieść do wielkości kąta pomiędzy funkcjami regresji. Im większy kont pomiędzy funkcjami regresji tym słabsza zależność korelacyjna.

 

 

 

 

 

 

MIARY DOPASOWANIA LINI REGRESJI DO DANYCH ( Tu wyznaczamy błąd)

Wyznaczamy go poprzez:

- współczynnik determinacji

- współczynnik zbieżności                          ( Współczynnik zbieżności informuje, jaka część wartości zmiennej objaśnionej nie została wyjaśniona zmianami wartości zmiennej objaśniającej)

- wariancję resztową ( dotyczy zmiennej objaśnionej dla funkcji regresji względem x. Wariancję resztową określamy wzorem               . Dla funkcji regresji x względem y S2 = (z)

 

Zmienność ogólna = zmienność wyjaśniona + zmienność nie wyjaśniona

 

Interpretujemy odchylenie standardowe reszt, które ma zawsze jednostkę taką jak zmienna objaśniona. Im mniejsza wartość wariancji resztowej tym mniejszy błąd przeprowadzonej analizy regresji.

 

Zadania ( wyznaczamy wariancję resztową)

Obliczanie odchylenia standardowego składnika resztowego w funkcji regresji opisującej wpływ liczby zatrudnionych osób na obroty.

Wartości teoretyczne zmiennej objaśnionej wyznaczamy wykorzystując wyznaczone wcześniej równanie

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(U) =

(komentarz) odchylenie standardowe reszt oznacza że faktycznie zaobserwowane obroty różnią się od poziomu szacowanego za pomocą funkcji regresji o 22,5 tys. zł.

 

 

 

 

 

 

 

 

 

 

S(Z) =2,998 =3

(komentarz) ta wartość oznacza że faktyczna liczba zatrudnionych osób różni się od poziomu szacowanego za pomocą funkcji regresji średnio o 3 osboby.

 

Następnie wykonujemy do tego rysunek

ANALIZA REGRESJI SŁUŻY DO WYZNACZANIA PROGNOZ!!!!

 

 

ANALIZA DYNAMIKI

(ZMIANY ZJAWISK W CZASIE)

1. Indeksy proste

 

 

Szereg czasowy

 

 

 

 

 

 

 

 

 

Tn  yn

 

Informacje codzienne jest to szereg okresu

 

 

PROSTE MIARY OPISU DYNAMIKI

Wyznaczamy trzy grupy mierników:

a) przyrosty absolutne

b) przyrosty względne

c) indeksy indywidualne

ad a) ciąg przyrostów o podstawie stałej.- Za podstawę porównań przyjmujemy wartość z okresu K.

(interpretacja przyrosty absolutne) -                      o podstawei stałej informują o ile zmieniła się wartość badanej cechy w porównaniu z wartością z okresu K.

Ciąg przyrostów o podstawie łańcuchowej -                  ( interpretacja) Informuje o ile zmieniła się wartość badanej cechy w porównaniu z wartością w okresie poprzednim.

Przyrosty absolutne są to mierniki mające jednostkę taką jak badana cecha y.

 

b) przrosty względne

przyrosty względne o podstawie stałej – za podstawę porównań przyjmujemy wartość z okresu K.

 

 

(interpretacja) przyrosty względne o podstawie stałej informują o ile zmieniła się wartość badanej cechy w stosunku do wartośći z okresu K.

Przyrosty względne o podstawie łańcuchowej –

 

 

(Interpretacja) informują o ile zmieniła się wartość badanej cechy w stosunku do wartości w okresie poprzednim

Przyrosty względne są to liczby niemianowane które interpretujemy zamieniając na procenty

 

 

Stałe

 

 

Łańcuchowee

 

 

c) indeksy indywidualne – ciąg o podstawie stałej. Za podstawę porównań przyjmujemy wartość z okresu K

 

( interpretacja) Indeksy o podstawie stałej informują o ile razy zmieniła się wartość badanej cechy w stosunku do wartości z okresu k.

Indeksy indywidualne – ciąg o podstawie łańcuchowej.

 

(interpretacja) Informują nas o ile razy zmieniła się wartość badanej cechy w stosunku do wartości w okresie poprzednim

Indeksy indywidualne są miarami niemianowanymi, które dla interpretacji zamieniamy na procenty.

 

∆ - „ o ile”

P – „ o ile w stosunku do”

 

 

( interpretacja w odniesieniu do 100%)

( interpretacja w odniesieniu do 0%)

 

Zależności pomiędzy przyrostami  względnymi a indeksami

 

 

 

Na przykład:

Ludność województwa śląskiego w tys. osób

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. wyznaczamy przyrosty absolutne o podstawie stałej z roku 90

2. wyznaczamy przyrosty absolutne o podstawie łańcuchowej

3. wyznaczamy przyrosty względne o podstawie stałej z roku 98 ( w procentach!!!!!!!)

4. wyznaczamy przyrosty względne o podstawie łańcuchowej

5. wyznaczamy indeksy o podstawie stałej z roku 98

6. wyznaczamy indeksy łańcuchowe

 

Operacje w szeregach indeksów:

a) zamiana indeksów o podstawie stałej na łańcuchową

 

 

 

 

 

 

 

 

 

b) zamiana indeksów łańcuchowych na indeksy o podstawie słałej  K=3

 

 

 

 

 

 

 

 

 

 

 

 

 

c) zamiana podstawy indeksów o podstawie stałej

 

 

 

 

 

 

 

Średnie tempo zmian – dla wyznaczania średniego poziomu zmian wartości badanej cechy statystyczne w badanym czasie rzeczywistym , wyznaczamy średni indeks zmian czyli średnią geometryczną  obliczoną w ciągu indeksów łańcuchowych

 

 

 

 

 

( interpretacja) – średnie tempo zmian informuje nas jak zmienia się badana cecha średnio z okresu na okres.

 

 

Na przykład:

Wskaźniki cen towarów i usług konsumpcyjnych w Polsce w latach 1993-1996

 

 

 

 

 

 

1. wyznaczamy indeksy o podstawie stałej:

a) 92

b)95

2. wyznaczamy średnie tempo zmian

a) wyznaczamy indeksy o podstawie stałej z roku 1992

 

 

 

 

(interpretacja) – ceny towarów w roku 96 w stosunku do roku 92 wzrosły o około 2, 745

 

b)wyznaczamy indeksy o podstawie stałej z roku 1995

 

 

 

 

 

 

 

 

 

 

 

Ceny towarów konsumpcyjnych i usług były o 56,3% niższe w porównaniu z rokiem 95

 

c) średnie tempo zmian

 

 

( interpretacja) – ceny towarów i usług w latach 92-96 przeciętnie z roku na rok rosły około o 28,7 %

 

 

 

 

 

 

 

 

 

 

 

 

Komentarz: odchylenie standardowe reszt oznacza że faktyczne zaobserwowane obroty różnią się od poziomu szacowanego za pomocą funkcji regresji  o 22,5 tys. złotych.

 

 

 

 

 

 

 

 

 

 

 

 

 

Komentarz: ta wartość oznacza że faktyczna liczba zatrudnionych osób różni się od poziomu szacowanego za pomocą funkcji regresji średnio o 3 osoby. ( rysunek do tego musimy wykonać)

ANALIZA REGRESJI SŁUŻY DO WYZNACZANIA PROGNOZ!!!!!!

ANALIZA DYNAMIKI ( Zmiany zjawisk w czasie)

 

1. Indeksy proste

 

...

Zgłoś jeśli naruszono regulamin