1. Co jest celem analizy współzależności cech? Stwierdzenie czy miedzy badanymi cechami zachodzą jakieś zależności, jaka jest ich siła, kierunek i ksz...
7 downloads
36 Views
479KB Size
1. Co jest celem analizy współzależności cech? Stwierdzenie czy miedzy badanymi cechami zachodzą jakieś zależności, jaka jest ich siła, kierunek i kształt. 2. Co to jest diagram korelacyjny? Wykres gdzie na osi odciętych zaznaczamy wartości zmiennej X, na osi rzędnych wart zmiennej Y dla ) każdego pkt empirycznego ( . 3. Co to jest szereg korelacyjny? Są to dane indywidualne. Każda jednostka jest opisywana charakterystyczną parą liczb ( Stosowane dla małych n. ( ).
).
4. Co to jest tablica korelacyjna? Są to sklasyfikowane wyniki próby los w tablicy o k wierszach i r kolumnach. Wnętrze tablicy stanowią liczebności tych elementów próby, dla których wartości obu danych cech należą do kombinacji i-tego wiersza, j-tej kolumny. 5. Co to są rozkłady warunkowe; podaj wzory na średnie arytmetyczne i wariancje rozkładów warunkowych. Jest to funkcja prawdopodobieostwa rozkładu brzegowego zmiennej losowej ( ). warunkiem, że ( (
|
(
)
(
) (
|
) )
Średnie arytmetyczne: ̅
∑
̅
∑
Wariancje: ( )
∑(
̅)
∑
( )
∑(
̅)
∑
̅
̅
) pod
6. Co to są rozkłady brzegowe; podaj wzory na średnie arytmetyczne i wariancje rozkładów brzegowych. Rozkład brzegowy to łączny rozkład prawdopodobieostwa dowolnego układu zmiennych spośród n zmiennych los . Rozkład brzegowy zmiennej losowej X względem Y: (
)
∑
Rozkład brzegowy zmiennej losowej Y względem X: (
)
∑
Średnie arytmetyczne: ̅
∑
̅
∑
Wariancje: ( )
∑(
̅)
∑
̅
( )
∑(
̅)
∑
̅
7. Podaj wzory na kowariancję dla szeregu korelacyjnego i tablicy korelacyjnej. Dla szeregu korelacyjnego: (
)
(
)
∑(
̅ )(
̅)
̅̅̅
̅ ̅
̅̅̅
∑
̅̅̅
̅ ̅
̅̅̅
∑∑
Dla tablicy korelacyjnej: (
)
(
)
∑ ∑(
̅ )(
̅)
8. Podaj definicję współczynnika korelacji liniowej Pearsona dla szeregu korelacyjnego i tablicy korelacyjnej. Dla szeregu korelacyjnego: n
(x
R
i 1
n
(x i 1
i
x )(yi y) n
i
x ) 2 * (yi y) 2 i 1
Dla tablicy korelacyjnej: k
R
r
( x i 1 j 1
k
(x i 1
i
x)( y i y )nij r
i
x) 2 ni. * ( y i y ) 2 n. j j 1
9. Jaka jest interpretacja współczynnika korelacji i jego własności (siła, kierunek).
( X ,Y )
cov( X , Y ) D( X ) D(Y )
Określa poziom zależności liniowej między zmienną losową. Wartośd współczynnika mieści się w przedziale . Im większa jego wart bezwzględna, tym silniejsza jest zależnośd liniowa między zmiennymi. oznacza brak zależności między cechami, oznacza dokładną dodatnią liniową zależnośd między cechami, oznacza dokładną ujemną liniową zależnośd między cechami, tzn. jak zmienna X rośnie to Y maleje i na odwrót. Siła określa jak bardzo zmienne są od siebie zależne. 10. Co to jest stosunek korelacyjny, jego własności. Informuje jaka częśd całkowitej zmienności cechy zależnej może byd przypisana wpływowi drugiej cechy
Stosunek korelacyjny zm. X wzglądem zm. Y: e yx
S 2 (x j ) S 2 ( x)
własności: eyx2 є <0,1>; r2<=eyx2; eyx=0 => r=0 cechy są nieskorelowane; r=1 => eyx= exy=1 zależność liniowa; eyx є (0,1) => eyx!= exy
2
1
S j ( x) S 2 ( x)
0 e yx 1
11. Co to jest empiryczna linia regresji? Empiryczną linią regresji cechy Y względem cechy X na podstawie próbki (xi,yij) i=1,...n j=1,...ni nazywamy zb pkt (xi, y( x ) ) i=1,..n dla próbki, zaś (yk, xkl) k=1,..m l=1,..mk empiryczną linią regresji cechy i
X względem Y- zb pkt (yk,
x( y k ) )
k=1,..m
12. Co to jest cecha objaśniana i objaśniająca? cecha X : objaśniająca, opisująca, niezależna od innej cechy, lecz od niej zależy jakaś inna cecha cecha Y : objaśniana, opisywana, zależna od innej cechy np. y=ax+b
13. Model regresji liniowej dwóch zmiennych. Y=β0+β1x+εi oszacowania metodą najmniejszych kwadratów (MNK) współczynników regresji liniowej n
ˆ1
(x i 1
i
x n )(Yi Yn )
n
(x i 1
i
xn ) 2
1 n x n xi n i 1 n-liczba par obserwacji (xi,Yi) przewidywalne wartości zmiennej Y: Yˆi ˆ1 xi ˆ0 reszty: ˆi Yi Yˆi
ˆ1
błędy: i Yi 0 1 xi
cov( X , Y ) S (Y ) R 2 S ( x) S ( x)
ˆ0 Yn ˆ1 xn
Yn
1 n Yi n i 1
14. Podaj wzór na podstawową tożsamośd analizy wariancji w modelu regresji liniowej i objaśnij jego składniki.
(Y
i
Yn ) (Yˆi Yn ) 2 (Yi Yˆi ) 2 2
SST=SSR+SSE SST- całkowita suma kwadratów odchyleo zmiennej objaśnianej od wart. średniej SSR- suma kwadr błędów SSE-regresyjna suma kwadratów
15. Co to jest współczynnik dopasowania prostej regresji i jaka jest jego interpretacja.
R2
SSR SSE 1 SST SST
Informuje jaka częśd zmian wart zmiennej objaśnianej jest wyjaśniona zmianami zmiennej objaśnianej przyjętej w funkcji regresji.
16. Model regresji wielorakiej. p
Yi 0 j xij i i=1,...n i 1
Y1 1 x11 ... x1 p 0 1 ... ... ... ... ... * ... ... Y 1 x ... x np p n n1 n Oszacowanie wektora parametrów
ˆ ( X T X ) 1 X T Y
17. Do czego służy test niezależności chi-kwadrat Pearsona, podaj hipotezę zerową i alternatywną, oraz postad statystyki testowej. Weryfikacja hipotezy o stochastycznej niezależności zmiennych X i Y H0: pij=pi.p.j dla wszystkich (i,j) (brak związku między zmiennymi X,Y) H1: pij pi.p.j dla niektórych (i,j) (zmienne X,Y są stochastycznie zależne)
18. Do czego służy test istotności współczynnika korelacji, podaj postad hipotez zerowej i alternatywnych. Do stwierdzenia czy między badanymi cechami zaszła korelacja liniowa H0: ρ=0 (brak korelacji) a) H1: ρ<0
b) H1: ρ>0
c) H1: ρ 0
19. Do czego służy test istotności współczynnika regresji liniowej, podaj postad hipotez zerowej i alternatywnych. Służy do weryfikacji hipotez dotyczących zgodności hipotetycznego współczynnika regresji liniowej z empirycznym. H0: β1=b0 a) H1: β1
b) H1: β1>b0
c) H1: β1 b0
20. Do czego służy test liniowości regresji, podaj postad hipotez zerowej i alternatywnych. Służy do określania czy regresja Y względem X jest prostoliniowa H0 : nyx2-ρ2=0 H1: nyx2-ρ2 0