Statystyka – dyscyplina nauki, która zajmuje się formułowaniem metod liczbowego przetwarzania danych statystycznych w celu opisu i wnioskowania statys...
5 downloads
16 Views
292KB Size
Statystyka – dyscyplina nauki, która zajmuje się formułowaniem metod liczbowego przetwarzania danych statystycznych w celu opisu i wnioskowania statystycznego Statystyka *nazwa zbioru danych liczbowych prezentujących kształtowanie się określonych zjawisk i procesów *nazwa wszelkich prac związanych z gromadzeniem I opracowywaniem danych liczbowych *nazwy pewnych charakterystyk liczbowych obliczanych ze zbiorowości próbnych *nazwa dyscypliny naukowej, posiadającej własne metody badawcze Funkcje statystyki ~f. informacyjna – statystyka daje pełny i obiektywny obraz badanych zjawisk ~f.analityczna - stastystyka określa czynniki kształtujące konkretne zjawiska i procesy ~f.prognostyczna- statystyka pozwala na przewidywanie poziomu i struktury zjawisk Statystykę ze względu na funkcje dzielimy na statystykę opisową - zajmuje się opisem i systematyzowaniem zebranych w oparciu o populację generalną danych, zastępując dużą liczbę informacji kilkoma wskaźnikami, które przy nieostrożnej interpretacji mogą wprowadzać w błąd wnioskowanie statystyczne - zajmuje się wnioskowaniem o cechach populacji w oparciu o cechy wylosowanej z niej próby (proces ma nazwę estymacji) Badanie statystyczne - ogół prac mających na celu poznawanie określonej zbiorowości statystycznej Wyróżniamy 4 etapy badań statystycznych: -przygotowanie badania -zbieranie materiału statystycznego -opracowanie materiału statystycznego i jego prezentacja -analiza wyników opracowania Zbiorowość statystyczna - zbiór dowolnych elementów objętych badaniem statystycznym, charakteryzujących sie pewnymi prawidłowościami Zbiorowość statystyczna >skończona (np. 50 firm) >nieskończona(np. zbiorowość mikroorganizmów) >jednowymiarowa(np. badanie ze względu na 1 cechę) >wielowymiarowa(np. .. kilka cech) >względnie jednorosne(mało różniące się od sb) >niejednorosna(wyraźnie różnią się) >statyczna(wszystkie jednostki pochodzą z tego samego okresu) >dynamiczna(z różnych okresów) Cecha statystyczna - właściwość, którą odznaczają się jednostki statystyczne wchodzące w skład badanej zbiorowości Cechy: <> niemierzalne (jakościowe) - nie można określić, zmierzyć (np. płeć, kolor włosów) <>mierzalne(ilościowe) - dają się wyrazić za pomoca liczb *ciągłe - mogą przyjmować każdą wartość z określonego przedziału liczbowego *quasi-ciągłe - skończony zbiór wartości bardzo licznych (np. wynagrodzenie w groszach) *skokowe - wartości mogą się wyrażać tylko określonymi liczbami zmieniającymi się skokowo, bez wartości pośrednich, przyjmują tylko skończoną, policzalną wartość
Materiał statystyczny - zbiór danych uzyskanych w wyniku obserwacji Materiał pierwotny –dane zebrane specjalnie do celu badania Materiał wtórny - dane gromadzone z innych powodów, w wykorzystane do badania Szereg statystyczny - zbiór wyników obserwacji uporządkowanych według cechy Szeregi statystyczne 1.szczegółowe 2.czasowe uporządkowane wg kolejności rosnącej lub malejącej
3.przestrzenne
4.rozdzielcze(uporząd.wg badanej cechy) a. cech niemierzalnych
b. cech mierzalnych +przedziałowe +punktowe
Parametry opisujące strukturę zbiorowośi statystycznych *wskażnik struktury *wskaźnik natężenia *miary opisujące tendencję centralną *miary ekspresji *miary asymetrii Wskaźnik struktury – stosunek częsci zbiorowości wyrożniającej się okreslonym wariantem badanej cechy do liczebności całej populacji Wskaźnik natężenia - wielkość stosunkowa wyrażająca kształtowanie się wielkości jednego zjawiska na tle innego logicznie z nim związanego Miary opisujące tendencję centralną A. Klasyczne *średnia geometryczna *średnia harmoniczna *średnia arytmetyczna B. Pozycyjne *dominanta *kwantyle(kwartyle, kwintyle, decyle, percentyle) Średnia geometryczna – pierwiastek n-tego stopnia z iloczynu n wartości danej zmiennej Średnia arytmetyczna- suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzielona przez liczbę tych jednostek
Własności śr. arytmetycznej: *wypadkowa wszystkich wartości zmiennej i spelnia x min<=x<=xmax *wartość śr.arytmetycznej nie zalezy od liczebności klas lecz od ich wzajemnych proporcji *suma odchyleń poszczególnych wartości zmiennej od śr.arytmetycznej jest równa 0 *śr.arytmetyczna jest miarą prawidłową tylko w odniesieniu do zbiorowości jednorodnych o wiewielkim zróżnicowaniu wartości zmiwnnej *w miarę wzrostu asymetrii i zróżnicowania rozkładu śr. arytmetyczna traci wartość poznawczą *śr.arytmetycznej nie można obliczyć dla szeregu o otwartych przedziałach jeśli przedziały te mają duże liczebności. Otwarte przedziały klasowe można domykać gdy liczba jednostek w tych przedziałach nie przekracza 5% liczebności całej populacji Średnie pozycyjne - średnie, które są wartościami pewnych konkretnych jednostek zbiorowości statystycznej wybranych ze względu na ich charakterystyczne położenie w całej zbiorowości Dominanta - wartość, która w zbiorowości występuje najczęsciej Założenia: *musi być jeden przedział wyraźnie dominujący *rozpiętość tego przedziału oraz przedziałów sąsiednich musi być jednakowa Własności dominanty: *wyznaczamy wtedy gdy jest jeden ośrodek dominujący *jeśli w szeregu rozdzielczym z przedziałami klasowymi dominanta występuje w skrajnych przedziałach wówczas nie nazywa się jej analitycznie *wartość dominanty nie zmieni się gdy do wzoru podstawimy zamiast właściwych liczebności - częstości Kwartyle Mediana – drugi kwartyl - wartość, która w uporządkowanym szeregu zajmuje pozycję środkową Własności Mediany *wartość mediany nie zależy od wartości krańcowych, w przeciwieństwie do śr. arytmetycznej jest więc średnią odporną na wartości nietypowe * można ją wyznaczyć we wszystkich rodzajach szeregów statystycznych. Jest często stosowana w doswiadczalnictwie, mikrobiologii *miedianę można wyznaczyć, gdy liczebności wszystkich przedziałów nie są dokładnie znane, wystarczy ze znamy liczbę wszystkich obserwacji i wartość środkową Kwartyle – pierwszy - wartość cechy poniżej której znajduje się ¼ zbiorowości, a powyżej ¾ zbiorowości Kwartyle – trzeci - wartość cechy poniżej której znajduje się ¾ zbiorowości, a powyżej ¼ zbiorowości Wariancja - przeciętne kwadratowe odchylenie poszczególnych wynników od ich średniej. Własności odchylenia standardowego i wariancji: -do obliczenia tych charakterystyk potrzebna jest znajomość wszystkich wartości cech.
-wartość wariancji nie ulega zmianie, gdy miejsce liczebności wstawimy odsetki. -wariancja nie jest odporna na wartości nietypowe w szeregu. -wariancja obliczana na szeregach rozdzielczych przedziałowych jest wielkością zawyżoną. przeszacowanie wartości wariancji jest tym większe im większa jest liczba klas. Typowy obszar zmienności cechy – około 2/3 wszystkich jednostek badanej zbiorowości statystycznej posiada wartoście cechy w tym przedziale . Reguła trzech sigm: 68% wartości cech leży w odległości ≤1δ od wartości średniej, 95,5% wartości cechy leży w odległości ≤2δ od wartości średniej, 99.7% wartości cechy leży w odległości ≤3δ od wartości średniej. Miary pozycyjne: *rozstęp- to różnica między największą i najmniejszą zaobserwowaną wielkością R=xmax-xmin. *odchylenie ćwiartkowe- to połowa różnicy między trzecim (górnym) a pierwszym (dolnym) kwartylem Q=1/2(Q3-Q1) Odchylenie ćwiartkowe mierzy poziom zróżnicowania tylko części jednostek badanej zbiorowości, pozostałe po odrzuceniu 25% jednostek o warunkach najniższych oraz 25% jednostek o wartościach najwyższych. Współczynnik zmienności klasyczej - stosunek odchylenia standardowego do średniej arytmetycznej. Asymetrię najłatwiej jest określić poprzez porównanie: dominanty , mediany i średniej asymetrii. Rozkład symetryczny-wszystkie średnie (średnia asymetryczna, dominanta, mediana) są sobie równe. asymetria ujemna, szereg skośny lewostronny .