1.doc

(127 KB) Pobierz

Statystyka matematyczna zajmuje się metodami wnioskowania statystycznego, które polegają na tym, że na podstawie wyników uzyskanych z próby formułujemy wnioski o całej zbiorowości. Wnioskowanie statystyczne obejmuje estymacje i weryfikację hipotez statystycznych |-to dział statystyki, używający teorii prawdopodobieństwa i innych działów matematyki do rozwijania statystyki z czysto matematycznego punktu widzenia.
Mediana: 167

Mediana (zwana też wartością środkową lub drugim kwartylem) to w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2, czyli drugim kwartylem.

Rangowanie: 27,21,34,56,45,67,56,21,27,67,100,21,11,80,21,21

11,21,21,21,21,21,27,27,34,45,56,56,67,67,80,100

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

11=1;21:(2+3+4+5+6)/5=4;(7+8)/2=7,5;34=9;45=10;(11+12)/2=11,5;(13+14)/2=13,5;

80=15;100=16

BADANIA PEŁNE I CZĘŚCIOWE

Celem badania statystycznego jest na ogół poznanie rozkładu interesującej nas cechy populacji generalnej przez uzyskanie informacji o wartościach syntetycznych charakterystyk (parametrów) tego rozkładu.
Rozróżnia się dwa zasadnicze typy badań:
- badania pełne obejmujące wszystkie elementy zbiorowości generalnej,
- badania częściowe obejmujące część elementów populacji generalnej.
PRÓBA
Podzbiór elementów populacji generalnej podlegających badaniu nazywa się próbą.
Statystyka matematyczna zajmuje się tylko badaniami częściowymi, takimi, w których dobór próby podlega pewnym obiektywnym regułom.
Cechy statystyczne - właściwości charakteryzujące jednostki statystyczne (obiekty):

CECHY STAŁE: Są wspólne dla wszystkich jednostek danej zbiorowości i nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości:

· rzeczowe - właściwości, które charakteryzują określony zbiór osób, rzeczy lub zjawisk,

· o przestrzenne - gdzie badamy,

· czasowe - jaki okres obejmuje badanie lub w jakim momencie się ono odbywa.

CECHY ZMIENNE: Są to właściwości, które różnią poszczególne jednostki statystyczne (głównie one podlegają obserwacji),

· mierzalne - (ilościowe, kwantytatywne) - właściwości które można zmierzyć i wyrazić za pomocą odpowiednich jednostek fizycznych (np. w kilometrach, centymetrach), zalicza się również do nich cechy quasi-ilościowe (porządkowe), kwantyfikują natężenie badanej właściwości przedstawionej w sposób opisowy, porządkując w ten sposób zbiorowość (np. oceny studentów: bdb, db, itp.),

· niemierzalne - (jakościowe, kwalitatywne) - zwykle określane słownie (np. płeć).

Cechy mierzalne - (nazywane zmiennymi) - oznaczenie: X, Y, Z, ich wartości: x, y, z:

· skokowe (dyskretne) - przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej, najczęściej jest to zbiór liczb całkowitych dodatnich (np. liczba osób w rodzinie, liczba usterek, itp.).

· ciągłe - mogą przyjąć każdą wartość z określonego przedziału liczbowego [a,b], przy czym liczba miejsc po przecinku jest uzależniona od dokładności dokonywanych pomiarów (np. waga detalu).

W przypadku badań zbiorowości wielowymiarowych zmienne (cechy mierzalne) dzielimy na:

· stymulanty - te cechy, których wyższe wartości pozwalają zakwalifikować daną jednostkę statystyczną jako lepszą z punku widzenia realizowanego badania,

· dominanty - cechy, których wysokie wartości świadczą o niskiej pozycji jednostki w zbiorze.

Cechy jakościowe (niemierzalne) to takie, których nie można jednoznacznie scharakteryzować za pomocą liczb (czyli nie można zmierzyć). Możemy je tylko opisać słowami. Możliwa jest zatem jedynie zupełna i rozłączna klasyfikacja zbioru wyników. Podstawową operacją pomiarową jest identyfikacja kategorii, do której należy zaliczyć wynik. Prowadzi to do podziału zbioru wyników na podzbiory rozłączne. Do cech jakościowych zaliczamy np. płeć, grupę krwi, kolor włosów, zgon lub przeżycie, stan uodpornienia przeciwko ospie (zaszczepiony lub nie) itp. W przypadku grupy krwi rezultat pomiaru będzie następujący: n1 pacjentów ma grupę krwi A, n2 pacjentów - grupę krwi B, n3 pacjentów - grupę AB i n4 - grupę O.

Cechy porządkowe umożliwiają porządkowanie (lub uszeregowanie) wszystkich elementów zbioru wyników. Cechy takie najlepiej określa się przymiotnikami i ich stopniowaniem. Każdemu ze stanów można również przypisać liczbę według wzrostu natężenia. Proces ten nazywa się rangowaniem. Na przykład, badając wzrost osoby, możemy użyć określeń: "niski", "średni" lub "wysoki". Podobnie, badając liczbę krwinek białych i używając określeń "poniżej normy", "w normie" lub "powyżej normy" - mamy do czynienia ze skalą porządkową.

Cechy ilościowe (mierzalne) to takie, które dadzą się wyrazić za pomocą jednostek miary w pewnej skali. Cechami mierzalnymi są na przykład: wzrost (w cm), waga (w kg), stężenie hemoglobiny we krwi (w g/dl), wiek (w latach) itp. Wśród cech mierzalnych wyróżniamy dwie podgrupy: cechy ciągłe i cechy skokowe.

Cecha ciągła to zmienna, która może przyjmować każdą wartość z określonego skończonego przedziału liczbowego, np. wzrost, masa ciała czy temperatura.
Cechy skokowe mogą przyjmować wartości ze zbioru skończonego lub przeliczalnego (zwykle całkowite), na przykład: liczba łóżek w szpitalu, liczba krwinek białych w 1 ml krwi.

Pomiar - czynność przyporządkowania liczb przedmiotom (obiektom) lub wydarzeniom zgodnie z pewnym zbiorem reguł. Wynikiem pomiaru są dwa rodzaje wielkości, te które mówią o liczebności zbioru obiektów, i te, które charakteryzują stopień nasilenia zjawiska.

Skale pomiarowe ze względu na relacje dzielimy na:

· nominalne - relacja: równe różne; pomiar polega na zastosowaniu liczby jako nazwy, czyli grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy czy liczby, np. studenci wg rodzaju studiów, szczególny przypadek - skala dychotomiczna (dwupunktowa),

· porządkowe - relacja: większe lub mniejsze; pomiar polega na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy lub liczby i porządkuje się te klasy ze względu na stopień natężenia, w jakim posiadają one badaną cechę,

· przedziałowe - relacja: większe o tyle; pomiar występuje wtedy, gdy uporządkowany zbiór wartości cechy składa się z liczb rzeczywistych, Zero w tej skali ustalone jest dowolnie, np. skala Celsjusza i Fahrenheita, skala pozwala stwierdzić tylko o ile jest coś wyższe,

· stosunkowe (ilorazowe) - relacja: tyle razy większe; spełnia wszystkie aksjomaty liczb, pomiary w tej skali charakteryzują się stałymi ilorazami i zerem bezwzględnym, tylko w tej skali możliwe jest porównywanie jednostek za pomocą względnych charakterystyk: np. jeden obiekt jest dwa razy cięższy od drugiego.

8. szacunki statystyczne (interpolacyjne, ekstrapolacyjne)

Jeśli z pewnych względów nie możemy (lub nie chcemy) w sposób bezpośredni, tj. na podstawie badania pełnego lub częściowego uzyskać informacji o interesującej nas zbiorowości, to przeprowadzamy postępowanie zwane szacunkiem statystycznym. Szacunek ten polega na ustaleniu pewnych wielkości lub właściwości nieznanej zbiorowości na podstawie zbiorowości znanej, pozostającej z nią w określonym związku. Na przykład czas przeznaczony na czytanie książek, gazet i czasopism przez określoną grupę ludzi możemy szacować na podstawie liczby zakupionych książek, czasopism i gazet. Metodami szacunku statystycznego jest m.in. szacunek interpolacyjny i ekstrapolacyjny. Interpolacja polega na szacowaniu nieznanych wartości cechy na podstawie znanych wartości sąsiednich (późniejszych i sąsiednich). Ekstrapolacja natomiast na szacowaniu wartości wykraczających poza przedział wartości znanych.

9. ETAPY BADAŃ STATYSTYCZNYCH

Badanie statystyczne to zespół czynności, których celem jest określenie zbiorowości statystycznej i prawidłowości dotyczących cech statystycznych.

ETAPY:

Przygotowanie badania,
Zebranie materiałów statystycznych,
Przygotowanie materiałów statystycznych do opracowania,
Opracowanie materiału statystycznego,
Prezentacja danych statystycznych,
Analiza statystyczna.

Ad. 1) Przygotowanie badania.

· Cel badania

· Przedmiot badania w ujęciu rzeczowym, czasowym i terytorialnym

· Zakres badania– wybór cech charakterystycznych podlegających badaniom

· Metoda badania (pełne lub częściowe)

· Plan badań, czyli harmonogram, formularze, instrukcje statystyczne

Formularze statystyczne jest to zbiór spisanych pytań dotyczących badanych cech rozważanych zbiorowości statystycznych. Formularz statystyczny składa się z nagłówka (tytuł,nr, adres) z kwestionariusza właściwego, czyli zasadniczej części formularza, w którym zawarte są wszystkie pytania formularza statystycznego. Pytania mogą być w postaci tabelarycznej, tekstowej i mieszanej. Tabela składa się z boczku i części końcowej.

Każda pozycja formularza jest opisana w instrukcji statystycznej, która jest niezbędna, aby uniknąć błędnych interpretacji i uzyskać jednolitą odpowiedz, Powinna zawierać podstawę prawną, przedmiot badania, terminy, sprawozdania itp.

Ad. 2) Materiał statystyczny jest to zbiór informacji o wartościach badanych cech w poszczególnych jednostkach statystycznych, który powstaje w wyniku prowadzonych obserwacji

Dzielimy go na

· Pierwotny materiał zebrany specjalnie dla naszych celów

· Wtórny obejmuje materiały już poprzednio zebrane przez inne jednostki i wykorzystane dla naszych celów, np. GUS

Kontrola materiału statystycznego

· Kontrola formalna, czyli kompletność zebranego materiału,

· Kontrola merytoryczna– obejmująca kontrole zgodności rachunkowej i logicznej poprawności zapisów

Ad. 3) Przygotowanie materiału statystycznego do opracowania. Stosujemy dwa etapy opracowania materiału statystycznego:

Grupowanie – polega na podziale całej zbiorowości statystycznej na mniejsze części

· Grupy proste – jedna cecha statystyczna

· Grupy złożone – co najmniej dwie cechy statystyczne

Po podzieleniu zbiorowości na grupy według pewnej cechy ustalamy kolejność oraz nazwy tych grup otrzymujemy uporządkowane nazwy grup tworzące wykaz klasyfikacyjny.

Wykaz klasyfikacyjny musi być wyczerpujący logiczny i przejrzysty. W przypadku, gdy badana cecha mierzalna ma charakter ciągły, warianty cech przedstawiamy w postaci przedziałów liczbowych (przedziały klasowe).

W wykazanych klasyfikacjach z cechą ze zmiennością ciągłą ważne jest obliczanie środków poszczególnych przedziałów oznaczony poszczególnych przedziałów.

10. Obserwacja statystyczna. Zbieranie materiałów - czyli obserwacja statystyczna , jego zliczanie i grupowanie jest drugim etapem badania statystycznego. Materiał statystyczny - zbiór danych liczbowych i opisowych. Materiał pierwotny - to sporządzony "teraz" (obecnie) przez ankietera. Materiał wtórny - to korzystanie z już wykonanych badań. Surowy materiał statystyczny - to materiał jeszcze nie skorygowany, może zawierać błędy.

Rodzaje błędów:

a) Błędy systematyczne (tendencyjne) - polegają na podawaniu faktów celowo znikształconych. Spowodowane jest to obawą przed konsekwencjami ujawnienia prawdy. Na przykład właściciele sklepów i przedsiębiorstw mogą kłamać nt. wielkości obrotów - ponieważ na ich podstawie określa się wysokość podatku.
b) Błędy niesystematyczne (przypadkowe) - polegają na pomyłce liczbowej.

11. Szeregi statystyczne

Najprostsza, formą podziału zbiorowości na grupy są szeregi statystyczne.

Szereg statystyczny jest to liczbowe ujecie poddanej badaniu zbiorowości według określonego kryterium. Kryterium podziału stanowi wybrana cecha i jego warianty lub czas i usytuowanie terytorialne poszczególnych jednostek badanej zbiorowości. Szereg statystyczny w układzie pionowym składa się z dwóch kolumn. Jedna ujmuje cechę będącą kryterium podziału i jej kolejne warianty, a druga odpowiadające kolejnym wariantom cechy liczebności (przykład).

Szereg może tez mieć postać pozioma, złożoną z dwóch wierszy. Jeden z wierszy określa cechę i jej warianty, drugi odpowiadające tym wariantom liczebności. (przykład)

Rozróżnia się następujące rodzaje szeregów statystycznych:

- szeregi wyliczające

- szeregi strukturalne (rozdzielcze)

- szeregi terytorialne (geograficzne, przestrzenne)

- szeregi dynamiczne (czasowe)

12. Wnioskowanie statystyczne to dział statystyki zajmujący się problemami uogólniania wyników badania próby losowej na całą populację oraz szacowania błędów wynikających z takiego uogólnienia (patrz badanie statystyczne).

OPIS STATYSTYCZNY

13. Rozkład empiryczny to uzyskany na podstawie badania statystycznego opis wartości przyjmowanych przez cechę statystyczną w próbie przy pomocy częstości ich występowania.

Rozkład empiryczny może być prezentowany jako:

· szereg rozdzielczy

· histogram

· wielobok liczebności

· krzywa liczebności

· wykres pudełkowy

Dane uzyskane z badanie podlegają interpretacji i analizie dzięki wyznaczeniu miar rozkładu.

14. dominanta

15. Rozkład normalny, zwany też rozkładem Gaussa, lub krzywą dzwonową, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.

Przyczyną jest jego popularność w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników, jej rozkład będzie zbliżony do normalnego [1], stąd można go bardzo często zaobserwować w danych [2]. Ponadto rozkład normalny ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są dość proste obliczeniowo [3].

16. MIARY POŁOŻENIA (przeciętnego poziomu)

Klasyczne Pozycyjne

- Średnia - Dominanta D(x)

arytmetyczna - Mediana M(x)

- pozostałe kwantyle Qb/v(x)

17. Mediana- kwartyl drugiego rzędu

18. średnia, wariancja

Średnia arytmetyczna – - ogólna suma wartości podzielona przez liczbę wartości (liczebność zbiorowości)

Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od ...

Plik z chomika:

lily121

Inne pliki z tego folderu:

Statystyka.zip (1291 KB)
Zeszyt1.xls (19 KB)
korelacja_regresja_zestaw1.xls (137 KB)
korelacja_regresja_zestaw1.2.xls (144 KB)
korelacja_regresja_zestaw1.1.xls (131 KB)

1.doc

ETAPY:

Klasyczne Pozycyjne

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: