Mediana (zwana też wartością środkową lub drugim kwartylem) to w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2, czyli drugim kwartylem.
11,21,21,21,21,21,27,27,34,45,56,56,67,67,80,100
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
11=1;21:(2+3+4+5+6)/5=4;(7+8)/2=7,5;34=9;45=10;(11+12)/2=11,5;(13+14)/2=13,5;
80=15;100=16
CECHY STAŁE: Są wspólne dla wszystkich jednostek danej zbiorowości i nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości:
· rzeczowe - właściwości, które charakteryzują określony zbiór osób, rzeczy lub zjawisk,
· o przestrzenne - gdzie badamy,
· czasowe - jaki okres obejmuje badanie lub w jakim momencie się ono odbywa.
CECHY ZMIENNE: Są to właściwości, które różnią poszczególne jednostki statystyczne (głównie one podlegają obserwacji),
· mierzalne - (ilościowe, kwantytatywne) - właściwości które można zmierzyć i wyrazić za pomocą odpowiednich jednostek fizycznych (np. w kilometrach, centymetrach), zalicza się również do nich cechy quasi-ilościowe (porządkowe), kwantyfikują natężenie badanej właściwości przedstawionej w sposób opisowy, porządkując w ten sposób zbiorowość (np. oceny studentów: bdb, db, itp.),
· niemierzalne - (jakościowe, kwalitatywne) - zwykle określane słownie (np. płeć).
Cechy mierzalne - (nazywane zmiennymi) - oznaczenie: X, Y, Z, ich wartości: x, y, z:
· skokowe (dyskretne) - przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej, najczęściej jest to zbiór liczb całkowitych dodatnich (np. liczba osób w rodzinie, liczba usterek, itp.).
· ciągłe - mogą przyjąć każdą wartość z określonego przedziału liczbowego [a,b], przy czym liczba miejsc po przecinku jest uzależniona od dokładności dokonywanych pomiarów (np. waga detalu).
W przypadku badań zbiorowości wielowymiarowych zmienne (cechy mierzalne) dzielimy na:
· stymulanty - te cechy, których wyższe wartości pozwalają zakwalifikować daną jednostkę statystyczną jako lepszą z punku widzenia realizowanego badania,
· dominanty - cechy, których wysokie wartości świadczą o niskiej pozycji jednostki w zbiorze.
Cechy porządkowe umożliwiają porządkowanie (lub uszeregowanie) wszystkich elementów zbioru wyników. Cechy takie najlepiej określa się przymiotnikami i ich stopniowaniem. Każdemu ze stanów można również przypisać liczbę według wzrostu natężenia. Proces ten nazywa się rangowaniem. Na przykład, badając wzrost osoby, możemy użyć określeń: "niski", "średni" lub "wysoki". Podobnie, badając liczbę krwinek białych i używając określeń "poniżej normy", "w normie" lub "powyżej normy" - mamy do czynienia ze skalą porządkową.
Cechy ilościowe (mierzalne) to takie, które dadzą się wyrazić za pomocą jednostek miary w pewnej skali. Cechami mierzalnymi są na przykład: wzrost (w cm), waga (w kg), stężenie hemoglobiny we krwi (w g/dl), wiek (w latach) itp. Wśród cech mierzalnych wyróżniamy dwie podgrupy: cechy ciągłe i cechy skokowe.
Cecha ciągła to zmienna, która może przyjmować każdą wartość z określonego skończonego przedziału liczbowego, np. wzrost, masa ciała czy temperatura. Cechy skokowe mogą przyjmować wartości ze zbioru skończonego lub przeliczalnego (zwykle całkowite), na przykład: liczba łóżek w szpitalu, liczba krwinek białych w 1 ml krwi.
Pomiar - czynność przyporządkowania liczb przedmiotom (obiektom) lub wydarzeniom zgodnie z pewnym zbiorem reguł. Wynikiem pomiaru są dwa rodzaje wielkości, te które mówią o liczebności zbioru obiektów, i te, które charakteryzują stopień nasilenia zjawiska.
Skale pomiarowe ze względu na relacje dzielimy na:
· nominalne - relacja: równe różne; pomiar polega na zastosowaniu liczby jako nazwy, czyli grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy czy liczby, np. studenci wg rodzaju studiów, szczególny przypadek - skala dychotomiczna (dwupunktowa),
· porządkowe - relacja: większe lub mniejsze; pomiar polega na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy lub liczby i porządkuje się te klasy ze względu na stopień natężenia, w jakim posiadają one badaną cechę,
· przedziałowe - relacja: większe o tyle; pomiar występuje wtedy, gdy uporządkowany zbiór wartości cechy składa się z liczb rzeczywistych, Zero w tej skali ustalone jest dowolnie, np. skala Celsjusza i Fahrenheita, skala pozwala stwierdzić tylko o ile jest coś wyższe,
· stosunkowe (ilorazowe) - relacja: tyle razy większe; spełnia wszystkie aksjomaty liczb, pomiary w tej skali charakteryzują się stałymi ilorazami i zerem bezwzględnym, tylko w tej skali możliwe jest porównywanie jednostek za pomocą względnych charakterystyk: np. jeden obiekt jest dwa razy cięższy od drugiego.
7.
8. szacunki statystyczne (interpolacyjne, ekstrapolacyjne)Jeśli z pewnych względów nie możemy (lub nie chcemy) w sposób bezpośredni, tj. na podstawie badania pełnego lub częściowego uzyskać informacji o interesującej nas zbiorowości, to przeprowadzamy postępowanie zwane szacunkiem statystycznym. Szacunek ten polega na ustaleniu pewnych wielkości lub właściwości nieznanej zbiorowości na podstawie zbiorowości znanej, pozostającej z nią w określonym związku. Na przykład czas przeznaczony na czytanie książek, gazet i czasopism przez określoną grupę ludzi możemy szacować na podstawie liczby zakupionych książek, czasopism i gazet. Metodami szacunku statystycznego jest m.in. szacunek interpolacyjny i ekstrapolacyjny. Interpolacja polega na szacowaniu nieznanych wartości cechy na podstawie znanych wartości sąsiednich (późniejszych i sąsiednich). Ekstrapolacja natomiast na szacowaniu wartości wykraczających poza przedział wartości znanych.
9. ETAPY BADAŃ STATYSTYCZNYCH
Badanie statystyczne to zespół czynności, których celem jest określenie zbiorowości statystycznej i prawidłowości dotyczących cech statystycznych.
Ad. 1) Przygotowanie badania.
· Cel badania
· Przedmiot badania w ujęciu rzeczowym, czasowym i terytorialnym
· Zakres badania– wybór cech charakterystycznych podlegających badaniom
· Metoda badania (pełne lub częściowe)
· Plan badań, czyli harmonogram, formularze, instrukcje statystyczne
Formularze statystyczne jest to zbiór spisanych pytań dotyczących badanych cech rozważanych zbiorowości statystycznych. Formularz statystyczny składa się z nagłówka (tytuł,nr, adres) z kwestionariusza właściwego, czyli zasadniczej części formularza, w którym zawarte są wszystkie pytania formularza statystycznego. Pytania mogą być w postaci tabelarycznej, tekstowej i mieszanej. Tabela składa się z boczku i części końcowej.
Każda pozycja formularza jest opisana w instrukcji statystycznej, która jest niezbędna, aby uniknąć błędnych interpretacji i uzyskać jednolitą odpowiedz, Powinna zawierać podstawę prawną, przedmiot badania, terminy, sprawozdania itp.
Ad. 2) Materiał statystyczny jest to zbiór informacji o wartościach badanych cech w poszczególnych jednostkach statystycznych, który powstaje w wyniku prowadzonych obserwacji
Dzielimy go na
· Pierwotny materiał zebrany specjalnie dla naszych celów
· Wtórny obejmuje materiały już poprzednio zebrane przez inne jednostki i wykorzystane dla naszych celów, np. GUS
Kontrola materiału statystycznego
· Kontrola formalna, czyli kompletność zebranego materiału,
· Kontrola merytoryczna– obejmująca kontrole zgodności rachunkowej i logicznej poprawności zapisów
Ad. 3) Przygotowanie materiału statystycznego do opracowania. Stosujemy dwa etapy opracowania materiału statystycznego:
Grupowanie – polega na podziale całej zbiorowości statystycznej na mniejsze części
· Grupy proste – jedna cecha statystyczna
· Grupy złożone – co najmniej dwie cechy statystyczne
Po podzieleniu zbiorowości na grupy według pewnej cechy ustalamy kolejność oraz nazwy tych grup otrzymujemy uporządkowane nazwy grup tworzące wykaz klasyfikacyjny.
Wykaz klasyfikacyjny musi być wyczerpujący logiczny i przejrzysty. W przypadku, gdy badana cecha mierzalna ma charakter ciągły, warianty cech przedstawiamy w postaci przedziałów liczbowych (przedziały klasowe).
W wykazanych klasyfikacjach z cechą ze zmiennością ciągłą ważne jest obliczanie środków poszczególnych przedziałów oznaczony poszczególnych przedziałów.
10. Obserwacja statystyczna. Zbieranie materiałów - czyli obserwacja statystyczna , jego zliczanie i grupowanie jest drugim etapem badania statystycznego. Materiał statystyczny - zbiór danych liczbowych i opisowych. Materiał pierwotny - to sporządzony "teraz" (obecnie) przez ankietera. Materiał wtórny - to korzystanie z już wykonanych badań. Surowy materiał statystyczny - to materiał jeszcze nie skorygowany, może zawierać błędy.
Rodzaje błędów:
a) Błędy systematyczne (tendencyjne) - polegają na podawaniu faktów celowo znikształconych. Spowodowane jest to obawą przed konsekwencjami ujawnienia prawdy. Na przykład właściciele sklepów i przedsiębiorstw mogą kłamać nt. wielkości obrotów - ponieważ na ich podstawie określa się wysokość podatku.b) Błędy niesystematyczne (przypadkowe) - polegają na pomyłce liczbowej.
11. Szeregi statystyczne
Najprostsza, formą podziału zbiorowości na grupy są szeregi statystyczne.
Szereg statystyczny jest to liczbowe ujecie poddanej badaniu zbiorowości według określonego kryterium. Kryterium podziału stanowi wybrana cecha i jego warianty lub czas i usytuowanie terytorialne poszczególnych jednostek badanej zbiorowości. Szereg statystyczny w układzie pionowym składa się z dwóch kolumn. Jedna ujmuje cechę będącą kryterium podziału i jej kolejne warianty, a druga odpowiadające kolejnym wariantom cechy liczebności (przykład).
Szereg może tez mieć postać pozioma, złożoną z dwóch wierszy. Jeden z wierszy określa cechę i jej warianty, drugi odpowiadające tym wariantom liczebności. (przykład)
Rozróżnia się następujące rodzaje szeregów statystycznych:
- szeregi wyliczające
- szeregi strukturalne (rozdzielcze)
- szeregi terytorialne (geograficzne, przestrzenne)
- szeregi dynamiczne (czasowe)
12. Wnioskowanie statystyczne to dział statystyki zajmujący się problemami uogólniania wyników badania próby losowej na całą populację oraz szacowania błędów wynikających z takiego uogólnienia (patrz badanie statystyczne).
OPIS STATYSTYCZNY
13. Rozkład empiryczny to uzyskany na podstawie badania statystycznego opis wartości przyjmowanych przez cechę statystyczną w próbie przy pomocy częstości ich występowania.
Rozkład empiryczny może być prezentowany jako:
· szereg rozdzielczy
· histogram
· wielobok liczebności
· krzywa liczebności
· wykres pudełkowy
Dane uzyskane z badanie podlegają interpretacji i analizie dzięki wyznaczeniu miar rozkładu.
14. dominanta
15. Rozkład normalny, zwany też rozkładem Gaussa, lub krzywą dzwonową, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.
Przyczyną jest jego popularność w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników, jej rozkład będzie zbliżony do normalnego[1], stąd można go bardzo często zaobserwować w danych[2]. Ponadto rozkład normalny ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są dość proste obliczeniowo[3].
16. MIARY POŁOŻENIA (przeciętnego poziomu)
- Średnia - Dominanta D(x)
arytmetyczna - Mediana M(x)
- pozostałe kwantyle Qb/v(x)
17. Mediana- kwartyl drugiego rzędu
18. średnia, wariancja
Średnia arytmetyczna – - ogólna suma wartości podzielona przez liczbę wartości (liczebność zbiorowości)
Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od ...
lily121