Rodzaje badań statystycznych.docx

(870 KB) Pobierz

Rodzaje badań statystycznych 

Wyróżnia się badania :

1.     Pełne ( całkowite )

2.     Częściowe

Badania pełne i częściowe  mogą być :

1.     Ciągłe ( np. rejestracja urodzeń, zgonów, małżeństw, itp. )

2.     Okresowe ( np. spisy ludności , rolne, przemysłu )

3.     Doraźne ( np. klęsk żywiołowych )

Wśród badań częściowych wyróżnia się :

1.     Badania reprezentacyjne (  są bardzo wartościowe, bo pozwalają z dużym prawdopodobieństwem uogólnić wyniki uzyskane ze zbiorowości próbnej na całą populację generalną, są tańsze od badań całkowitych).

2.     Badania monograficzne ( obejmują obserwację grupy społecznej, wsi , miasta , przykładem badania monograficznego jest badanie warunków życia ludności w mieście Rzeszowie w pewnym momencie lub w okresie)

3.     Badania ankietowe ( dość często wykorzystywana metoda badań , sprowadza się głównie do zbierania informacji pierwotnych, ważnym problemem jest wykształcenie umiejętności dobrego opracowania ankiety, zestaw pytań w kwestionariuszy ankietowym powinien być umiejętnie sformułowany.

W Polsce badaniami ankietowymi zajmują się takie instytucje jak : OBOP, CBOS, PPENTOR oraz inne ośrodki naukowe.

 

Procedury dobru próby

W badaniach statystycznych w praktyce posługujemy się próbą . Próba mała gdy ,    gdy   n>30 to mamy do czynienia  z próbą dużą .

Od próby wymaga się , aby była reprezentatywna. Na reprezentatywność próby mają wpływ dwa czynniki :

1.     Sposób doboru próby

2.     Liczebność próby

      Wyróżnia się dwie procedury doboru próby :

1.     Dobór celowy ( sprowadza się do tego , że o wyborze jednostek decyduje badacz, opierając się na merytorycznej znajomości problematyki badawczej, próba ta nie podlega prawu wielkich liczb )

2.     Dobór losowy ( zgodny jest z zasadami doboru według metody reprezentacyjnej, umożliwia zastosowanie metod statystyki matematycznej do wnioskowania, próba ma charakter losowy, gdy każda jednostka populacji z jednakowym prawdopodobieństwem  różnym od zera może się w niej znaleźć. Wyodrębniona próba podlega działaniu  prawa wielkich liczb, co oznacza że wraz ze wzrostem liczebności próby losowej (n) rośnie stopień jej reprezentatywności )

Przed pobraniem próby ważne jest określenie jednostki losowania Indywidualna jednostka losowania pokrywa się z jednostką badania, a zespołową jednostką losowania , gdy nie pokrywa się z jednostką badania ( np. losuje się mieszkania a bada się ich  osoby w nich zameldowane ).

 

Losowanie próby określa się jako operat losowania , przez który rozumie się wykaz jednostek  uwzględnionych  przy losowaniu z możliwością ich identyfikacji Na przykład , takim operatem losowania dla populacji mieszkańców Rzeszowa jest spis ( ponumerowany) wszystkich mieszkańców tego miasta.

Sposób postępowania przy doborze próby losowej określa się mianem schematu losowania. Podstawowe schematy losowania to:

1.     losowanie indywidualne

2.     losowanie nieograniczone ze zwracaniem ( zwane inaczej niezależnym lub zwrotnym )

3.     losowanie nieograniczone bez zwracania ( inaczej określane jako zależne )

4.     losowanie warstwowe

5.     losowanie systematyczne

6.     losowanie grupowe

      Klasyfikacja cech statystycznych

Cechy statystyczne można podzielić na:

1.     ilościowe ( mierzalne, kwantytatywne ) – można je zmierzyć i wyrazić za pomocą odpowiednich jednostek fizycznych ( np. kg, m, szt, t )

2.     jakościowe ( kwalitatywne) – zwykle są określane słownie np. płeć, standard mieszkania, pochodzenie społeczne, rodzaj kredytu itp.

Cechy ilościowe określa się jako zmienne, które można podzielić na :

·         skokowe ( dyskretne )

·         ciągłe

Cecha skokowa  przyjmuje  skończony i przeliczalny zbiór wartości na danej skali liczbowej , przy czym jest to najczęściej zbiór  liczb   całkowitych nieujemnych ( np. liczba dzieci w rodzinie , liczba usterek w konkretnym produkcie , wielkość gospodarstwa domowego itp. )

Cecha ciągła przyjmuje  wszystkie liczby rzeczywiste z określonego przedziału liczbowego < a , b > , przy czym liczba miejsc po przecinku jest uzależniona od dokładności pomiarów ( np. wiek , płaca, wzrost, plon pszenicy itp. )

Występuje również podział cech na :

·         stałe ( własności wspólne dla wszystkich jednostek statystycznych danej zbiorowości statystycznej

·         zmienne ( własności , dzięki którym poszczególne jednostki różnią się między sobą, przy czym dokładny stopień zmienności poszczególnych cech jest możliwy lub niemożliwy do określenia )

 

Dla potrzeb pomiaru cech stosuje się cztery rodzaje skal : nominalną , porządkową, interwałową i ilorazową .

Skala nominalna – skala stosująca wyłącznie opis słowny dla potrzeb identyfikacji jednostki. Np. kobieta i mężczyzna . Nie są możliwe działania arytmetyczne na danych opisanych na skali nominalnej.

Skala porządkowa – służąca do porządkowania danych. Na przykład ranking szkół wyższych z punktu widzenia ich atrakcyjności.

Skala interwałowa - skala mająca własności skali porządkowej, gdyż możliwe jest porządkowanie jednostek statystycznych opisanych w tej skali , a jednocześnie jest możliwe określenie interwału ( przedziału ) liczbowego, w którym zawierają się obserwacje.

 

 

Skala ilorazowa – skala ma cechy skali interwałowej, a ponadto iloraz ma tutaj określoną interpretację. Dane opisane w skali ilorazowej przyjmują zawsze wartości liczbowe, np. waga itp.

Szeregi statystyczne

Materiał liczbowy , otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, po opracowaniu i pogrupowaniu nazywamy szeregiem strukturalnym, charakteryzuje on zbiorowość statystyczną pod względem wyróżnionej cechy jakościowej i ilościowej.

Wyróżnia się dwa typy grupowania : grupowanie typologiczne ( według cechy jakościowej ) oraz grupowanie wariancyjne ( według cechy ilościowej )

Szeregiem szczegółowym prostym nazywamy uporządkowany nierosnąco lub niemalejąco ciąg wartości badanej zmiennej. Oznaczmy symbolem X badaną zmienną  , symbolem xi ( i=1,2,...,n) wartość tej zmiennej odpowiadającą i-tej jednostce statystycznej. Załóżmy, że badano n jednostek statystycznych. Ciąg wartości tej zmiennej ;

x1 , x2, ..., xn

określa się szeregiem szczegółowym prostym, jeśli w powyższym ciągu każdy następny element nie jest mniejszy od poprzedniego.

Przykład 1.

Załóżmy , że w pewnej miejscowości poddano obserwacji 16 rodzin ze względu na liczbę dzieci i otrzymano następujące wyniki :

0,1,1,2,2,3,3,3,4,4,4,5,5,6,6,7

Powyższy ciąg wartości jest uporządkowany niemalejąco, jest więc szeregiem szczegółowym prostym. W tym przypadku jednostką statystyczną jest rodzina, a cechą liczba dzieci w rodzinie

Wśród szeregów strukturalnych cechy ilościowej wyróżnia się szereg szczegółowy ważony oraz rozdzielczy.

 

 

Szereg szczegółowy ważony

 

 

Załóżmy, że wśród danych zawartych w szeregu szczegółowym prostym wyróżniono k różnych wartości. Następnie grupujemy jednostki statystyczne odpowiadające jednakowym wartościom cechy. Postępując w ten sposób otrzymujemy wyniki, które można zaprezentować w poniższej tablicy

 

Tab. 1  Wyniki grupowania statystycznego

 

Wartości cechy

         xi

 

Liczebność

       f i    

 

Częstość względna

       fi / n

          x1

          x2

                .

                 .

                .

                xk

       f1

       f2

       .

       .

       .

      fk

       f1 / n

       f2 / n

         .

         .

         .

       fk / n

  

   Razem

Źródło; opracowanie włane

Druga i trzecia kolumna tej tablicy charakteryzuje strukturę zbiorowości n- elementowej pod względem cechy X. Symbolem fi oznaczamy liczbę jednostek statystycznych , dla których wartość cechy przyjęła wartość xi ( i = 1,2,...,n). Wartość tę nazywamy liczebnością. Trzecia kolumna zawiera wielkości zwane liczebnościami względnymi lub frakcjami. Suma tych wielkości jest równa 1. Mnożąc te wielkości przez 100, otrzymujemy częstości w procentach . Częstości względne są  wielkościami niemianowanymi. Mogą być wykorzystane do porównań struktur zbiorowości różniących się liczebnościami. Liczebności lub częstości zawarte w przedostatniej i ostatniej kolumnie tej tablicy charakteryzują rozkład elementów zbiorowości pod względem danej cechy , lub rozkład cechy.

 

Szereg rozdzielczy

 

Obszar zmienności wartości cech dzielimy na rozłączne przedziały w postaci

dla i=1,2,...,k. Są to przedziały prawostronnie otwarte. Jednostki statystyczne , których wartości cechy przedstawia szereg szczegółowy prosty grupujemy wykorzystując przedziały, które nazywać będziemy przedziałami klasowymi lub klasami. Wyniki grupowania zawiera poniższa tablica

 

 

Tab.2    Wyniki grupowania statystycznego

 

 

Przedział klasowy

Liczebność

             

środek przedziału klasowego

        

Częstość względna

         

                   

     

           .

           .          

           .

                  

                 

                      

.

.

.

       

        

          .

          .

          .

        

                     

                           

    .

    .

    .

          

            Razem

    

           

        

  

Źródło: Opracowanie własne

 

Wartość środkową oblicza się według następującej formuły :

 

 

     ( i=1,2,...,k)

Przy budowie szeregu rozdzielczego należy sobie odpowiedzieć na następujące pytania :

1.     czy długości przedziałów mają być jednakowe ?

2.     na ile klas należy podzielić obszar zmienności ?

 

 

 

 

 

W praktyce badań statystycznych wygodnie jest, gdy przedziały klasowe są jednakowej długości. W przypadku , gdy przedziały nie są jednakowej długości, do opisu struktury zbiorowości wykorzystać należy tzw. gęstość liczebności, definiowaną za pomocą następującego wzoru :

 

                 ( i=1,2,...,n )

 

gdzie w mianowniku mamy długość i-tego przedziału, w liczniku zaś odpowiadającą mu liczebność.

W badaniach statystycznych brak jest jednoznacznych kryteriów  umożliwiających w sposób jednoznaczny odpowiedzieć na pytanie o liczbę klas w szeregu rozdzielczym.

J. Spława Neyman zalecał przy tworzeniu  szeregów rozdzielczych podział obszaru zmienności na około 10 – 20 klas, w zależności od liczebności zbiorowości.

Oznaczmy symbolem  „ h „ długość przedziału klasowego. Załóżmy, że wszystkie przedziały mają mieć równą długość. W tym przypadku najczęściej zaleca się, aby długość przedziału obliczać za pomocą następującej formuły :

 

                     ( i=1,...,n)

 

gdzie : w liczniku jest zakres zmienności wartości cechy, w mianowniku zaś liczba wymaganych klas.

Jeśli decydujemy się na budowę przedziałów klasowych , to narażamy się na pewną stratę informacji dotyczących pojedynczych wyników. Im większa jest rozpiętość przedziału klasowego, tym ta strata może być bardziej dotkliwa.

Przedziały klasowe zapisuje się zazwyczaj z dokładnością do przyjętej jednostki pomiarowej. Można budować rozkłady ( szeregi ) z przedziałami klasowymi domkniętymi lub otwartymi.

Rozstęp wynosi      R= Xmax – Xmin . Rozstęp charakteryzuje  jedynie wstępnie dyspersję badanego rozkładu.

Odchylenie ćwiartkowe wyrażone jest następującym wzorem :

Najpierw należy obliczyć kwartyl trzeci i kwartyl pierwszy.

 

Grupy dochodów miesięcznych

na gospodarstwo domowe

Liczba kobiet

W %

Szereg

skumulowany

         0,5 – 1,0

...
Zgłoś jeśli naruszono regulamin