Pomoc matematyczna.docx

(169 KB) Pobierz

Statystyka jest nauką traktującą o ilościowych metodach badania zjawisk (procesów) masowych.

Zjawiska masowe dotyczą dużej liczby jednostek. Prawidłowości, które można ujawnić w drodze obserwacji zjawisk masowych nazywamy PRAWODŁOWOŚCIAMI STATYSTYCZNYMI.

 

POPULACJA (zbiorowość generalna) na którą składają się wszystkie jednostki tworzące wyodrębnioną całość statystyczną i będące przedmiotem badania statystycznego. Każda jednostka ma takie same prawdopodobieństwo dostania się do próby.

POPULACJA SKOŃCZONA zbiór elementów populacji jest skończony np. ludność polski, osoby na tej sali

POPULACJA NIESKOŃCZONA posiada nieskończoną liczbę elementów (zbiorowość, rzuty monetą)

PRÓBA STATYSTYCZNA -jednostki wybrane w określony sposób z populacji.*

*próba powinna być reprezentatywna!(Wszystkie jednostki mają taką samą możliwość/prawdopodobieństwo znalezienia się w próbie.

 

Rodzaje badań statystycznych:

PEŁNE- obejmuje wszystkie elementy zbiorowości generalnej np. spis powszechny.

CZĘŚCIOWE - obejmuje tylko pewną część zbiorowości.

Przyczyny prowadzenia badań częściowych:

- Populacja jest nieskończona (leki)

- Badania mają charakter niszczący (badanie wytrzymałości)

- Skończona, ale bardzo liczna populacja (szacunkowe wyniki wyborów)

STATYSTYKA OPISOWA - zajmuje się opracowaniem danych dotyczących zbiorowości czy próby bez posługiwania się rachunkiem prawdopodobieństwa (deterministyczne)

STATYSTYKA MATEMATYCZNA - wnioskowanie statystyczne - pozwala ustalić prawidłowości i podejmować decyzje dot. całej zbiorowości na postawie próby dobranej w sposób losowy (o znalezieniu się danej jednostki populacji w próbie decyduje przypadek) przy zastosowaniu rachunku prawdopodobieństwa.

 

Cechy statystyczne

 

Niemierzalne (jakościowe)                            Mierzalne (ilościowe)

 

Cech jakościowych nie można mierzyć lecz tylko wyrazić słownie : płeć kierunek studiów kolor oczu

Cechy ilościowe można mierzyć i mogą być wyrażone za pomocą licz lub w różnych miarach np. wzrost cena, wiek

Cechy mierzalne - skokowe - quasi osiągalne - ciągłe

Zmienne skokowe mogą wyrażać się tylko określonymi liczbami zmieniającymi się w sposób skokowy bez wartości pośrednich.

Zmienne ciągłe mogą przyjmować każdą wartość z określonego przedziału liczbowego (temperatura)

Quasi osiągalne -> ceny -> coś jest skokowe, ale może przyjąć wiele wartości.

 

Biorąc pod uwagę liczbę cech podanych w badaniu zbiorowości, statystycznie możemy podzielić na jednowymiarowe (jedno-cechowe) i wielowymiarowe (wielo-cechowe).

Zmienna losowa i jej rozkład

 

Niech E będzie zbiorem zdarzeń elementarnych pewnego doświadczenia. Funkcje X(e) przyporządkowującą każdemu zdarzeniu elementarnemu e ϵ E i tylko jedną liczbę X(e)=x nazywamy ZMIENNĄ LOSOWĄ. Zmienna losowa jest przekształceniem zdarzenia losowego w wartość liczbową.

 

Przykład: rzucamy dwoma monetami, jeżeli wypadnie orzeł wygrywamy 1 zł, jeśli reszka nic nie wygrywamy. Zbiór zdarzeń elementarnych i wartości wygranej (0;0)=2, (0;R)=1, (R;0)=1, (R;R)=0.

Rozkładem prawdopodobieństwa skokowej zmiennej losowej nazywamy zbiór par z {(xi,pi)}=1,2….ni, gdzie xi jest wartością zmiennej zaś pi prawdopodobieństwem, z jakim zmienna X przybiera wartości xi.

 

0

1

2

0,25

0,5

0,25

Wartość zmiennej losowej (xi

Prawdopodobieństwa (pi)

 

Wartość dystrybuanty zmiennej losowej to prawdopodobieństwo, że zmienna losowa przyjmie wartość nie większą od określonego poziomu F(xi)=  P(X ≤ xi)

 

Wartość zmiennej losowej(xi)  

0

1

2

0,25

0,5

0,25

0,25

0,75

1

Prawdopodobieństwo (pi)

Wartość dystrybuanty F(xi)

 

F(1) = P (X ≤ 1) = 0,75

F(2) = P (X ≤ -2) = 0

F(3) = P (X ≤ 10) = 1

 

Momenty rozkładu prawdopodobieństwa zmiennej losowej skokowej.

O Moment zwykły rzędu r: E(Xr) = i=1kxi pi=mr

m- wartość oczekiwana

 

Średnia

O Moment centralny rzędu r:

µr = E[X-(X)]r= i=1k(xi-m)rpi

Wariancja – średnia zróżnicowania; Pi – prawdopodobieństwo, że X=xi

 

Moment zwykły rzędu pierwszego to wartość oczekiwana E(X) zmiennej losowej X.

E(X) = i=1kxi,pi

Moment centralny drugiego rzędu to wariancja D2X

D2(X) = i=1kxi-m2 pi = E(X2) – E(X)2= m2 – m12

Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji – D(X) = D2(X)

 

Własności wartości oczekiwanej

1. Jeśli c jest stałą wartością to:
E(c)= c

E(cx)= cE (X)

 

2. Jeżeli X1 i X2 są dwiema zmiennymi losowymi, każda o wartości oczekiwanej wnoszącej odpowiednio E(X1) i E(X2) to zachodzi:

E(X1 + X2) = E(X1) + E(X2)

 

Własność wariancji

Jeżeli c jest stałą wartością to:

D2(c) = 0,

D2(x+c) = D2(X),

D2(cX) = c2D2

 

Dominanta to taka wartość zmiennej losowej, której wystąpienie jest najbardziej prawdopodobne.
P(x) = xd = max {p}

 

Mediana i kwartale

Medianą zmiennej losowej nazywamy wartość M zmiennej losowej X spełniającej nierówność:

P(X ≤ M) ≥ 12  i P(X ≥ M) ≥ 12

F(Q1) = P(X ≤ Q1) = 0,25

M= F(M)= P(X ≤ M) = 0,5               M=Q2

F(Q3) = P (X ≤ Q3) = 0,75

 

Współczynnik skośności

AS = EX- xdD(X) 

AS = 1-10,71 = 0  -> rozkład symetryczny

 

 

Współczynnik asymetrii

A(X) = µ3D3 (x)  D(x) – odchylenie

 

 

 

 

 

 

 

Wariancja z próby losowej jest obciążonym estymatorem wariacji w populacji
S2x=1ni=1n(xi-x)2

ES2X=n-1n

D2(X)D2(X)

 

Obciążenie to wynosi

σn=n-1nD2X-D2X=-1nD2(X)

Czyli wariancja z próby daje zaniżone oszacowania wariancji w populacji. Obciążenie to wraz ze wzrostem liczebności próby maleje do zera.

Nieobciążony estymator wariancji
S2x=1n-1i=1n(xi-x)2

S2x=nn-1S2(x)

Efektywność
Spośród nieobciążonych estymatorów Tn(1), Tn(2) parametru θ, najefektywniejszy jest ten, którego wariancja jest mniejsza

Zgodność
Estymator Tn jest zgodny z estymatorem parametru θ, jeżeli dla dowolnie małego ε>0:

limn→∞=P(|Tn-θ|)<ϵ=1
Warunek ten oznacza, że wraz ze wzrostem liczebności próby wzrasta pewność, że wartość estymatora Tn, liczone na podstawie jej wyników, nie różnią się znacznie od wartości par...

Zgłoś jeśli naruszono regulamin