Pravděpodobnostní rozdělení spojité náhodné veličiny pro základní soubory

 

Pro popis náhodných veličin, s kterými pracujeme ve statistice u základních souborů, používáme nejčastěji následující pravděpodobnostní rozdělení: Gaussovo normální rozdělení, normované normální rozdělení, neznámé rozdělení.

 

1. Gaussovo normální rozdělení

 

Normálním rozdělením („Gaussovou křivkou“) se řídí velké množství náhodných veličin v biologii, případně je zde alespoň předpokládáno. Při statistické analýze bývá normalita rozdělení podmínkou použití těch nejúčinnějších statistických metod. Mnoho sledovaných biologických proměnných, které se tímto rozdělením vůbec neřídí, můžeme také aproximativně (tzn. s uspokojivým přiblížením) modelovat pomocí tohoto rozdělení, především u statistických souborů s velkým počtem jedinců.

Náhodná veličina X má v celém základním souboru normální rozdělení závislé na 2 parametrech: střední hodnotě m a směrodatné odchylce s > 0, která charakterizuje variabilitu náhodné veličiny X .

Grafickým vyjádřením Gaussova normálního rozdělení je zvonovitá křivka, symetrická kolem střední hodnoty  m  („parametr polohy“ – udává polohu křivky na ose x). Šířku křivky v tzv. inflexním bodě (bod obratu křivky) udává směrodatná odchylka s („parametr rozptýlení“). Grafické vyjádření Gaussova normálního rozdělení pro náhodnou veličinu X je uveden na obrázku 1.

Obrázek 1. Gaussovo normální rozdělení pravděpodobností

 

Popis: obr 2

 

X = spojitá náhodná veličina

f(x)= hustota pravděpodobnosti náhodné veličiny X

m = střední hodnota náhodné veličiny X

s = směrodatná odchylka náhodné veličiny X

 

Tvar křivky Gaussova normálního rozdělení je ovlivněn a plně charakterizován parametry m a s. Přesnější interpretaci parametru rozptýlení s přibližují vztahy, které uvádějí pravděpodobnosti různých intervalů kolem středu rozdělení. Pro každé Gaussovo normální rozdělení GNR (m; s) platí:

V rozmezí hodnot m ± 1s se vyskytuje 68,3 % všech jedinců populace.

V rozmezí hodnot m ± 2s se vyskytuje 95,5 % všech jedinců populace.

V rozmezí hodnot m ± 3s se vyskytuje 99,7 % všech jedinců populace.

Výskyt zbývajících 0,3 % hodnot souboru (oba extrémní konce osy x) je tak málo pravděpodobný, že z hlediska statistiky jsou takové hodnoty považovány za chybu měření („odlehlé, extrémní hodnoty“) a vylučují se z dalšího hodnocení (blíže viz Grubbsův test v Přednášce 2: Vylučování extrémních hodnot souboru).

 

 

2. Normované normální rozdělení

 

Normované (neboli standardizované) normální rozdělení je normální rozdělení se střední hodnotou, která je rovna 0 a směrodatnou odchylkou, která je rovna vždy 1. Někdy se toto rozdělení nazývá U-rozdělení (případně Z-rozdělení), protože je definováno pro teoreticky odvozenou veličinu U, která vznikne transformací původní náhodné veličiny X tak, že se od ní odečte střední hodnota celé populace a rozdíl se vydělí směrodatnou odchylkou populace:

                     

 

X – měřená náhodná veličina (absolutní hodnoty znaku xi) s GNR o parametrech m a s

U – normovaná veličina (relativní hodnoty ui) s NNR o parametrech m(N) = 0 a s(N) = 1

Transformací získané hodnoty normované veličiny U jsou relativní (bezrozměrné), přičemž každá hodnota ui udává počet směrodatných odchylek od střední hodnoty 0. Příklad grafického vyjádření normovaného normálního rozdělení pro náhodnou veličinu U je uveden na obrázku 2.

Obrázek 2. Normované normální rozdělení pravděpodobností

 

Popis: NNR

U = normovaná náhodná veličina získaná transformací

f(u)= hustota pravděpodobnosti normované náhodné veličiny U

m = střední hodnota normované náhodné veličiny U

s = směrodatná odchylka normované náhodné veličiny U

 

Křivka normovaného rozdělení je zvonovitá, symetrická kolem střední hodnoty m stejně jako Gaussova křivka. Liší se pouze posunem na ose x (střed souměrnosti křivky NNR, tzn. střední hodnota m je posunuta do hodnoty 0) a jednotkovou šířkou (směrodatná odchylka s = 1).  Podobně platí i shoda v procentuelním zastoupení výskytu hodnot v intervalech daných směrodatnými odchylkami symetricky kolem střední hodnoty m.  

Normované hodnoty veličiny U spolu s jejich distribučními funkcemi F(u) jsou tabelovány ve statistických tabulkách (viz Tabulky: Distribuční funkce F(u) normovaného normálního rozdělení). Distribuční funkce normovaného normálního rozdělení je možno využívat při zjišťování pravděpodobnosti, že daná hodnota padne do určitého intervalu.

 

 

3. Neznámé rozdělení

Některé spojité náhodné veličiny sledované v biologických a lékařských vědách neodpovídají Gaussovu normálnímu rozdělení pravděpodobností – mají pak obvykle různě nepravidelnou křivku rozdělení, často vícevrcholovou a asymetrickou. Hovoříme o tzv. neznámém rozdělení pravděpodobností, které pro nepravidelnost křivky nelze popsat přesnými parametry, určujícími střed symetrie ani šířku křivky, jako tomu bylo u Gausova normálního rozdělení.

Pro popis neznámého rozdělení je používána jediná charakteristika – medián .  Medián je považován za střed neznámého rozdělení, šířku křivky neznámého rozdělení nelze pro její nepravidelnost určovat. Protože je medián definován jako 50 % kvantil, dělí plochu pod křivkou rozdělení na 2 poloviny, symbolicky znázorňující podíl jedinců (50 %) v populaci, kteří mají hodnoty sledovaného znaku nižší než medián a podíl jedinců (50 %) v populaci, kteří mají hodnoty sledovaného znaku vyšší než medián.

Příklady grafického vyjádření neznámého rozdělení pro spojitou náhodnou veličinu jsou uvedeny na obrázku 3.

 

Obrázek 3. Příklady neznámého rozdělení pravděpodobností

Popis: nezname

 

 Zpět