Náhodná veličina
Zkoumaný statistický znak je možno popsat pomocí veličiny, tzn. projevu znaku číselně vyjádřeného. Tato veličina za určitých podmínek (tj. za určitých podchycených podmínek) vlivem náhodných činitelů (tj. vlivem určitých nepodchycených podmínek) nabývá různých hodnot. Označujeme ji proto pojmem náhodná veličina.
Náhodnou veličinu lze definovat jako číselné vyjádření výsledku náhodného jevu – projevu kvantitativního nebo kvalitativního znaku, který je předmětem zkoumání.
Z formálního hlediska můžeme rozlišit 2 typy náhodných veličin:
1. Diskrétní (nespojitá) náhodná veličina – taková, která může nabývat pouze jednotlivých hodnot (celých čísel) z konečného nebo nekonečného intervalu, tzn. může se měnit jen po skocích.
2. Spojitá náhodná veličina – taková, která může nabývat všech hodnot z konečného nebo nekonečného intervalu, tzn. může se měnit spojitě bez skoků.
Spojitou náhodnou veličinu můžeme převést na nespojitou tak, že její průběh rozdělíme do intervalů a každý interval nebude reprezentovat nekonečně hodnot, jak je tomu u spojité náhodné veličiny, ale jen jedna hodnota, obvykle střední hodnota intervalu. Např. spojitou náhodnou veličinu dojivost dojnice nabývající všech hodnot, např. od 5 do 15 kg rozdělíme do intervalů 5-7 kg, 7-9 kg, 9-11 kg, 11-13 kg, 13-15 kg a tak získáme nespojitou náhodnou veličinu nabývající hodnot 6, 8, 10, 12, 14 kg.
Nespojitou náhodnou veličinu na spojitou obvykle nepřevádíme, protože bychom se mohli dopustit nemožných závěrů. Např. nespojitou náhodnou veličinu počet mláďat v králičím vrhu nelze převést na spojitou náhodnou veličinu, protože počet mláďat 5,35 ve vrhu je nemožný (0,35 mláděte nemůže nastat).
Náhodná veličina prakticky představuje všechna data získaná měřením sledovaného statistického znaku v nějakém pozorování (experimentu). Prvním krokem při statistickém zpracování a vyhodnocení těchto dat (náhodné veličiny) bývá roztřídění a uspořádání naměřených hodnot do přehledné formy (variační řady, tabulky četností, grafy). Pojmem variační řada je označována řada všech hodnot (variant) náhodné veličiny, seřazených vzestupně nebo sestupně. Při opakovaném výskytu některých hodnot ve variační řadě používáme pojem četnost varianty (počet opakování dané hodnoty, frekvence hodnoty).
Výskyt hodnot náhodné veličiny podléhá určitým zákonitostem. Zákonitost výskytu hodnot náhodné veličiny vyplývá z rozdělení hodnot náhodné veličiny. Rozdělení náhodné veličiny vyjadřuje výskyt (četnost, frekvenci) hodnot náhodné veličiny v závislosti na dané hodnotě náhodné veličiny, což je důležité pro vytvoření představy, jak jsou různé hodnoty náhodné veličiny na číselné ose měřené veličiny rozmístěny.
A) Rozdělení četností diskrétní náhodné veličiny
nabývá jen určitých hodnot (nejčastěji celých čísel), proto je grafickým vyjádřením rozdělení diskrétní náhodné veličiny úsečkový graf rozdělení četností jednotlivých hodnot.
Např. při sledování počtu mláďat u výběrového souboru dvanácti vrhů králíků (n = 12) byly pozorovány následující počty mláďat, uspořádané do variační řady: 2, 3, 4, 4, 5, 5, 5, 6, 6, 7, 7, 8
Příklad grafického vyjádření rozdělení četností této variační řady je zobrazen na následujícím obrázku 1.:
Obrázek 1. Rozdělení četností diskrétní náhodné veličiny
B) Rozdělení četností spojité náhodné veličiny
teoreticky může nabývat všech hodnot v rámci určitého reálného intervalu. Pro lepší přehlednost a zjednodušení takovéto spojité variační řady se při grafickém vyjádření rozdělení spojité náhodné veličiny hodnoty této veličiny rozdělují do tříd, které představují přesné vymezení intervalu hodnot náhodné veličiny. Jednotlivé variační třídy v jednom souboru dat mají obvykle stejnou velikost. Každý jedinec tedy „patří“ do určitého intervalu – třídy.
Třída je reprezentována nejčastěji jedinou hodnotou – středem třídy a počtem hodnot zjištěných pro danou třídu - četností (frekvencí) třídy (počet hodnot vyskytujících se v dané třídě).
Podle vyjádření četnosti rozlišujeme:
a) absolutní četnost – hodnota, která vyjadřuje, kolik hodnot se v dané třídě vyskytuje.
b) relativní četnost – hodnota, která vyjadřuje poměr (%) výskytu hodnot v dané třídě k celkovému počtu hodnot ve všech třídách.
Všechny empirické křivky pro možné výběry z téže populace se pohybují přibližně okolo teoretické křivky, která popisuje pravděpodobnostní rozdělení náhodné veličiny u celého základního souboru. Tvar této křivky pravděpodobnostního rozdělení sledované náhodné veličiny můžeme pouze odhadovat na základě empirických křivek výběrových souborů z dané populace. Přitom čím větší bude výběrový soubor, tím přesněji se bude blížit empirická křivka skutečnému tvaru křivky teoretické křivky pro danou náhodnou veličinu. U teoretické křivky rozdělení je na ose y používán pojem hustota pravděpodobnosti – f(x). Tato pravděpodobnostní funkce vyjadřuje pravděpodobnost, že náhodná veličina X nabude hodnoty x.
Obrázek 3. Rozdělení pravděpodobností náhodné veličiny