Náhodná veličina

 

Zkoumaný statistický znak je možno popsat pomocí veličiny, tzn. projevu znaku číselně vyjádřeného. Tato veličina za určitých podmínek (tj. za určitých podchycených podmínek) vlivem náhodných činitelů (tj. vlivem určitých nepodchycených podmínek) nabývá různých hodnot. Označujeme ji proto pojmem náhodná veličina.

Náhodnou veličinu lze definovat jako číselné vyjádření výsledku náhodného jevu – projevu kvantitativního nebo kvalitativního znaku, který je předmětem zkoumání.

formálního hlediska můžeme rozlišit 2 typy náhodných veličin:

1.     Diskrétní (nespojitá) náhodná veličina – taková, která může nabývat pouze jednotlivých hodnot (celých čísel) z konečného nebo nekonečného intervalu, tzn. může se měnit jen po skocích.

2.     Spojitá náhodná veličina – taková, která může nabývat všech hodnot z konečného nebo nekonečného intervalu, tzn. může se měnit spojitě bez skoků.

  Spojitou náhodnou veličinu můžeme převést na nespojitou tak, že její průběh rozdělíme do intervalů a každý interval nebude reprezentovat nekonečně hodnot, jak je tomu u spojité náhodné veličiny, ale jen jedna hodnota, obvykle střední hodnota intervalu. Např. spojitou náhodnou veličinu dojivost dojnice nabývající všech hodnot, např. od 5 do 15 kg rozdělíme do intervalů 5-7 kg, 7-9 kg, 9-11 kg, 11-13 kg, 13-15 kg a tak získáme nespojitou náhodnou veličinu nabývající hodnot 6, 8, 10, 12, 14 kg.

 Nespojitou náhodnou veličinu na spojitou obvykle nepřevádíme, protože bychom se mohli dopustit nemožných závěrů. Např. nespojitou náhodnou veličinu počet mláďat v králičím vrhu nelze převést na spojitou náhodnou veličinu, protože počet mláďat 5,35 ve vrhu je nemožný (0,35 mláděte nemůže nastat).

 

Rozdělení náhodné veličiny

Náhodná veličina prakticky představuje všechna data získaná měřením sledovaného statistického znaku v nějakém pozorování (experimentu). Prvním krokem při statistickém zpracování a vyhodnocení těchto dat (náhodné veličiny) bývá roztřídění a uspořádání naměřených hodnot do přehledné formy (variační řady, tabulky četností, grafy). Pojmem variační řada je označována řada všech hodnot (variant) náhodné veličiny, seřazených vzestupně nebo sestupně. Při opakovaném výskytu některých hodnot ve variační řadě používáme pojem četnost varianty (počet opakování dané hodnoty, frekvence hodnoty).

Výskyt hodnot náhodné veličiny podléhá určitým zákonitostem. Zákonitost výskytu hodnot náhodné veličiny vyplývá z rozdělení hodnot náhodné veličiny. Rozdělení náhodné veličiny vyjadřuje výskyt (četnost, frekvenci) hodnot náhodné veličiny v závislosti na dané hodnotě náhodné veličiny, což je důležité pro vytvoření představy, jak jsou různé hodnoty náhodné veličiny na číselné ose měřené veličiny rozmístěny.

 

A) Rozdělení četností diskrétní náhodné veličiny

nabývá jen určitých hodnot (nejčastěji celých čísel), proto je grafickým vyjádřením rozdělení diskrétní náhodné veličiny úsečkový graf rozdělení četností jednotlivých hodnot.

Např. při sledování počtu mláďat u výběrového souboru dvanácti vrhů králíků (n = 12) byly pozorovány následující počty mláďat, uspořádané do variační řady:   2, 3, 4, 4, 5, 5, 5, 6, 6, 7, 7, 8  

Příklad grafického vyjádření rozdělení četností této variační řady je zobrazen na následujícím obrázku 1.: 

 

Obrázek 1. Rozdělení četností diskrétní náhodné veličiny

Popis: obr 1

 

 

B) Rozdělení četností spojité náhodné veličiny

 teoreticky může nabývat všech hodnot v rámci určitého reálného intervalu. Pro lepší přehlednost a zjednodušení takovéto spojité variační řady se při grafickém vyjádření rozdělení spojité náhodné veličiny hodnoty této veličiny rozdělují do tříd, které představují přesné vymezení intervalu hodnot náhodné veličiny. Jednotlivé variační třídy v jednom souboru dat mají obvykle stejnou velikost. Každý jedinec tedy „patří“ do určitého intervalu – třídy.

Třída je reprezentována nejčastěji jedinou hodnotou – středem třídy a počtem hodnot zjištěných pro danou třídu - četností (frekvencí) třídy (počet hodnot vyskytujících se v dané třídě).

Podle vyjádření četnosti rozlišujeme:

a)      absolutní četnost – hodnota, která vyjadřuje, kolik hodnot se v dané třídě vyskytuje.

b)      relativní četnost – hodnota, která vyjadřuje poměr (%) výskytu hodnot v dané třídě k celkovému počtu hodnot ve všech třídách. 

Pro náhodnou veličinu kvantitativního znaku se třídy vytváří uměle – tj. vytváří je člověk, protože nevyplývají z projevu znaku. Např. pro hmotnost králíků se třídy vytvoří uměle tak, že se přesně vymezí intervaly pro hodnoty hmotnosti např. 1,00-1,50 kg, 1,51-2,00 kg, 2,01-2,50 kg, 2,51-3,00 kg, 3,01-3,50 kg, 3,51-4,00 kg.

Při stanovení počtu tříd se vždy uplatňuje subjektivní prvek. Orientačně lze počet tříd stanovit podle rozsahu výběrového souboru takto:

            do 100 jedinců           6 – 9 tříd

            do 500 jedinců           10 – 15 tříd

            nad 500 jedinců          16 – 20 tříd

Pro přesnější stanovení tříd je vhodné dodržovat některé hlavní zásady, podle nichž se řazení do tříd (třídění, grupování) provádí:

U naměřených dat zjistíme nejmenší a největší číselnou hodnotu a provedeme jejich odečtení. Tím získáme variační rozpětí, které rozdělíme na určitý počet stejně velkých dílů. Ve výše uvedeném příkladu pro hmotností králíků bychom tedy dostali: 4,00-1,00=3,00 kg dělíme 6 (zvolený počet tříd) a dostaneme 0,5 kg jako velikost třídního intervalu. Všechny hodnoty, které jsou v jednotlivých dílech (třídách) obsaženy, pak reprezentuje hodnota jediná (střed třídy). Rozdíl mezi dvěma po sobě následujícími středy tříd nazýváme délkou intervalu (třídy).

 

Pro grafické vyjádření rozdělení četností spojité náhodné veličiny se nejčasteji používají dva typy grafů – histogram a polygon.

 

Histogram

představuje grafické vyjádření rozdělení spojité náhodné veličiny, ve kterém jsou na ose x vyznačeny třídní intervaly a nad každým intervalem je sestrojen sloupec, jenž vyjadřuje absolutní nebo relativní četnost pro daný třídní interval.

Polygon

představuje grafické vyjádření rozdělení spojité náhodné veličiny, ve kterém jsou na ose x vyznačeny středy třídních intervalů a nad každým intervalem je ve středu třídy sestrojen bod, jenž vyjadřuje absolutní nebo relativní četnost pro daný třídní interval. Body jsou spojeny lineárně.

Příklad grafického vyjádření rozdělení četností spojité náhodné veličiny (hmotnost) pomocí histogramu a polygonu je zobrazen na následujícím obrázku 2:

 

 

Obrázek 2. Rozdělení četností spojité náhodné veličiny

Popis: obr 1

 

Polygon představuje nejčastější typ grafického vyjádření rozdělení četností náhodných veličin kvantitativních statistických znaků. Polygon může být jako typ grafického vyjádření rozdělení četností použit jak pro spojitou tak i diskrétní veličinu - u ní pak lineárně spojujeme vrcholy úseček úsečkového grafu. Tvar polygonu je specifický pro každý konkrétní výběrový soubor, na kterém bylo provedeno sledování dané náhodné veličiny. Pro polygon proto často používáme pojem empirická křivka rozdělení náhodné veličiny

Všechny empirické křivky pro možné výběry z téže populace se pohybují přibližně okolo teoretické křivky, která popisuje pravděpodobnostní rozdělení náhodné veličiny u celého základního souboru. Tvar této křivky pravděpodobnostního rozdělení sledované náhodné veličiny můžeme pouze odhadovat na základě empirických křivek výběrových souborů z dané populace. Přitom čím větší bude výběrový soubor, tím přesněji se bude blížit empirická křivka skutečnému tvaru křivky teoretické křivky pro danou náhodnou veličinu. U teoretické křivky rozdělení je na ose y používán pojem  hustota pravděpodobnosti – f(x). Tato pravděpodobnostní funkce vyjadřuje pravděpodobnost, že náhodná veličina X nabude hodnoty x.

Příklad grafického vyjádření pravděpodobnostního rozdělení spojité náhodné veličiny (hmotnost) pomocí teoretické křivky rozdělení v základním souboru (ZS) ve vztahu k empirickým křivkám rozdělení četností dané náhodné veličiny ve výběrových souborech (VS) je zobrazen na obrázku 3.

   

Obrázek 3. Rozdělení pravděpodobností náhodné veličiny

Popis: obr 1

 

 

 

Typy pravděpodobnostních rozdělení

Velká řada biologických znaků odpovídá normálnímu (Gaussovu) rozdělení pravděpodobností, které je symetrické – většina hodnot v populaci je rozmístěna kolem střední hodnoty a naopak extrémně nízké a vysoké hodnoty mají v populaci nejnižší pravděpodobnost výskytu. Některé z biologických znaků (např. v medicíně) však tomuto rozdělení neodpovídají – křivky jejich pravděpodobnostních rozdělení pak mohou nabývat různých tvarů (asymetrické, nepravidelné ap.). Příklady různých typů pravděpodobnostních rozdělení pro spojitou náhodnou veličinu jsou uvedeny na obrázku 4.

 

Obrázek 4. Různé typy pravděpodobnostních rozdělení spojité náhodné veličiny:

  

a)      Normální, symetrické (Gaussovo)

  

 

 

b)      Asymetrické
 

 

 



 

 

 

 

c)      Extrémní



 

 

 



 

d)      Neznámé (nepravidelné)




 

 

 

 

 

Zpět