X2-
test (testování shody rozdělení
četností)
Většina postupů při zpracování souborů dat ve statistice se liší podle toho, jestli daný soubor má nebo nemá GNR. V biologii většinou toto rozdělení předpokládáme, nemusí však být vždy. Na podmínku normality jsou citlivé hlavně některé statistické testy, které používáme k hodnocení souborů (při n > 30 se citlivost zmenšuje).
Pro rozhodnutí, zda se rozdělení četností v souboru shoduje s
předpokládaným GNR se nejčastěji používá
X2test dobré shody.
Je založen na posouzení rozdílu mezi skutečnými (empirickými) četnostmi výskytu hodnot ve VS a očekávanými (teoretickými) četnostmi, odpovídajícimi příslušnému rozdělení pravděpodobností (GNR).
(X2test rozhoduje, zda je
rozdíl mezi empirickými a teoretickými četnostmi způsoben pouze
náhodně a VS odpovídá GNR, nebo je
rozdíl natolik velký, že je způsoben tím, že VS nepochází z populace
odpovídající GNR, ale z nějakého jiného rozdělení.)
Např.: při sledování hmotnosti králíků máme rozhodnout, zda náhodný výběr o 1000 kusech odpovídá GNR s těmito parametry: m =3.75 kg , s = 0.5 kg (kterým se řídí celá populace - ZS).
Při
testu vycházíme z těchto hodnot:
VS : x1, x2, x3, ..... x1000 (n = 1000)
ZS : m =3.75, s =0.5
1)
Zvolí se intervaly tříd (di - dolní mez, hi - horní mez) , např.po 0.5 kg
( i
- číslo třídy )
2)
Zjistí se absolutní četnost empirická – nei v jednotlivých třídách ( => histogram výběrového
souboru).
3)
Vypočítá
se absolutní četnost teoretická (očekávaná pro GNR) - noi
v jednotlivých třídách :
a)
pro hodnoty di a hi se vypočítají
relativní hodnoty udi a uhi :
b) pro udi a uhi se zjistí v tabulkách hodnoty distribuční funkce : F(udi), F(uhi)
c)
pro každou třídu se zjistí teoretická pravděpodobnost
:
poi
= F(uhi) - F(udi)
d)
pro každou třídu se vypočítá očekávaná absolutní četnost
: noi = n .
poi
4)
Vypočítá
se testová charakteristika X2 :
m –
počet tříd
5)
Vypočítaný X2 porovnáme s tabulkovou hodnotou X2(a,n) - kritická hodnota při pravděpodobnosti chyby
a (např.0.05) a n stupních volnosti (n = m-k-1).
k – počet parametrů GNR, které
neznáme, a musíme je odhadnout z VS.
6)
Je-li X2
£ X2(a,n) => statisticky nevýznamný rozdíl mezi empirickou a teoretickou četností, způsobený náhodnými
činiteli; (VS odpovídá GNR).
Je-li X2
> X2(a,n) => statisticky významný rozdíl mezi nei a noi, způsobený
tím, že VS odpovídá jinému rozdělení než
GNR (rozdíl není způsoben jen náhodnými činiteli).
Pro charakteristiku a další testování takového VS je nutno použít jiné rozdělení a neparametrické metody.