Testy rozdílů četností
Testování rozdílu empirické a teoretické četnosti
Tímto testem porovnáváme empirické (experimentálně získané) četnosti sledovaného kvalitativního znaku pozorované ve výběrovém souboru o rozsahu n jedinců s teoretickou (statistickou) četností, kterou známe např. z literatury nebo z dlouhodobých pozorování. Testujeme přitom nulovou hypotézu o shodě empirické a teoretické četnosti H0: ne = no. Test rozdílu empirické a teoretické četnosti se nejčastěji používá při srovnávání výskytu nějakého náhodného jevu – kvalitativního znaku (např. úhyn zvířete, výskyt onemocnění, provedení vakcinace) ve sledovaném výběrovém souboru vzhledem k výskytu tohoto náhodného jevu v celé populaci. Jiným příkladem je použití v genetice při výpočtech spojených s porovnáváním empirických četností pozorovaných v genetických pokusech s očekávanými četnostmi teoreticky známými (štěpné poměry dle Mendela).
Příklad:
V chovu 146 telat bylo ve 13 případech zjištěno onemocnění enteritidou. V celé populaci je výskyt tohoto onemocnění u telat podle dlouhodobých sledování 4,5% . Liší se výskyt enteritidy ve sledovaném chovu vzhledem k celé populaci?
Postup:
Rozlišíme 2 kategorie (třídy) zvířat u výběrového i základního souboru:
- Nemocná zvířata
- Zdravá zvířata
1) Sestavíme tabulku četností pro obě kategorie:
Třídy: Nemocná telata Zdravá telata
Empirické četnosti (ne) : 13 133
Očekávané četnosti (no): 6,57 139,43
(výpočet: no = po . n) (0,045.146=6,57) (0,955.146=139,43)
2) Vypočteme testovací kritérium:
3) Stanovíme stupně volnosti: v = m-1 = 1
4) Zvolíme hladinu významnosti α a vyhledáme v tabulkách kritickou hodnotu odpovídající této hladině významnosti a danému stupni volnosti: c20,95(1)= 3,84
5) Porovnáme vypočítané testovací kritérium c2 s tabulkovou kritickou hodnotou (viz Tabulky: Kritické hodnoty rozdělení c2):
Vypočítaný c2 > c20,95(1) => rozdíl mezi empirickou a teoretickou četností je statisticky významný na hladině významnosti 0,05
Závěr: Pozorovaná výskyt enteritidy je ve sledované stáji statisticky významně (p < 0,05) vyšší než v celé populaci.
Příklad:
V experimentu s křížením rostlin hrachu, kdy byly sledovány barva a tvar semene, byly u souboru n = 556 semen pozorovány následující empirické četnosti (nei) ve 4 kvalitativních třídách:
kulatá žlutá semena: 315
kulatá zelená semena: 108
hranatá žlutá semena: 101
hranatá zelená semena: 32
Z předpokladu genetické nezávislosti barvy a tvaru semene a dominance kulatosti respektive žluté barvy (podle Mendelových zákonů) vyplývá, že by štěpný poměr měl být 9:3:3:1. Odpovídá pokus Mendelovým zákonům?
Postup:
1) Odvození očekávaných pravděpodobností poi pro výskyt potomků (semen) v jednotlivých třídách (výpočet ze zadaného štěpného poměru):
9/16 : 3/16 : 3/16 : 1/16
2) Vypočítáme očekávané četnosti v jednotlivých třídách (noi = poi . n) :
no1: 9/16.556= 312.75
no2: 3/16.556= 104.25
no3: 3/16.556= 104.25
no4: 1/16.556= 34.75
3) Vypočítáme testovací kritérium:
3) Stanovíme stupně volnosti: v = m-1 = 3
4) Zvolíme hladinu významnosti α a vyhledáme v tabulkách kritickou hodnotu odpovídající této hladině významnosti a danému stupni volnosti: c20,95(3)= 7.81
5) Porovnáme vypočítané testovací kritérium c2 s tabulkovou kritickou hodnotou (viz Tabulky: Kritické hodnoty rozdělení c2):
Vypočítaný c2 < c20,95(3) => rozdíly v četnostech v jednotlivých třídách nejsou statisticky významné.
Závěr: Pozorované četnosti v našem experimentu odpovídají teoretickému předpokladu podle Mendelových zákonů (p > 0,05).
Testování rozdílu 2 (několika) empirických četností
Tímto testem jsme schopni porovnat 2 i více skupin empirických četností mezi sebou a rozhodnout, zda se skupiny ve svých četnostech výskytu sledovaného kvalitativního znaku liší. V testu pracujeme s nejméně dvěma skupinami četností, přičemž každá skupina má několik kvalitativních tříd. Skupiny reprezentují náhodné výběrové soubory, které porovnáváme mezi sebou a testujeme tedy rozdíly empirických četností mezi skupinami navzájem.
Zjištěné empirické četnosti uspořádáme do tabulek četností, v nichž každý řádek a sloupec odpovídá klasifikaci do kategorií podle určitého kvalitativního znaku (skupiny, třídy). Testování rozdílu empirických četností pak provádíme vzhledem k vlastním součtům v tabulce. V tabulce četností označíme:
k – počet řádků (skupin) a četnosti ve skupinách ni
m – počet sloupců (tříd) a četnosti ve třídách nj
Při uspořádání četností v tabulce používáme pro označení četností (empirických i očekávaných) v jednotlivých buňkách tabulky symbol nij, kde indexy i, j přiřazují danou četnost k odpovídajícímu řádku (skupině) a sloupci (třídě) v tabulce. Pro každou pozorovanou empirickou četnost neij v každé buňce tabulky vypočítáme odpovídající očekávanou četnost noij pomocí součtů empirických četností v řádcích ( si = součet empirických četností v řádku i) a sloupcích tabulky (tj = součet empirických četností ve sloupci j) podle následujícího vztahu:
Testovací kritérium c2 pak vypočteme známý způsobem a porovnáme vypočtený c2 s tabulkovou kritickou hodnotou c21-a (n), abychom posoudili statistickou významnost rozdílu srovnávaných četností. Jako kritické hodnoty pro c2–test slouží 1-a kvantily c2 - rozdělení při n = (k-1) . (m-1) stupních volnosti (viz Tabulky: Kritické hodnoty rozdělení c2).
Pokud vypočtená statistika (testovací kritérium) c2 přesáhne tabulkovou kritickou hodnotu c21-a (n), prohlásíme, že empirické četnosti pozorované v jednotlivých skupinách se statisticky významně liší na hladině významnosti a.
Příklad:
Ve 3 chovech (A,B,C) v kraji byly sledovány počty mrtvě a živě narozených selat. Máme zjistit, zda se liší mortalita selat v těchto chovech? Zjištěné výsledky výskytu živě a mrtvě narozených selat v jednotlivých chovech jsou shrnuty v následující tabulce, která prezentuje empirické četnosti (noij) pozorované ve 3 skupinách (A,B,C) a 2 třídách (živé,mrtvé) :
|
Živé |
Mrtvé |
A |
96 |
25 |
B |
121 |
22 |
C |
89 |
16 |
Provedeme výpočet součtů řádků s sloupců v tabulce:
|
Živé |
Mrtvé |
Skup. S (si) |
A |
96 (100,34) |
25 (20,66) |
121 |
B |
121 (118,59) |
22 (24,41) |
143 |
C |
89 (87,07) |
16 (17,93) |
105 |
Tř. S (tj) |
306 |
63 |
369 (n) |
Teoretické četnosti (noij) pro každou buňku tabulky vypočítáme podle vzorce:
kde:
n = celkový počet jedinců ve sledovaném výběru (kontingenční tabulce)
si = součet empirických četností v řádku i
tj = součet empirických četností ve sloupci j
Vypočítáme testovací kritérium c2:
Stanovíme počet stupňů volnosti: v = (k-1).(m-1) = 2
Vyhledáme tabulkovou kritickou hodnotou pro zvolenou hladinu významnosti a a stanovené stupně volnosti (viz Tabulky: Kritické hodnoty rozdělení c2): c20,95(2) = 5,99
Porovnáme vypočtený c2 s tabulkovou kritickou hodnotou:
c2 < c20,95(2) => mezi sledovanými četnostmi není statisticky významný rozdíl
Závěr: Počet mrtvě a živě narozených selat se mezi sledovanými chovy A, B a C statisticky významně neliší (p > 0,05).