Testy rozdílů četností

 

Testování rozdílu empirické a teoretické četnosti

 

Tímto testem porovnáváme empirické (experimentálně získané) četnosti sledovaného kvalitativního znaku pozorované ve výběrovém souboru o rozsahu n jedinců s teoretickou (statistickou) četností, kterou známe např. z literatury nebo z dlouhodobých pozorování. Testujeme přitom nulovou hypotézu o shodě empirické a teoretické četnosti H0: ne = no. Test rozdílu empirické a teoretické četnosti se nejčastěji používá při srovnávání výskytu nějakého náhodného jevu – kvalitativního znaku (např. úhyn zvířete, výskyt onemocnění, provedení vakcinace) ve sledovaném výběrovém souboru vzhledem k výskytu tohoto náhodného jevu v celé populaci. Jiným příkladem je použití v genetice při výpočtech spojených s porovnáváním empirických četností pozorovaných v genetických pokusech s očekávanými četnostmi teoreticky známými (štěpné poměry dle Mendela).

 

Příklad:

V chovu 146 telat bylo ve 13 případech zjištěno onemocnění enteritidou. V celé populaci je výskyt tohoto onemocnění u telat podle dlouhodobých sledování 4,5% . Liší se výskyt enteritidy ve sledovaném chovu vzhledem k celé populaci?

Postup:

Rozlišíme 2 kategorie (třídy) zvířat u výběrového i základního souboru:

-        Nemocná zvířata

-        Zdravá zvířata

 

1) Sestavíme tabulku četností pro obě kategorie:   

         Třídy:                                                   Nemocná telata            Zdravá telata

Empirické četnosti (ne) :                               13                               133      

Očekávané četnosti (no):                            6,57                           139,43

  (výpočet: no = po . n)                     (0,045.146=6,57)         (0,955.146=139,43)

                                                                                       

2) Vypočteme testovací kritérium:

 

 

   

 

3) Stanovíme stupně volnosti:   v = m-1 = 1

4) Zvolíme hladinu významnosti α a vyhledáme v tabulkách kritickou hodnotu odpovídající této hladině významnosti a danému stupni volnosti: c20,95(1)= 3,84

5) Porovnáme vypočítané testovací kritérium c2 s tabulkovou kritickou hodnotou (viz Tabulky: Kritické hodnoty rozdělení c2):

Vypočítaný c2 > c20,95(1) => rozdíl mezi empirickou a teoretickou četností je statisticky významný na hladině významnosti 0,05

Závěr: Pozorovaná výskyt enteritidy je ve sledované stáji statisticky významně (p < 0,05) vyšší než v celé populaci.

 

 

 Příklad:

V experimentu s křížením rostlin hrachu, kdy byly sledovány barva a tvar semene, byly u souboru n = 556 semen pozorovány následující empirické četnosti  (nei) ve 4 kvalitativních třídách:

 kulatá žlutá semena:               315

 kulatá zelená semena:            108        

 hranatá žlutá semena:             101

 hranatá zelená semena:            32

                                         

Z předpokladu genetické nezávislosti barvy a tvaru semene a dominance kulatosti respektive žluté barvy (podle Mendelových zákonů) vyplývá, že by štěpný poměr měl být 9:3:3:1. Odpovídá pokus Mendelovým zákonům?

 

Postup:

1) Odvození očekávaných pravděpodobností poi pro výskyt potomků (semen) v jednotlivých třídách (výpočet ze zadaného štěpného poměru):

     9/16  :  3/16  :  3/16  :  1/16

2) Vypočítáme očekávané četnosti v jednotlivých třídách (noi = poi . n) :

     no1:  9/16.556= 312.75          

     no2: 3/16.556= 104.25           

     no3: 3/16.556= 104.25

     no4: 1/16.556= 34.75

 

3) Vypočítáme testovací kritérium:

 

    

 

 

3) Stanovíme stupně volnosti:   v = m-1 = 3

4) Zvolíme hladinu významnosti α a vyhledáme v tabulkách kritickou hodnotu odpovídající této hladině významnosti a danému stupni volnosti: c20,95(3)= 7.81

5) Porovnáme vypočítané testovací kritérium c2 s tabulkovou kritickou hodnotou (viz Tabulky: Kritické hodnoty rozdělení c2):

Vypočítaný c2 < c20,95(3)  => rozdíly v četnostech v jednotlivých třídách nejsou statisticky významné.

 

Závěr: Pozorované četnosti v našem experimentu odpovídají teoretickému předpokladu podle Mendelových zákonů (p > 0,05).

 

 

    Testování rozdílu 2 (několika) empirických četností

 

Tímto testem jsme schopni porovnat 2 i více skupin empirických četností mezi sebou a rozhodnout, zda se skupiny ve svých četnostech výskytu sledovaného kvalitativního znaku liší. V testu pracujeme s nejméně dvěma skupinami četností, přičemž každá skupina má několik kvalitativních tříd. Skupiny reprezentují náhodné výběrové soubory, které porovnáváme mezi sebou a testujeme tedy rozdíly empirických četností mezi skupinami navzájem.  

Zjištěné empirické četnosti uspořádáme do tabulek četností, v nichž každý řádek a sloupec odpovídá klasifikaci do kategorií podle určitého kvalitativního znaku (skupiny, třídy). Testování rozdílu empirických četností pak provádíme vzhledem k vlastním součtům v tabulce. V tabulce četností označíme:

k – počet řádků (skupin) a četnosti ve skupinách ni

m – počet sloupců (tříd) a četnosti ve třídách nj

Při uspořádání četností v tabulce používáme pro označení četností (empirických i očekávaných) v jednotlivých buňkách tabulky symbol nij, kde indexy i, j přiřazují danou četnost k odpovídajícímu řádku (skupině) a sloupci (třídě) v tabulce. Pro každou pozorovanou empirickou četnost neij v každé buňce tabulky vypočítáme odpovídající očekávanou četnost noij pomocí součtů empirických četností v řádcích ( si = součet empirických četností v řádku i) a sloupcích tabulky (tj = součet empirických četností ve sloupci j) podle následujícího vztahu:

 

Testovací kritérium c2 pak vypočteme známý způsobem a porovnáme vypočtený c2 s tabulkovou kritickou hodnotou c21-a (n), abychom posoudili statistickou významnost rozdílu srovnávaných četností. Jako kritické hodnoty pro c2–test slouží 1-a kvantily c2 - rozdělení při n = (k-1) . (m-1) stupních volnosti (viz Tabulky: Kritické hodnoty rozdělení c2).

Pokud vypočtená statistika (testovací kritérium) c2 přesáhne tabulkovou kritickou hodnotu c21-a (n), prohlásíme, že empirické četnosti pozorované v jednotlivých skupinách se statisticky významně liší na hladině významnosti a.

 

Příklad:

Ve 3 chovech (A,B,C) v kraji byly sledovány počty mrtvě a živě narozených selat. Máme zjistit, zda se liší mortalita selat v těchto chovech? Zjištěné výsledky výskytu živě a mrtvě narozených selat v jednotlivých chovech jsou shrnuty v následující tabulce, která prezentuje empirické četnosti (noij) pozorované ve 3 skupinách (A,B,C) a 2 třídách (živé,mrtvé) :

 

                 

   

Živé

Mrtvé

A

96

25

B

121

22

C

89

16

 

 

 

 

Provedeme výpočet součtů řádků s sloupců v tabulce:

 

 

               

Živé

Mrtvé

Skup. S

(si)

A

96

(100,34)

25

(20,66)

121

B

121

(118,59)

22

(24,41)

143

C

89

(87,07)

16

(17,93)

105

Tř. S

(tj)

306

63

 369      (n)

 

 

Teoretické četnosti (noij) pro každou buňku tabulky vypočítáme podle vzorce:

                              

                     kde:

                               n = celkový počet jedinců ve sledovaném výběru (kontingenční tabulce)

                               si = součet empirických četností v řádku i

                               tj = součet empirických četností ve sloupci j

                              

 

             Vypočítáme testovací kritérium c2:

 

 

 

 

Stanovíme počet stupňů volnosti:   v = (k-1).(m-1) = 2

Vyhledáme tabulkovou kritickou hodnotou pro zvolenou hladinu významnosti a a stanovené stupně volnosti (viz Tabulky: Kritické hodnoty rozdělení c2):  c20,95(2) = 5,99

Porovnáme vypočtený  c2 s tabulkovou kritickou hodnotou:

c2 < c20,95(2) => mezi sledovanými četnostmi není statisticky významný rozdíl

 

Závěr: Počet mrtvě a živě narozených selat se mezi sledovanými chovy A, B a C statisticky významně neliší (p > 0,05).

 

Zpět