Parametrické testy - Studentův t-test

(Test rozdílu 2 středních hodnot)

 

Studentův t-test je nejčastěji používaným parametrickým testem - používá se pro testování rozdílu 2 středních hodnot m. Podle statistické významnosti testovaného rozdílu středních hodnot (nejčastěji mezi pokusnou a kontrolní skupinou) usuzujeme na účinnost aplikovaného pokusného zásahu ve sledovaném experimentu.

Výpočet testovacího kritéria t vychází z odhadů parametrů m a s2 u výběrových souborů: a s2. Vypočtené testovací kritérium porovnáme s tabulkovou kritickou hodnotou (1-a/2 kvantil Studentova t-rozdělení pro dané n a zvolené a).

 

 

Jednovýběrový t-test

(porovnání základního a výběrového souboru)

Jednovýběrový t-test používáme v experimentálních situacích, kdy známe střední hodnotu m základního souboru (např. fyziologické hodnoty sledované veličiny) – tuto je pak možno považovat za konstantu. V experimentu pak ověřujeme hypotézu, že pokusný výběrový soubor pochází z populace, která má stejnou střední hodnotu jako tato známá konstanta. Testujeme nulovou hypotézu:  H0: m = konst.

Při testu vycházíme z dat sledovaného výběrového souboru, u kterého předpokládáme, že pochází z populace s určitými parametry µ a s2 a dále ze známé střední hodnoty základního souboru m, která je rovna určité (známé) konstantě.

Nejprve vypočteme aritmetický průměr a rozptyl výběrového souboru (počet členů: n).

Poté vypočteme testovací kritérium (statistiku) t:                         

 

- průměr výběrového souboru

m - střední hodnota základního souboru

s2 – rozptyl výběrového souboru

n – počet členů výběrového souboru 

 

Pro vyhledání tabulkové kritické hodnoty musíme stanovit počet stupňů volnosti výběrového souboru: n = n – 1 a zvolit hladinu významnosti a.

Vypočtenou statistiku t porovnáme s tabulkovou kritickou hodnotou t1-a/2(n), kde n = n-1 a a  volíme 0,05 nebo 0,01 (viz Tabulky: Kvantily t1-α/2 (n) Studentova t-rozdělení):

·         Je-li t £ t1-a/2(n) Þ  statisticky nevýznamný rozdíl mezi střední hodnotou m  a známou konstantou při zvolené a (nezamítáme nulovou hypotézu H0, tzn. výběrový soubor pochází z populace se známou střední hodnotou m = konst.).

Závěr: pokusný zásah byl neúčinný, protože nebyla ovlivněna střední hodnota souboru při aplikaci zásahu (p > 0,05).

 

·         Je-li t > t1-a/2(n)  Þ   statisticky  významný rozdíl mezi střední hodnotou m  a známou konstantou (a = 0,05) nebo

statisticky vysoce významný rozdíl (při a = 0,01)

(zamítáme nulovou hypotézu H0, tzn. výběrový soubor nepochází s populace se známou střední hodnotou a pochází z jiné populace, kde m ¹ konst.).

Závěr: pokusný zásah byl účinný, protože způsobil změnu střední hodnoty u pokusného souboru ve srovnání se známou konstantní střední hodnotou (< 0,05 resp. p < 0,01).

 

Modelový příklad na jednovýběrový t-test: Příklad 5

 

 

Dvojvýběrový t-test

(porovnání dvou výběrových souborů)

Používá se pro hodnocení experimentů, kde neznáme střední hodnotu základního souboru, a porovnáváme pouze 2 soubory výběrových dat. Tato data mohou být představována buď dvěma měřeními provedenými opakovaně u jedné skupiny jedinců (typicky měření před aplikací pokusného zásahu a po aplikaci – tzv. „párový pokus“ neboli „závislé výběry“) nebo dvěma nezávislými skupinami měření („nepárový pokus“ neboli „nezávislé výběry“).

V případě dvojvýběrového t-testu testujeme nulovou hypotézu: H0 : m1  = m2 

A) Párový t-test

porovnává data, která tvoří „spárované variační řady“, tzn. že pocházejí ze subjektů, které byly podrobeny dvěma měřením. Provádíme tedy 2 měření u jednoho výběrového souboru: 1. měření před aplikací pokusného zásahu, 2. po aplikaci pokusného zásahu. Takto získané hodnoty tvoří páry a reprezentují při testování jak kontrolní tak i pokusnou skupinu porovnávaných dat.

V testu vycházíme z rozdílů naměřených párových hodnot u srovnávaných variačních řad. Testujeme hypotézu, že střední hodnota měření před pokusem a po pokuse se rovnají (neboli: rozdíl středních hodnot párových měření je nulový).

Nejprve vypočteme rozdíly párových hodnot u výběrového souboru (n - počet párů) a ze zjištěných rozdílů vypočítáme aritmetický průměr  a směrodatnou odchylkus“ (resp. rozptyl s2).

Poté vypočteme testovací kritérium (statistiku) t:                  

 

 

Pro vyhledání tabulkové kritické hodnoty je nutno stanovit počet stupňů volnosti výběrového souboru: n = n-1 a zvolit hladinu významnosti a.

Vypočtenou statistiku t porovnáme s tabulkovou kritickou hodnotou t1-a/2(n) , kde n = n-1 a  a volíme 0,05 nebo 0,01 (viz Tabulky: Kvantily t1-α/2 (n) Studentova t-rozdělení):

·         Je-li t £ t1-a/2(n) Þ  statisticky nevýznamný rozdíl m1 a m2 při zvolené a.

(nezamítáme nulovou hypotézu H0, tzn. že střední hodnota měření před pokusem se neliší od střední hodnoty měření po pokusu).

Závěr: pokusný zásah byl neúčinný, protože nebyla ovlivněna střední hodnota měření provedeného po aplikaci zásahu (> 0,05).

·         Je-li t > t1-a/2(n)  Þ    statisticky  významný rozdíl m1 a m2 (a = 0,05) nebo

                                        statisticky vysoce významný rozdíl (při a = 0,01)

(zamítáme nulovou hypotézu H0, tzn. střední hodnota měření před pokusem se liší od střední hodnoty měření po pokusu).

Závěr: pokusný zásah byl účinný, protože způsobil změnu střední hodnoty u měření provedeného po aplikaci pokusného zásahu ve srovnání se střední hodnotou zjištěnou před aplikací zásahu (p < 0,05 resp. p < 0,01).

 

Modelové příklady na párový t-test: Příklad 6, Příklad 18, Příklad 22

 

B) Nepárový t-test

Nepárový t-test porovnává data, tvořená dvěma nezávislými výběry, tzn. že pocházejí ze dvou různých skupin jedinců.  Typicky jde o porovnání hodnot pokusné skupiny (kde byl aplikován pokusný zásah) a kontrolní skupiny (kde aplikace pokusného zásahu provedena nebyla).

Testovaná nulová hypotéza: H0: m1 = m2  (střední hodnota m1 populace, ze které pochází pokusný výběr se rovná střední hodnotě m2 populace, ze které pochází kontrolní výběr).

Výpočet testu vychází z odhadů parametrů obou srovnávaných populací, tj. aritmetického průměru a výběrového rozptylu u pokusného a kontrolního výběru:

U výběrových souborů vypočteme výběrové charakteristiky:  

          1. výběrový soubor (počet členů n1) : 1, s1

                     2. výběrový soubor (počet členů n2) : 2, s2

Protože testované soubory mohou pocházet z populací, které mají stejný nebo naopak různý rozptyl hodnot sledované veličiny, je nejprve nutno otestovat rozdíl rozptylů obou souborů (nulovou hypotézu H0: s12 = s22) pomocí F-testu:  

F =  větší z rozptylů (s12, s22)        

                                  menší z rozptylů (s12, s22)               

Pro vyhledání tabulkové kritické hodnoty pro F-test je nutno stanovit stupně volnosti pro:

stupně volnosti čitatele (většího rozptylu):           nV = n(1,2) –1  

stupně volnosti jmenovatele (menšího rozptylu): nM = n(1,2) –1

Ve statistických tabulkách (viz Tabulky: Kvantily F0,975 (nV, nM) Fisher-Snedecorova rozdělení) vyhledáme kritickou hodnotu Fkrit. = 1 - a/2 kvantil  F-rozdělení o (vV,vM) stupních volnosti pro zvolenou hladinu významnosti α = 0,05.

                                                                        

Podle výsledku F-testu zvolíme odpovídající postup pro nepárový t-test:

 

a)      Je-li F £ F0,975 (nV, nM)

tzn. že platí H0: s12 = s22. (Oba výběry tedy pocházejí z populací se shodným rozptylem).

Pro testování rozdílu středních hodnot použijeme nepárový t-test pro shodné rozptyly:                    

                                                           (Stupně volnosti pro t-test: nn1+ n2 -2)       

    Pro n1 = n2 = n platí:                            n = (n-1) .2     

 

 

b)      Je-li F > F0,975 (nV, nM) 

tzn. že neplatí nulová hypotéza H0: s12 = s22. (Oba výběry tedy pocházejí z populací s různým rozptylem).

Pro testování rozdílu středních hodnot použijeme nepárový  t-test pro různé rozptyly:               

 

                           Stupně volnosti pro t-test:          (Pro n1, n2 > 30:  n = )

 

 

      Pro n1 = n2 = n platí :               

 

 

 

Vypočtenou statistiku t porovnáme s tabulkovou kritickou hodnotou t1-a/2(n), nalezenou podle daného n a zvolené hladiny významnosti a (0,05 nebo 0,01) - viz Tabulky: Kvantily t1-α/2 (n) Studentova t-rozdělení:

·         Je-li t £ t1-a/2(n) Þ  statisticky nevýznamný rozdíl m1 a m2   při zvolené a (nezamítáme nulovou hypotézu H0, tzn. že střední hodnota pokusného souboru se neliší od střední hodnoty kontrolního souboru).

Závěr: aplikovaný pokusný zásah byl neúčinný, protože nebyla ovlivněna střední hodnota pokusného souboru vlivem aplikace zásahu ve srovnání se střední hodnotou kontrolního souboru (p > 0,05).

·         Je-li t > t1-a/2(n) Þ    statisticky  významný rozdíl m1 a m2  (při a = 0,05) nebo

    statisticky vysoce významný rozdíl (při a = 0,01)

(zamítáme nulovou hypotézu H0, tzn. že střední hodnota pokusného souboru se liší od střední hodnoty kontrolního souboru).

Závěr: pokusný zásah byl účinný, protože způsobil změnu střední hodnoty u pokusného souboru vlivem aplikace pokusného zásahu ve srovnání se střední hodnotou kontrolního souboru (p < 0,05 resp. < 0,01).

 

Modelové příklady na nepárový t-test: Příklad 3, Příklad 4, Příklad 17, Příklad 19, Příklad 21

 

Zpět