Parametrické testy - Studentův t-test
(Test rozdílu 2 středních hodnot)
Studentův t-test je nejčastěji používaným parametrickým testem - používá se pro testování rozdílu 2 středních hodnot m. Podle statistické významnosti testovaného rozdílu středních hodnot (nejčastěji mezi pokusnou a kontrolní skupinou) usuzujeme na účinnost aplikovaného pokusného zásahu ve sledovaném experimentu.
Výpočet testovacího kritéria t vychází z odhadů parametrů m a s2 u výběrových souborů: a s2. Vypočtené testovací kritérium porovnáme s tabulkovou kritickou hodnotou (1-a/2 kvantil Studentova t-rozdělení pro dané n a zvolené a).
Jednovýběrový t-test
(porovnání základního a výběrového souboru)
Jednovýběrový t-test používáme v experimentálních situacích, kdy známe střední hodnotu m základního souboru (např. fyziologické hodnoty sledované veličiny) – tuto je pak možno považovat za konstantu. V experimentu pak ověřujeme hypotézu, že pokusný výběrový soubor pochází z populace, která má stejnou střední hodnotu jako tato známá konstanta. Testujeme nulovou hypotézu: H0: m = konst.
Při testu vycházíme z dat sledovaného výběrového souboru, u kterého předpokládáme, že pochází z populace s určitými parametry µ a s2 a dále ze známé střední hodnoty základního souboru m, která je rovna určité (známé) konstantě.
Nejprve vypočteme aritmetický průměr a rozptyl výběrového souboru (počet členů: n).
Poté vypočteme testovací kritérium (statistiku) t:
- průměr výběrového souboru
m - střední hodnota základního souboru
s2 – rozptyl výběrového souboru
n – počet členů výběrového souboru
Pro vyhledání tabulkové kritické hodnoty musíme stanovit počet stupňů volnosti výběrového souboru: n = n – 1 a zvolit hladinu významnosti a.
Vypočtenou statistiku t porovnáme s tabulkovou kritickou hodnotou t1-a/2(n), kde n = n-1 a a volíme 0,05 nebo 0,01 (viz Tabulky: Kvantily t1-α/2 (n) Studentova t-rozdělení):
· Je-li t £ t1-a/2(n) Þ statisticky nevýznamný rozdíl mezi střední hodnotou m a známou konstantou při zvolené a (nezamítáme nulovou hypotézu H0, tzn. výběrový soubor pochází z populace se známou střední hodnotou m = konst.).
Závěr: pokusný zásah byl neúčinný, protože nebyla ovlivněna střední hodnota souboru při aplikaci zásahu (p > 0,05).
· Je-li t > t1-a/2(n) Þ statisticky významný rozdíl mezi střední hodnotou m a známou konstantou (a = 0,05) nebo
statisticky vysoce významný rozdíl (při a = 0,01)
(zamítáme nulovou hypotézu H0, tzn. výběrový soubor nepochází s populace se známou střední hodnotou a pochází z jiné populace, kde m ¹ konst.).
Závěr: pokusný zásah byl účinný, protože způsobil změnu střední hodnoty u pokusného souboru ve srovnání se známou konstantní střední hodnotou (p < 0,05 resp. p < 0,01).
Modelový příklad na jednovýběrový t-test: Příklad 5
Dvojvýběrový t-test
(porovnání dvou výběrových souborů)
Používá se pro hodnocení experimentů, kde neznáme střední hodnotu základního souboru, a porovnáváme pouze 2 soubory výběrových dat. Tato data mohou být představována buď dvěma měřeními provedenými opakovaně u jedné skupiny jedinců (typicky měření před aplikací pokusného zásahu a po aplikaci – tzv. „párový pokus“ neboli „závislé výběry“) nebo dvěma nezávislými skupinami měření („nepárový pokus“ neboli „nezávislé výběry“).
V případě dvojvýběrového t-testu testujeme nulovou hypotézu: H0 : m1 = m2
porovnává data, která tvoří „spárované variační řady“, tzn. že pocházejí ze subjektů, které byly podrobeny dvěma měřením. Provádíme tedy 2 měření u jednoho výběrového souboru: 1. měření před aplikací pokusného zásahu, 2. po aplikaci pokusného zásahu. Takto získané hodnoty tvoří páry a reprezentují při testování jak kontrolní tak i pokusnou skupinu porovnávaných dat.
V testu vycházíme z rozdílů naměřených párových hodnot u srovnávaných variačních řad. Testujeme hypotézu, že střední hodnota měření před pokusem a po pokuse se rovnají (neboli: rozdíl středních hodnot párových měření je nulový).
Nejprve vypočteme rozdíly párových hodnot u výběrového souboru (n - počet párů) a ze zjištěných rozdílů vypočítáme aritmetický průměr a směrodatnou odchylku „s“ (resp. rozptyl s2).
Poté vypočteme testovací kritérium (statistiku) t:
Pro vyhledání tabulkové kritické hodnoty je nutno stanovit počet stupňů volnosti výběrového souboru: n = n-1 a zvolit hladinu významnosti a.
Vypočtenou statistiku t porovnáme s tabulkovou kritickou hodnotou t1-a/2(n) , kde n = n-1 a a volíme 0,05 nebo 0,01 (viz Tabulky: Kvantily t1-α/2 (n) Studentova t-rozdělení):
· Je-li t £ t1-a/2(n) Þ statisticky nevýznamný rozdíl m1 a m2 při zvolené a.
(nezamítáme nulovou hypotézu H0, tzn. že střední hodnota měření před pokusem se neliší od střední hodnoty měření po pokusu).
Závěr: pokusný zásah byl neúčinný, protože nebyla ovlivněna střední hodnota měření provedeného po aplikaci zásahu (p > 0,05).
· Je-li t > t1-a/2(n) Þ statisticky významný rozdíl m1 a m2 (a = 0,05) nebo
statisticky vysoce významný rozdíl (při a = 0,01)
(zamítáme nulovou hypotézu H0, tzn. střední hodnota měření před pokusem se liší od střední hodnoty měření po pokusu).
Závěr: pokusný zásah byl účinný, protože způsobil změnu střední hodnoty u měření provedeného po aplikaci pokusného zásahu ve srovnání se střední hodnotou zjištěnou před aplikací zásahu (p < 0,05 resp. p < 0,01).
Modelové příklady na párový t-test: Příklad 6, Příklad 18, Příklad 22
Nepárový t-test porovnává data, tvořená dvěma nezávislými výběry, tzn. že pocházejí ze dvou různých skupin jedinců. Typicky jde o porovnání hodnot pokusné skupiny (kde byl aplikován pokusný zásah) a kontrolní skupiny (kde aplikace pokusného zásahu provedena nebyla).
Testovaná nulová hypotéza: H0: m1 = m2 (střední hodnota m1 populace, ze které pochází pokusný výběr se rovná střední hodnotě m2 populace, ze které pochází kontrolní výběr).
Výpočet testu vychází z odhadů parametrů obou srovnávaných populací, tj. aritmetického průměru a výběrového rozptylu u pokusného a kontrolního výběru:
U výběrových souborů vypočteme výběrové charakteristiky:
1. výběrový soubor (počet členů n1) : 1, s1
2. výběrový soubor (počet členů n2) : 2, s2
Protože testované soubory mohou pocházet z populací, které mají stejný nebo naopak různý rozptyl hodnot sledované veličiny, je nejprve nutno otestovat rozdíl rozptylů obou souborů (nulovou hypotézu H0: s12 = s22) pomocí F-testu:
F = větší z rozptylů (s12, s22)
menší z rozptylů (s12, s22)
Pro vyhledání tabulkové kritické hodnoty pro F-test je nutno stanovit stupně volnosti pro:
stupně volnosti čitatele (většího rozptylu): nV = n(1,2) –1
stupně volnosti jmenovatele (menšího rozptylu): nM = n(1,2) –1
Ve statistických tabulkách (viz Tabulky: Kvantily F0,975 (nV, nM) Fisher-Snedecorova rozdělení) vyhledáme kritickou hodnotu Fkrit. = 1 - a/2 kvantil F-rozdělení o (vV,vM) stupních volnosti pro zvolenou hladinu významnosti α = 0,05.
Podle výsledku F-testu zvolíme odpovídající postup pro nepárový t-test:
a) Je-li F £ F0,975 (nV, nM)
tzn. že platí H0: s12 = s22. (Oba výběry tedy pocházejí z populací se shodným rozptylem).
Pro testování rozdílu středních hodnot použijeme nepárový t-test pro shodné rozptyly:
(Stupně volnosti pro t-test: n = n1+ n2 -2)
Pro n1 = n2 = n platí: n = (n-1) .2
b) Je-li F > F0,975 (nV, nM)
tzn. že neplatí nulová hypotéza H0: s12 = s22. (Oba výběry tedy pocházejí z populací s různým rozptylem).
Pro testování rozdílu středních hodnot použijeme nepárový t-test pro různé rozptyly:
Stupně volnosti pro t-test: (Pro n1, n2 > 30: n = )
Pro n1 = n2 = n platí :
Vypočtenou statistiku t porovnáme s tabulkovou kritickou hodnotou t1-a/2(n), nalezenou podle daného n a zvolené hladiny významnosti a (0,05 nebo 0,01) - viz Tabulky: Kvantily t1-α/2 (n) Studentova t-rozdělení:
· Je-li t £ t1-a/2(n) Þ statisticky nevýznamný rozdíl m1 a m2 při zvolené a (nezamítáme nulovou hypotézu H0, tzn. že střední hodnota pokusného souboru se neliší od střední hodnoty kontrolního souboru).
Závěr: aplikovaný pokusný zásah byl neúčinný, protože nebyla ovlivněna střední hodnota pokusného souboru vlivem aplikace zásahu ve srovnání se střední hodnotou kontrolního souboru (p > 0,05).
· Je-li t > t1-a/2(n) Þ statisticky významný rozdíl m1 a m2 (při a = 0,05) nebo
statisticky vysoce významný rozdíl (při a = 0,01)
(zamítáme nulovou hypotézu H0, tzn. že střední hodnota pokusného souboru se liší od střední hodnoty kontrolního souboru).
Závěr: pokusný zásah byl účinný, protože způsobil změnu střední hodnoty u pokusného souboru vlivem aplikace pokusného zásahu ve srovnání se střední hodnotou kontrolního souboru (p < 0,05 resp. p < 0,01).
Modelové příklady na nepárový t-test: Příklad 3, Příklad 4, Příklad 17, Příklad 19, Příklad 21