Odhady parametrů základního souboru

 

 

V praxi obvykle provádíme výběrové statistické šetření s cílem zkoumat vlastnosti základního souboru (populace). Na základě výběrových dat provádíme zevšeobecňující úsudek, tzn. usuzujeme na obecnější skutečnosti, které se týkají celé populace. Jednou ze základních úloh statistického usuzování (statistické indukce) je odhadování neznámých parametrů základního souboru pomocí údajů získaných náhodným výběrem z daného základního souboru. Důležitým rysem statistické metody odhadování je její pravděpodobnostní charakter (při jakémkoli úsudku, který o základním souboru učiníme na základě údajů získaných náhodným výběrem, musíme počítat s možností, že tento úsudek je chybný).

Podle typu rozdělení, kterým se řídí základní soubor je možno na základě dat výběrových souborů z tohoto rozdělení zjistit různé charakteristiky, které se v jistém smyslu blíží k odpovídajícím charakteristikám základního souboru (jsou jejich odhadem). Odhadování parametrů základního souboru na základě charakteristik výběrových souborů lze provést v zásadě dvěma metodami:

1.      Bodový odhad - neznámý parametr základního souboru odhadujeme pomocí jediného čísla, bodu. Bodovým odhadem parametru základního souboru jsou popisné charakteristiky výběrového souboru.

2.      Intervalový odhad - neznámý parametr základního souboru odhadujeme pomocí dolní a horní hranice intervalu hodnot, mezi nimiž se parametr základního souboru nachází s určitou pravděpodobností.

Intervalové odhady parametrů základního souboru umožňují vyjádřit chybu, kterou je odhad parametru základního souboru na základě statistik výběrového souboru zatížen. Naproti tomu bodový odhad parametru základního souboru pomocí charakteristiky výběrového souboru je zatížen určitou chybou odhadu, nepřesností. Tato chyba je tím menší, čím větší je rozsah n výběrového souboru.

 

A) Odhad parametrů souboru s Gaussovým normálním rozdělením

Odhadujeme dva parametry, používané pro charakteristiku Gaussovy křivky: parametr µ (střední hodnota) a parametr s (směrodatná odchylka), případně s2(rozptyl).

 

1. Odhad parametru µ (střední hodnota)

 

Bodový odhad µ:

bodovým odhadem parametru m (střední hodnota) základního souboru s Gaussovým normálním rozdělením je aritmetický průměr  vypočítaný na základě dat výběrového souboru:

 

 

Intervalový odhad µ:

počítáme dolní a horní meze intervalu  spolehlivosti (m1, m2), mezi nimiž se střední hodnota (parametr µ) základního souboru nachází s určitou (zvolenou) pravděpodobností :

           

 

Ve výpočtu používáme:

t1-a/2 koeficient spolehlivosti (1-a/2 kvantil  Studentova rozdělení), který odpovídá určité (zvolené) pravděpodobnosti chyby a, s jakou provádíme intervalový odhad (pro biologická data zpravidla a = 0,05, při požadavku větší přesnosti můžeme volit  a = 0,01). Zvolená pravděpodobnost chyby a tak určuje tzv. hladinu významnosti, na které je odhad prováděn a udává zároveň spolehlivost (1-a) počítaného intervalového odhadu. Koeficient spolehlivosti lze nalézt ve statistických tabulkách (viz Tabulky: Kvantily Studentova t-rozdělení).

- střední chyba průměru - vyjadřuje kolísání výběrových průměrů kolem skutečné střední hodnoty m základního souboru:

 

 

 

 

2. Odhad parametru s2 (rozptyl)

 Bodový odhad s2:

bodovým odhadem parametru s2 (rozptyl) základního souboru s Gaussovým normálním rozdělením je výběrový rozptyl s2, vypočtený na základě dat výběrového souboru:

 

Výraz n-1 ve jmenovateli zlomku: počet stupňů volnosti (v) výběrového souboru - ukazuje počet nezávislých veličin, které se vyskytují v  definici daného parametru. Výrazem n-1 se odlišuje výpočet odhadu rozptylu: s2 (výběrové charakteristiky) od definice skutečného parametru s2 (pro základní soubor).  

 

 

Intervalový odhad s2:

počítáme dolní a horní meze intervalu  spolehlivosti (m1, m2), mezi nimiž se rozptyl (parametr s2) základního souboru nachází s určitou (zvolenou) pravděpodobností :

                                    

 

Ve výpočtu používáme:

, - koeficienty spolehlivosti: tabulkové hodnoty - kvantily c2 rozdělení pro zvolené a a dané n = n-1

 

(viz Tabulky: Kritické hodnoty c2 rozdělení)

 

 

B) Odhad parametrů souboru s neznámým rozdělením

Odhadujeme medián , který považujeme za střed křivky u souborů s neznámým (nepravidelným) rozdělením. Šířku křivky u takovýchto rozdělení nelze pro její nepravidelnost určovat.

 

1. Odhad mediánu

Bodový odhad mediánu:

bodovým odhadem mediánu   základního souboru s neznámým rozdělením je výběrový medián , vypočtený na základě dat výběrového souboru:

Výběrový medián u souboru s lichým počtem hodnot je roven prostřední hodnotě vzestupné variační řady.

Výběrový medián u souboru se sudým počtem hodnot je roven aritmetickému průměru dvou prostředních hodnot.

 U větších výběrových souborů lze vypočítat pořadí hodnoty, která je  výběrovým mediánem:

                  

- pořadové číslo výběrového mediánu ve variační řadě (liché i sudé).

 

 

Intervalový odhad mediánu :

zjišťujeme dolní a horní mez intervalu spolehlivosti (m1, m2), mezi nimiž se medián  základního souboru nachází s určitou (zvolenou) pravděpodobností: m1,m2 - hodnoty odvozené z  tabulek tak, že se podle počtu prvků výběrového souboru (n) a zvolené pravděpodobnosti chyby a vyhledá v tabulce pořadové číslo pro dolní (horní) mez a toto pořadové číslo se  nahradí hodnotou, která mu odpovídá ve variační řadě hodnot výběrového souboru.

 

Zpět