Metódy prezentácie štatistických údajov. Grafické znázornenie štatistických údajov

Hodnota grafickej metódy pri analýze a zovšeobecnení údajov je veľká. Grafický obraz v prvom rade umožňuje kontrolovať spoľahlivosť štatistických ukazovateľov, pretože v grafe jasnejšie ukazujú existujúce nepresnosti spojené buď s prítomnosťou chýb pozorovania, alebo s podstatou skúmaného javu. Pomocou grafického obrazu je možné študovať zákonitosti vývoja javu, nadväzovať existujúce vzťahy. Jednoduché porovnanie údajov nie vždy umožňuje zachytiť prítomnosť kauzálnych vzťahov, zároveň ich grafické znázornenie pomáha identifikovať kauzálne vzťahy, najmä v prípade stanovovania východiskových hypotéz, ktoré sú následne predmetom ďalšieho vývoja.

Štatistický graf- toto je výkres, v ktorom sú štatistické agregáty charakterizované určitými ukazovateľmi opísané pomocou podmienených geometrických obrázkov alebo znakov. Grafický obrázok je súbor bodov, čiar a tvarov, ktoré predstavujú štatistické údaje. Pomocné prvky grafika je:

Pole grafu je časť roviny, v ktorej sa nachádzajú grafické obrázky. Pole grafu má určité rozmery, ktoré závisia od jeho účelu.

Priestorové orientačné body grafu sú nastavené vo forme sústavy súradnicových mriežok. Súradnicový systém je potrebný na umiestnenie geometrických symbolov do poľa grafu. Používajú sa pravouhlé aj polárne súradnicové systémy.

Mierkové orientačné body sa používajú na porovnanie grafického zobrazenia objektu a jeho skutočnej veľkosti. Orientačné body mierky sa stanovujú systémom mierok alebo značiek mierok.

Vysvetlenie grafu pozostáva z vysvetlenia objektu znázorneného v grafe (názvu) a sémantického významu každého znaku použitého v grafe.

Štatistické grafy sú klasifikované podľa účelu (obsahu), spôsobu konštrukcie a charakteru grafického zobrazenia (obr. 1).

Obr.1. Klasifikácia štatistických grafov

Podľa spôsobu vytvárania grafických obrázkov existujú:

Diagramy- grafické znázornenie štatistických údajov, jasne ukazujúce vzťah medzi porovnávanými hodnotami.

Štatistické mapy

Existujú tieto hlavné typy grafov: čiarové, pruhové, pásové, sektorové, štvorcové, kruhové, kučeravé.

Čiarové grafy sa používajú na charakterizáciu dynamiky, t.j. hodnotenie zmien javov v čase. Na vodorovnej osi sú zobrazené časové úseky alebo dátumy a zvislá osa ukazuje úrovne série dynamiky. Na jeden graf je možné umiestniť viacero grafov, čo umožňuje porovnávať dynamiku rôznych ukazovateľov, prípadne jeden ukazovateľ pre rôzne regióny alebo krajiny.

Obr.2. Dynamika objemu dovozu osobných automobilov do Ruskej federácie

za 2006-1q. 2010

Stĺpcové grafy môže byť použité:

analyzovať dynamiku sociálno-ekonomických javov;

vyhodnotenie realizácie plánu;

charakteristiky variácií v sérii distribúcií;

pre priestorové porovnania (porovnania medzi územiami, krajinami, firmami);

študovať štruktúru javov.

Stĺpy sú umiestnené blízko alebo oddelene v rovnakej vzdialenosti. Výška stĺpcov by mala byť úmerná číselným hodnotám úrovní prvkov.

Obr.3. Dynamika podielu Bieloruska na obchodnom obrate Ruskej federácie s krajinami SNŠ

Na charakterizáciu štruktúry sociálno-ekonomických javov sa široko používajú koláčové grafy. Na jeho zostavenie by mal byť kruh rozdelený na sektory v pomere k špecifickej hmotnosti častí v celkovom objeme. Súčet špecifických váh sa rovná 100 %, čo zodpovedá celkovému objemu skúmaného javu.

Obr.4. Geografické rozdelenie obchodného obratu medzi Ruskou federáciou a krajinami SNŠ

Stĺpcové grafy pozostávajú z obdĺžnikov usporiadaných vodorovne (pruhy).

Krajiny niekedy používajú na porovnávaciu analýzu podľa regiónov diagramy znakov(schémy geometrických tvarov). Tieto diagramy odrážajú veľkosť študovaného objektu v súlade s veľkosťou jeho plochy.

Štatistické mapy sa používajú na posúdenie geografického rozloženia javov a komparatívnu analýzu podľa územia.

Štatistické mapy zahŕňajú kartogramy a kartogramy. Rozdiel medzi nimi spočíva v spôsobe zobrazovania štatistík na mapách.

Kartogram ukazuje územné rozloženie študovaného znaku v samostatných oblastiach a používa sa na identifikáciu vzorcov tohto rozloženia. Kartogramy sa delia na pozadie a bodové. Podkladové kartogramy s rôznou farebnou hustotou charakterizujú intenzitu ktoréhokoľvek ukazovateľa v rámci územného celku. Na bodovom kartograme je úroveň zvoleného javu znázornená bodkami.

Kartogram- ide o kombináciu geografickej mapy alebo jej schémy s diagramom. Umožňuje vám odrážať špecifiká každého regiónu v distribúcii skúmaného javu, jeho štrukturálnych črtách.

V súčasnosti boli vyvinuté rôzne softvérové balíky pre počítačovú grafiku, napríklad Excel, Statgraf, Statistica.

Štatistické údaje by mali byť prezentované takým spôsobom, aby sa dali použiť. Existujú 3 hlavné formy prezentácie štatistických údajov:

1) text - zahrnutie údajov do textu;

2) tabuľkový - prezentácia údajov v tabuľkách;

3) grafický – vyjadrenie údajov vo forme grafov.

Textová forma sa používa v prípade malého množstva digitálnych údajov.

Najčastejšie sa používa tabuľková forma, keďže ide o efektívnejšiu formu prezentácie štatistických údajov. Na rozdiel od matematických tabuliek, ktoré podľa počiatočných podmienok umožňujú získať jeden alebo druhý výsledok, štatistické tabuľky hovoria rečou čísel o skúmaných objektoch.

Štatistická tabuľka- ide o systém riadkov a stĺpcov, v ktorom sú v určitej postupnosti a súvislosti uvádzané štatistické informácie o sociálno-ekonomických javoch.

Tabuľka 2. Zahraničný obchod Ruskej federácie za roky 2000 - 2006, miliardy dolárov

Index	2000	2001	2002	2003	2004	2005	2006
Obrat zahraničného obchodu	149,9	155,6	168,3		280,6	368,9	468,4
Export		101,9	107,3	135,9	183,2	243,6	304,5
Importovať	44,9	53,8		76,1	97,4	125,3	163,9
Obchodná rovnováha	60,1	48,1	46,3	59,9	85,8	118,3	140,7
počítajúc do toho:
so zahraničím
export	90,8	86,6	90,9	114,6		210,1	261,1
importovať	31,4	40,7	48,8		77,5	103,5	138,6
obchodná rovnováha	59,3	45,9	42,1	53,6	75,5	106,6	122,5

Napríklad v tabuľke. 2 uvádza informácie o zahraničnom obchode Ruska, ktoré by bolo neefektívne vyjadrovať v textovej forme.

Rozlišovať predmet a predikátštatistická tabuľka. Subjekt označuje charakterizovaný objekt – buď jednotky populácie, alebo skupiny jednotiek, alebo celok ako celok. V prísudku sa uvádza charakteristika podmetu spravidla v číselnom tvare. Povinné hlavička tabuľka, ktorá označuje, do ktorej kategórie a do akého času údaje v tabuľke patria.

Podľa charakteru predmetu sa štatistické tabuľky delia na jednoduché, skupina a kombinačné. V predmete jednoduchej tabuľky nie je predmet štúdia rozdelený do skupín, ale je uvedený buď zoznam všetkých jednotiek populácie, alebo je uvedená populácia ako celok (napríklad tabuľka 11). V predmete skupinovej tabuľky je predmet štúdia rozdelený do skupín podľa jedného atribútu a predikát udáva počet jednotiek v skupinách (absolútne alebo v percentách) a súhrnné ukazovatele pre skupiny (napríklad tabuľka 4). V predmete kombinovanej tabuľky je populácia rozdelená do skupín nie podľa jedného, ale podľa niekoľkých kritérií (napríklad tabuľka 2).

Pri konštrukcii tabuliek sa musíte riadiť nasledujúcim všeobecné pravidlá.

1. Predmet tabuľky sa nachádza v ľavej (menej často - hornej) časti a predikát - v pravej (menej často - dolnej).

2. Záhlavia stĺpcov obsahujú názvy ukazovateľov a ich jednotky.

3. Posledný riadok dopĺňa tabuľku a nachádza sa na jej konci, ale niekedy je prvý: v tomto prípade je druhý riadok napísaný „vrátane“ a ďalšie riadky obsahujú zložky celkového riadku.

4. Číselné údaje sa zapisujú s rovnakým stupňom presnosti v každom stĺpci, pričom číslice čísel sú umiestnené pod číslicami a celá časť je oddelená od zlomkovej čiarky.

5. V tabuľke by nemali byť prázdne bunky: ak sú údaje nulové, vloží sa znak „–“ (pomlčka); ak údaje nie sú známe, zapíše sa „žiadne informácie“ alebo sa vloží znak „...“ (elipsa). Ak hodnota exponentu nie je nula, ale prvá platná číslica sa objaví po akceptovanom stupni presnosti, potom sa zaznamená 0,0 (ak bol akceptovaný napríklad stupeň presnosti 0,1).

Niekedy sú štatistické tabuľky doplnené o grafy, keď je cieľom zdôrazniť niektorú vlastnosť údajov, porovnať ich. Grafická forma je z hľadiska ich vnímania najefektívnejšou formou prezentácie údajov. Pomocou grafov sa dosahuje viditeľnosť charakteristík štruktúry, dynamiky, vzťahu javov a ich porovnávanie.

Štatistické grafy- sú to podmienené obrázky číselných hodnôt a ich pomerov prostredníctvom čiar, geometrických tvarov, kresieb alebo geografických máp. Grafická forma uľahčuje zohľadnenie štatistických údajov, robí ich vizuálnymi, expresívnymi a viditeľnými. Grafy však majú určité obmedzenia: po prvé, graf nemôže obsahovať toľko údajov, koľko sa zmestí do tabuľky; v grafe sú navyše vždy zaokrúhlené údaje - nie presné, ale približné. Graf sa teda používa len na zobrazenie všeobecnej situácie, nie na detaily. Posledným nedostatkom je zložitosť kreslenia. Dá sa prekonať pomocou osobného počítača (napríklad „Sprievodca diagramom“ z balíka Microsoft Office Excel).

Podľa spôsobu konštrukcie grafiky sa delia na diagramy, kartogramy a grafy.

Najbežnejším spôsobom grafického znázornenia údajov sú grafy, ktoré sú týchto typov: lineárne, radiálne, bodové, rovinné, objemové, kučeravé. Typ diagramov závisí od typu prezentovaných údajov a konštrukčnej úlohy. V každom prípade musí byť graf sprevádzaný nadpisom – nad alebo pod poľom grafu. Názov udáva, ktorý indikátor sa zobrazuje, pre ktoré územie a na aký čas.

Čiarové grafy sa používajú na znázornenie kvantitatívnych premenných: charakteristiky variácie ich hodnôt, dynamika, vzťahy medzi premennými. Zmeny údajov sa analyzujú pomocou distribučná oblasť, kumuluje(menej ako krivka) a ogives(krivka "väčšia ako"). Distribučný polygón je diskutovaný v téme 4 (napr. obr. 5). Na vytvorenie kumulácie sa hodnoty premennej funkcie vynesú pozdĺž úsečky a ordináty sú akumulované súčty frekvencií alebo frekvencií (od f1 na ∑ f). Na vytvorenie ogive sa nahromadené súčty frekvencií umiestnia na os y v opačnom poradí (od ∑ f predtým f1). Kumulujte a dávajte podľa tabuľky. 4. znázorniť na obr. jeden.

Ryža. 1. Kumuluje a určuje rozdelenie tovaru podľa hodnoty colnej hodnoty

Použitie čiarových grafov v analýze trendov je zahrnuté v téme 5 (napr. obrázok 13) a ich použitie na analýzu prepojenia v téme 6 (napr. obrázok 21). Téma 6 zahŕňa aj použitie bodových grafov (napr. obrázok 20).

Čiarové grafy sú rozdelené na jednorozmerný, ktorý sa používa na reprezentáciu údajov o jednej premennej a dvojrozmerný- pre dve premenné. Príkladom jednorozmerného čiarového grafu je distribučný mnohouholník a dvojrozmerným je regresná čiara (napr. obr. 21).

Niekedy sa pri veľkých zmenách indikátora používa logaritmická stupnica. Napríklad, ak sa hodnoty indikátora líšia od 1 do 1000, môže to spôsobiť ťažkosti pri vykresľovaní. V takýchto prípadoch prechádzajú na logaritmy hodnôt ukazovateľov, ktoré sa nebudú až tak líšiť: lg 1 = 0, lg 1000 = 3.

Medzi rovinný Podľa frekvencie používania sa rozlišujú stĺpcové grafy (histogramy), v ktorých je ukazovateľ prezentovaný ako stĺpec, ktorého výška zodpovedá hodnote ukazovateľa (napríklad obr. 4).

Úmernosť plochy konkrétneho geometrického útvaru k hodnote ukazovateľa je základom iných typov rovinných diagramov: trojuholníkový, námestie, pravouhlý. Môžete použiť aj porovnanie plôch kruhu – v tomto prípade sa nastavuje polomer kruhu.

pásový graf predstavuje indikátory vo forme horizontálne natiahnutých obdĺžnikov a je inak rovnaký ako stĺpcový graf.

Z rovinných diagramov sa často používa koláčový graf, ktorý slúži na ilustráciu štruktúry skúmanej populácie. Celá súprava sa berie ako 100%, zodpovedá celkovej ploche kruhu, plochy sektorov zodpovedajú častiam súpravy. Zostavme sektorový diagram štruktúry zahraničného obchodu Ruskej federácie v roku 2006 podľa tabuľky. 2 (pozri obr. 2). Pri použití počítačových programov sa sektorové diagramy budujú v trojrozmernej podobe, teda nie v dvoch, ale v troch rovinách (pozri obr. 3).

Ryža. 2. Jednoduchý koláčový graf 3. 3D koláčový graf

Kučeravé (obrázkové) diagramy umocňujú prehľadnosť obrázku, pretože obsahujú obrázok zobrazeného indikátora, ktorého veľkosť zodpovedá veľkosti indikátora.

Pri vykresľovaní grafu je všetko rovnako dôležité - správny výber grafického obrázka, proporcie, dodržiavanie pravidiel pre navrhovanie grafov. Tieto problémy sú podrobnejšie opísané v a.

Kartogramy a kartogramy sa používajú na zobrazenie geografických charakteristík skúmaných javov. Zobrazujú umiestnenie skúmaného javu, jeho intenzitu na určitom území – v republike, kraji, hospodárskom alebo správnom obvode a pod. Konštrukciou kartogramov a kartogramov sa zaoberá napr.

1. Pojem štatistiky

Štatistika je jedným z najstarších odborov vedomostí, ktoré vznikli na základe ekonomického účtovníctva. Jeho vznik je spojený s potrebami spoločnosti v rôznych druhoch informácií.

Predpokladá sa, že pojem štatistika pochádza z latinských slov stato (stav) a status (pozícia, stav).

V širšom zmysle je štatistika chápaná ako veda, ktorá študuje hromadné javy a ich zákonitosti z kvantitatívneho hľadiska.

Všeobecná teória štatistiky je metodologická veda, veda o metóde, ktorá je použiteľná na identifikáciu vzorcov v akejkoľvek oblasti, kde sú závery založené na masovom pozorovaní, kde existuje variácia znamenia v jednotlivých prvkoch populácie, kde všeobecné vzorce sa môžu prejaviť len vzájomným zrušením náhodnosti v jednotlivých jednotkách.

2. Štatistika ako veda

2.1 Spôsoby vypracovania štatistiky

Vývoj štatistiky ako vedy sa uberal dvoma smermi:

Prvý smer vznikol v Nemecku a je známy ako štátne štúdiá alebo deskriptívna škola. Predstavitelia tejto školy považovali za svoju hlavnú úlohu opis pamiatok štátu bez toho, aby analyzovali vzorce a vzťahy medzi nimi. Zakladateľom deskriptívnej školy bol nemecký vedec Hermann Konring.

Druhý smer vo vývoji štatistiky vznikol v Anglicku a je známy ako politická aritmetika. Predstavitelia tejto školy považovali za svoju hlavnú úlohu odhaliť na základe veľkého množstva pozorovaní rôzne zákonitosti a vzájomné súvislosti skúmaných javov. Zakladateľom školy bol William Petty.

2.2 Predmet štatistiky a základné pojmy

Belgický matematik Adolphe Ketie zhrnul teoretické informácie zo štátnic a praktickej práce predstaviteľov školy politickej aritmetiky. Aj dal vymedzenie predmetu štatistiky – ide o masové javy spojené so životom spoločnosti a človeka. V štatistike videl aj nástroj sociálneho poznania.

Charakteristické črty hromadných javov:

1. Každý prvok súpravy má tak individuálne alebo charakteristické črty, ako aj spoločné alebo podobné.

2. Charakteristiky jedného z prvkov hromadného javu nemožno získať na základe charakteristík iných prvkov.

Definícia: Hromadné javy skúmané štatistikou vo forme súboru jednotiek podobnej kvality s rôznymi individuálnymi charakteristikami sa nazývajú štatistické agregáty. Na základe toho môžeme povedať, že predmetom štatistiky sú rôzne štatistické agregáty, ktorých štúdium je spojené s kvantitatívnou charakteristikou a identifikáciou ich inherentných zákonitostí. Štatistická totalita je jedným z hlavných pojmov štatistickej vedy. Spája sa aj s takými pojmami ako: jednotka obyvateľstva. Definícia: Prvky, ktorých súbor tvorí skúmaný súbor, sa nazývajú jednotky. Znaky jednotiek populácie:

Každá jednotka populácie môže byť charakterizovaná rôznymi druhmi kvalitatívnych a kvantitatívnych znakov.

Ak má určitý atribút rôzne hodnoty pre určité jednotky populácie, nazýva sa to variácia. Definícia: Vzor identifikovaný na základe hromadného pozorovania, t.j. prejavujúca sa vo veľkom množstve javov cez prekonanie inherentnej náhodnosti jej jednotlivého prvku, sa nazýva štatistická pravidelnosť. Hlavnou úlohou štatistiky je abstrahovať od náhodného a identifikovať typické, pravidelné.

Existujú tri spôsoby, ako identifikovať vzory:

1. logický;

2. empirický;

3. na základe zákona veľkých čísel.

2.3 Metóda štatistiky

Hromadné pozorovanie, zoskupovanie a zhrnutie jeho výsledkov, výpočet a analýza zovšeobecňujúcich ukazovateľov. To všetko spolu dáva metódu štatistiky.

3.Štatistické pozorovanie

3.1 Štatistické pozorovanie ako etapa štatistického výskumu. Plán štatistického pozorovania

Štatistické pozorovanie je prvou etapou štatistického výskumu.

Definícia: Štatistické pozorovanie je vedecky organizovaný zber hromadných údajov o skúmaných procesoch a javoch, ktorý sa uskutočňuje podľa vopred navrhnutého programu.

Požiadavky na hromadné údaje:

Štatistické údaje musia byť dostatočne úplné. Každý jav má rôzne vzájomne súvisiace črty. Úplnosť údajov poskytuje pokrytie najvýznamnejších znakov potrebných na získanie objektívnych záverov. Ak sa údaje štatistického pozorovania týkajú rôznych časových období, území, potom je potrebné zabezpečiť ich porovnateľnosť. Pod porovnateľnosťou štatistických informácií sa rozumie jednotnosť ich merných jednotiek, odhady nákladov, hranice administratívnych území, časové charakteristiky a pod. Pred začatím štatistického pozorovania je potrebné stanoviť postup na jeho realizáciu. Na tento účel sa vypracuje podrobný plán monitorovania, ktorý obsahuje:

1. programová a metodická časť:

2. organizačná časť.

1. Programové a metodické otázky plánu pozorovania.

Táto časť plánu by mala obsahovať:

a) účel a ciele pozorovania:

b) objekt a jednotky, ktoré sa majú preskúmať;

c) program monitorovania.

Pozorovací program je zoznam otázok, na ktoré sa počas prieskumu očakáva odpoveď. Program by sa mal odlišovať úplnosťou informácií a šírkou pokrytia. Znenie otázok by malo byť čo najkratšie a najjasnejšie, vylúčiť nepresnosť a vágnosť v odpovediach, v prípade potreby je uvedený náznak pre jednotný výklad a pochopenie otázok. Programová metodická časť pozorovania uvádza konkrétne nástroje štatistického štúdia, t.j. formuláre, ktoré by mali obsahovať odpovede na formulované otázky, ako aj pokyny na ich vyplnenie.

2. Organizačné otázky plánu pozorovania.

Pre úspešnú organizáciu pozorovania a úplnosť pokrytia obyvateľstva je vypracovaný organizačný plán pozorovania.

V ňom sa uvádza:

a) predmet pozorovania:

b) čas a miesto štúdie;

c) organizácia zberu údajov a technológie na ich spracovanie.

3.2 Formy a typy štatistického pozorovania

Formy, druhy a metódy štatistického pozorovania.

Organizačné formy štatistického pozorovania

Typy štatistického pozorovania

Metódy štatistického pozorovania

v čase registrácie skutočností

pokrytím jednotiek obyvateľstva

1. Štatistické vykazovanie.

2. Špeciálne organizované pozorovanie.

3. Zaregistrujte pozorovanie.

1. Aktuálne alebo nepretržité.

2. Diskontinuálne:

a) periodické;

b) raz.

1. Pevné.

2. Diskontinuálne:

a) selektívne;

b) hlavné pole;

c) monografická.

1. Okamžite.

2. Dokumentárny.

a) zasielateľstvo;

b) samoregistrácia;

c) korešpondent;

d) dotazník;

e) sprievodca.

V domácej štatistike sa používajú tri organizačné formy (typy) štatistického pozorovania:

1. Hlásenie- ide o hlavnú formu štatistického pozorovania, pomocou ktorej štatistické úrady dostávajú potrebné údaje od podnikov, inštitúcií a organizácií v určitom časovom období vo forme zákonom stanovených výkazov, podpísaných osobami zodpovednými za ich poskytovania a spoľahlivosti zhromaždených informácií.

Zdieľané: telefón, ďalekopis, pošta.

2. Špeciálne organizovaný dohľad sa vykonáva s cieľom získať informácie, ktoré nie sú vo výkaze, alebo overiť jeho údaje. Praktická štatistika vykonáva sčítanie obyvateľstva, materiálnych zdrojov, viacročných porastov, neinštalovaných zariadení, stavieb rozostavaných zariadení a pod. Okrem sčítania vykonáva štatistika aj iné špeciálne organizované pozorovania, najmä rozpočtové zisťovania, ktoré charakterizujú štruktúru spotrebiteľských výdavkov. a rodinný príjem.

3. Zaregistrujte dohľad je formou nepretržitého štatistického pozorovania dlhodobých procesov, ktoré majú pevný začiatok, štádium vývoja a pevný koniec. Je založená na vedení štatistického registra. Register je systém, ktorý neustále sleduje stav jednotky pozorovania a vyhodnocuje silu vplyvu rôznych faktorov na skúmané ukazovatele.

V štatistickej praxi sa rozlišuje medzi registrami obyvateľstva a obchodnými registrami.

Druhy štatistického pozorovania podľa času registrácie faktov

Súčasné pozorovanie sa vykonáva systematicky podľa toho, ako sa vyskytujú javy. Pri pravidelnom pozorovaní sa registrácia skúmaných javov vykonáva v určitých, zvyčajne rovnakých, časových intervaloch. Jednorazové pozorovanie sa vykonáva raz, aby sa vyriešil problém, alebo sa podľa potreby opakuje po určitých časových úsekoch.

Typy štatistického pozorovania podľa pokrytia populačných jednotiek

Pri nepretržitom pozorovaní sa zaznamenávajú všetky jednotky obyvateľstva bez výnimky. Pri selektívnom pozorovaní sa skúma náhodne vybraná časť jednotiek populácie s cieľom charakterizovať celú populáciu.

Pri nedokonale kontinuálnom pozorovaní (hlavného poľa) sa skúma hlavná časť populácie a zámerne sa vylučuje určitá časť, o ktorej je známe, že pri charakterizácii celej populácie nehrá veľkú úlohu. Monografické pozorovanie spočíva v podrobnom popise malého počtu alebo jednotlivých typických jednotiek obyvateľstva.

Spôsoby evidencie faktov alebo spôsoby získavania primárneho materiálu

Priame pozorovanie sa vykonáva registráciou skúmaných jednotiek a ich charakteristík špeciálne určenými osobami na základe priameho skúmania, počítania, váženia, odčítania prístrojov atď. Dokumentárne pozorovanie je založené na využívaní rôznych primárnych účtovných dokladov podnikov, inštitúcií a organizácií ako zdroja štatistických informácií. Počas prieskumu sa štatistické materiály získavajú registráciou odpovedí opýtaných osôb. Spôsob preposielania spočíva v tom, že špeciálne vyškolení registrátori vyplnia vzorce pomocou prieskumu, pričom súčasne kontrolujú slobodu prijímaných informácií. Zamestnanci štatistických orgánov počas samoregistrácie alebo vlastného výpočtu distribuujú dotazníky opýtaným, inštruujú ich a následne zbierajú vyplnené formuláre, pričom kontrolujú úplnosť a správnosť získaných informácií. Dotazníkový prieskum spočíva v tom, že vyvinutý dotazník je zaslaný okruhu ľudí a po vyplnení je vrátený orgánom vykonávajúcim pozorovanie. Korešpondent spočíva v tom, že štatistické úrady organizujú osobitnú sieť korešpondentov z osôb žijúcich v teréne, ktorí vykonávajú pozorovania v súlade s vypracovaným formulárom a pokynmi a oznamujú štatistickým úradom informácie. Nevyžiadané zabezpečuje predkladanie informácií orgánom vykonávajúcim dohľad na nevyžiadanom základe.

4. Súhrn a zoskupovanie štatistík

4.1 Úlohy a typy štatistického súhrnu

Definícia: Súhrn je súbor sekvenčných operácií na zovšeobecnenie konkrétnych jednotlivých faktov, ktoré tvoria súbor s cieľom identifikovať typické črty a vzorce vlastné skúmanému javu ako celku.

Ak sa teda počas štatistického pozorovania zhromažďujú údaje o každej jednotke objektu, výsledkom súhrnu sú podrobné údaje, ktoré odrážajú jeho súhrn ako celok.

Štatistický súhrn by mal byť založený na predbežnej teoretickej analýze javov a procesov.

Podľa hĺbky spracovania materiálu zhrnutia sú jednoduché aj zložité.

Jednoduché zhrnutie je operácia na výpočet súčtu pre množinu jednotiek pozorovania.

Komplexné zhrnutie je súbor operácií, ktorý zahŕňa zoskupovanie jednotiek pozorovania, sčítanie súčtov pre každú skupinu a pre celý objekt a prezentáciu výsledkov zoskupovania a súhrnu vo forme štatistických tabuliek.

Zhrnutiu predchádza vývoj jeho programu, ktorý pozostáva z nasledujúcich krokov:

Výber funkcií zoskupenia;

Stanovenie poradia vytvárania skupín;

Rozvoj systému štatistických ukazovateľov na charakterizáciu skupín a objektu ako celku;

Vývoj rozložení štatistických tabuliek, v ktorých by mali byť prezentované výsledky súhrnu.

Podľa spracovania materiálu zhrnutie je decentralizované a centralizované.

Pri decentralizovanom súhrne (používa sa spravidla pri spracovaní štatistického výkazníctva) sa tvorba materiálu uskutočňuje postupne. Správy podnikov teda zhŕňajú štatistické úrady zakladajúcich subjektov Ruskej federácie a výsledky za región sa už posielajú Štátnemu výboru pre štatistiku Ruska a tam sú ukazovatele za národné hospodárstvo ako celok. určený. Pri centralizovanom súhrne sa všetok primárny materiál dostane do jednej organizácie, kde sa spracuje od začiatku do konca. Centralizovaný sumár sa zvyčajne používa na spracovanie materiálov z jednorazových štatistických zisťovaní. Podľa techniky vyhotovenia sa štatistický súhrn delí na mechanizovaný a ručný.

Na vykonanie zhrnutia sa vypracuje plán, ktorý stanovuje organizačné otázky: kto a kedy bude vykonávať všetky operácie, postup ich vykonania a zloženie informácií, ktoré sa majú uverejniť v periodickej tlači.

4.2 Metóda zoskupovania v štatistike

Štatistické zoskupovanie je rozdelenie celého súboru materiálov do skupín a podskupín podľa podstatných znakov pre komplexné štúdium javov a procesov spoločenského života.

Základný znak sa nazýva zoskupenie.

Na vytváranie skupín v štatistikách sa používajú hlavne dva typy funkcií:

1. kvantitatívna (číselná);

2. kvalitatívny (prívlastkový).

Zoskupovanie na rovnakom základe je tzv jednoduché a nazývajú sa zoskupenia podľa dvoch alebo viacerých znakov, ktoré sa navzájom kombinujú kombinačné(ťažké).

Po výbere atribútu zoskupenia sa vyberie počet skupín. Ak je zoskupenie založené na kvalitatívnom znaku, potom sa otázka počtu skupín rieši automaticky - bude ich toľko, koľko je kvalitatívnych stavov skúmanej populácie (jej jednotiek).

Pri zoskupovaní podľa kvantitatívnych charakteristík vzniká otázka určenia intervalov zoskupovania. Hodnota intervalu je rozdiel medzi maximálnou a minimálnou hodnotou atribútu v každej skupine. V závislosti od charakteru rozdelenia populačných jednotiek pre danú charakteristiku môžu byť intervaly rôzne a nerovnako veľké. Ak je distribúcia znaku v rámci hraníc jeho variácie dostatočne rovnomerná, potom sa rozsah fluktuácií znaku rozdelí na rovnaké intervaly, ktorých dĺžka je určená vzorcom:

kde XMak a Xmin maximálnu a minimálnu hodnotu prvku v tejto populácii,

n je počet vytvorených skupín.

Počet skupín je možné nastaviť na základe predchádzajúcich štúdií. V prípade, že sa musíte rozhodnúť o počte skupín sami, potom môžete použiť Sturgessov vzorec na určenie optimálneho počtu skupín:

n - počet skupín

N je počet jednotiek obyvateľstva

Existujú uzavreté intervaly, v ktorých je uvedená horná a dolná hranica, a otvorené intervaly, v ktorých je len jedna hranica: horná alebo dolná.

Štatistické zoskupenia podľa úloh riešených s ich pomocou sa delia na:

Typologické zoskupenie- ide o rozdelenie skúmanej kvalitatívne heterogénnej populácie na triedy, sociálno-ekonomické typy, homogénne skupiny jednotiek v súlade s pravidlami vedeckého zoskupovania.

Štrukturálne nazývané zoskupenie, v ktorom je homogénna populácia rozdelená do skupín, ktoré charakterizujú jej štruktúru podľa nejakého premenlivého znaku.

analytické nazývané zoskupenie, ktoré odhaľuje vzťah medzi skúmanými javmi a ich črtami.

4.3 Distribučné rady v štatistike

Štatistický distribučný rad je usporiadané rozdelenie populačných jednotiek do skupín podľa určitého premenlivého atribútu.

V závislosti od znaku, ktorý je základom vytvorenia distribučného radu, existujú:

1. Atributívny – distribučný rad postavený na kvalitatívnych základoch.

2. Variačné – distribučné rady postavené na kvantitatívnom základe. Každý variačný znak pozostáva z 2 prvkov: variantov a frekvencií.

Varianty sú jednotlivé hodnoty funkcie, ktorú má v sérii variácií.

Frekvencie sú počty jednotlivých variantov alebo každej skupiny variačných sérií.

Frekvencie sa nazývajú frekvencie a sú vyjadrené v zlomkoch jednotky alebo ako percento z celku.

V závislosti od povahy variácie znaku existujú:

1. Diskrétny variačný rad charakterizuje rozdelenie jednotiek populácie podľa diskrétneho atribútu (hodnota kvantitatívneho atribútu nadobúda iba celočíselné hodnoty).

2. Intervalový variačný rad - je vhodný pre kontinuálnu variáciu znaku a tiež vtedy, ak sa diskrétna variácia prejavuje v širokom rozsahu, t.j. počet možností pre diskrétnu funkciu je pomerne veľký.

Najpohodlnejšie je analyzovať distribučné série pomocou ich ugarského obrazu.

Polygón sa používa pri zobrazovaní diskrétnych variačných radov.

Histogram sa použije na zobrazenie série variácií intervalu.

5. Štatistické ukazovatele

Štatistický ukazovateľ je kvantitatívna charakteristika sociálno-ekonomických javov a procesov z hľadiska kvalitatívnej istoty. Kvalitatívna istota ukazovateľa spočíva v tom, že priamo súvisí s vnútorným obsahom skúmaného javu alebo procesu, jeho podstatou.

Procesy a javy, ktoré študuje štatistika, sú spravidla pomerne zložité a ich podstatu nemožno odzrkadľovať pomocou jediného ukazovateľa. V takýchto prípadoch sa využíva systém štatistických ukazovateľov (súbor vzájomne súvisiacich ukazovateľov, ktorý má jednoúrovňovú alebo viacúrovňovú štruktúru a je zameraný na riešenie konkrétneho štatistického problému).

5.1 Absolútne a relatívne ukazovatele

Absolútna štatistika.

Štatistické ukazovatele vo forme absolútnych hodnôt charakterizujú absolútne rozmery procesov a javov študovaných štatistikou: ich hmotnosť, plocha, objem, dĺžka; odrážať ich časové charakteristiky, a môže predstavovať aj objem populácie, t.j. počet jeho základných jednotiek.

Jednotlivé absolútne ukazovatele sa spravidla získavajú priamo v procese štatistického pozorovania ako výsledok merania, váženia, počítania a hodnotenia záujmovej kvantitatívnej vlastnosti.

Konsolidované objemové ukazovatele sa získajú ako výsledok súhrnu a zoskupenia jednotlivých hodnôt (charakterizujú objem prvku alebo objem populácie ako celku pre skúmaný objekt, ako aj pre akúkoľvek jeho časť).

Absolútne štatistické ukazovatele sú vyjadrené v nasledujúcich jednotkách merania:

Prírodné (tony, kilogramy, kilometre, kusy);

Náklady (peňažné hodnotenie sociálno-ekonomických javov a procesov);

Práca (osobo-dni, osobohodiny).

Relatívna štatistika.

Relatívny ukazovateľ je výsledkom delenia jedného absolútneho ukazovateľa druhým a vyjadruje pomer medzi kvantitatívnymi charakteristikami sociálno-ekonomických procesov a javov. V čitateli sa ukazovateľ nazýva aktuálny alebo porovnávaný ukazovateľ, v menovateli základ alebo základ porovnania.

Ak je základ porovnávania 1, potom je relatívny ukazovateľ vyjadrený v koeficientoch, ak je základ 100, potom je vyjadrený v percentách (%), ak pre 1000, je vyjadrený v ppm (% 0 ), ak sa ako základ berie 10 000, potom sa vyjadruje v decimiloch .

Percento sa spravidla používa v prípadoch, keď porovnávaný absolútny ukazovateľ presahuje základný ukazovateľ najviac 2-3 krát. Úroky nad 200-300 sa zvyčajne nahrádzajú násobným pomerom, koeficientom.

5.2 Priemery (hodnoty)

Priemerná hodnota, ktorá je zovšeobecnenou kvantitatívnou charakteristikou znaku v štatistickej populácii za špecifických podmienok miesta a času, je najbežnejšou formou štatistických ukazovateľov.

Zvážte typy priemerov, ktoré sa počítajú pre prípady, keď sa každý z variantov variačného radu vyskytuje iba raz (vtedy sa priemer nazýva jednoduchý alebo nevážený) a keď sa variant alebo intervaly opakujú (vážený priemer). Možnosť počtu opakovaní - frekvencia. Pri výbere jedného alebo druhého typu priemeru by sa malo pri sčítaní alebo vážení vychádzať zo zásady zmysluplnosti výsledku.

Aritmetický priemer.

X je stredná mocnina;

Z je exponent, ktorý určuje typ priemeru;

Xi - možnosti;

mi – frekvencie alebo štatistické váhy variantov.

Priemerná harmonická (z=-1).

Doučovanie

Potrebujete pomôcť s učením témy?

Naši odborníci vám poradia alebo poskytnú doučovacie služby na témy, ktoré vás zaujímajú.
Odoslať žiadosť s uvedením témy práve teraz, aby ste sa dozvedeli o možnosti konzultácie.

Textová forma

tabuľková forma

Štatistická tabuľka

Štatistické grafy sú podmienené obrázky číselných hodnôt a ich pomerov prostredníctvom čiar, geometrických tvarov, kresieb alebo geografických tabuliek. Grafická forma uľahčuje zohľadnenie štatistických údajov, robí ich vizuálnymi, expresívnymi a viditeľnými. Grafy však majú určité obmedzenia: po prvé, graf nemôže obsahovať toľko údajov, koľko sa zmestí do tabuľky; v grafe sú navyše vždy zaokrúhlené údaje - nie presné, ale približné. Graf sa teda používa len na zobrazenie všeobecnej situácie, nie na detaily. Posledným nedostatkom je zložitosť kreslenia. Dá sa prekonať pomocou osobného počítača (napríklad „Sprievodca grafom“ z balíka Microsoft Office Excel).

Stanovenie empirickej distribučnej funkcie.

Vzorková (empirická) distribučná funkcia v matematickej štatistike je to aproximácia teoretickej distribučnej funkcie zostrojená pomocou vzorky z nej.

Definícia

Nech je vzorka z rozdelenia náhodnej premennej danej distribučnej funkcie . Predpokladáme, že kde, sú nezávislé náhodné premenné definované na nejakom priestore elementárnych výsledkov. Nechajte . Definujme náhodnú premennú nasledujúcim spôsobom:

kde je indikátor udalosti , je funkcia Heaviside. Funkcia rozdelenia vzorky v bode sa teda rovná relatívnej frekvencii prvkov vzorky, ktoré nepresahujú hodnotu . Náhodná premenná sa nazýva výberová distribučná funkcia náhodnej premennej a je aproximáciou funkcie. Existuje výsledok, ktorý ukazuje, že funkcia konverguje rovnomerne k , a ukazuje mieru konvergencie.

stĺpcový graf

Histogram sa používa na grafické znázornenie rozdelenia neustále sa meniace vlastnosti a pozostáva z priľahlých obdĺžnikov, ako je znázornené na obr. 2.1. Základňa každého obdĺžnika sa rovná šírke intervalu zoskupenia a jeho výška je taká, že námestie obdĺžnik je úmerný frekvencii (alebo frekvencii) zasiahnutia daného intervalu. Ak je riadok neintervalový, potom sa šírka všetkých stĺpcov zvolí ľubovoľne, ale rovnako. Výšky obdĺžnikov by teda mali byť úmerné hodnotám

kde n i- frekvencia i-tý interval zoskupenia; Ahoj- šírka i-tý interval zoskupenia.

Na histogramovom grafe je základňa obdĺžnikov vynesená pozdĺž osi x ( X) a výška je pozdĺž osi y ( pri) pravouhlého súradnicového systému.

Avšak v prípadoch, keď je šírka všetkých intervalov zoskupenia rovnaká, vzhľad histogramu sa nezmení, ak hodnoty nie sú vynesené pozdĺž osi y. p i a intervalové frekvencie n i.

Ryža. 2.1. Histogram rozdelenia výsledkov v predchádzajúcom príklade (keď šírka niektorých intervalov zoskupenia nie je rovnaká).

V tomto prípade, aby sa neporušil princíp konštrukcie histogramu (plochy obdĺžnikov sú úmerné frekvenciám intervalov), už nie je možné vykresliť frekvencie pozdĺž osi y, ale výšky obdĺžnikov. (ktoré musia byť úmerné pomerom) musia byť vykreslené.

Frekvenčný polygón

Ďalším bežným grafickým znázornením je frekvenčný polygón.

Frekvenčný polygón je tvorený prerušovanou čiarou spájajúcou body zodpovedajúce stredným hodnotám intervalov zoskupenia a frekvenciám týchto intervalov, stredné hodnoty sú vynesené pozdĺž osi X, a frekvencie - pozdĺž osi pri.

Z porovnania dvoch uvažovaných metód grafického znázornenia empirických rozdelení vyplýva, že na získanie frekvenčného mnohouholníka zo zostrojeného histogramu je potrebné spojiť stredy vrcholov obdĺžnikov, ktoré tvoria histogram, spojením priamych úsečky. Príklad frekvenčného polygónu je na obr. 2.2.

Ryža. 2.2. Frekvenčný polygón

Frekvenčný polygón sa používa na reprezentáciu rozdelenia spojitých aj diskrétnych prvkov. V prípade spojitého rozdelenia je frekvenčný polygón výhodnejším spôsobom grafického znázornenia ako histogram, ak je graf empirického rozdelenia opísaný hladkou závislosťou.

21.Hypotéza(starogr. ὑπόθεσις - predpoklad; z ὑπό - zdola, pod + θέσις - téza) - predpoklad alebo domnienka; tvrdenie, ktoré predpokladá dôkaz, na rozdiel od axióm

Postuláty, ktoré nevyžadujú dôkaz. Hypotéza sa považuje za vedeckú, ak spĺňa Popperovo kritérium, t.j. môžu byť potenciálne testované kritickým experimentom, ako aj ak spĺňa iné kritériá, ktoré odlišujú vedu od nevedy.

Štatistická hypotéza je predpoklad o vlastnostiach náhodných premenných alebo udalostí, ktoré chceme otestovať oproti dostupným údajom. Príklady štatistických hypotéz vo výskume vzdelávania:

Hypotéza 1. Výkon triedy stochasticky (pravdepodobne) závisí od úrovne učenia sa žiaka.

Hypotéza 2. Asimilácia počiatočného kurzu matematiky nemá výrazné rozdiely medzi študentmi, ktorí začali študovať vo veku 6 alebo 7 rokov.

Hypotéza 3. Problémové učenie na prvom stupni je vo vzťahu k celkovému rozvoju žiakov efektívnejšie ako tradičné vyučovacie metódy.

Príklad 1 Výrobný proces niektorých medicínskych produktov je veľmi komplikovaný. Na prvý pohľad nevýznamné odchýlky od technológie spôsobujú výskyt vysoko toxickej vedľajšej nečistoty. Toxicita tejto nečistoty môže byť taká vysoká, že aj množstvo, ktoré nie je možné zistiť konvenčnou chemickou analýzou, môže byť pre človeka užívajúceho tento liek nebezpečné. Výsledkom je, že pred uvedením novovyrobenej šarže na trh sa táto podrobuje štúdiu toxicity biologickými metódami. Malé dávky liečiva sa podávajú množstvu pokusných zvierat, ako sú myši, a výsledok sa zaznamenáva. Ak je liek toxický, potom všetky alebo takmer všetky zvieratá uhynú. V opačnom prípade je počet preživších vysoký.

Výskum lieku môže viesť k jednému z možných postupov: uvoľnenie šarže na predaj (a 1), vrátenie šarže dodávateľovi na prepracovanie alebo možno zničenie (a 2).

Dva druhy chýb spojené s akciami a 1 a a 2 sú úplne odlišné a je tiež dôležité vyhnúť sa im. Najprv zvážte prípad, keď sa použije akcia a 1, zatiaľ čo 2 je vhodnejšie. Droga je pre pacienta nebezpečná, pričom je uznávaná ako bezpečná. Chyba tohto druhu môže spôsobiť smrť pacientov užívajúcich tento liek. Toto je chyba typu I, pretože je pre nás dôležitejšie sa jej vyhnúť.

Zvážte prípad, keď sa vykoná akcia a 2, zatiaľ čo 1 je vhodnejšie. To znamená, že v dôsledku nepresností pri vykonávaní experimentu bola šarža netoxického lieku klasifikovaná ako nebezpečná. Dôsledky chyby sa môžu prejaviť vo finančnej strate a vo zvýšení ceny lieku. Náhodné odmietnutie úplne bezpečného lieku je však zjavne menej nežiaduce ako príležitostná smrť pacientov. Odmietnutie netoxickej šarže lieku je chyba typu II.

Prípustná pravdepodobnosť chyby typu I(Rkr) sa môže rovnať 5 % alebo 1 % (0,05 alebo 0,01).

22. Test štatistickej hypotézy(testovanie štatistických hypotéz) je proces rozhodovania, či je daná štatistická hypotéza nekonzistentná s pozorovanou vzorkou údajov.

štatistický test alebo štatistický test- prísne matematické pravidlo, ktorým sa prijíma alebo zamieta štatistická hypotéza.

· 23.klasifikácia hypotéz

· jednoduché- je označená jedna okolnosť, za ktorej alebo neprítomnosti je právna norma platná;

· komplexné- prítomnosť v hypotéze dvoch alebo viacerých okolností súčasne, ktoré spolu určujú pôsobenie normy;

· alternatíva- sú uvedené viaceré varianty okolností (alternatíva), za ktorých možno pravidlo uplatniť. V tomto prípade, keď sa vyskytne jeden z nich, platí norma;

parametrická hypotéza nazývaná hypotéza hodnoty distribučných parametrov alebo o porovnávaciu hodnotu parametrov dvoch rozdelení. Príkladom parametrickej štatistickej hypotézy je hypotéza o rovnosť matematických očakávaní dve normálne sady.

Neparametrické hypotézy nazývané hypotézy o náhodné rozdelenie množstvá.

Nulový, hlavná alebo testovaná hypotéza je pôvodne navrhnutá hypotéza, ktorá sa označuje H0.

Štatistická hypotéza predstavuje nejaký predpoklad o zákone rozdelenia náhodnej veličiny alebo o parametroch tohto zákona, formulovaný na základe vzorky. Príkladmi štatistických hypotéz sú predpoklady: všeobecná populácia je rozdelená podľa exponenciálneho zákona; matematické očakávania dvoch exponenciálne rozdelených vzoriek sa navzájom rovnajú. V prvom z nich je urobený predpoklad o forme zákona o rozdelení a v druhom o parametroch dvoch rozdelení. Hypotézy, na základe ktorých neexistujú predpoklady o konkrétnom druhu distribučného zákona, sa nazývajú neparametrické, inak - parametrické.

Hypotéza, že medzi porovnávanými charakteristikami nie je rozdiel a pozorované odchýlky sú vysvetlené len náhodnými výkyvmi vo vzorkách, na základe ktorých sa porovnávanie robí, sa nazýva tzv. nulový(hlavná) hypotéza a označujú H 0 Spolu s hlavnou hypotézou uvažujeme aj alternatíva(súťažiaci, protirečivý) jej hypotéza H jeden . A ak je nulová hypotéza zamietnutá, potom sa uskutoční alternatívna hypotéza.

Rozlišujte medzi jednoduchými a zložitými hypotézami. Hypotéza je tzv jednoduché, ak jednoznačne charakterizuje distribučný parameter náhodnej premennej. Napríklad, ak  je parameter exponenciálneho rozdelenia, potom hypotéza H 0 o rovnosti  = 10 je jednoduchá hypotéza. komplexné nazývaná hypotéza, ktorá pozostáva z konečného alebo nekonečného súboru jednoduchých hypotéz. Komplexná hypotéza H 0 o nerovnosti  > 10 pozostáva z nekonečného množstva jednoduchých hypotéz H 0 o rovnosti =b i, kde b i- ľubovoľné číslo väčšie ako 10. Hypotéza H 0, že očakávanie normálneho rozdelenia je dva pre neznámy rozptyl, je tiež zložité. Komplexnou hypotézou bude predpoklad o rozdelení náhodnej premennej X podľa bežného zákona, ak špecifické hodnoty matematického očakávania a rozptylu nie sú pevne stanovené.

Testovanie hypotéz je založené na výpočte nejakej náhodnej premennej – kritéria, ktorého presné alebo približné rozdelenie je známe. Označme toto množstvo pomocou z, jeho hodnota je funkciou prvkov vzorky z=z(x 1, x 2, …, x n). Postup testovania hypotéz predpisuje pre každú hodnotu kritéria jedno z dvoch rozhodnutí - prijať alebo zamietnuť hypotézu. Celý priestor vzorky a teda aj súbor hodnôt kritéria sú rozdelené do dvoch neprekrývajúcich sa podmnožín S 0 a S jeden . Ak je hodnota kritéria z spadá do oblasti S 0 , potom je hypotéza prijatá a ak S 1 , – hypotéza sa zamieta. Veľa S Volá sa 0 oblasť prijatia hypotézy alebo oblasť prijateľných hodnôt a súpravu S 1 – oblasť odmietnutia hypotézy alebo kritická oblasť. Výber jednej oblasti jednoznačne určuje druhú oblasť.

Prijatie alebo odmietnutie hypotézy H 0 podľa náhodnej vzorky s určitou pravdepodobnosťou zodpovedá pravde, a preto sú možné dva druhy chýb. Chyba typu I sa vyskytuje s pravdepodobnosťou , keď je správna hypotéza zamietnutá. H 0 a konkurenčná hypotéza je prijatá H jeden . Chyba druhého druhu nastáva s pravdepodobnosťou  v prípade prijatia nesprávnej hypotézy H 0 , pričom konkurenčná hypotéza je pravdivá H 1 . Pravdepodobnosť spoľahlivosti je pravdepodobnosť, že neurobíte chybu I. typu a prijmete správnu hypotézu H 0 Pravdepodobnosť odmietnutia falošnej hypotézy H Volá sa 0 sila kritéria. Preto pri testovaní hypotézy existujú štyri možné výsledky, tabuľka. 3.1.

Tabuľka 3.1.

Uvažujme napríklad prípad, keď sa nejaký nezaujatý odhad parametra  vypočíta zo vzorky objemu n a tento odhad má distribučnú hustotu f(), obr. 3.1.

Ryža. 3.1. Oblasti a odchýlky hypotézy

Predpokladajme, že skutočná hodnota odhadovaného parametra sa rovná T. Ak vezmeme do úvahy hypotézu H 0 o rovnosti  = T, potom aký veľký by mal byť rozdiel medzi  a T túto hypotézu zamietnuť. Na túto otázku možno odpovedať v štatistickom zmysle, berúc do úvahy pravdepodobnosť dosiahnutia určitého daného rozdielu medzi  a T na základe vzorkovacieho rozdelenia parametra  .

Je vhodné predpokladať rovnaké hodnoty pravdepodobnosti parametra  prekračujúceho spodnú a hornú hranicu intervalu. Takýto predpoklad v mnohých prípadoch umožňuje minimalizovať interval spoľahlivosti, t.j. zvýšiť silu testovacieho kritéria. Celková pravdepodobnosť, že parameter  prekročí interval s hranicami  1– /2 a   /2 je  . Táto hodnota by mala byť zvolená tak malá, že je nepravdepodobné, že prekročí interval. Ak odhad parametra spadá do daného intervalu, tak v tomto prípade nie je dôvod spochybňovať testovanú hypotézu, preto hypotéza rovnosti  = T možno prijať. Ak sa však po prijatí vzorky ukáže, že odhad je mimo stanovených limitov, potom v tomto prípade existujú vážne dôvody na zamietnutie hypotézy H 0 Z toho vyplýva, že pravdepodobnosť chyby I. typu sa rovná  (rovná sa hladine významnosti kritéria).

Za predpokladu, že napríklad skutočná hodnota parametra je v skutočnosti rovná T+d, potom podľa hypotézy H 0 o rovnosti  = T– pravdepodobnosť, že odhad parametra  bude spadať do oblasti prijatia hypotézy, bude  , obr. 3.2.

Pre danú veľkosť vzorky možno znížiť pravdepodobnosť chyby typu I znížením hladiny významnosti  . V tomto prípade sa však zvyšuje pravdepodobnosť chyby druhého druhu  (sila kritéria klesá). Podobné uvažovanie možno vykonať v prípade, keď sa skutočná hodnota parametra rovná T– d.

Jediný spôsob, ako znížiť obe pravdepodobnosti, je zväčšiť veľkosť vzorky (hustota distribúcie odhadu parametra sa „zúži“). Pri výbere kritickej oblasti sa riadia Neumannovým-Pearsonovým pravidlom: kritickú oblasť by sme mali zvoliť tak, aby pravdepodobnosť  bola malá, ak je hypotéza pravdivá, a inak veľká. Voľba konkrétnej hodnoty  je však relatívne ľubovoľná. Bežné hodnoty sa pohybujú od 0,001 do 0,2. Pre zjednodušenie manuálnych výpočtov boli zostavené tabuľky intervalov s hranicami  1– /2 a   /2 pre typické hodnoty  a rôzne metódy konštrukcie kritéria.

Pri výbere hladiny významnosti je potrebné vziať do úvahy silu kritéria pri alternatívnej hypotéze. Niekedy sa ukáže, že veľká sila kritéria je významnejšia ako malá hladina významnosti a jej hodnota sa volí relatívne veľká, napríklad 0,2. Takáto voľba je opodstatnená, ak sú dôsledky chýb druhého druhu závažnejšie ako chyby prvého druhu. Ak sa napríklad zamietne správne rozhodnutie „pokračovať s používateľmi s aktuálnymi heslami“, chyba typu I bude mať za následok určité oneskorenie normálneho fungovania systému v dôsledku zmien hesla. Ak sa rozhodne nezmeniť heslá napriek nebezpečenstvu neoprávneného prístupu k informáciám neoprávnenými osobami, táto chyba bude mať vážnejšie následky.

V závislosti od povahy testovanej hypotézy a miery nesúladu medzi hodnotením charakteristiky a jej teoretickou hodnotou sa používajú rôzne kritériá. Najbežnejšie používané kritériá na testovanie hypotéz o distribučných zákonoch zahŕňajú Pearsonov, Kolmogorov, Mises, Wilcoxonov chí-kvadrát test a Fisherov a Studentov test hodnôt parametrov.

25. KRITICKÁ OBLASŤ- časť vzorového priestoru tak, že vloženie pozorovanej hodnoty náhodnej premennej, s distribúciou ktorej je testovaná hypotéza spojená, znamená zamietnutie tejto hypotézy.

kritických bodov(hranice) k cr sú body oddeľujúce kritickú oblasť od oblasti prijatia hypotézy.
Existujú jednostranné (pravostranné alebo ľavostranné) a obojstranné kritické oblasti.

Náhodná chyba merania sa vytvára pod vplyvom veľkého množstva faktorov sprevádzajúce proces merania. Každá špecifická situácia má svoj vlastný mechanizmus generovania chýb. Preto je prirodzené predpokladať, že každá situácia by mala mať svoj vlastný typ distribúcie chýb. V mnohých prípadoch je však možné urobiť určité predpoklady o tvare distribučnej funkcie ešte pred meraniami, takže po meraniach zostáva len určiť hodnoty niektorých parametrov, ktoré sú zahrnuté vo výraze pre odhad distribučná funkcia.

Náhodná chyba charakterizuje neistotu našich vedomostí o skutočnej hodnote nameranej hodnoty získanej ako výsledok pozorovaní. Mierou neistoty situácie opísanej náhodnou premennou X je podľa K. Shannona entropia

ktorý je funkcionálom diferenciálnej distribučnej funkcie . Dá sa predpokladať, že akýkoľvek proces merania je vytvorený tak, že neistota výsledku pozorovania sa ukáže ako najväčšia v rámci určitých limitov určených hodnotami dovolených chýb. Najpravdepodobnejšie by preto mali byť také rozdelenia, v ktorých sa entropia obracia na maximum.

Aby sme identifikovali typ najpravdepodobnejších distribúcií, zvážme niektoré z najtypickejších prípadov.

1. V triede distribúcií výsledkov pozorovania, ktoré majú medzi hodnotami určitú zónu rozptylu x = b a x = ašírka b-a=2a nájdeme taký, ktorý maximalizuje entropiu za prítomnosti obmedzujúcich podmienok:
, , ,
kde je matematické očakávanie výsledkov pozorovania. Riešenie problému sa nachádza metódou Lagrangeových multiplikátorov.

Požadovaná hustota distribúcie výsledkov pozorovaní je opísaná výrazom

Definujme číselné charakteristiky rovnomerného rozdelenia. Matematické očakávanie náhodnej chyby sa zistí podľa vzorca (10):

Rozptyl náhodnej rovnomerne rozloženej chyby možno nájsť podľa vzorca (18):

Kvôli symetrii rozdelenia vzhľadom na matematické očakávanie sa koeficient šikmosti musí rovnať nule:

Na určenie špičatosti najprv nájdeme štvrtý moment náhodnej chyby:

Preto

Na záver zistíme pravdepodobnosť náhodnej chyby spadajúcej do daného intervalu rovnajúceho sa vytieňovanej oblasti na obr.7

2. V triede distribúcií výsledkov pozorovania, ktoré majú určitý rozptyl, nájdeme také, ktoré maximalizuje entropiu v prítomnosti obmedzení:

, , , .

Riešenie tohto problému sa nachádza aj metódou Lagrangeových multiplikátorov. Požadovaná hustota distribúcie výsledkov pozorovaní je opísaná výrazom

Rozdelenie opísané rovnicami (25) a (26) sa nazýva normálne alebo Gaussovo rozdelenie.

Obrázok 8 zobrazuje krivky normálneho rozdelenia náhodných chýb pre rôzne hodnoty štandardnej odchýlky .

Obrázok ukazuje, že so zvyšovaním smerodajnej odchýlky sa rozdelenie stále viac rozširuje, zvyšuje sa pravdepodobnosť veľkých chýb a klesá pravdepodobnosť menších chýb, t.j. zvyšuje sa rozptyl výsledkov pozorovania.

Vypočítajme pravdepodobnosť, že výsledok pozorovania bude spadať do nejakého daného intervalu:

Zmeňme premenné:

Potom dostaneme nasledujúci výraz pre požadovanú pravdepodobnosť:

Integrály v hranatých zátvorkách nie sú vyjadrené v elementárnych funkciách, preto sa počítajú pomocou takzvaného normalizovaného normálneho rozdelenia s diferenciálnou funkciou

Pomocou funkcie F( z) pravdepodobnosť nájsť ako

(29)

Pri používaní tohto vzorca by ste mali mať na pamäti identitu

Vyplýva to priamo z definície funkcie Ф( z).

Širokú distribúciu normálneho rozdelenia chýb v praxi merania vysvetľuje centrálna limitná veta teórie pravdepodobnosti, ktorá je jednou z najpozoruhodnejších matematických teorém, na vývoji ktorej sa podieľali mnohí významní matematici – De Moivre, Laplace, Gauss. , Čebyšev a Ljapunov. Centrálna limitná veta uvádza, že rozdelenie náhodných chýb sa bude blížiť normálu vždy, keď sa výsledky pozorovania vytvoria pod vplyvom veľkého počtu nezávisle pôsobiacich faktorov, z ktorých každý má len malý vplyv v porovnaní s celkovým účinkom všetkých ostatných.

3. Predpokladajme, že výsledky pozorovaní sú normálne rozdelené, ale ich štandardná odchýlka je náhodná hodnota, ktorá sa líši od skúsenosti k skúsenosti. Tento predpoklad je opatrnejší ako predpoklad nemennosti počas celého času merania. V tomto prípade, uvažujúc rovnakým spôsobom ako predtým, je ľahké zistiť, že entropia je maximalizovaná, ak výsledky pozorovaní majú Laplaceovu distribúciu s hustotou

(30)

kde je matematické očakávanie, je štandardná odchýlka výsledkov pozorovania. Laplaceova distribúcia by sa mala použiť v prípadoch, keď charakteristiky presnosti nie sú vopred známe alebo sú v priebehu času nestabilné.

Funkciu diferenciálneho rozdelenia náhodných chýb získame dosadením a do výrazu (30):

Šikmosť rozdelenia sa rovná nule, pretože rozdelenie je symetrické okolo nuly a špičatosť podľa vzorca (22) je

V porovnaní s normálnym rozdelením ( Napr= 0) rovnomerné rozloženie je s plochým vrchom ( Napr= -1,2) a Laplaceova distribúcia je vrcholovejšia ( Napr = 3).

Formy prezentácie štatistických údajov.

Štatistické údaje by mali byť prezentované takým spôsobom, aby sa dali použiť. Existujú 3 hlavné formy prezentácie štatistických údajov:

Text - zahrnutie údajov do textu;

Tabular - prezentácia údajov v tabuľkách;

Grafické - vyjadrenie údajov vo forme grafov.

Textová forma používané s malým množstvom digitálnych dát.

tabuľková forma sa používa najčastejšie, keďže ide o efektívnejšiu formu prezentácie štatistických údajov. Na rozdiel od matematických tabuliek, ktoré podľa počiatočných podmienok umožňujú získať jeden alebo druhý výsledok, štatistické tabuľky hovoria rečou čísel o skúmaných objektoch.

Štatistická tabuľka- ide o systém riadkov a stĺpcov, v ktorom sú v určitej postupnosti a súvislosti uvádzané štatistické informácie o sociálno-ekonomických javoch.

Rozlišujte podmet a prísudok štatistickej tabuľky. Subjekt označuje charakterizovaný objekt – buď jednotky populácie, alebo skupiny jednotiek, alebo celok ako celok. V prísudku sa uvádza charakteristika podmetu spravidla v číselnom tvare. Povinný je nadpis tabuľky, ktorý označuje, do ktorej kategórie a do akého času údaje tabuľky patria.

Podľa charakteru predmetu sa štatistické tabuľky delia na jednoduché, skupinové a kombinované. V predmete jednoduchej tabuľky nie je predmet štúdia rozdelený do skupín, ale je uvedený buď zoznam všetkých jednotiek populácie, alebo je uvedená populácia ako celok. V predmete skupinovej tabuľky je predmet štúdia rozdelený do skupín podľa jedného atribútu a predikát udáva počet jednotiek v skupinách (absolútne alebo v percentách) a súhrnné ukazovatele pre skupiny. V predmete kombinovanej tabuľky je populácia rozdelená do skupín nie podľa jedného, ale podľa viacerých kritérií.

Pri zostavovaní tabuliek by sa mali dodržiavať nasledujúce všeobecné pravidlá.

Predmet tabuľky sa nachádza v ľavej (zriedkavo - hornej) časti a predikát - v pravej (menej často - dolnej).

Záhlavia stĺpcov obsahujú názvy ukazovateľov a ich merné jednotky.

Posledný riadok dopĺňa tabuľku a nachádza sa na jej konci, ale niekedy je prvý: v tomto prípade je druhý riadok napísaný „vrátane“ a ďalšie riadky obsahujú zložky celkového riadku.

Číselné údaje sa zapisujú s rovnakým stupňom presnosti v každom stĺpci, pričom číslice čísel sú umiestnené pod číslicami a časť celého čísla je oddelená od zlomkovej čiarky.

Tabuľka by nemala obsahovať prázdne bunky: ak sú údaje nulové, vloží sa znak „–“ (pomlčka); ak údaje nie sú známe, zapíše sa „žiadne informácie“ alebo sa vloží znak „...“ (elipsa). Ak hodnota exponentu nie je nula, ale prvá platná číslica sa objaví po akceptovanom stupni presnosti, potom sa zaznamená 0,0 (ak bol akceptovaný napríklad stupeň presnosti 0,1).

Grafický obraz v prvom rade umožňuje kontrolovať spoľahlivosť štatistických ukazovateľov, pretože v grafe jasnejšie ukazujú existujúce nepresnosti spojené buď s prítomnosťou chýb pozorovania, alebo s podstatou skúmaného javu. Pomocou grafického obrazu je možné študovať zákonitosti vývoja javu, nadväzovať existujúce vzťahy. Jednoduché porovnanie údajov nie vždy umožňuje zachytiť prítomnosť kauzálnych vzťahov, zároveň ich grafické znázornenie pomáha identifikovať kauzálne vzťahy, najmä v prípadoch stanovovania východiskových hypotéz, ktoré sú následne predmetom ďalšieho vývoja. Grafy sú tiež široko používané na štúdium štruktúry vplyvov, ich zmeny v čase a ich umiestnenie v priestore. Porovnávané charakteristiky sa v nich výraznejšie prejavujú a sú zreteľne viditeľné hlavné vývojové trendy a vzťahy vlastné skúmanému javu alebo procesu.

V štatistike je graf vizuálnym znázornením štatistických veličín a ich vzťahov pomocou geometrických bodov, čiar, obrázkov alebo geografických máp.

Grafy dávajú prezentácii štatistických údajov väčšiu prehľadnosť ako tabuľky, výraznosť, uľahčujú ich vnímanie a analýzu. Štatistický graf vám umožňuje vizuálne posúdiť povahu skúmaného javu, jeho vlastné vzorce, vývojové trendy, vzťahy s inými ukazovateľmi a geografické rozlíšenie študovaných javov. Už v staroveku Číňania hovorili, že jeden obrázok môže nahradiť tisíc slov. Grafy robia štatistický materiál zrozumiteľnejším, dostupným aj pre neodborníkov, upozorňujú široké publikum na štatistické údaje a popularizujú štatistiky a štatistické informácie.

Vždy, keď je to možné, sa odporúča začať analýzu štatistických údajov vždy s ich grafickým znázornením. Graf vám umožňuje okamžite získať všeobecnú predstavu o celom súbore štatistických ukazovateľov. Grafická metóda analýzy funguje ako logické pokračovanie tabuľkovej metódy a slúži na získanie zovšeobecňujúcich štatistických charakteristík procesov, ktoré sú súčasťou hromadných javov.

Pomocou grafického znázornenia štatistických údajov sa riešia mnohé úlohy štatistického výskumu:

1) vizuálne znázornenie veľkosti ukazovateľov (javov) vo vzájomnom porovnaní;
2) charakterizácia štruktúry akéhokoľvek javu;
3) zmena javu v čase;
4) priebeh plánu;
5) závislosť zmeny jedného javu od zmeny iného;
6) prevalencia alebo distribúcia akýchkoľvek množstiev na území.

Inými slovami, v štatistických štúdiách sa používa široká škála grafov.

Každý graf má tieto hlavné prvky:

1) priestorové referenčné body (súradnicový systém);
2) grafický obrázok;
3) pole grafu;
4) orientačné body v mierke;
5) vysvetlenie rozvrhu;
6) názov grafu

Priestorové orientačné body sú špecifikované ako systém súradnicových sietí. V štatistických grafoch sa najčastejšie používa systém pravouhlých súradníc. Niekedy sa využíva princíp polárnych (uhlových) súradníc (kruhové grafy). V kartogramoch sú prostriedkom priestorovej orientácie hranice štátov, hranice ich administratívnych častí, geografické orientačné body (obrysy riek, pobrežia morí a oceánov).

Na osiach súradnicového systému alebo na mape sú v určitom poradí umiestnené charakteristiky štatistických znakov zobrazovaných javov alebo procesov. Prvky umiestnené na súradnicových osiach môžu byť kvalitatívne alebo kvantitatívne.

Grafický obraz štatistických údajov je súbor čiar, obrazcov, bodov, ktoré tvoria geometrické tvary rôznych tvarov (kruh, štvorce, obdĺžniky atď.) s rôznym šrafovaním, sfarbením, hustotou bodov.

Každý jav skúmaný štatistikou možno znázorniť graficky. Aby ste to dosiahli, musíte nájsť správne grafické riešenie, určiť grafický obrázok, ktorý najlepšie vyhovuje tomuto javu, jasnejšie zobrazuje štatistické údaje. Grafický obrázok by mal zodpovedať účelu grafu. Preto pred vykreslením grafu je potrebné pochopiť podstatu javu a cieľ, ktorý je pre grafický obrázok stanovený. Zvolená forma grafu by mala zodpovedať vnútornému obsahu a charakteru štatistického ukazovateľa. Napríklad porovnanie na grafe sa robí podľa takých meraní, ako je plocha, dĺžka jednej zo strán obrázkov, umiestnenie bodov, ich hustota atď.

Takže na zobrazenie zmien javu v priebehu času je najprirodzenejším typom grafu čiara. Pre distribučné série - polygón alebo histogram.

Pole grafu je priestor, v ktorom sa nachádzajú grafické obrázky (geometrické telesá tvoriace grafy).

Pole grafu je charakterizované veľkosťou a proporciami. Veľkosť poľa závisí od účelu grafu. Aj proporcie a veľkosť grafu (formát grafu) musia zodpovedať podstate zobrazovaných javov. Pre štatistické štúdie sa často používajú grafy s nerovnakými stranami, napríklad s pomerom strán poľa 1: alebo 1:1,33 až 1:1,6 + 5,8. Niekedy je však vhodný štvorcový tvar grafov.

Orientačné body mierky, ktoré poskytujú kvantitatívnu istotu geometrickému obrázku, sú systémom mierok používaných v grafike. Mierka grafu je podmienená miera prevodu štatistickej číselnej hodnoty do grafickej. Stupnica stupnice je čiara, ktorej jednotlivé body možno v súlade s prijatou stupnicou odčítať ako určitú hodnotu štatistického ukazovateľa. Mierka je zvolená tak, aby sa do grafu zmestila najväčšia a najmenšia zo zobrazených hodnôt.

Mierky sú jednotné a nerovnomerné, priamočiare (zvyčajne umiestnené pozdĺž súradnicových osí) a krivočiare (kruhové v koláčových grafoch).

Vysvetlenie tabuľky je slovné vysvetlenie jej obsahu (názov tabuľky a zodpovedajúce vysvetlivky k jej jednotlivým častiam).

Názov tabuľky by mal jasne a výstižne popisovať jej obsah. Vysvetľujúce texty môžu byť umiestnené v grafickom obrázku, vedľa neho alebo mimo neho, pozdĺž mierok. Pomáhajú mentálne prejsť od geometrických obrazov k javom a procesom zobrazeným na grafe.

Zvláštnosťou grafických obrazov je ich výraznosť, zrozumiteľnosť a viditeľnosť. Grafické obrázky však nie sú len ilustračné, sú aj analytické. Takže v súčasnosti sú rozvrhy široko používané v účtovnej a štatistickej praxi podnikov a inštitúcií, vo výskumnej práci, vo výrobných a ekonomických činnostiach, vo vzdelávacom procese, propagande a iných oblastiach.

Existuje mnoho druhov grafiky. Ich klasifikácia je založená na niekoľkých vlastnostiach:

a) spôsob vytvárania grafického obrazu;
b) geometrické znaky zobrazujúce štatistické ukazovatele a vzťahy;
c) úlohy riešené pomocou grafického obrázku.

Štatistické grafy vo forme grafického obrázka:

Lineárne: štatistické krivky.

Rovinný: pruh, pás, štvorec, kruh, sektor, kučeravý, bodka, pozadie.

Objemové: distribučné plochy.

Štatistické grafy podľa spôsobu konštrukcie a obrázkových úloh:

Diagramy: porovnávacie diagramy, dynamické diagramy, štrukturálne diagramy.

Štatistické mapy: kartogramy, kartogramy.

Podľa spôsobu konštrukcie sa štatistické grafy delia na diagramy a štatistické mapy.

Grafy sú najbežnejším spôsobom grafického znázornenia. Ide o grafy kvantitatívnych vzťahov. Typy a spôsoby ich konštrukcie sú rôzne. Diagramy sa používajú na vizuálne porovnanie rôznych hľadísk (priestorových, časových, atď.) hodnôt navzájom nezávislých: územia, počet obyvateľov atď. atribút.

Štatistické mapy - grafy kvantitatívneho rozloženia po povrchu. Vo svojom hlavnom účele úzko súvisia s diagramami a sú špecifické len v tom zmysle, že sú podmieneným znázornením štatistických údajov na vrstevnicovej geografickej mape, to znamená, že zobrazujú priestorové rozloženie alebo priestorové rozloženie štatistických údajov. Geometrické znaky, ako je uvedené vyššie, sú buď body, alebo čiary alebo roviny, alebo geometrické telesá. V súlade s tým existujú bodové, čiarové, rovinné a priestorové (objemové) grafy.

Pri konštrukcii bodových grafov sa množiny bodov používajú ako grafické obrázky; pri konštrukcii lineárnych - línií. Základným princípom konštrukcie všetkých rovinných diagramov je, že štatistické veličiny sú zobrazené vo forme geometrických útvarov a následne sú rozdelené na pruhové, pásové, kruhové, štvorcové a kučeravé.

Štatistické mapy podľa grafického zobrazenia sa delia na kartogramy a kartogramy.

V závislosti od rozsahu úloh, ktoré sa majú riešiť, sa rozlišujú porovnávacie diagramy, štrukturálne diagramy a dynamické diagramy.