Grafické znázornenie štatistických údajov. Grafická prezentácia štatistických informácií


Hodnota grafickej metódy pri analýze a zovšeobecnení údajov je veľká. Grafický obraz v prvom rade umožňuje kontrolovať spoľahlivosť štatistických ukazovateľov, pretože v grafe jasnejšie ukazujú existujúce nepresnosti spojené buď s prítomnosťou chýb pozorovania, alebo s podstatou skúmaného javu. Pomocou grafického obrazu je možné študovať zákonitosti vývoja javu, nadväzovať existujúce vzťahy. Jednoduché porovnanie údajov nie vždy umožňuje zachytiť prítomnosť kauzálnych vzťahov, zároveň ich grafické znázornenie pomáha identifikovať kauzálne vzťahy najmä v prípade stanovovania východiskových hypotéz, ktoré sú následne predmetom ďalšieho vývoja.

Štatistický graf- toto je výkres, v ktorom sú štatistické agregáty charakterizované určitými ukazovateľmi opísané pomocou podmienených geometrických obrázkov alebo znakov. Grafický obrázok je súbor bodov, čiar a tvarov, ktoré predstavujú štatistické údaje. Pomocné prvky grafika je:

    Pole grafu je časť roviny, v ktorej sa nachádzajú grafické obrázky. Pole grafu má určité rozmery, ktoré závisia od jeho účelu.

    Priestorové orientačné body grafu sú nastavené vo forme sústavy súradnicových mriežok. Súradnicový systém je potrebný na umiestnenie geometrických symbolov do poľa grafu. Používajú sa pravouhlé aj polárne súradnicové systémy.

    Mierkové orientačné body sa používajú na porovnanie grafického zobrazenia objektu a jeho skutočnej veľkosti. Orientačné body mierky sa stanovujú systémom mierok alebo značiek mierok.

    Vysvetlenie grafu pozostáva z vysvetlenia objektu znázorneného v grafe (názvu) a sémantického významu každého znaku použitého v grafe.

Štatistické grafy sú klasifikované podľa účelu (obsahu), spôsobu konštrukcie a charakteru grafického zobrazenia (obr. 1).

Obr.1. Klasifikácia štatistických grafov

Podľa spôsobu vytvárania grafických obrázkov existujú:

    Diagramy- grafické znázornenie štatistických údajov, jasne ukazujúce vzťah medzi porovnávanými hodnotami.

    Štatistické mapy

Existujú tieto hlavné typy grafov: čiarové, pruhové, pásové, sektorové, štvorcové, kruhové, kučeravé.

Čiarové grafy sa používajú na charakterizáciu dynamiky, t.j. hodnotenie zmien javov v čase. Na vodorovnej osi sú zobrazené časové úseky alebo dátumy a zvislá osa ukazuje úrovne série dynamiky. Na jeden graf je možné umiestniť viacero grafov, čo umožňuje porovnávať dynamiku rôznych ukazovateľov, prípadne jeden ukazovateľ pre rôzne regióny alebo krajiny.

Obr.2. Dynamika objemu dovozu osobných automobilov do Ruskej federácie

za 2006-1q. 2010

Stĺpcové grafy môže byť použité:

    analyzovať dynamiku sociálno-ekonomických javov;

    vyhodnotenie realizácie plánu;

    charakteristiky variácií v sérii distribúcií;

    pre priestorové porovnania (porovnania medzi územiami, krajinami, firmami);

    študovať štruktúru javov.

Stĺpy sú umiestnené blízko alebo oddelene v rovnakej vzdialenosti. Výška stĺpcov by mala byť úmerná číselným hodnotám úrovní prvkov.

Obr.3. Dynamika podielu Bieloruska na obchodnom obrate Ruskej federácie s krajinami SNŠ

Na charakterizáciu štruktúry sociálno-ekonomických javov sa široko používajú koláčové grafy. Na jeho zostavenie by mal byť kruh rozdelený na sektory v pomere k špecifickej hmotnosti častí v celkovom objeme. Súčet špecifických váh sa rovná 100 %, čo zodpovedá celkovému objemu skúmaného javu.

Obr.4. Geografické rozdelenie obchodného obratu medzi Ruskou federáciou a krajinami SNŠ

Stĺpcové grafy pozostávajú z obdĺžnikov usporiadaných vodorovne (pruhy).

Krajiny niekedy používajú na porovnávaciu analýzu podľa regiónov diagramy znakov(schémy geometrických tvarov). Tieto diagramy odrážajú veľkosť študovaného objektu v súlade s veľkosťou jeho plochy.

Štatistické mapy sa používajú na posúdenie geografického rozloženia javov a komparatívnu analýzu podľa územia.

Štatistické mapy zahŕňajú kartogramy a kartogramy. Rozdiel medzi nimi spočíva v spôsobe zobrazovania štatistík na mapách.

Kartogram ukazuje územné rozloženie študovaného znaku v samostatných oblastiach a používa sa na identifikáciu vzorcov tohto rozloženia. Kartogramy sa delia na pozadie a bodové. Podkladové kartogramy s rôznou farebnou hustotou charakterizujú intenzitu ktoréhokoľvek ukazovateľa v rámci územného celku. Na bodovom kartograme je úroveň zvoleného javu znázornená bodkami.

Kartogram- ide o kombináciu geografickej mapy alebo jej schémy s diagramom. Umožňuje vám odrážať špecifiká každého regiónu v distribúcii skúmaného javu, jeho štrukturálnych črtách.

V súčasnosti boli vyvinuté rôzne softvérové ​​balíky pre počítačovú grafiku, napríklad Excel, Statgraf, Statistica.

Štatistické údaje by mali byť prezentované takým spôsobom, aby sa dali použiť. Existujú 3 hlavné formy prezentácie štatistických údajov:

1) text - zahrnutie údajov do textu;

2) tabuľkový - prezentácia údajov v tabuľkách;

3) grafický – vyjadrenie údajov vo forme grafov.

Textová forma sa používa v prípade malého množstva digitálnych údajov.

Najčastejšie sa používa tabuľková forma, keďže ide o efektívnejšiu formu prezentácie štatistických údajov. Na rozdiel od matematických tabuliek, ktoré podľa počiatočných podmienok umožňujú získať jeden alebo druhý výsledok, štatistické tabuľky hovoria rečou čísel o skúmaných objektoch.

Štatistická tabuľka- ide o systém riadkov a stĺpcov, v ktorom sú v určitej postupnosti a súvislosti uvádzané štatistické informácie o sociálno-ekonomických javoch.

Tabuľka 2. Zahraničný obchod Ruskej federácie za roky 2000 - 2006, miliardy dolárov

Index 2000 2001 2002 2003 2004 2005 2006
Obrat zahraničného obchodu 149,9 155,6 168,3 280,6 368,9 468,4
Export 101,9 107,3 135,9 183,2 243,6 304,5
Importovať 44,9 53,8 76,1 97,4 125,3 163,9
Obchodná rovnováha 60,1 48,1 46,3 59,9 85,8 118,3 140,7
počítajúc do toho:
so zahraničím
export 90,8 86,6 90,9 114,6 210,1 261,1
importovať 31,4 40,7 48,8 77,5 103,5 138,6
obchodná rovnováha 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Napríklad v tabuľke. 2 uvádza informácie o zahraničnom obchode Ruska, ktoré by bolo neefektívne vyjadrovať v textovej forme.

Rozlišovať predmet a predikátštatistická tabuľka. Subjekt označuje charakterizovaný objekt – buď jednotky populácie, alebo skupiny jednotiek, alebo celok ako celok. V prísudku sa uvádza charakteristika podmetu spravidla v číselnom tvare. Povinné hlavička tabuľka, ktorá označuje, do ktorej kategórie a do akého času údaje v tabuľke patria.

Podľa charakteru predmetu sa štatistické tabuľky delia na jednoduché, skupina a kombinačné. V predmete jednoduchej tabuľky nie je predmet štúdia rozdelený do skupín, ale je uvedený buď zoznam všetkých jednotiek populácie, alebo je uvedená populácia ako celok (napríklad tabuľka 11). V predmete skupinovej tabuľky je predmet štúdia rozdelený do skupín podľa jedného atribútu a predikát udáva počet jednotiek v skupinách (absolútne alebo v percentách) a súhrnné ukazovatele pre skupiny (napríklad tabuľka 4). V predmete kombinovanej tabuľky je populácia rozdelená do skupín nie podľa jedného, ​​ale podľa niekoľkých kritérií (napríklad tabuľka 2).

Pri konštrukcii tabuliek sa musíte riadiť nasledujúcim všeobecné pravidlá.

1. Predmet tabuľky sa nachádza v ľavej (menej často - hornej) časti a predikát - v pravej (menej často - dolnej).

2. Záhlavia stĺpcov obsahujú názvy ukazovateľov a ich jednotky.

3. Posledný riadok dopĺňa tabuľku a nachádza sa na jej konci, ale niekedy je prvý: v tomto prípade je druhý riadok napísaný „vrátane“ a ďalšie riadky obsahujú zložky celkového riadku.

4. Číselné údaje sa zapisujú s rovnakým stupňom presnosti v každom stĺpci, pričom číslice čísel sú umiestnené pod číslicami a celá časť je oddelená od zlomkovej čiarky.

5. V tabuľke by nemali byť prázdne bunky: ak sú údaje nulové, vloží sa znak „–“ (pomlčka); ak údaje nie sú známe, zapíše sa „žiadne informácie“ alebo sa vloží znak „...“ (elipsa). Ak hodnota exponentu nie je nula, ale prvá platná číslica sa objaví po akceptovanom stupni presnosti, potom sa zaznamená 0,0 (ak bol akceptovaný napríklad stupeň presnosti 0,1).

Niekedy sú štatistické tabuľky doplnené o grafy, keď je cieľom zdôrazniť niektorú vlastnosť údajov, porovnať ich. Grafická forma je z hľadiska ich vnímania najefektívnejšou formou prezentácie údajov. Pomocou grafov sa dosahuje viditeľnosť charakteristík štruktúry, dynamiky, vzťahu javov a ich porovnávanie.

Štatistické grafy- sú to podmienené obrázky číselných hodnôt a ich pomerov prostredníctvom čiar, geometrických tvarov, kresieb alebo geografických máp. Grafická forma uľahčuje zohľadnenie štatistických údajov, robí ich vizuálnymi, expresívnymi a viditeľnými. Grafy však majú určité obmedzenia: po prvé, graf nemôže obsahovať toľko údajov, koľko sa zmestí do tabuľky; v grafe sú navyše vždy zaokrúhlené údaje - nie presné, ale približné. Graf sa teda používa len na zobrazenie všeobecnej situácie, nie na detaily. Posledným nedostatkom je zložitosť kreslenia. Dá sa prekonať pomocou osobného počítača (napríklad „Sprievodca diagramom“ z balíka Microsoft Office Excel).

Podľa spôsobu konštrukcie grafiky sa delia na diagramy, kartogramy a grafy.

Najbežnejším spôsobom grafického znázornenia údajov sú grafy, ktoré sú týchto typov: lineárne, radiálne, bodové, rovinné, objemové, kučeravé. Typ diagramov závisí od typu prezentovaných údajov a konštrukčnej úlohy. V každom prípade musí byť graf sprevádzaný nadpisom – nad alebo pod poľom grafu. Názov udáva, ktorý indikátor sa zobrazuje, pre ktoré územie a na aký čas.

Čiarové grafy sa používajú na znázornenie kvantitatívnych premenných: charakteristiky variácie ich hodnôt, dynamika, vzťahy medzi premennými. Zmeny údajov sa analyzujú pomocou distribučná oblasť, kumuluje(menej ako krivka) a ogives(krivka "väčšia ako"). Distribučný polygón je diskutovaný v téme 4 (napr. obr. 5). Na vytvorenie kumulácie sa hodnoty premennej funkcie vynesú pozdĺž úsečky a ordináty sú akumulované súčty frekvencií alebo frekvencií (od f1 na ∑ f). Na vytvorenie ogive sa nahromadené súčty frekvencií umiestnia na os y v opačnom poradí (od ∑ f predtým f1). Kumulujte a dávajte podľa tabuľky. 4. znázorniť na obr. jeden.

Ryža. 1. Kumuluje a určuje rozdelenie tovaru podľa hodnoty colnej hodnoty

Použitie čiarových grafov v analýze trendov je zahrnuté v téme 5 (napr. obrázok 13) a ich použitie na analýzu prepojenia v téme 6 (napr. obrázok 21). Téma 6 zahŕňa aj použitie bodových grafov (napr. obrázok 20).

Čiarové grafy sú rozdelené na jednorozmerný, ktorý sa používa na reprezentáciu údajov o jednej premennej a dvojrozmerný- pre dve premenné. Príkladom jednorozmerného čiarového grafu je distribučný mnohouholník a dvojrozmerným je regresná čiara (napr. obr. 21).

Niekedy sa pri veľkých zmenách indikátora používa logaritmická stupnica. Napríklad, ak sa hodnoty indikátora líšia od 1 do 1000, môže to spôsobiť ťažkosti pri vykresľovaní. V takýchto prípadoch prechádzajú na logaritmy hodnôt ukazovateľov, ktoré sa nebudú až tak líšiť: lg 1 = 0, lg 1000 = 3.

Medzi rovinný Podľa frekvencie používania sa rozlišujú stĺpcové grafy (histogramy), v ktorých je ukazovateľ prezentovaný ako stĺpec, ktorého výška zodpovedá hodnote ukazovateľa (napríklad obr. 4).

Úmernosť plochy konkrétneho geometrického útvaru k hodnote ukazovateľa je základom iných typov rovinných diagramov: trojuholníkový, námestie, pravouhlý. Môžete použiť aj porovnanie plôch kruhu – v tomto prípade sa nastavuje polomer kruhu.

pásový graf predstavuje indikátory vo forme horizontálne natiahnutých obdĺžnikov a je inak rovnaký ako stĺpcový graf.

Z rovinných diagramov sa často používa koláčový graf, ktorý slúži na ilustráciu štruktúry skúmanej populácie. Celá súprava sa berie ako 100%, zodpovedá celkovej ploche kruhu, plochy sektorov zodpovedajú častiam súpravy. Zostavme sektorový diagram štruktúry zahraničného obchodu Ruskej federácie v roku 2006 podľa tabuľky. 2 (pozri obr. 2). Pri použití počítačových programov sa sektorové diagramy budujú v trojrozmernej podobe, teda nie v dvoch, ale v troch rovinách (pozri obr. 3).

Ryža. 2. Jednoduchý koláčový graf 3. 3D koláčový graf

Kučeravé (obrázkové) diagramy umocňujú prehľadnosť obrázku, pretože obsahujú obrázok zobrazeného indikátora, ktorého veľkosť zodpovedá veľkosti indikátora.

Pri vykresľovaní grafu je všetko rovnako dôležité - správny výber grafického obrázka, proporcie, dodržiavanie pravidiel pre navrhovanie grafov. Tieto problémy sú podrobnejšie opísané v a.

Kartogramy a kartogramy sa používajú na zobrazenie geografických charakteristík skúmaných javov. Zobrazujú umiestnenie skúmaného javu, jeho intenzitu na určitom území – v republike, kraji, hospodárskom alebo správnom obvode a pod. Konštrukciou kartogramov a kartogramov sa zaoberá napr.

Koniec práce -

Táto téma patrí:

Pojem štatistiky. Predmet a metóda štatistiky

Pojem štatistiky.. predmet a metóda štatistiky.. štatistické pozorovanie..

Ak potrebujete ďalší materiál k tejto téme, alebo ste nenašli to, čo ste hľadali, odporúčame použiť vyhľadávanie v našej databáze diel:

Čo urobíme s prijatým materiálom:

Ak sa tento materiál ukázal byť pre vás užitočný, môžete si ho uložiť na svoju stránku v sociálnych sieťach:

Všetky témy v tejto sekcii:

Predmet a metóda štatistiky
Pojem „štatistika“ zaviedol do vedeckého používania nemecký vedec Gottfried Achenwal v roku 1746, ktorý navrhol nahradiť názov kurzu „Štátne štúdiá“ vyučovaného na nemeckých univerzitách názvom „St.

Štatistické pozorovanie
Ľudia majú rôzne postoje k štatistickým informáciám: niektorí ich nevnímajú, iní bezvýhradne veria a ďalší súhlasia s názorom anglického politika Disraeliho: „Existujú 3 druhy klamstiev: klamstvá,

Súhrn a zoskupovanie štatistík
Zhrnutie - vedecky organizované spracovanie pozorovacích materiálov (podľa vopred vypracovaného programu), ktoré zahŕňa okrem povinnej kontroly zozbieraných údajov aj systematizáciu, zoskupovanie.

Absolútne hodnoty
Na charakterizáciu hromadných javov štatistika využíva štatistické veličiny (ukazovatele), ktoré charakterizujú skupiny jednotiek alebo agregát (jav) ako celok. Štatistické veličiny

Relatívne hodnoty
Relatívna hodnota je výsledkom delenia (porovnania) dvoch absolútnych hodnôt. Čitateľ zlomku je porovnávaná hodnota a menovateľ je porovnávaná hodnota (ba

Priemerné hodnoty
Ako už bolo mnohokrát povedané, štatistika skúma hromadné javy a procesy. Každý z týchto javov má spoločné pre celý súbor aj špeciálne, individuálne vlastnosti.

Budovanie distribučnej série
Štatistiky skúmané charakteristiky sa líšia (odlišujú sa od seba) pre rôzne jednotky populácie v rovnakom období alebo časovom bode. Napríklad hodnota obratu zahraničného obchodu sa líši

Výpočet štrukturálnych charakteristík distribučného radu
Pri štúdiu variácie sa používajú také charakteristiky distribučného radu, ktoré kvantitatívne opisujú jeho štruktúru, štruktúru. Takým je napríklad medián – hodnota atribútu premennej

Výpočet mier veľkosti a intenzity variácie
Najjednoduchším ukazovateľom je rozsah variácie - absolútny rozdiel medzi maximálnymi a minimálnymi hodnotami vlastnosti od hodnôt dostupných v skúmanej populácii (24):

Výpočet distribučných momentov a ukazovateľov jeho tvaru
Na ďalšie štúdium povahy variácií sa používajú priemerné hodnoty rôznych stupňov odchýlok jednotlivých hodnôt vlastnosti od jej aritmetickej strednej hodnoty. Tieto ukazovatele sa nazývajú

Kontrola, či je distribučný rad normálny
Teoretická distribučná krivka sa chápe ako grafické znázornenie radu vo forme súvislej čiary zmeny frekvencie vo variačnom rade, funkčne spojené so zmenou opcií, iné

Kontrola, či distribučná séria zodpovedá Poissonovmu zákonu
Colná kontrola vykonala kontrolu po prepustení tovaru. V dôsledku toho sa získali nasledujúce diskrétne distribučné série počtu porušení identifikovaných v každom teste (tabuľka 16). stôl 1

Absolútne a relatívne ukazovatele zmeny štruktúry
Vývoj štatistickej populácie sa prejavuje nielen kvantitatívnym rastom alebo poklesom prvkov systému, ale aj zmenou jeho štruktúry. Štruktúra je štruktúra agregátu

Poradové ukazovatele zmeny štruktúry
Na meranie rozdielov v štruktúre sa často používajú menej presné, ale ľahšie vypočítateľné ukazovatele, ktoré sú založené na posudzovaní rozdielov nie v hodnotách samotných akcií, ale v ich radoch, to znamená ordinálnych.

Koncept selektívneho pozorovania
Metóda odberu vzoriek sa používa vtedy, keď je použitie kontinuálneho pozorovania fyzicky nemožné z dôvodu obrovského množstva údajov alebo nie je ekonomicky realizovateľné. Existuje fyzická nemožnosť

Metódy odberu vzoriek
1. Vlastne náhodný výber: všetky jednotky HS sú očíslované a čísla vyžrebované ako výsledok žrebovania zodpovedajú jednotkám, ktoré spadli do vzorky a počet čísel sa rovná plánovanému počtu

Priemerná vzorkovacia chyba
Po dokončení výberu požadovaného počtu jednotiek vo vzorke a zaregistrovaní charakteristík týchto jednotiek stanovených v programe pozorovania pristúpia k výpočtu zovšeobecňujúcich ukazovateľov. k nim z

Okrajová výberová chyba
Vzhľadom na to, že na základe výberového zisťovania nie je možné presne posúdiť zovšeobecňujúcu charakteristiku HS, je potrebné nájsť hranice, v ktorých sa nachádza. V konkrétnej vzorke rozdiel

Požadovaná veľkosť vzorky
Pri vývoji programu selektívneho pozorovania sa im priradí konkrétna hodnota hraničnej chyby a úroveň pravdepodobnosti. Minimálna veľkosť vzorky, ktorá poskytuje dané

Smernice
Úloha. V podniku sa uskutočnil rozhovor so 100 pracovníkmi z 1000 v poradí náhodnej neopakujúcej sa vzorky a získali sa tieto údaje o ich príjmoch za mesiac (tabuľka 24): Ta

Pojem časových radov
Jednou z najdôležitejších úloh štatistiky je štúdium zmien analyzovaných ukazovateľov v čase, teda ich dynamiky. Tento problém sa rieši analýzou série dynamiky (časové rady).

Indikátory zmien v úrovniach série dynamiky
Analýza časových radov začína určením toho, ako sa úrovne radov menia (zvyšujú, znižujú alebo zostávajú nezmenené) v absolútnom a relatívnom vyjadrení. Na sledovanie

Priemerné ukazovatele série dynamiky
Každú sériu dynamiky možno považovať za určitý súbor n ukazovateľov meniacich sa v čase, ktoré možno zhrnúť ako priemerné hodnoty. Takéto zovšeobecnené (priemerné) ukazovatele sú obzvlášť

Metódy identifikácie hlavného trendu (trendu) v rade dynamiky
Jednou z hlavných úloh štúdia série dynamiky je identifikovať hlavný trend (vzor) pri zmene úrovní série, nazývaný trend. V niektorých prípadoch pravidelnosť pri zmene úrovní série

Hodnotenie primeranosti trendu a prognóza
Pre nájdenú trendovú rovnicu je potrebné posúdiť jej spoľahlivosť (primeranosť), čo sa zvyčajne vykonáva pomocou Fisherovho kritéria, porovnaním jej vypočítanej hodnoty Fр

Sezónna analýza
V sérii dynamiky, ktorej úrovne sú mesačné alebo štvrťročné ukazovatele, sú spolu s náhodnými výkyvmi často pozorované sezónne výkyvy, ktoré sa chápu ako periodické

Smernice
Podľa Federálnej štátnej štatistickej služby saldo zahraničného obchodu (SVT) Ruska za obdobie 2000-2006. charakterizované množstvom dynamiky uvedenej v tabuľke. 36. Tabuľka 36. Saldo zahraničného obchodu (CBT) Ruska za s

Koncept korelačnej závislosti
Jedným z najvšeobecnejších zákonov objektívneho sveta je zákon univerzálneho spojenia a závislosti medzi javmi. Prirodzene, pri skúmaní javov v najrozmanitejších oblastiach štatistiky nevyhnutne narážajú

Metódy identifikácie a hodnotenia korelácií
Na identifikáciu prítomnosti a povahy korelácie medzi dvoma znakmi sa v štatistike používa množstvo metód. 1. Zohľadnenie paralelných údajov (kn

Koeficienty poradovej korelácie
Koeficienty poradovej korelácie sú menej presné, ale ľahšie vypočítateľné neparametrické ukazovatele na meranie blízkosti vzťahu medzi dvoma korelovanými znakmi. Tie obsahujú

Zvláštnosti korelácie časových radov
V mnohých štúdiách je potrebné študovať dynamiku viacerých ukazovateľov súčasne, t.j. zvážte niekoľko časových radov paralelne. V tomto prípade je potrebné merať závislosť

Ukazovatele tesnosti vzťahu medzi kvalitatívnymi znakmi
Metóda korelačných tabuliek je použiteľná nielen pre kvantitatívne, ale aj pre deskriptívne (kvalitatívne) znaky, ktorých vzťah je často potrebné skúmať pri vedení rôznych sociológov.

Viacnásobná korelácia
Pri riešení praktických problémov sa výskumníci stretávajú so skutočnosťou, že korelácie sa neobmedzujú len na vzťahy medzi dvoma znakmi: efektívnym y a faktorom x. V akcii

Účel a typy indexov
Index je relatívna hodnota, ktorá ukazuje, koľkokrát sa úroveň skúmaného javu za daných podmienok líši od úrovne toho istého javu za iných podmienok. Rozdiel v podmienkach môže byť

Jednotlivé indexy
Relatívna hodnota získaná porovnaním úrovní sa nazýva individuálny index, ak nezáleží na štruktúre skúmaného javu. Jednotlivé indexy sú označené i

Všeobecné indexy
Ak je skúmaný jav heterogénny a porovnanie úrovní možno vykonať až po ich privedení na spoločnú mieru, ekonomická analýza sa vykoná pomocou všeobecných indexov. Index sa stáva všeobecným

Stredné indexy
Pri skúmaní kvalitatívnych ukazovateľov je často potrebné zvážiť zmenu v čase (alebo priestore) priemernej hodnoty indexovaného ukazovateľa pre určitú homogénnu populáciu.

Územné indexy
Územné indexy slúžia na priestorové, medziregionálne porovnávanie rôznych ukazovateľov. Ich výpočet je zložitejší ako výpočet uvažovaných tradičných (dynamických) indexov

GRAFICKÉ ZOBRAZENIE ŠTATISTICKÝCH ÚDAJOV, metóda vizuálneho znázornenia a zovšeobecnenia údajov o sociálno-ekonomických javoch prostredníctvom geometrických obrázkov, nákresov alebo schematických geografických máp a vysvetľujúcich nápisov k nim. Grafické znázornenie štatistických údajov prehľadne a názorne zobrazuje vzťah medzi javmi a procesmi spoločenského života, hlavné trendy v ich vývoji, mieru ich distribúcie v priestore; umožňuje vidieť ako celok javov ako celok, tak aj jeho jednotlivé časti.

Na grafickú prezentáciu štatistických údajov sa používajú rôzne typy štatistických grafov. Každý graf pozostáva z grafického obrázku a pomocných prvkov. Patria sem: vysvetlenie mapy, priestorové odkazy, odkazy na mierku, pole mapy. Pomocné prvky umožňujú čítať graf, porozumieť mu a použiť ho. Grafy možno klasifikovať podľa množstva znakov: v závislosti od tvaru grafického obrazu môžu byť bodové, čiarové, rovinné, priestorové a kučeravé. Podľa spôsobu konštrukcie grafiky sa delia na diagramy a štatistické mapy.

Najbežnejším spôsobom grafických obrázkov je diagram. Ide o kresbu, na ktorej sú štatistické údaje prezentované ako geometrické tvary alebo znaky a územie, ktorého sa tieto údaje týkajú, je uvedené len slovne. Ak je diagram prekrytý na geografickej mape alebo na pláne územia, ktorého sa štatistické údaje týkajú, potom sa graf nazýva mapový diagram. Ak sú štatistické údaje zobrazené tieňovaním alebo vyfarbením príslušného územia na geografickej mape alebo pláne, potom sa graf nazýva kartogram.

Na porovnanie podobných štatistických údajov charakterizujúcich rôzne objekty alebo územia možno použiť rôzne typy grafov. Najviditeľnejšie sú stĺpcové grafy, v ktorých sú štatistické údaje zobrazené ako vertikálne pretiahnuté obdĺžniky. Ich prehľadnosť sa dosiahne porovnaním výšky stĺpov (obr. 1).

Ak je základná čiara vertikálna a pruhy sú vodorovné, potom sa graf nazýva pásový graf. Obrázok 2 zobrazuje porovnávací stĺpcový graf, ktorý charakterizuje územie zemegule.

Grafy určené na popularizáciu sú niekedy zostavené vo forme štandardných obrázkov - nákresov charakteristických pre zobrazované štatistické údaje, čo robí graf výraznejším a upozorňuje naň. Takéto diagramy sa nazývajú kučeravé alebo obrázkové (obr. 3).

Veľkú skupinu indikatívnych grafov tvoria štrukturálne diagramy. Spôsob grafického znázornenia štruktúry štatistických údajov spočíva v zostavení štruktúrnych koláčových alebo koláčových grafov (obr. 4).

Na zobrazenie a analýzu vývoja javov v čase sa konštruujú diagramy dynamiky: tyčové, pásové, štvorcové, kruhové, lineárne, radiálne atď. Výber typu diagramu závisí od charakteristík počiatočných údajov, účel štúdie. Napríklad, ak existuje séria dynamiky s trochu nerovnakými úrovňami v čase (1913, 1940, 1950, 1980, 2000, 2005), potom sa použijú stĺpcové, štvorcové alebo koláčové grafy. Sú vizuálne pôsobivé, dobre zapamätateľné, ale nehodia sa na zobrazenie veľkého množstva úrovní. Ak je počet úrovní v sérii dynamiky veľký, potom sa použijú lineárne diagramy, ktoré reprodukujú vývojový proces vo forme súvislej prerušovanej čiary (obr. 5).

Pomerne často sa na jednom čiarovom grafe zobrazuje niekoľko kriviek, ktoré poskytujú porovnávací popis dynamiky rôznych ukazovateľov alebo toho istého ukazovateľa v rôznych krajinách (obr. 6).

Na zobrazenie závislosti jedného indikátora na druhom sa vytvorí diagram vzťahov. Jeden indikátor sa považuje za X a druhý za Y (t. j. funkcia X). Je vybudovaný pravouhlý súradnicový systém so stupnicami pre ukazovatele a v ňom je nakreslený graf (obr. 7).

Rozvoj výpočtovej techniky a aplikovaného softvéru umožnil vytvárať geografické informačné systémy (GIS), ktoré predstavujú kvalitatívne novú etapu v grafickom znázornení informácií. GIS poskytujú zber, uchovávanie, spracovanie, prístup, zobrazovanie a distribúciu priestorovo koordinovaných údajov; zahŕňajú veľké množstvo grafických a tematických databáz v spojení s modelovými a výpočtovými funkciami, ktoré umožňujú prezentovať informácie v priestorovej (kartografickej) forme, získavať viacvrstvové elektronické mapy regiónu v rôznych mierkach. Podľa územného pokrytia sa rozlišujú globálne, subkontinentálne, štátne, regionálne a lokálne typy GIS. Predmetové zameranie GIS je určené úlohami riešenými s jeho pomocou, medzi ktoré môže patriť inventarizácia zdrojov, analýza, hodnotenie, monitorovanie, riadenie a plánovanie.

Lit .: Gerchuk Ya. P. Grafické metódy v štatistike. M., 1968; Teória štatistiky / Edited by R. A. Shmoylova. 4. vyd. M., 2005. S. 150-83.

Štatistický graf je kresba, v ktorej sú štatistické populácie charakterizované určitými ukazovateľmi opísané pomocou podmienených geometrických obrázkov alebo znakov. V štatistických grafoch sa najčastejšie používa systém pravouhlých súradníc, existujú však aj grafy založené na princípe polárnych súradníc (kruhové grafy).

Klasifikácia typov grafov:

a) spôsob vytvárania grafického obrazu;

b) geometrické znaky zobrazujúce štatistické ukazovatele a vzťahy;

c) úlohy riešené pomocou grafického obrázku.

Štatistické grafy vo forme grafického obrázka:

1. Lineárne: štatistické krivky.

2. Rovinný: pruh, pás, štvorec, kruh, sektor, kučeravý, bodka, pozadie.

3. Objemové: distribučné plochy.

Štatistické grafy podľa spôsobu konštrukcie a obrázkových úloh:

1. Diagramy: porovnávacie diagramy, dynamické diagramy, štruktúrne diagramy (najbežnejší spôsob grafických obrazov. Ide o grafy kvantitatívnych vzťahov).

2. Štatistické mapy: kartogramy, kartogramy (grafy kvantitatívneho rozloženia po povrchu. Vo svojom hlavnom účele tesne susedia s diagramami a sú špecifické len v tom zmysle, že ide o podmienené obrazy štatistických údajov na vrstevnicovej geografickej mape, t.j. , zobrazujú priestorové rozloženie alebo priestorové rozloženie štatistík)

10/ Absolútne čísla

Absolútne ukazovatele odrážať fyzikálne rozmery procesov a javov skúmaných štatistikou, konkrétne ich hmotnosť, plochu, objem, dĺžku, časové charakteristiky. Vždy sú to pomenované čísla. Vyjadrené v prírodné, hodnotové alebo pracovné merné jednotky.

Naturálne jednotky - tony, kilometre, litre, sudy, kusy.

Relatívne prírodné jednotky sa používajú vtedy, keď má výrobok viacero odrôd a celkový objem možno určiť len na základe spotrebiteľskej vlastnosti spoločnej pre všetky odrody. Prepočet na konvenčné jednotky sa vykonáva na základe špeciálnych koeficientov vypočítaných ako pomer spotrebiteľských vlastností jednotlivých odrôd produktu k referenčnej hodnote.

Nákladové jednotky merania poskytujú peňažné hodnotenie sociálno-ekonomických javov (hodnota HDP). Merné jednotky práce umožňujú zohľadniť celkové náklady práce v podniku a náročnosť práce jednotlivých operácií technologického procesu (osobo-dni, osobohodiny).

Jednotlivé absolútne ukazovatele získané priamo v procese štatistického pozorovania ako výsledok sledovaného kvantitatívneho znaku.

Súhrnné absolútne ukazovatele objemu sa získajú sumarizáciou a zoskupením jednotlivých hodnôt.

11/ Relatívne ukazovatele

Relatívny ukazovateľ je výsledkom delenia jedného absolútneho ukazovateľa druhým a vyjadruje pomer medzi kvantitatívnymi charakteristikami sociálno-ekonomických javov.

Bez relatívnych ukazovateľov nie je možné zmerať intenzitu vývoja skúmaného javu v čase, posúdiť úroveň vývoja jedného javu na pozadí iných javov s ním prepojených, uskutočniť priestorové a územné porovnania.

Pri výpočte relatívneho ukazovateľa sa volá absolútny ukazovateľ, ktorý je v čitateli výsledného pomeru aktuálne alebo porovnateľné, a exponent v menovateli sa nazýva základ porovnania alebo základ.

Relatívne ukazovatele môžu byť vyjadrené v koeficientoch, percentách, ppm, desatinných číslach alebo ide o pomenované hodnoty. Percentá sa používajú v prípadoch, keď porovnávaný absolútny ukazovateľ prevyšuje základný ukazovateľ najviac 2-3 krát. Ak je nadradenosť väčšia, použije sa koeficient.

Sú nasledujúce typy relatívnych ukazovateľov.

    Relatívny ukazovateľ dynamiky (RDI) je pomer úrovne skúmaného procesu alebo javu za dané časové obdobie a úrovne toho istého javu v minulosti. OPD sa meria v percentách alebo sa vyjadruje ako koeficient.

    Táto hodnota ukazuje, koľkokrát je aktuálna úroveň väčšia ako základná línia alebo aký je jej podiel na základnej línii. Ak je GPV vyjadrený ako násobok, potom je to rastový faktor. Keď sa tento faktor vynásobí 100, získa sa rýchlosť rastu.

    Relatívny ukazovateľ plánu (RPI) je pomer plánovanej úrovne ukazovateľa k už dosiahnutému ukazovateľu v minulosti. ROP, podobne ako RAP, sa vyjadruje v percentách alebo ako pomer.

    Indikátor implementácie relatívneho plánu (PRRP) je pomer skutočne dosiahnutej úrovne k plánovanej úrovni indikátora. PRRP sa vyjadruje aj ako percento alebo ako pomer.

    Index relatívnej štruktúry (RPS) je pomer štrukturálnych častí skúmaného objektu a je určený pomerom ukazovateľa, ktorý charakterizuje časť populácie, k ukazovateľu, ktorý charakterizuje celú populáciu. OPS sa vyjadruje v zlomkoch jednotiek alebo v percentách.

    Index relatívnej koordinácie (RIC) - pomer rôznych častí patriacich k jednému objektu.

    Relative Comparison Index (RPCr) je pomer absolútnych ukazovateľov rovnakého mena, ktoré charakterizujú rôzne objekty.

    Ukazovateľ relatívnej intenzity (RII) charakterizuje mieru šírenia skúmaného procesu alebo javu v jeho inherentnom prostredí a je určený pomerom ukazovateľa charakterizujúceho jav a ukazovateľa charakterizujúceho prostredie pre distribúciu tohto javu. OPI sa meria v percentách, ppm, decimil. Tento ukazovateľ sa vypočíta, keď absolútna hodnota nestačí na formulovanie primeraných záverov o rozsahu javu. Rôzne OPII sú indikátory úroveň ekonomického rozvoja charakterizujúca produkciu HDP na obyvateľa, obchodný obrat na obyvateľa a pod. Ukazovatele úrovne ekonomického rozvoja sú pomenované hodnoty a merajú sa v rubľoch na obyvateľa atď.

§ 1. Pojmy štatistiky, štatistická pravidelnosť a totalita ..... 2

§2. Znaky jednotiek štatistickej populácie, ich klasifikácia ...... 2

§jedna. Koncepcia štatistického pozorovania, jeho príprava ............... 4

§2. Typy štatistického pozorovania ................................................................. ................. .. 5

§3. Chyby v pozorovaní ................................................. ...................................... 6

§štyri. Zhrnutie a zoskupenie ................................................... ........................ 6

§5. Typy štatistických zoskupení ...................................................... ............ 6

§6. Štatistické tabuľky ................................................................ ............... 7

§7. Štatistické grafy ...................................................... ................... ............ osem

§jedna. Skutočné a teoretické rozdelenie ................................................................ 21

§2. Krivka normálneho rozdelenia................................................................ 21

§3. Testovanie hypotézy normálneho rozdelenia................................ 21

§štyri. Kritériá zhody: Pearson, Romanovsky, Kolmogorov.......... 21

§5. Praktická hodnota modelovej distribučnej série ..... 22

§jedna. Koncept selektívneho pozorovania. Dôvody jeho použitia ...... 23

§3. Chyby pri odbere vzoriek ................................................................ ............... 24

§štyri. Vzorové pozorovacie úlohy ................................................ 25

§5. Rozšírenie údajov z pozorovania vzorky na všeobecnú populáciu... 26

§6. Malá vzorka ................................................. ............................. 26

§jedna. Koncept korelácie a CRA ................................................ 27

§2. Podmienky používania a obmedzenia KPA .................................. 27

§3. Párová regresia založená na metóde najmenších štvorcov.. 28

§štyri. Aplikácia párovej lineárnej regresnej rovnice .......... 29

§6. Viacnásobná korelácia................................................ 32


Téma 1.: Úvod do štatistiky.

  1. koncepcie štatistiky, štatistickej pravidelnosti a populácie.
  2. znaky jednotiek štatistickej populácie, ich klasifikácia.
  3. predmet a metóda štatistiky.

§ 1 Pojmy štatistiky, štatistická pravidelnosť a totalita.

Slovo štatistika pochádza z latinského „ postavenie” v preklade – stav, stav vecí.

Pojem štatistika vznikol v druhej polovici 18. storočia. V súvislosti s poznaním stavov, skúmaním ich znakov. Do rovnakého obdobia sa datuje aj začiatok výučby štatistiky na univerzite. V závislosti od odvetvia štatistického výskumu existujú: štatistiky obyvateľstva, priemyslu, poľnohospodárstva a pod. - aplikovaná štatistika.

Všeobecná teória štatistiky je súbor metód a techník na zber, spracovanie, prezentáciu a analýzu číselných údajov. Pojem štatistika sa dnes používa v 3 významoch:

  1. ako synonymum slova "údaje"
  2. významový odbor, ktorý spája princípy a metódy práce s číselnými údajmi charakterizujúcimi masové javy (stredná dĺžka života u mužov je nižšia ako u žien)
  3. odbor praktickej činnosti zameraný na spracovanie a analýzu číselných údajov.

Štatistika umožňuje identifikovať a merať vzorec vývoja sociálno-ekonomických procesov a javov, ako aj vzťah medzi nimi v konkrétnych podmienkach miesta a času.

Pravidelnosť označuje opakovanie, postupnosť a poradie zmien javov.

Štatistická zákonitosť - zákonitosť, v ktorej nevyhnutnosť je v každom jednotlivom jave nerozlučne spojená s náhodou a len v množstve javov sa prejavuje ako zákon. Proti konceptu štatistickej zákonitosti stojí koncept dynamickej zákonitosti, ktorý sa prejavuje v každom jave. (príklad: S kruh =pr 2 ako > r tém > S kruh). Objektom štatistického skúmania je štatistický súbor - súbor jednotiek, ktoré majú hromadný charakter, homogenitu, determinovanú celistvosťou a prítomnosťou variácií. Každý jednotlivý prvok sa nazýva štatistická populačná jednotka (ESS).

§2. Znaky jednotiek štatistickej populácie, ich klasifikácia.

ECC majú určité vlastnosti, ktoré sa nazývajú vlastnosti. Štatistika študuje javy prostredníctvom ich znakov, čím je súbor homogénnejší, tým viac spoločných znakov majú jeho jednotky a tým menej sa líšia hodnoty týchto znakov.

Opisný znak je znak, ktorý možno vyjadriť len slovne.

  1. Kvantitatívny znak - znak, ktorý možno vyjadriť číselne.
  2. Priamy znak je vlastnosť, ktorá je priamo vlastná charakteristickému objektu.
  3. Nepriamym znakom sú vlastnosti nie samotného charakterizovaného objektu, ale objektu s ním spojeného alebo v ňom zahrnutého.
  4. primárny atribút je absolútna hodnota, ktorú možno merať.
  5. sekundárny znak – výsledok porovnania primárnych znakov, meria sa priamo.
  6. prírodné znamenie - meria sa v kusoch, kg, tonách, litroch atď.
  7. pracovné znamenie – meria sa v človekodňoch, človekohodinách.
  8. atribút hodnoty - meraný v rubľoch, $, €, ₤.
  9. bezrozmerný znak - meranie v podieloch,%
  10. alternatívna vlastnosť je vlastnosť, ktorá preberá iba jednu hodnotu z niekoľkých možných.
  11. diskrétne znamienko - má iba celočíselné hodnoty, bez medziľahlého.
  12. spojitý znak je znak, ktorý nadobúda akúkoľvek hodnotu v určitom rozsahu.
  13. Faktorová vlastnosť je vlastnosť, ktorá mení inú vlastnosť.
  14. efektívna vlastnosť – vlastnosť, ktorá sa mení pod črtou inej
  15. momentálny znak - znak meraný v určitom časovom bode.
  16. intervalový znak - znak pre určité časové obdobie.

Rovnaký znak možno klasifikovať súčasne podľa rôznych klasifikácií.

§3. Predmet a metóda štatistiky.

Predmetom štatistického výskumu sú štatistické agregáty - súbor jednokvalitných premenlivých objektov.

Špecifiká predmetu štatistiky určujú špecifiká metódy, medzi ktoré patria:

  1. zber údajov (štatistické pozorovanie, publikácia)
  2. zovšeobecňovanie údajov (súhrn, zoskupovanie)
  3. prezentácia údajov (tabuľky a grafy)
  4. analýza a interpretácia číselných údajov (výpočet priemerov, analýza variácií, KRA, série dynamiky, indexy)

Téma 2: Organizácia štatistického pozorovania.

Zhrnutie a zoskupenie údajov.

§jedna. Pojem štatistického pozorovania, jeho príprava.

§2. Typy štatistického pozorovania.

§3 Chyby pozorovania.

§4 Zhrnutie a zoskupenie

§5 Typy štatistických zoskupení.

§6 Štatistické tabuľky.

§7 Štatistické grafy.

§jedna. Pojem štatistického pozorovania, jeho príprava.

Akýkoľvek štatistický výskum začína zberom údajov.

Zdroje informácií:

  1. rôzne publikácie (noviny, časopisy atď.)
  2. hlavným zdrojom publikovaných štatistických informácií sú publikácie orgánov štátnej štatistiky (RF v roku 2001, vydavateľstvo GOSKOMSTAT).
  3. vykonávanie štatistického pozorovania, t.j. vedecky organizovaný zber údajov.

Štatistické pozorovanie je hromadné, plánované, vedecky organizované pozorovanie fenoménu spoločenského a ekonomického života, ktoré spočíva v registrácii znakov pre každú jednotku skúmanej populácie.

Proces pozorovania:

  1. Príprava na pozorovanie
  2. Vykonávanie hromadného zberu dát
  3. Príprava údajov na spracovanie
  4. Vypracovanie návrhov na zlepšenie štatistického pozorovania.

Príprava na pozorovanie:

  1. Určenie účelu a predmetu pozorovania
  2. Určenie zloženia označení podliehajúcich registrácii
  3. Vývoj dokumentov pre zber údajov
  4. Výber spravodajskej jednotky a jednotky, voči ktorej sa bude vykonávať zisťovanie.
  5. Je potrebné definovať metódy a prostriedky získavania údajov.

Organizačné problémy, ktoré treba vyriešiť:

  1. je potrebné určiť zloženie služieb vykonávajúcich štúdiu
  2. informovať personál
  3. zostaviť harmonogram prác
  4. replikovať dokumenty na zber údajov

Objektom pozorovania sú sociálno-ekonomické javy a procesy.

Na registráciu je potrebné jasne identifikovať znaky.

Pozorovací program - zoznam znakov znakov podliehajúcich registrácii v procese pozorovania.

Požiadavky programu pozorovania:

  1. Program by mal obsahovať podstatné črty, ktoré priamo charakterizujú skúmaný jav, nemal by obsahovať črty programu, ktoré majú sekundárne javy alebo črty, ktorých hodnoty budú zjavne nespoľahlivé alebo budú úplne chýbať.
  2. Otázky programu pozorovania by mali byť presné, nie nejednoznačné a ľahko pochopiteľné, aby sa predišlo ťažkostiam pri získavaní odpovedí.
  3. Malo by sa určiť poradie otázok.
  4. Program monitorovania by mal zahŕňať otázky priamej povahy na vykonávanie a objasňovanie zozbieraných údajov.
  5. na zabezpečenie jednotnosti prijímaných informácií je program vypracovaný vo forme dokumentu - nazývaného štatistický formulár.

Štatistický formulár je dokument jednej vzorky obsahujúci program a výsledky pozorovaní.

Rozlišuje sa individuálna forma (odpovede na otázky o jednej jednotke pozorovania) a odpisová (informácie o viacerých jednotkách štatistického súboru).

Formulár a návod na jeho vyplnenie sú nástrojmi na štatistické pozorovanie.

Výber času pozorovania spočíva v riešení 2 otázok: stanovenie kritického dátumu alebo intervalu, určenie obdobia pozorovania.

Kritický dátum - konkrétny deň v roku, hodina dňa, od ktorej musia byť znamenia registrované pre každú jednotku skúmanej populácie.

Obdobie pozorovania - čas, počas ktorého sa vypĺňajú štatistické formuláre, t.j. čas potrebný na zber údajov.

Malo by sa vziať do úvahy, že vzdialenosť obdobia pozorovania od kritického dátumu alebo intervalu môže viesť k zníženiu spoľahlivosti získaných informácií.

§2. Typy štatistického pozorovania.

V domácej štatistike sa používajú tri formy štatistických pozorovaní.

  1. štatistické vykazovanie podnikov, organizácií, inštitúcií.
  2. špeciálne organizované štatistické pozorovanie (sčítanie ľudu atď.)
  3. register - forma priebežného štatistického sledovania dlhodobých procesov

Štatistické pozorovanie je klasifikované:

Podľa času pozorovania:

  • aktuálne pozorovanie - vykonáva sa priebežná evidencia znakov (matrika, kriminalita a pod.).
  • periodické pozorovanie - vykonáva sa v určitých časových intervaloch (životná úroveň v meste Čeľabinsk, náklady na spotrebný kôš, sčítanie obyvateľstva).
  • Jednorazové – jednorazové pozorovanie na konkrétny účel.

Podľa pokrytia jednotiek obyvateľstva:

  • Nepretržité pozorovanie – je potrebné získať informácie o všetkých ECC
  • Nie úplné pozorovanie
    • Metóda hlavného poľa - skúmajú sa najvýznamnejšie jednotky študovanej populácie (na štúdium strojárskeho podniku regiónu Čeľabinsk).
    • Selektívne pozorovanie je náhodný výber ECC, ktoré sa majú pozorovať.
    • Monografické pozorovanie - keď sa pozoruje jedno ECC, často sa používajú na zostavenie programu hromadného pozorovania.

Spôsobom zberu údajov:

  • Priame pozorovanie - registrátori sami priamym meraním, vážením zisťujú skutočnosť subjektu, ktorý má byť zaregistrovaný (dieťa do 1 roka v poliklinike).
  • Dokumentárne pozorovanie - používajú sa rôzne dokumenty (vyhotovenie vyhlásenia)

Anketa – potrebné informácie sa získavajú zo slov respondenta.

  • Špedičný prieskum - realizujú špeciálne vyškolení pracovníci, ktorí na základe prieskumu relevantných osôb dostávajú potrebné informácie a odpovede sami zaznamenávajú do formulára. Expedičný prieskum môže byť priamy (tvárou v tvár) a nepriamy (telefónny prieskum)
  • Korešpondenčný prieskum - informácie poskytujú pracovníci dobrovoľných korešpondentov, táto metóda si vyžaduje malé finančné náklady, ale neudáva presnú hodnotu pozorovania.
  • Samoregistrácia - formuláre si vypĺňajú sami respondenti a matrikári im tlačivá dotazníkov len rozdávajú a vysvetľujú, ako ich treba vyplniť.

§3. Chyby v pozorovaní

Hlavnou požiadavkou na štatistické pozorovanie je presnosť.

Presnosť - miera zhody akéhokoľvek charakteristického ukazovateľa so skutočnou hodnotou určenou z materiálov štatistického pozorovania.

Nesúlad medzi vypočítanou a skutočnou hodnotou sa nazýva chyba pozorovania, v závislosti od príčin výskytu rozlišujú: chyby registrácie a chyby reprezentatívnosti. Chyby registrácie sa delia na náhodné a systematické.

Náhodné chyby - výsledok akcií náhodných faktorov (riadky, stĺpce sú zmiešané)

Systematické chyby – vždy majú tendenciu ukazovateľ buď nadhodnocovať, alebo podceňovať. (Vek)

Chyby reprezentatívnosti sú povahou nekontinuálneho pozorovania a vznikajú v dôsledku nepresnej reprodukcie vzorky celej pôvodnej populácie.

Po prijatí štatistických formulárov musíte:

  1. skontrolujte úplnosť zozbieraných údajov.
  2. vykonať aritmetickú kontrolu založenú na vzájomnom vzťahu rôznych znakov.
  3. vykonávať logickú kontrolu založenú na znalosti logických vzťahov medzi znakmi.

§štyri. Zhrnutie a zoskupenie

Na základe zozbieraných údajov nie je možné urobiť výpočet a vyvodiť závery, najskôr ich treba zhrnúť a zhrnúť do jednej tabuľky. Na tieto účely sa používa súhrn a zoskupovanie.

Zhrnutie – súbor sekvenčných operácií na zovšeobecnenie konkrétnych jednotlivých faktov, ktoré tvoria súbor a identifikujú typické znaky a vzorce vlastné skúmanému javu ako celku.

Jednoduchá vodka - počítanie súčtov za obyvateľstvo.

Komplexné zhrnutie je súbor operácií na zoskupovanie jednotlivých pozorovaní, počítanie výsledkov pre každú skupinu a za celý objekt ako celok a prezentovanie výsledkov vo forme štatistických tabuliek.

Podľa formy spracovania materiálu môže byť sumár decentralizovaný, centralizovaný - takýto sumár sa vykonáva s jednorazovým štatistickým pozorovaním.

Zoskupovanie - rozdelenie súboru jednotiek skúmanej populácie do skupín podľa určitých charakteristík.

§5. Typy štatistických zoskupení

Zoskupenia možno klasifikovať podľa štruktúry a obsahu.

Analytické zoskupovanie charakterizuje vzťah medzi znakmi, z ktorých jeden je faktor a druhý je produktívny.

vzdelanie

Neúplné Vyššie

§6. Štatistické tabuľky

Výsledky zhrnutia a zoskupenia by mali byť prezentované takým spôsobom, aby sa dali použiť.

Existujú 3 spôsoby prezentácie údajov:

  1. údaje môžu byť zahrnuté do textu.
  2. prezentácia v tabuľkách.
  3. grafickým spôsobom

Štatistická tabuľka - systém riadkov a stĺpcov, v ktorých sú v určitej postupnosti prezentované štatistické informácie o sociálno-ekonomických javoch.

Rozlišujte medzi predmetom a prísudkom tabuľky.

Predmet je objekt charakterizovaný číslami, zvyčajne sa predmet uvádza na ľavej strane tabuľky.

Predikát je sústava ukazovateľov, ktorými je objekt charakterizovaný.

Štatistická tabuľka obsahuje 3 typy hlavičiek: všeobecné, bočné

Všeobecný názov by mal odrážať obsah celej tabuľky umiestnenej nad tabuľkou v strede.

Pravidlá tabuľky.

  1. sú povinné všetky tri typy nadpisov bez slovných skratiek, do nadpisu možno umiestniť spoločné merné jednotky.
  2. tabuľka by nemala mať extra čiary, môžu chýbať zvislé značky.
  3. Vyžaduje sa posledný riadok. Môže byť na začiatku alebo na konci dokumentu. Ak na začiatku dokumentu, potom ak na konci, potom SPOLU:
  1. digitálne údaje v rámci jedného stĺpca sa zaznamenávajú s jedným stupňom presnosti. Číslice sa píšu striktne pod číslicami, celá časť je oddelená čiarkou.
  2. tabuľka by nemala obsahovať prázdne bunky, ak nie sú žiadne údaje, píšu „Žiadne informácie“ alebo „...“, ak sú údaje nulové, potom „-“. Ak sa hodnota nerovná nule, ale prvá platná číslica sa objaví po zadanej presnosti 0,01®0,0 - ak je akceptovaná presnosť až na desatiny.
  3. ak je v tabuľke veľa stĺpcov, stĺpce predmetu sú označené veľkými písmenami a stĺpce predikátu číslami.
  4. ak je tabuľka založená na požičaných údajoch, zdroj údajov je uvedený pod tabuľkou, v prípade potreby môžu byť k tabuľke pripojené poznámky.

§7. Štatistické grafy

Štatistické tabuľky je možné doplniť grafmi.

Štatistické grafy sú podmienené obrázky číselných hodnôt a ich pomerov cez čiary, geometrické tvary, kresby.

Výhody grafického obrazu

  1. jasne, nápadne, výrazne.
  2. hranice zmeny ukazovateľa, komparatívna miera zmeny a volatilita sú okamžite viditeľné

Nevýhody grafického obrazu

  1. Zahrňte menej údajov ako v tabuľke.
  2. graf zobrazuje zaokrúhlené údaje, všeobecnú situáciu, ale nie detaily.

Štatistické grafy

Diagramy

kučeravý

Téma 3: Štatistické ukazovatele.

§jedna. Podstata a význam štatistického ukazovateľa, jeho atribúty.

§2. Klasifikácia štatistických ukazovateľov.

§3. Typy relatívnych ukazovateľov. Konštrukčné princípy.

§štyri. Systémy štatistických ukazovateľov.

Štatistický znak je vlastnosť obsiahnutá v ESS, existuje objektívne od toho, či sa študuje ako veda alebo nie.

Štatistický ukazovateľ je zovšeobecňujúca charakteristika nejakej vlastnosti obyvateľstva.

Štruktúra štatistického ukazovateľa (jeho atribúty):

  • Priemerné hodnoty
  • Variačné ukazovatele
  • Funkcie indikátorov pripojenia
  • Ukazovatele štruktúry a charakteru distribúcie
  • Dynamické ukazovatele
  • Ukazovatele variability
  • Ukazovatele presnosti a spoľahlivosti vzorových odhadov
  • Indikátory presnosti a spoľahlivosti prognózy

Podľa typu: celkový počet jednotiek alebo celková vlastnosť objektu. Toto je súčet primárnych charakteristík, meraných v kusoch, kg, m, $ atď.

Relatívny ukazovateľ- získaná porovnaním absolútnych alebo relatívnych ukazovateľov v priestore, v čase alebo porovnaním ukazovateľov rôznych vlastností skúmaného objektu.

Relatívny ukazovateľ 1. rádu sa získa porovnaním 2 x absolútnych ukazovateľov. Relatívny ukazovateľ 2. rádu sa získa porovnaním relatívnych ukazovateľov 1. rádu atď.

Relatívny index 3. rádu a vyššie je veľmi zriedkavý.

Priame ukazovatele - také ukazovatele, ktorých hodnota rastie s nárastom skúmaného javu.

Inverzné ukazovatele - ukazovatele, ktorých hodnota klesá s nárastom skúmaného javu.

… štruktúry

…reproduktory

…vzťahy

… intenzita

...vzťah k štandardu

... prirovnania

Štruktúrne ukazovatele sa získajú vzťahom časti k celku.

Relatívne ukazovatele dynamiky

ü Ukazovatele dynamiky (tempa rastu, rast)

ü Indexy

Ukazovatele vzťahov charakterizujte vzťah medzi vlastnosťami:

ü Korelačný koeficient

ü Analytické indexy

Indikátory intenzity charakterizovať vzťah dvoch objektov na rôznych základoch.

ü Náročnosť práce – množstvo času potrebného na výrobu jednej jednotky výrobku

ü Výroba – množstvo výrobkov vyrobených za jednotku času

VÝSTUP \u003d 1 / intenzita práce

Ukazovatele postoja k štandardu- pomer skutočných hodnôt znamenia ukazovateľa k normatívnemu, plánovanému, optimálnemu.

Porovnávacie ukazovatele - porovnanie rôznych predmetov na rovnakom základe.

Všeobecné princípy konštrukcie štatistických ukazovateľov:

  1. štatistiky spolu objektívne súvisia.
  2. Porovnávané ukazovatele sa môžu líšiť iba v jednom atribúte, nemôžete porovnávať ukazovateľ podľa dvoch alebo viacerých atribútov.
  3. je potrebné poznať a brať do úvahy limity ukazovateľa.

Pre každú charakteristiku objektu je potrebný systém štatistických ukazovateľov.

  1. kognitívna funkcia – založená na analýze údajov
  2. propaganda
  3. stimulačná funkcia

Téma 4: Priemery

§jedna. pojem priemeru

§2. typy priemerov

§3. aritmetický priemer a jeho vlastnosti

§štyri. harmonický priemer, geometrický priemer, kvadratický priemer.

§5. viacrozmerný priemer

Najbežnejšou formou štatistických ukazovateľov je priemer.

Najdôležitejšou vlastnosťou priemeru je, že odráža to spoločné, čo je vlastné každej jednotke skúmanej populácie, hoci hodnota atribútu jednotlivých jednotiek populácie môže kolísať jedným alebo druhým smerom.

Typickosť priemeru priamo súvisí s homogenitou skúmanej populácie. V prípade nehomogénnej populácie je potrebné ju rozdeliť na kvalitatívne homogénne skupiny a pre každú z homogénnych skupín vypočítať priemer.

Priemer môžete určiť pomocou počiatočného pomeru priemeru (ISS) jeho logického vzorca.

Štrukturálne priemery

Móda - Mo

Medián – ja

V sérii dynamiky sa vypočíta aritmetický priemer a chronologický priemer.

aritmetický priemer sa nazýva taká priemerná hodnota znaku, pri ktorej výpočte sa nemení celkový objem znaku.

Príklad: hmotnosť.

St jednoduchá aritmetika

X i– individuálna hodnota vlastnosti

n je celkový počet skúmanej populácie

porov. aritmeticky vážené

Vlastnosti porov. aritmetika.

Súčet odchýlok jednotlivých hodnôt vlastnosti od jej priemernej hodnoty je nula

ak sa každá jednotlivá hodnota prvku vynásobí alebo vydelí rovnakým konštantným číslom, potom sa priemer zvýši alebo zníži o rovnakú hodnotu.

ak sa ku každej jednotlivej hodnote atribútu pridá jedno a to isté konštantné číslo, potom sa priemerná hodnota zodpovedajúcim spôsobom zmení o rovnaké číslo.

Dôkaz

ak sa váhy f váženého priemeru vynásobia alebo vydelia rovnakým číslom, potom sa priemer nezmení.

súčet štvorcových odchýlok atribútu je menší ako od akéhokoľvek iného čísla.

Iné typy priemerov

Typ stredu

jednoduchý priemer

Vážený priemer

harmonický

geometrický

kvadratický

Charakterizovať zoskupenie na jednom základe je veľmi ťažké a v pamäti zostáva málo informácií.

Viacrozmerný priemer – priemerná hodnota pre niekoľko funkcií E.S.S.

Z pomerov hodnôt funkcií pre E.S. k priemerným hodnotám týchto vlastností.

Viacrozmerný priemer pre i jednotky

X ij– hodnota znaku j pre jednotku i

Stredná hodnota znaku j

k je počet funkcií

j je číslo objektu a počet jeho populácie

Téma 5: Analýza variácií

§jedna. Variácie znakov a ich príčiny

§2. Distribučné rady

§3. Štrukturálne charakteristiky variačného radu.

§štyri. Sila variačných indikátorov.

§5. Indikátory intenzity variácie

§6. typy disperzie. Pravidlo sčítania odchýlky.

Odchýlka v hodnote prvku v populácii je rozdiel v jeho hodnotách medzi rôznymi jednotkami danej populácie v rovnakom období alebo časovom bode.

Dôvod variácie: rozdielne podmienky pre existenciu ESS, je to variácia, ktorá vytvára potrebu takej vedy, akou je štatistika.

Uskutočnenie variačnej analýzy začína konštrukciou variačného radu - usporiadaného rozdelenia populačných jednotiek podľa rastúcich alebo klesajúcich znamienok a počítaním zodpovedajúcich frekvencií.

Distribučné rady

ü zaradený

ü diskrétne

ü interval

Hodnotené série variácií- zoznam jednotlivých jednotiek. agregáty vo vzostupnom zostupnom poradí hodnoteného objektu

Séria diskrétnych variácií - tabuľka pozostávajúca z 2 riadkov - polymérne hodnoty premennej vlastnosti a počet jednotiek s danou hodnotou vlastnosti.

Intervalový variačný rad sa vytvorí v týchto prípadoch:

  1. funkcia nadobúda diskrétne hodnoty, ale ich počet je príliš veľký
  2. atribút má akúkoľvek hodnotu v určitom rozsahu

Pri konštrukcii intervalového variačného radu je potrebné zvoliť optimálny počet skupín, najbežnejšia metóda pomocou Sturgessovho vzorca

k - počet intervalov

n je objem populácie

Pri výpočtoch sa takmer vždy získajú zlomkové hodnoty, ktoré sa zaokrúhľujú na celé číslo.

Dĺžka intervalu - l

Typy intervalov

dolná hranica nasledujúceho intervalu opakuje hornú hranicu nasledujúceho intervalu

otvorený interval, interval s jednou hranicou

Pri výpočte pre rad variácií intervalu sa stred intervalu berie ako x i.

NME = 60 medián = 1

Kumulovať – rozdelenie menšie ako

Ogiva – distribúcia väčšia ako

Medián je hodnota vlastnosti, ktorá rozdeľuje celú populáciu na dve rovnaké časti.

Pre diskrétny variačný rad výpočet mediánu: ak je n párne, potom č. Jednotka mediánu

Séria intervalových variácií:

k - počet intervalov

x 0 - dolná hranica mediánu intervalu

l je dĺžka stredného intervalu

Súčet frekvencií

Kumulatívna frekvencia intervalu predchádzajúceho mediánu.

Stredná intervalová frekvencia

Stredný interval– prvý interval, ktorého akumulovaná frekvencia presahuje polovicu celkového súčtu frekvencií.

Graficky je medián na súčte.

  1. Kvartily - hodnota atribútu rozdeľujúceho populáciu na 4 rovnaké časti.

1. kvartil

3. kvartil

2. kvartil – medián.

xQ 1 x Q 3 - dolná hranica intervalu obsahujúceho 1. a 3. kvartil.

l - dĺžka intervalu

a - akumulované frekvencie intervalov predchádzajúcich intervalov obsahujúcich 1. a 3. kvartil.

Frekvencie kvartilových intervalov.

Na charakterizáciu série variácií sa používajú:

Decily - rozdeľujú populáciu na 10 rovnakých častí, Percitily - rozdeľujú populáciu na 100 rovnakých častí.

  1. Režim je často sa vyskytujúca charakteristická vlastnosť. Pre diskrétne variačné série - najvyššia frekvencia. Pre sériu intervalových variácií sa režim vypočíta pomocou nasledujúceho vzorca:

Dolná hranica modálneho intervalu

l– dĺžka modálneho intervalu

fMo- frekvencia modálneho intervalu

f Mo +1 je frekvencia intervalu nasledujúceho po modáli

Modálny interval - interval s najvyššou frekvenciou. Graficky sa režim nachádza na histograme.

  1. Variácia rozpätia
  2. Priemerná lineárna odchýlka

vážený

  1. Rozptyl:

vážený

  1. smerodajná odchýlka

disperzná vlastnosť.

  1. zníženie všetkých hodnôt prvku o rovnakú hodnotu nemení hodnotu rozptylu.
  2. Zníženie všetkých hodnôt vlastností o k-krát zníži rozptyl o do 2časy a RMS v do raz
  3. ak vypočítate strednú druhú mocninu odchýlok z akejkoľvek hodnoty A odlišnej od aritmetického priemeru, potom bude vždy väčšia ako stredná druhá mocnina odchýlok vypočítaná z aritmetického priemeru. Teda z priemeru je vždy menej ako vypočítané z akejkoľvek inej hodnoty, t.j. má minimálny majetok. RMS = 1,25 – s rozdeleniami blízkymi normálu.

V podmienkach normálneho rozdelenia existuje nasledujúci vzťah medzi a počtom pozorovaní v rámci 68,3 % pozorovaní.

95,4 % pozorovaní je v medziach

99,7 % pozorovaní je v medziach

Na porovnanie variácií znakov v rôznych súboroch alebo na porovnanie variácií rôznych znakov v rovnakom súbore sa používajú relatívne ukazovatele, základom je aritmetický priemer.

  1. Relatívny rozsah variácií.
  2. Relatívna lineárna odchýlka
  3. Variačný koeficient

tieto ukazovatele poskytujú nielen porovnávacie hodnotenie, ale tvoria aj homogenitu populácie. Súbor sa považuje za homogénny, ak variačný koeficient nepresiahne 33 %.

Spolu so štúdiom variácií znaku v populácii ako celku je často potrebné sledovať kvantitatívne zmeny znaku, ale v skupinách, do ktorých je populácia rozdelená, a medzi nimi. To sa dosiahne výpočtom rôznych pohľadov.

Typy disperzie:

  1. Celkový rozptyl
  2. Medziskupinový rozptyl
  3. Rozptyl v rámci skupiny (zvyškový)

1. meria variáciu vlastnosti v celej populácii pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobili

Príklad: spotreba jogurtov: na základe vzorky 100 ľudí

Sociálny status

x i -individuálna hodnota znaku

Priemerná hodnota znaku za celú populáciu

frekvenciu tejto funkcie.

  1. 2. charakterizuje variáciu znaku pod vplyvom znaku faktora, ktorý je základom zoskupenia.

Priemer skupiny

Celkový priemer skupiny

Frekvencia podľa skupiny

  1. 3. charakterizuje variáciu vlastnosti pod vplyvom faktorov nezaradených do zoskupenia

X iji hodnota funkcie v skupine j

Priemerná hodnota funkcie v j skupina

f ij - frekvenciai-tá funkcia vj skupina

Existuje pravidlo, ktoré spája 3 typy rozptylu, nazýva sa pravidlo sčítania rozptylu.

Zvyškový rozptyl podľa j skupina

Súčet frekvencií nad j skupina

n je celkový súčet frekvencií

hlavnou úlohou analýzy variačných radov je identifikovať vzory frekvenčného rozloženia.

Distribučná krivka je grafické znázornenie vo forme súvislej čiary zmeny frekvencie v sérii variácií vo funkčne súvisiacej zmene hodnoty vlastnosti.

Distribučnú krivku je možné vykresliť pomocou mnohouholníka a histogramu. Empirické rozdelenie je vhodné zredukovať na teoretické, na niektorú z dobre preštudovaných foriem.

Krivka normálneho rozdelenia.

Existujú nasledujúce typy distribučných kriviek:

  1. unimodálne
  2. veľa vrcholov

Homogénne populácie sú charakterizované jednovertexovými krivkami, multivertexová krivka naznačuje heterogenitu populácie a potrebu preskupenia.

Zistenie všeobecnej povahy rozloženia zahŕňa posúdenie jeho homogenity a výpočet šikmosti a špičatosti. Pre symetrické distribúcie

Pre porovnávaciu štúdiu asymetrie rôznych rozdelení sa vypočíta koeficient asymetrie As.

Centrálny moment tretieho rádu; - RMS kocky;

Ak, potom je asymetria významná

Ak As<0, то As – левосторонняя, если As>0, potom je As pravák.

Ak, potom je As bezvýznamné. Pre symetrické a stredne asymetrické sa vypočíta indikátor špičatosti: ak E k > 0, potom je distribúcia vrcholná, ak E k<0, то распределение плосковершинное.

Variácia alternatívneho znaku sa kvantitatívne prejavuje nasledovne.

0 - jednotky, ktoré túto funkciu nemajú;

1 - jednotky s touto vlastnosťou;

R- podiel jednotiek s týmto znakom;

q- podiel jednotiek, ktoré túto vlastnosť nemajú;

potom p+q = 1.

Alternatívna funkcia má 2 hodnoty 0 a 1 s váhami p a q.

Priame znamenia- sú to znaky, ktorých hodnota rastie s nárastom skúmaného javu.

Obrátené znamienka - znaky, ktorých veľkosť klesá s nárastom skúmaného javu.

Generácia (priama)

Intenzita práce (obrátená)

Maximálny rozptyl podielu je 0,25.

Téma 6: Modelovanie distribučných sérií.

§jedna. Aktuálne a teoretické rozdelenie

§2. Krivka normálneho rozdelenia.

§3. Testovanie hypotézy normálneho rozdelenia.

§štyri. Kritériá súhlasu: Pearson, Romanovsky, Kolmogorov.

§5. Praktická hodnota modelovania distribučných sérií.

§jedna. Aktuálne a teoretické rozdelenie

Jedným z najdôležitejších cieľov štúdia distribučných radov je odhaliť vzor distribúcie a určiť jej povahu. Distribučné vzorce sa najzreteľnejšie prejavia až pri veľkom počte pozorovaní.

Skutočnú distribúciu je možné graficky znázorniť pomocou distribučnej krivky - graficky znázornenej ako súvislá čiara zmeny frekvencie vo variačnom rade variantu funkčne súvisiaceho so zmenou.

Teoretická distribučná krivka je chápaná ako krivka tohto typu rozdelenia vo všeobecnosti, ktorá vylučuje vplyv faktorov náhodných pre pravidelnosť.

Teoretické rozdelenie možno vyjadriť analytickým vzorcom nazývaným analytický vzorec. Najbežnejšie je normálne rozdelenie.

§2. Krivka normálneho rozdelenia.

Zákon normálneho rozdelenia:

y je ordináta normálneho rozdelenia

t je normalizovaná odchýlka.

; e = 2,7218; x i - možnosti variačnej série; - priemerný;

Vlastnosti:

Normálna distribučná funkcia je rovnomerná, t.j. f(t)=f(-t), . Funkcia normálneho rozdelenia je úplne určená štandardnou odchýlkou.

§3. Testovanie hypotézy normálneho rozdelenia.

Dôvodom častého odvolávania sa na zákon rozdeľovania je závislosť vyplývajúca z pôsobenia mnohých náhodných príčin, z ktorých žiadna nie je dominantná. Ak sa Mo = Me vypočítalo vo variačnom rade, potom to môže naznačovať blízkosť k normálnemu rozdeleniu. Najpresnejší test súladu s bežným zákonom sa robí pomocou špeciálnych kritérií.

§štyri. Kritériá súhlasu: Pearson, Romanovsky, Kolmogorov.

Pearsonovo kritérium.

Teoretická frekvencia

Empirická frekvencia

Metóda výpočtu teoretických frekvencií.

  1. Stanoví sa aritmetický priemer a podľa série variácií intervalu sa vypočíta t pre každý interval.
  2. Nájdeme hodnotu hustoty pravdepodobnosti pre zákon normalizovaného rozdelenia. STRANA 49
  3. Nájdeme teoretickú frekvenciu.

l - dĺžka intervalu

- súčet empirických početností

- hustota pravdepodobnosti

zaokrúhlite hodnotu na celé čísla

  1. Výpočet Pearsonovho pomeru
  2. tabuľková hodnota

d.f. – počet intervalov – 3

d.f. je počet stupňov voľnosti.

  1. ak > , tak rozdelenie nie je normálne, t.j. hypotéza normálneho rozdelenia je zrušená. Ak< , то распределение является нормальным.

Romanovského kritérium.

Vypočíta sa Pearsonovo kritérium;

Počet stupňov.

Ak s<3, то распределение близко к нормальному.

Kolmogorovovo kritérium

, D- maximálna hodnota medzi akumulovanými empirickými a teoretickými frekvenciami. Nevyhnutná podmienka pre použitie Kolmogorova: Počet pozorovaní je viac ako 100. Podľa špeciálnej pravdepodobnostnej tabuľky, s ktorou možno tvrdiť, že toto rozdelenie je normálne.

§5. Praktická hodnota modelovania distribučných sérií.

  1. schopnosť aplikovať zákony normálneho rozdelenia na empirické rozdelenie.
  2. schopnosť používať pravidlo 3 x sigma.
  3. Schopnosť vyhnúť sa dodatočným časovo náročným a nákladným výpočtom skúmaním populácie s vedomím, že rozdelenie je normálne.

Téma 7: Selektívne pozorovanie.

§jedna. Koncept selektívneho pozorovania. Dôvody jeho použitia.

§2. Typy selektívneho pozorovania.

§3. Chyby pri odbere vzoriek.

§štyri. Vzorové pozorovacie úlohy

§5. Distribúcia údajov z pozorovania vzorky bežnej populácii.

§6. Malá vzorka.

§jedna. Koncept selektívneho pozorovania. Dôvody jeho použitia.

Selektívne pozorovanie - také nekontinuálne pozorovanie, pri ktorom sa určitým spôsobom vybrané jednotky skúmanej populácie podrobia štatistickému skúmaniu.

Účel (úloha) výberového pozorovania: pre skúmanú časť charakterizovať celú populáciu jednotiek pri dodržaní všetkých pravidiel a zásad štatistického pozorovania.

Dôvody použitia selektívneho pozorovania:

  1. úspora materiálu, nákladov práce a času;
  2. možnosť podrobnejšie a detailnejšie študovať jednotlivé jednotky štatistickej populácie a ich skupiny.
  3. niektoré špecifické problémy je možné vyriešiť len pomocou selektívneho pozorovania.
  4. kompetentné a dobre organizované selektívne pozorovanie poskytuje vysokú presnosť výsledkov.

Všeobecná populácia je súbor jednotiek, z ktorých sa robí výber.

Rámec výberu je súbor jednotiek vybraných pre prieskum. V štatistike je zvykom rozlišovať parametre bežnej populácie a výberovej populácie.

Typy odberu vzoriek

Podľa spôsobu výberu:

Opakované

Jednotka, ktorá je zaradená do vzorky, sa po zaregistrovaní sledovaných charakteristík vracia bežnej populácii, aby sa zúčastnila na ďalšom výberovom konaní.

Objem všeobecnej populácie zostáva nezmenený, čo vedie k konštantnému zásahu vo vzorke ktorejkoľvek jednotky.

Neopakujúce sa

Jednotka vo vzorke sa nevracia do populácie, z ktorej sa robí výber.

Spôsob výberu:

Vlastne-náhodne je vo vzťahu k jednotkám zo všeobecnej populácie náhodne alebo náhodne bez akýchkoľvek prvkov konzistentnosti. Pred vykonaním takejto vzorky sa však treba uistiť, že všetky jednotky bežnej populácie majú rovnakú šancu byť zaradené do vzorky, t.j. v úplnom zozname jednotiek štatistickej populácie nie sú žiadne opomenutia alebo neznalosť jednotlivých jednotiek. Je tiež potrebné jasne stanoviť hranice bežnej populácie. Technicky stanovený výber sa uskutočňuje žrebovaním alebo použitím tabuľky náhodných čísel.

Mechanický odber vzoriek (každý 5 v zozname) sa používa v prípadoch, keď je všeobecná populácia nejako usporiadaná, t.j. existuje určitá postupnosť v rozložení jednotiek. Pri vykonávaní mechanického odberu vzoriek sa určuje podiel výberu, ktorý je stanovený pomerom všeobecnej populácie a populácie vzorky.

Nebezpečenstvo chyby pri mechanickom odbere vzoriek sa môže objaviť v dôsledku: náhodnej zhody zvoleného intervalu a cyklických vzorcov v usporiadaní jednotiek všeobecnej populácie.

Zónový odber vzoriek používa sa vtedy, keď všetky jednotky všeobecnej populácie možno rozdeliť do skupín (regiónov, krajín) podľa nejakého atribútu.

Kombinovaná vzorka.

Výber jednotiek je možné vykonať:

  1. alebo v pomere k veľkosti skupiny
  2. alebo v pomere k vnútroskupinovej diferenciácii znaku
  3. , kde n je veľkosť vzorky, N je veľkosť všeobecnej populácie, n i veľkosť vzorky i- skupiny, N i objem i vzorky.
  4. - táto metóda je presnejšia, ale v priebehu odberu vzoriek je veľmi ťažké vopred určiť odchýlku. (pred pozorovaním).

sériový výber.

Používa sa, keď sú ECC spojené do malých skupín (sérií), napríklad balenie s hotovými výrobkami, študentské skupiny. Podstatou sériového odberu vzoriek je, že série sa vyberú buď náhodne, alebo mechanicky a následne sa v rámci vybranej série vykoná kontinuálny prieskum.

Kombinovaný výber.

Ide o kombináciu vyššie diskutovaných spôsobov výberu, častejšie sa používa kombinácia typických a sériových sérií, t.j. výber sérií z niekoľkých typických skupín.

Výber môže byť aj viacstupňový a jednostupňový, viacfázový a jednofázový.

Viacstupňový výber: zo všeobecnej populácie sa najskôr vyberú veľké skupiny, potom menšie atď., až kým sa nevyberú jednotky, ktoré sú predmetom prieskumu.

Viacfázový výber: zahŕňa zachovanie rovnakej jednotky výberu vo všetkých fázach jej implementácie. Výberové jednotky vybrané v každom ďalšom stupni zároveň podliehajú skúške, ktorej program sa rozširuje (Príklad: študenti celého ústavu, potom študenti niektorých fakúlt).

§3. Chyby pri odbere vzoriek.

Systematický

Chyby reprezentatívnosti sa vyskytujú iba pri selektívnom pozorovaní. Vznikajú v dôsledku skutočnosti, že vzorová populácia nemôže presne reprodukovať všeobecnú populáciu. Nedá sa im vyhnúť, no dajú sa ľahko predvídať a v prípade potreby ich možno minimalizovať.

Výberová chyba je rozdiel medzi hodnotou parametra vo všeobecnej populácii a jeho hodnotou vypočítanou z výsledkov výberového pozorovania. Dх=-m+ , Dх – hraničná chyba vo vzorke, m – všeobecný priemer; - vzorový priemer.

Hraničná výberová chyba je náhodná hodnota.Čebyševove práce sa venujú štúdiu vzorcov náhodných výberových chýb. Čebyševova veta dokazuje, že Dx nepresahuje: - priemernú výberovú chybu t-koeficient spoľahlivosti udáva pravdepodobnosť tejto chyby. str. 42-43.

V prípade, keď je potrebné určiť t zo známej F(t), vezmeme najbližšiu veľkú F(t) a určíme z nej t.

Limit zlomok chyby

P - podiel.

Ak bol výber vykonaný neopakovateľným spôsobom, pridajú sa vzorce pre limitné chyby

Oprava pre neopakovanie.

Pre každý typ pozorovania vzorky sa prezentovaná chyba vypočítava inak:

  1. správne náhodné a mechanické pozorovanie;
  2. Zónový dohľad
  3. sériové odbery vzoriek

r je počet sérií vo vzorke;

R je počet sérií vo všeobecnej populácii;

Medziskupinový rozptyl proporcií.

§štyri. Vzorové pozorovacie úlohy

Používa sa na nasledujúce úlohy:

  1. n-? na určenie veľkosti vzorky zo známych F(t), Dx.
  2. stanovenie vzorky Dx zo známych F(t), n
  3. stanovenie F(t) zo známych Dx a n

1 úloha n - ? Po prvé, n je určené vzorcom opätovného výberu pre neopakujúci sa výber:

Spôsoby, ako určiť rozptyl:

  1. je prevzatý z predchádzajúcich podobných štúdií.
  2. RMS s normálnou distribúciou » 1/6 rozsahu variácie.
  3. ak je rozdelenie zjavne asymetrické, potom RMS » 1/5 rozsahu variácie
  4. Pre podiel sa použije maximálny možný rozptyl p(1-p)=0,25
  5. s n³100, potom s 2 \u003d S 2 - výberový rozptyl

30 £ n 100 GBP, potom s 2 \u003d S 2 (n / n-1), s 2 - všeobecný rozptyl

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Pri výpočte n by sme nemali sledovať veľkú hodnotu t a malé hraničné chyby, pretože to vedie k zvýšeniu n a tým k zvýšeniu nákladov. Nasledujúci zákon je podobný.

§5. Distribúcia údajov z pozorovania vzorky bežnej populácii.

Konečným cieľom každého VN je charakterizovať všeobecnú populáciu.

Hodnoty vypočítané z výsledkov VN sa rozdelia medzi všeobecnú populáciu, pričom sa zohľadní hranica ich hraničnej chyby.

Predpokladajme spotrebu jogurtu za mesiac jednou osobou.

250 – 20 miliónov GBP 250 + 20 GBP; 230 miliónov £ 270

A len 1000 ľudí

230 000 miliónov £ 270 000

48 % - 5 % £ p £ 48 % + 5 %

§6. Malá vzorka.

V praxi štatistického výskumu v moderných podmienkach je čoraz viac potrebné zaoberať sa malými vzorkami.

Malá vzorka - počet jednotiek pozorovacej vzorky z toho nepresahuje 30, n £ 30 /

Rozvinutie teórie malého vzorkovania urobil anglický štatistik Gosset, ktorý v roku 1908 napísal pod pseudonymom študent.

Dokázal, že odhad nezrovnalosti medzi priemerom malej vzorky a všeobecnou vzorkou má osobitný distribučný zákon. Pri výpočte pre malú vzorku sa hodnota s 2 nepočíta. t st pre možné limity chýb použite študentské kritérium. Strany 44-45. je pravdepodobnosť opačnej udalosti.

Počet stupňov voľnosti

obmedzenie malej chyby vzorky

chyba marginálneho podielu

Téma 8: Korelačno-regresná analýza a modelovanie.

§jedna. Koncept korelácie a CRA.

§2. Podmienky používania a obmedzenia KRA.

§3. Párová regresia založená na metóde najmenších štvorcov.

§štyri. Aplikácia párovej lineárnej regresnej rovnice.

§5. Ukazovatele tesnosti spojenia a pevnosti spojenia.

§6. Viacnásobná korelácia.

§jedna. Koncept korelácie a CRA.

Funkčné spojenie y=5x

korelácia

Medzi rôznymi javmi a ich znakom existujú 2 typy súvislostí, funkčné a štatistické.

Takéto spojenie sa nazýva funkčné, keď so zmenou hodnoty jednej z premenných sa druhá mení presne definovaným spôsobom, t. j. hodnota jednej premennej zodpovedá jednej alebo viacerým presne špecifikovaným hodnotám inej premennej. . Funkčné spojenie je možné len vtedy, keď premenná y závisí od premennej x a nezávisí od iných faktorov, ale v reálnom živote je to nemožné.

Štatistický vzťah existuje, keď pri zmene hodnoty jednej z premenných môže druhá nadobudnúť akékoľvek hodnoty v určitých medziach, ale jej štatistické charakteristiky sa menia podľa určitého zákona.

Najdôležitejším konkrétnym prípadom štatistického vzťahu je korelačný vzťah. Pri korelácii zodpovedajú rôzne hodnoty jednej premennej rôznym priemerným hodnotám inej premennej, t.j. so zmenou hodnoty atribútu x sa prirodzeným spôsobom mení priemerná hodnota atribútu y.

Slovo korelácia zaviedol anglický biológ a štatistik Francis Gal (korelácia)

Korelácia môže vzniknúť rôznymi spôsobmi:

  • kauzálna závislosť variácie výsledného znaku od variácie faktorového znaku.
  • Korelácia môže nastať medzi 2 účinkami rovnakej príčiny (požiare, počet hasičov, veľkosť požiaru)
  • Vzťah znakov, z ktorých každý je príčinou aj následkom súčasne (produktivita práce a plat)

V štatistike je obvyklé rozlišovať medzi nasledujúcimi typmi závislosti:

  1. párová korelácia - vzťah medzi 2 znakmi výslednice a faktoriálu, alebo medzi dvoma faktoriálmi.
  2. parciálna korelácia - vzťah medzi efektívnym a jedným faktorom faktora s pevnou hodnotou atribútu iného faktora.
  3. viacnásobná korelácia - závislosť výsledného znaku od dvoch alebo viacerých faktorových znakov zahrnutých do štúdie.

Úlohou korelačnej analýzy je kvantifikovať blízkosť vzťahu medzi znakmi. Koncom 19. storočia Galton a Pearson skúmali vzťah medzi výškou otcov a detí.

Regresia skúma formu vzťahu. Úlohou regresnej analýzy je určiť analytické vyjadrenie vzťahu.

Korelačno-regresná analýza ako všeobecný pojem zahŕňa zmenu tesnosti spojenia a stanovenie analytického vyjadrenia spojenia.

§2. Podmienky používania a obmedzenia KRA.

  1. prítomnosť hromadných údajov, pretože korelácia je štatistická
  2. vyžaduje sa kvalitatívna homogenita populácie.
  3. podriadenie rozdelenia populácie podľa výsledných a faktorových charakteristík zákonu normálneho rozdelenia, s ktorým súvisí použitie metódy najmenších štvorcov.

§3. Párová regresia založená na metóde najmenších štvorcov.

Regresná analýza spočíva v určení analytického vyjadrenia vzťahu. Forma rozlišuje lineárnu regresiu, ktorá je vyjadrená rovnicou priamky a nelineárnu regresiu resp.

Podľa smeru komunikácie sa rozlišujú v priamke, t.j. Keď sa x zvyšuje, zvyšuje sa y.

obrátene

Reverzne t.j. ako x rastie, y klesá.

  1. grafická metóda - vynesením empirických údajov do korelačného poľa, ale presnejší odhad sa robí metódou najmenších štvorcov.

X - skutočný znak

U - znak efektívnosti

Rozdiel medzi skutočnou hodnotou a hodnotou vypočítanou na základe rovnice druhej mocniny by mal smerovať k minimu.

Pri LSM min je súčet štvorcových odchýlok empirických hodnôt y od teoretických hodnôt získaných podľa zvolenej regresnej rovnice.

Pre lineárny vzťah

Þ a,b

pre parabolu

Pre hyperbolu

do rovnice sa zapíšu parametre a,b,c, potom výslednú rovnicu dosadíme empirickou hodnotou x i a nájdite teoretickú hodnotu y i . Potom porovnávame y i teoretické a y i empirický. Súčet druhých mocnín rozdielu medzi nimi by mal byť minimálny. Vyberáme typ závislosti, v ktorej sa táto závislosť vykonáva.

V rovnici párovej lineárnej regresie:

b je koeficient párovej lineárnej regresie, meria pevnosť väzby, t.j. charakterizuje priemernú odchýlku populácie y od jej priemernej hodnoty na akceptovanú jednotku merania.

b\u003d 20, keď sa x zmení o 1 znamienko, y sa odchyľuje od svojej priemernej hodnoty v priemere o 20 v populácii.

Kladné znamienko pri regresnom koeficiente označuje priamy vzťah medzi znakmi, znak „-“ označuje spätnú väzbu medzi znakmi.

§štyri. Aplikácia párovej lineárnej regresnej rovnice.

Hlavnou aplikáciou je prognózovanie podľa regresnej rovnice. Prognózovanie je limitované podmienkami stability iných faktorov a podmienok procesu. Ak sa v ňom prudko zmení prostredie prebiehajúceho procesu, tak táto regresná rovnica neprebehne.

Bodová predpoveď sa získa dosadením očakávanej hodnoty faktora do regresnej rovnice. Pravdepodobnosť presnej implementácie takejto prognózy je extrémne malá.

Ak je bodová predpoveď sprevádzaná hodnotou priemernej chyby predpovede, potom sa takáto predpoveď nazýva intervalová predpoveď.

Priemerná chyba prognózy sa skladá z dvoch typov chýb:

  1. chyby typu 1 - chyba regresnej priamky
  2. chyba 2. druhu - chyba spojená s chybou variácie.

Priemerná chyba predpovede.

Chyba v polohe regresnej priamky v bežnej populácii

n - veľkosť vzorky

x k - chybná hodnota faktora

RMS výsledného znaku z regresnej priamky vo všeobecnej populácii

Korelačná analýza zahŕňa posúdenie tesnosti vzťahu. Indikátory:

  1. koeficient lineárnej korelácie - charakterizuje tesnosť a smer vzťahu medzi dvoma znakmi v prípade lineárneho vzťahu medzi nimi

pri =-1 je spojenie funkčne inverzné, =1 je spojenie funkčné priame, pri =0 nie je spojenie.

Používa sa len pre lineárne vzťahy, používa sa na hodnotenie vzťahov medzi kvantitatívnymi charakteristikami. Vypočítané len na jednotlivé hodnoty.

Korelačný pomer:

Empirický: oba typy rozptylu sa počítajú podľa výsledného atribútu.

teoreticky:

Disperzia hodnôt efektívnej funkcie vypočítaná regresnou rovnicou

Rozptyl empirickej hodnoty výsledného znaku

  • vysoký stupeň presnosti
  • vhodný na posúdenie blízkosti vzťahu medzi popisným a kvantitatívnym znakom, ale kvantitatívny by mal byť účinný
  • vhodné pre všetky typy pripojení

Spearmanov korelačný koeficient

hodnosti - poradové čísla jednotiek obyvateľstva v zoradenej sérii. Je potrebné zoradiť obe funkcie v rovnakom poradí od najmenšieho po najväčší alebo naopak. Ak sú poradia populačných jednotiek označené p x a p y, potom korelačný koeficient radov bude mať nasledujúcu podobu:

Výhody koeficientu korelačného radu:

  1. Hodnotiť môžete aj podľa popisných znakov, ktoré sa nedajú vyjadriť číselne, preto je výpočet Spearmanovho koeficientu možný pre tieto dvojice znakov: číslo - číslo; popisný – kvantitatívny; Opisný – opisný. (vzdelanie je popisný atribút)
  2. ukazuje smer spojenia

Nevýhody Spearmanovho koeficientu.

  1. identické rozdiely v poradí môžu zodpovedať úplne odlišným rozdielom v hodnote vlastnosti (v prípade kvantitatívnych vlastností). Príklad: Výroba elektriny v krajine za rok

USA 2400 kWh 1

RF 800 kWh 2

Kanada 600 kWh 3

Ak sa medzi Spearmanovými hodnotami vyskytuje niekoľko rovnakých hodnôt, vytvoria sa súvisiace hodnosti, t.j. rovnaké stredné čísla

V tomto prípade sa Spearmanov koeficient vypočíta takto:

j- počet odkazov v poradí pre prvok x

Aj- počet rovnakých poradí v j odkazoch x

k-čísla väziva v poradí podľa znaku y

Bk- počet rovnakých radov v ktoré kopa

  1. 4. Kendallov koeficient poradovej korelácie

Maximálna výška hodnosti

S je skutočný súčet poradí

Poskytuje presnejší odhad ako Spearmanov koeficient.

Pre výpočet sú všetky jednotky zoradené podľa atribútu x podľa atribútu pri pre každú hodnosť sa vypočíta počet nasledujúcich hodností presahujúcich daný súčet, označený P a počet nasledujúcich hodností pod týmto označením Q.

P+Q= 1/2 n(n-1)

  1. Fechnerov koeficient poradovej korelácie.

Fechnerov koeficient - miera tesnosti spojenia vo forme pomeru rozdielu v počte párov zhodných a nezhodných znakov k súčtu týchto čísel.

  1. výpočet priemerov pre x a y
  2. jednotlivé hodnoty x i y i sa porovnávajú s priemernými hodnotami s povinným označením znamienka „+“ alebo „-“. Ak sa znamienka zhodujú v x a y, potom ich odkazujeme na číslo „C“, ak nie, potom na „H“.
  3. spočítajte počet zhodných a nezhodných párov.

Úloha merania vzťahu stojí pred štatistikom vo vzťahu k deskriptívnym znakom, čo je dôležitý špeciálny prípad takejto úlohy, meranie vzťahu medzi 2 alternatívnymi znakmi, z ktorých jeden je príčinou druhého následku.

Tesnosť vzťahu medzi 2 alternatívnymi vlastnosťami možno merať pomocou 2 koeficientov:

  1. asociačný koeficient
  2. kontingenčný faktor

Koeficient podmienenosti má nevýhodu: keď sa jedna z dvoch heterogénnych kombinácií Av alebo Ba rovná nule, koeficient sa zmení na jeden. Veľmi liberálne posudzuje tesnosť spojenia – preceňuje ho.

Pearsonov pomer

Ak neexistujú dve, ale viac možných hodnôt každej zo vzájomne súvisiacich vlastností, vypočítajú sa tieto koeficienty:

  1. Pearsonov pomer
  2. Chuprov koeficient pre popisný znak

Pearsonov koeficient sa vypočíta zo štvorcových matíc

Pod normálom

do 1 a do 2 - číslo skupiny podľa znakov 1 a 2, resp. Nevýhodou Pearsonovho koeficientu je, že ani pri zvýšení počtu skupín nedosahuje 1.

Čuprov koeficient (1874–1926)

Chuprov koeficient dôslednejšie odhaduje tesnosť spojenia.

§6. Viacnásobná korelácia.

Štúdium vzťahu medzi výslednicou a dvoma alebo viacerými faktorovými charakteristikami sa nazýva viacnásobná regresia. Pri štúdiu závislostí metódami viacnásobnej regresie sú stanovené 2 úlohy.

  1. stanovenie analytického vyjadrenia vzťahu medzi efektívnym znakom y a skutočnými znakmi x 1 , x 2 , x 3 , ... x k, t.j. nájdite funkciu y \u003d f (x 1, x 2, ... x k)
  2. Hodnotenie tesnosti vzťahu medzi efektívnym a každým z faktorových znakov.

Korelačno-regresný model (CRM) je regresná rovnica, ktorá zahŕňa hlavné faktory, ktoré ovplyvňujú variáciu výsledného atribútu.

Vytvorenie viacnásobného regresného modelu zahŕňa nasledujúce kroky:

  1. výber formy komunikácie
  2. výber faktorových vlastností
  3. Zabezpečenie dostatočnej veľkosti populácie na poskytnutie správnych odhadov.

I. celá množina vzťahov medzi premennými, s ktorými sa v praxi stretávame, je celkom úplne opísaná funkciami 5 typov:

  1. lineárny:
  2. moc:
  3. orientačné:
  4. parabola:
  5. hyperbola:

aj keď je v praxi CRA prítomných všetkých 5 funkcií, najčastejšie sa používa lineárna závislosť, ako najjednoduchšia a najľahšie interpretovateľná rovnica lineárnej závislosti: , k - súbor faktorov zahrnutých v rovnici, bj

0 - pretože >0,7 preto im venujeme osobitnú pozornosť

ECO. Stupnica tesnosti komunikácie:

Ak je spojenie 0 - 0,3 - slabé spojenie

0,3 - 0,5 - znateľné

0,3 - 0,5 - zavrieť

0,7 - 0,9 - vysoká

viac ako 0,9 - veľmi vysoká

potom porovnáme dve funkcie (príjem a pohlavie)<0,7, то включаем в уравнение множественной регрессии.

Výber faktorov, ktoré sa majú zahrnúť do rovnice viacnásobnej regresie:

  1. medzi účinnými a skutočnými znakmi musí existovať príčinná súvislosť.
  2. účinné a skutočné znaky musia byť vo vzájomnom úzkom vzťahu, inak vzniká jav multikolinearita (>06) , t.j. faktory faktorov zahrnuté v rovnici ovplyvňujú nielen výsledok, ale navzájom, čo vedie k nesprávnej interpretácii číselných údajov.

Metódy výberu faktorov, ktoré sa majú zahrnúť do rovnice viacnásobnej regresie:

1. expertná metóda – založené na intuitívnej logickej analýze vykonanej vysoko kvalifikovanými odborníkmi.

2. použitie matíc párových korelačných koeficientov sa vykonáva paralelne s prvou metódou, matica je symetrická vzhľadom na jednotkovú uhlopriečku.

3. kroková regresná analýza - postupné zahrnutie faktorových vlastností do regresnej rovnice a testovanie významnosti sa vykonáva na základe hodnôt dvoch ukazovateľov v každom kroku. Korelačný, regresný ukazovateľ.

Korelačné skóre: Vypočítajte zmenu v teoretickej korelácii pomeru alebo zmenu priemerného reziduálneho rozptylu. Regresný ukazovateľ je zmena podmienene čistého regresného koeficientu.

Celkom

31

32

22

85