Mga katangian ng istatistika at pananaliksik. Graphical na presentasyon ng istatistikal na impormasyon

1. Ang konsepto ng estadistika

Ang mga istatistika ay isa sa mga pinakalumang sangay ng kaalaman na lumitaw batay sa pang-ekonomiyang accounting. Ang paglitaw nito ay nauugnay sa mga pangangailangan ng lipunan sa iba't ibang uri ng impormasyon.

Ito ay pinaniniwalaan na ang terminong istatistika ay nagmula sa mga salitang Latin na stato (estado) at status (posisyon, estado).

Sa isang malawak na kahulugan, ang mga istatistika ay nauunawaan bilang isang agham na nag-aaral ng mass phenomena at ang kanilang mga regularidad mula sa isang quantitative point of view.

Ang pangkalahatang teorya ng istatistika ay isang metodolohikal na agham, ang agham ng isang pamamaraan na naaangkop upang matukoy ang mga pattern sa anumang lugar kung saan ang mga konklusyon ay batay sa mass observation, kung saan mayroong pagkakaiba-iba ng isang sign sa mga indibidwal na elemento ng isang populasyon, kung saan ang mga pangkalahatang pattern maaari lamang ipakita ang kanilang mga sarili sa pamamagitan ng magkaparehong pagkansela ng randomness sa mga indibidwal na yunit. .

2. Mga istatistika bilang isang agham

2.1 Mga paraan ng pagbuo ng mga istatistika

Ang pag-unlad ng mga istatistika bilang isang agham ay napunta sa dalawang direksyon:

Ang unang direksyon ay nagmula sa Germany at kilala bilang state studies o ang descriptive school. Itinuring ng mga kinatawan ng paaralang ito ang kanilang pangunahing gawain na ang paglalarawan ng mga tanawin ng estado nang hindi sinusuri ang mga pattern at relasyon sa pagitan nila. Ang nagtatag ng descriptive school ay ang German scientist na si Hermann Konring.

Ang pangalawang direksyon sa pag-unlad ng mga istatistika ay nagmula sa England, at ito ay kilala bilang political aritmetika. Isinasaalang-alang ng mga kinatawan ng paaralang ito ang kanilang pangunahing gawain upang ihayag, batay sa isang malaking bilang ng mga obserbasyon, iba't ibang mga regularidad at ugnayan ng mga pinag-aralan na phenomena. Ang nagtatag ng paaralan ay si William Petty.

2.2 Ang paksa ng mga istatistika at mga pangunahing konsepto

Ang Belgian mathematician na si Adolphe Ketie ay nagbubuod ng teoretikal na impormasyon mula sa mga pag-aaral ng estado at ang praktikal na gawain ng mga kinatawan ng paaralan ng political arithmetic. Nagbigay din siya kahulugan ng paksa ng istatistika - ito ay mga mass phenomena na nauugnay sa buhay ng lipunan at tao. Nakita rin niya sa mga istatistika ang isang instrumento ng social cognition.

Mga natatanging tampok ng mass phenomena:

1. Ang bawat elemento ng set ay may parehong indibidwal o natatanging mga tampok, pati na rin ang mga karaniwan o katulad.

2. Ang mga katangian ng isa sa mga elemento ng isang mass phenomenon ay hindi maaaring makuha sa batayan ng mga katangian ng iba pang mga elemento.

Depinisyon: Ang mga mass phenomena na pinag-aralan ng mga istatistika sa anyo ng isang set ng magkakatulad na kalidad na mga yunit na may iba't ibang mga indibidwal na katangian ay tinatawag na statistical aggregates. Batay dito, masasabi natin na ang paksa ng mga istatistika ay iba't ibang mga pinagsama-samang istatistika, ang pag-aaral kung saan nauugnay sa isang quantitative na katangian at ang pagkakakilanlan ng kanilang mga likas na pattern. Ang kabuuang estadistika ay isa sa mga pangunahing konsepto ng agham istatistika. Ito ay nauugnay din sa mga konsepto tulad ng: isang yunit ng populasyon. Kahulugan: Ang mga elemento, ang hanay na bumubuo sa hanay na pinag-aaralan, ay tinatawag na mga yunit. Mga palatandaan ng mga yunit ng populasyon:

Ang bawat yunit ng populasyon ay maaaring mailalarawan sa pamamagitan ng iba't ibang uri ng mga katangian ng husay at dami.

Kung ang isang tiyak na katangian ay may iba't ibang mga halaga para sa ilang mga yunit ng populasyon, kung gayon ito ay tinatawag na pagkakaiba-iba. Kahulugan: Isang pattern na natukoy batay sa mass observation, i.e. ipinahayag sa isang malaking masa ng mga phenomena sa pamamagitan ng pagtagumpayan ang likas na randomness ng indibidwal na elemento nito, ay tinatawag na statistical regularity. Ang pangunahing gawain ng mga istatistika ay ang abstract mula sa random at upang makilala ang tipikal, regular.

May tatlong paraan upang matukoy ang mga pattern:

1. lohikal;

2. empirical;

3. batay sa batas ng malalaking bilang.

2.3 Paraan ng mga istatistika

Pagmamasid ng masa, pagpapangkat at buod ng mga resulta nito, pagkalkula at pagsusuri ng mga pangkalahatang tagapagpahiwatig. Ang lahat ng ito nang magkasama ay nagbibigay ng paraan ng mga istatistika.

3.Istatistikong pagmamasid

3.1 Statistical observation bilang isang yugto ng statistical research. Plano sa pagmamasid sa istatistika

Ang pagmamasid sa istatistika ay ang unang yugto ng istatistikal na pananaliksik.

Depinisyon: Ang obserbasyon ng istatistika ay isang pang-agham na organisadong koleksyon ng mass data sa mga proseso at phenomena na pinag-aaralan, na isinasagawa ayon sa isang pre-designed na programa.

Mga Kinakailangan sa Bulk Data:

Dapat sapat na kumpleto ang data ng istatistika. Ang bawat kababalaghan ay may iba't ibang magkakaugnay na katangian. Ang pagkakumpleto ng data ay nagbibigay ng saklaw ng mga pinaka makabuluhang tampok na kinakailangan upang makakuha ng mga layunin na konklusyon. Kung ang data ng istatistikal na pagmamasid ay tumutukoy sa iba't ibang mga tagal ng panahon, mga teritoryo, kung gayon kinakailangan upang matiyak ang kanilang pagiging maihahambing. Sa ilalim ng paghahambing ng istatistikal na impormasyon ay sinadya ang pagkakapareho ng kanilang mga yunit ng pagsukat, mga pagtatantya ng gastos, mga hangganan ng mga teritoryong pang-administratibo, mga temporal na katangian, atbp. Bago simulan ang pagmamasid sa istatistika, kinakailangan na itatag ang pamamaraan para sa pagpapatupad nito. Upang gawin ito, binuo ang isang detalyadong plano sa pagsubaybay, na naglalaman ng:

1. bahagi ng programa at pamamaraan:

2. bahagi ng organisasyon.

1. Mga isyu sa programa at pamamaraan ng plano sa pagmamasid.

Dapat kasama sa bahaging ito ng plano ang:

a) ang layunin at layunin ng pagmamasid:

b) bagay at mga yunit na susuriin;

c) programa sa pagsubaybay.

Ang programa sa pagmamasid ay isang listahan ng mga tanong na inaasahang masasagot sa panahon ng sarbey. Ang programa ay dapat na makilala sa pamamagitan ng pagkakumpleto ng impormasyon at lawak ng saklaw. Ang mga salita ng mga tanong ay dapat na maikli at malinaw hangga't maaari, ibukod ang kamalian at malabo sa mga sagot, kung kinakailangan, isang pahiwatig ay ibinibigay para sa isang pinag-isang interpretasyon at pag-unawa sa mga tanong. Ang metodolohikal na bahagi ng programa ng obserbasyon ay nagpapahiwatig ng mga tiyak na tool ng istatistikal na pag-aaral, i.e. mga form, na dapat maglaman ng mga sagot sa mga nabuong tanong, pati na rin ang mga tagubilin para sa pagsagot sa mga ito.

2. Mga isyu sa organisasyon ng plano sa pagmamasid.

Para sa matagumpay na organisasyon ng pagmamasid at pagkakumpleto ng saklaw ng populasyon, isang plano ng organisasyon para sa pagmamasid ay binuo.

Nakasaad dito:

a) ang paksa ng pagmamasid:

b) ang oras at lugar ng pag-aaral;

c) organisasyon ng pagkolekta ng data at mga teknolohiya para sa kanilang pagproseso.

3.2 Mga anyo at uri ng istatistikal na pagmamasid

Mga anyo, uri at paraan ng pagmamasid sa istatistika.

Mga pormang pang-organisasyon ng pagmamasid sa istatistika

Mga uri ng istatistikal na pagmamasid

Mga pamamaraan ng istatistikal na pagmamasid

sa oras ng pagpaparehistro ng mga katotohanan

sa pamamagitan ng saklaw ng mga yunit ng populasyon

1. Pag-uulat ng istatistika.

2. Espesyal na organisadong pagmamasid.

3. Magrehistro ng pagmamasid.

1. Kasalukuyan o tuloy-tuloy.

2. Hindi natuloy:

a) pana-panahon;

b) isang beses.

1. Solid.

2. Hindi natuloy:

a) pumipili;

b) ang pangunahing hanay;

c) monograpiko.

1. Agad-agad.

2. Dokumentaryo.

a) pagpapasa;

b) pagpaparehistro sa sarili;

c) koresponden;

d) talatanungan;

e) katulong.

Sa domestic statistics, tatlong organisasyonal na anyo (uri) ng statistical observation ang ginagamit:

1. Pag-uulat- ito ang pangunahing anyo ng pagmamasid sa istatistika, sa tulong kung saan natatanggap ng mga awtoridad sa istatistika ang kinakailangang data mula sa mga negosyo, institusyon at organisasyon sa loob ng isang tiyak na tagal ng panahon sa anyo ng mga ligal na itinatag na mga dokumento sa pag-uulat, na nilagdaan ng mga taong responsable para sa kanilang probisyon at ang pagiging maaasahan ng impormasyong nakolekta.

Ibinahagi: telepono, teletype, mail.

2. Espesyal na organisadong pagsubaybay ay isinasagawa upang makakuha ng impormasyong wala sa pag-uulat, o upang i-verify ang data nito. Ang mga praktikal na istatistika ay nagsasagawa ng mga census ng populasyon, mga mapagkukunang materyal, mga plantasyong pangmatagalan, hindi naka-install na kagamitan, mga lugar ng pagtatayo ng mga kagamitan na kasalukuyang isinasagawa, atbp. at kita ng pamilya.

3. Magrehistro ng pangangasiwa ay isang anyo ng tuluy-tuloy na istatistikal na pagmamasid ng mga pangmatagalang proseso na may nakapirming simula, yugto ng pag-unlad at isang nakapirming wakas. Ito ay batay sa pagpapanatili ng isang rehistro ng istatistika. Ang rehistro ay isang sistema na patuloy na sinusubaybayan ang estado ng yunit ng pagmamasid at sinusuri ang lakas ng epekto ng iba't ibang mga kadahilanan sa pinag-aralan na mga tagapagpahiwatig.

Sa istatistikal na kasanayan, ang isang pagkakaiba ay ginawa sa pagitan ng mga rehistro ng populasyon at mga rehistro ng negosyo.

Mga uri ng istatistikal na pagmamasid sa oras ng pagrehistro ng mga katotohanan

Ang kasalukuyang pagmamasid ay isinasagawa nang sistematiko, habang nangyayari ang mga phenomena. Sa pana-panahong pagmamasid, ang pagpaparehistro ng mga phenomena sa ilalim ng pag-aaral ay isinasagawa sa tiyak, karaniwang magkapareho, mga agwat ng oras. Ang isang beses na obserbasyon ay isinasagawa nang isang beses upang malutas ang isang problema o paulit-ulit na episodically pagkatapos ng ilang mga tagal ng panahon, kung kinakailangan.

Mga uri ng istatistikal na pagmamasid sa pamamagitan ng saklaw ng mga yunit ng populasyon

Sa patuloy na pagmamasid, ang lahat ng mga yunit ng populasyon ay naitala nang walang pagbubukod. Sa piling obserbasyon, ang isang random na napiling bahagi ng mga yunit ng populasyon ay sinusuri upang makilala ang buong populasyon.

Sa hindi perpektong patuloy na pagmamasid (ng pangunahing hanay), ang pangunahing bahagi ng populasyon ay sinusuri at ang isang tiyak na bahagi ay sadyang hindi kasama, tungkol sa kung saan ito ay kilala na hindi ito gumaganap ng malaking papel sa paglalarawan ng buong populasyon. Ang monograpikong pagmamasid ay binubuo sa isang detalyadong paglalarawan ng isang maliit na bilang o indibidwal na tipikal na mga yunit ng populasyon.

Mga paraan ng pagrerehistro ng mga katotohanan o paraan ng pagkuha ng pangunahing materyal

Ang direktang pagmamasid ay isinasagawa sa pamamagitan ng pagrehistro ng mga yunit na pinag-aaralan at ang kanilang mga katangian ng mga espesyal na itinalagang tao batay sa direktang pagsusuri, pagbibilang, pagtimbang, pagbabasa ng instrumento, atbp. Ang obserbasyon ng dokumentaryo ay batay sa paggamit ng iba't ibang pangunahing dokumento ng accounting ng mga negosyo, institusyon, at organisasyon bilang pinagmumulan ng istatistikal na impormasyon. Sa panahon ng survey, ang mga istatistikal na materyales ay nakukuha sa pamamagitan ng pagrehistro ng mga sagot na ibinigay ng mga taong nakapanayam. Ang paraan ng pagpapasa ay binubuo sa katotohanang pinupunan ng mga espesyal na sinanay na registrar ang mga formula sa pamamagitan ng isang survey, habang sabay na kinokontrol ang kalayaan ng impormasyong natanggap. Sa panahon ng self-registration o self-calculation, ang mga empleyado ng mga statistical body ay namamahagi ng mga form ng questionnaire sa mga kinakapanayam, nagtuturo sa kanila, at pagkatapos ay kinokolekta ang mga nakumpletong form, na kinokontrol ang pagkakumpleto at kawastuhan ng impormasyong natanggap. Ang isang survey ng palatanungan ay binubuo sa katotohanan na ang nabuong palatanungan ay ipinadala sa isang lupon ng mga tao at, pagkatapos punan, ay ibinalik sa mga katawan na nagsasagawa ng mga obserbasyon. Ang Correspondent ay binubuo sa organisasyon ng mga awtoridad sa istatistika ng isang espesyal na network ng mga koresponden mula sa mga taong naninirahan sa larangan na nagsasagawa ng mga obserbasyon alinsunod sa binuo na form at mga tagubilin at nag-uulat ng impormasyon sa mga awtoridad sa istatistika. Ang Unsolicited ay nagbibigay para sa pagsusumite ng impormasyon sa mga katawan na nagsasagawa ng pagsubaybay sa hindi hinihinging batayan.

4. Buod at pagpapangkat ng mga istatistika

4.1 Mga gawain at uri ng buod ng istatistika

Kahulugan: Ang buod ay isang hanay ng mga sunud-sunod na operasyon upang i-generalize ang mga partikular na iisang katotohanan na bumubuo ng isang set upang matukoy ang mga tipikal na tampok at pattern na likas sa phenomenon na pinag-aaralan sa kabuuan.

Kaya, kung sa panahon ng statistical observation data ay nakolekta tungkol sa bawat yunit ng isang bagay, kung gayon ang resulta ng buod ay detalyadong data na sumasalamin sa kabuuan nito sa kabuuan.

Ang isang buod ng istatistika ay dapat na batay sa isang paunang teoretikal na pagsusuri ng mga phenomena at proseso.

Ayon sa lalim ng pagproseso ng materyal ang mga buod ay parehong simple at kumplikado.

Ang isang simpleng buod ay isang operasyon upang kalkulahin ang mga kabuuan para sa isang hanay ng mga yunit ng pagmamasid.

Ang isang kumplikadong buod ay isang hanay ng mga operasyon na kinabibilangan ng pagpapangkat ng mga yunit ng pagmamasid, pagbibilang ng mga kabuuan para sa bawat pangkat at para sa buong bagay, at paglalahad ng pagpapangkat at mga resulta ng buod sa anyo ng mga istatistikal na talahanayan.

Ang buod ay nauuna sa pagbuo ng programa nito, na binubuo ng mga sumusunod na hakbang:

Ang pagpili ng mga tampok ng pagpapangkat;

Pagpapasiya ng pagkakasunud-sunod ng pagbuo ng mga grupo;

Pagbuo ng isang sistema ng mga istatistikal na tagapagpahiwatig upang makilala ang mga grupo at ang bagay sa kabuuan;

Pagbuo ng mga layout ng mga istatistikal na talahanayan kung saan dapat ipakita ang mga resulta ng buod.

Ayon sa pagproseso ng materyal ang buod ay desentralisado at sentralisado.

Sa isang desentralisadong buod (ginagamit ito, bilang isang patakaran, sa pagproseso ng pag-uulat ng istatistika), ang pagbuo ng materyal ay isinasagawa sa sunud-sunod na mga yugto. Kaya, ang mga ulat ng mga negosyo ay buod ng mga istatistikal na awtoridad ng mga nasasakupang entidad ng Russian Federation, at ang mga resulta para sa rehiyon ay ipinadala na sa State Statistics Committee ng Russia, at doon ang mga tagapagpahiwatig para sa pambansang ekonomiya sa kabuuan ay determinado. Sa isang sentralisadong buod, lahat ng pangunahing materyal ay pumapasok sa isang organisasyon, kung saan ito ay pinoproseso mula simula hanggang katapusan. Ang sentralisadong buod ay karaniwang ginagamit upang iproseso ang mga materyales mula sa isang beses na istatistikal na survey. Ayon sa pamamaraan ng pagpapatupad, ang buod ng istatistika ay nahahati sa mekanisado at manu-mano.

Upang magsagawa ng isang buod, ang isang plano ay iginuhit na nagtatakda ng mga isyu sa organisasyon: kung kanino at kailan isasagawa ang lahat ng mga operasyon, ang pamamaraan para sa pagsasagawa nito, at ang komposisyon ng impormasyon na ilalathala sa periodical press.

4.2 Pamamaraan ng pagpapangkat sa mga istatistika

Ang pagpapangkat ng istatistika ay ang paghahati ng buong hanay ng mga materyales sa mga grupo at subgroup ayon sa mga mahahalagang katangian para sa isang komprehensibong pag-aaral ng mga phenomena at proseso ng buhay panlipunan.

Ang palatandaang pinagbabatayan ay tinatawag na pagpapangkat.

Upang bumuo ng mga pangkat sa mga istatistika, dalawang uri ng mga tampok ang pangunahing ginagamit:

1. quantitative (numerical);

2. husay (attributive).

Ang pagpapangkat sa parehong batayan ay tinatawag simple lang, at ang mga pagpapangkat ayon sa dalawa o higit pang mga tampok na kinuha sa kumbinasyon sa isa't isa ay tinatawag kumbinasyonal(mahirap).

Pagkatapos mapili ang attribute ng pagpapangkat, pipiliin ang bilang ng mga pangkat. Kung ang pagpapangkat ay batay sa isang katangian ng husay, kung gayon ang tanong ng bilang ng mga pangkat ay awtomatikong malulutas - magkakaroon ng mas marami sa kanila bilang mayroong mga estado ng husay ng pinag-aralan na populasyon (mga yunit nito).

Kapag nagpapangkat ayon sa dami ng mga katangian, ang tanong ay lumitaw sa pagtukoy ng mga pagitan ng pagpapangkat. Ang halaga ng pagitan ay ang pagkakaiba sa pagitan ng maximum at minimum na halaga ng katangian sa bawat pangkat. Depende sa likas na katangian ng mga distribusyon ng mga yunit ng populasyon para sa isang partikular na katangian, ang mga pagitan ay maaaring magkakaiba at hindi pantay sa laki. Kung ang pamamahagi ng isang katangian sa loob ng mga hangganan ng pagkakaiba-iba nito ay sapat na pare-pareho, kung gayon ang hanay ng mga pagbabagu-bago ng katangian ay nahahati sa pantay na mga agwat, ang haba nito ay tinutukoy ng formula:

saan XSi Mak at Xmin ayon sa pagkakabanggit, ang maximum at minimum na halaga ng tampok sa populasyon na ito,

n ay ang bilang ng mga nabuong grupo.

Maaaring itakda ang bilang ng mga grupo batay sa mga nakaraang pag-aaral. Kung sakaling ikaw mismo ang magpasya sa bilang ng mga pangkat, maaari mong gamitin ang formula ng Sturgess upang matukoy ang pinakamainam na bilang ng mga grupo:

n - bilang ng mga pangkat

Ang N ay ang bilang ng mga yunit ng populasyon

May mga saradong pagitan, kung saan ibinibigay ang itaas at ibabang mga hangganan, at mga bukas na pagitan, kung saan mayroon lamang isang hangganan: itaas o ibaba.

Ang mga pangkat ng istatistika ayon sa mga gawaing nalutas sa kanilang tulong ay nahahati sa:

Typological grouping- ito ang paghahati ng pinag-aralan na qualitatively heterogenous na populasyon sa mga klase, socio-economic na uri, homogenous na grupo ng mga yunit alinsunod sa mga alituntunin ng scientific grouping.

Structural tinatawag na isang pagpapangkat kung saan ang isang homogenous na populasyon ay nahahati sa mga pangkat na nagpapakilala sa istraktura nito ayon sa ilang iba't ibang katangian.

analitikal tinatawag na pagpapangkat na nagpapakita ng kaugnayan sa pagitan ng mga pinag-aralan na phenomena at ng mga katangian nito.

4.3 Serye ng pamamahagi sa mga istatistika

Ang serye ng pamamahagi ng istatistika ay isang nakaayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa isang tiyak na magkakaibang katangian.

Depende sa sign na pinagbabatayan ng pagbuo ng isang serye ng pamamahagi, mayroong:

1. Attributive - serye ng pamamahagi na binuo sa mga batayan ng husay.

2. Variational - serye ng pamamahagi na binuo ayon sa dami. Ang anumang variation sign ay binubuo ng 2 elemento: variant at frequency.

Ang mga variant ay mga indibidwal na halaga ng isang tampok na kinukuha nito sa isang serye ng variation.

Ang mga frequency ay ang mga bilang ng mga indibidwal na variant o bawat pangkat ng serye ng variation.

Ang mga frequency ay tinatawag na mga frequency, na ipinahayag sa mga fraction ng isang yunit o bilang isang porsyento ng kabuuan.

Depende sa likas na katangian ng pagkakaiba-iba ng katangian, mayroong:

1. Ang isang discrete variational series ay nagpapakilala sa distribusyon ng mga unit ng populasyon ayon sa isang discrete attribute (ang halaga ng isang quantitative attribute ay tumatagal lamang ng mga integer value).

2. Interval variation series - ito ay angkop para sa tuluy-tuloy na variation ng isang katangian, at gayundin kung ang discrete variation ay nagpapakita mismo sa isang malawak na hanay, i.e. medyo malaki ang bilang ng mga opsyon para sa isang discrete feature.

Ito ay pinaka-maginhawa upang pag-aralan ang serye ng pamamahagi gamit ang kanilang Ugaric na imahe.

Ginagamit ang polygon kapag nagpapakita ng discrete variational series.

Kinukuha ang histogram upang ipakita ang serye ng pagkakaiba-iba ng pagitan.

5. Mga tagapagpahiwatig ng istatistika

Ang statistical indicator ay isang quantitative na katangian ng socio-economic phenomena at mga proseso sa mga tuntunin ng qualitative certainty. Ang kwalitatibong katiyakan ng tagapagpahiwatig ay nakasalalay sa katotohanan na ito ay direktang nauugnay sa panloob na nilalaman ng kababalaghan o prosesong pinag-aaralan, ang kakanyahan nito.

Bilang isang patakaran, ang mga proseso at phenomena na pinag-aralan ng mga istatistika ay medyo kumplikado, at ang kanilang kakanyahan ay hindi maipapakita sa pamamagitan ng isang solong tagapagpahiwatig. Sa ganitong mga kaso, ginagamit ang isang sistema ng mga istatistikal na tagapagpahiwatig (isang hanay ng mga magkakaugnay na tagapagpahiwatig na may isang solong antas o multi-level na istraktura at naglalayong lutasin ang isang tiyak na problema sa istatistika).

5.1 Absolute at relative indicators

Mga ganap na istatistika.

Ang mga tagapagpahiwatig ng istatistika sa anyo ng mga ganap na halaga ay nagpapakilala sa ganap na sukat ng mga proseso at phenomena na pinag-aralan ng mga istatistika: ang kanilang masa, lugar, dami, haba; sumasalamin sa kanilang mga temporal na katangian, at maaari ring kumatawan sa dami ng populasyon, i.e. ang bilang ng mga bumubuong yunit nito.

Ang mga indibidwal na ganap na tagapagpahiwatig, bilang isang panuntunan, ay nakuha nang direkta sa proseso ng istatistikal na pagmamasid bilang isang resulta ng pagsukat, pagtimbang, pagbibilang at pagsusuri ng isang quantitative na katangian ng interes.

Ang pinagsama-samang mga tagapagpahiwatig ng volumetric ay nakuha bilang isang resulta ng isang buod at pagpapangkat ng mga indibidwal na halaga (nailalarawan nila ang dami ng isang tampok o ang dami ng isang populasyon kapwa sa kabuuan para sa bagay na pinag-aaralan, at para sa anumang bahagi nito).

Ang mga ganap na istatistikal na tagapagpahiwatig ay ipinahayag sa mga sumusunod na yunit ng pagsukat:

Natural (tonelada, kilo, kilometro, piraso);

Gastos (monetary assessment ng socio-economic phenomena at mga proseso);

Paggawa (man-days, man-hours).

Mga kamag-anak na istatistika.

Ang kamag-anak na tagapagpahiwatig ay ang resulta ng paghahati ng isang ganap na tagapagpahiwatig sa isa pa at nagpapahayag ng ratio sa pagitan ng mga quantitative na katangian ng mga proseso at phenomena ng sosyo-ekonomiko. Sa numerator, ang indicator ay tinatawag na current o compared indicator, sa denominator naman ay tinatawag itong base o base ng paghahambing.

Kung ang batayan ng paghahambing ay kinuha bilang 1, kung gayon ang kamag-anak na tagapagpahiwatig ay ipinahayag sa mga coefficient, kung ang base ay kinuha bilang 100, pagkatapos ito ay ipinahayag bilang isang porsyento (%), kung para sa 1000, ito ay ipinahayag sa ppm (% 0 ), kung ang base ay kinuha bilang 10.000, pagkatapos ito ay ipinahayag sa decimilles .

Ang porsyento, bilang panuntunan, ay ginagamit sa mga kaso kung saan ang inihambing na absolute indicator ay lumampas sa base ng isa nang hindi hihigit sa 2-3 beses. Ang mga interes na higit sa 200-300 ay karaniwang pinapalitan ng maramihang ratio, isang koepisyent.

5.2 Mga Average (mga halaga)

Ang average na halaga, na isang pangkalahatang quantitative na katangian ng isang katangian sa isang istatistikal na populasyon sa ilalim ng mga partikular na kondisyon ng lugar at oras, ay ang pinakakaraniwang anyo ng mga istatistikal na tagapagpahiwatig.

Isaalang-alang ang mga uri ng mga average na kinakalkula para sa mga kaso kung saan ang bawat isa sa mga variant ng variational series ay nangyayari nang isang beses lamang (pagkatapos ang average ay tinatawag na simple, o unweighted) at kapag ang variant o mga agwat ay inuulit (weighted average). Ang bilang ng mga pagpipilian sa pag-uulit - dalas. Kapag pumipili ng isa o ibang uri ng average, dapat magpatuloy ang isa mula sa prinsipyo ng pagiging makabuluhan ng resulta kapag nagbubuod o kapag tumitimbang.

Ang ibig sabihin ng aritmetika.

Ang X ay ang ibig sabihin ng kapangyarihan;

Ang Z ay ang exponent na tumutukoy sa uri ng average;

Xi - mga pagpipilian;

mi – mga frequency o istatistikal na timbang ng mga variant.

Average na harmonic (z=-1).

Nagtuturo

Kailangan mo ng tulong sa pag-aaral ng isang paksa?

Ang aming mga eksperto ay magpapayo o magbibigay ng mga serbisyo sa pagtuturo sa mga paksang kinaiinteresan mo.
Magsumite ng isang application na nagpapahiwatig ng paksa ngayon upang malaman ang tungkol sa posibilidad ng pagkuha ng konsultasyon.

§1. Mga konsepto ng estadistika, regularidad ng istatistika at kabuuan ..... 2

§2. Mga palatandaan ng mga yunit ng istatistikal na populasyon, ang kanilang pag-uuri ...... 2

§isa. Ang konsepto ng statistical observation, ang paghahanda nito ............... 4

§2. Mga uri ng istatistikal na obserbasyon .............................................. ................. .. 5

§3. Mga pagkakamali sa pagmamasid ................................................ ................... ................... 6

§apat. Buod at pagpapangkat .............................................. ............... .................. 6

§5. Mga uri ng istatistikal na pagpapangkat .............................................. ............ 6

§6. Mga talahanayan ng istatistika................................................. ... ............ 7

§7. Mga Statistical Graph ................................................ .................. ............ walo

§isa. Aktwal at Teoretikal na Pamamahagi................................................ 21

§2. Normal na Kurba ng Distribusyon................................................. 21

§3. Pagsubok sa Hypothesis ng Normal Distribution............................. 21

§apat. Pamantayan ng konkordans: Pearson, Romanovsky, Kolmogorov........... 21

§5. Ang praktikal na halaga ng serye ng pamamahagi ng pagmomodelo ..... 22

§isa. Ang konsepto ng selective observation. Mga dahilan ng paggamit nito ...... 23

§3. Mga error sa pag-sample................................................... ............... 24

§apat. Mga Halimbawang Gawain sa Pagmamasid................................................ 25

§5. Pagpapalawak ng sample na data ng pagmamasid sa pangkalahatang populasyon... 26

§6. Maliit na sample ................................................ .............. ................ 26

§isa. Ang konsepto ng ugnayan at CRA .......................................... 27

§2. Mga kundisyon para sa paggamit at mga limitasyon ng KPA ............................... 27

§3. Pinagtambal na regression batay sa paraan ng least squares.. 28

§apat. Paglalapat ng Paired Linear Regression Equation .......... 29

§6. Maramihang Kaugnayan................................................ 32

Paksa 1.: Panimula sa mga istatistika.

mga konsepto ng istatistika, regularidad ng istatistika at populasyon.
mga palatandaan ng mga yunit ng istatistikal na populasyon, ang kanilang pag-uuri.
paksa at paraan ng estadistika.

§1. Mga konsepto ng estadistika, regularidad at kabuuan ng istatistika.

Ang salitang istatistika ay nagmula sa Latin na " katayuan” sa pagsasalin - isang estado, isang estado ng mga gawain.

Ang terminong istatistika ay nagmula sa ikalawang kalahati ng ika-18 siglo. May kaugnayan sa kaalaman ng mga estado, ang pag-aaral ng kanilang mga tampok. Ang simula ng mga istatistika ng pagtuturo sa unibersidad ay nagsimula sa parehong panahon. Depende sa sangay ng istatistikal na pananaliksik, mayroong: mga istatistika ng populasyon, industriya, agrikultura, atbp. - inilapat na mga istatistika.

Ang pangkalahatang teorya ng istatistika ay isang hanay ng mga pamamaraan at pamamaraan para sa pagkolekta, pagproseso, paglalahad at pagsusuri ng numerical data. Ang terminong istatistika ay ginagamit ngayon sa 3 kahulugan:

bilang kasingkahulugan ng salitang "data"
isang sangay ng mga kahulugan na pinagsasama ang mga prinsipyo at pamamaraan ng pagtatrabaho sa numerical data na nagpapakilala sa mass phenomena (ang pag-asa sa buhay para sa mga lalaki ay mas mababa kaysa sa mga kababaihan)
isang sangay ng praktikal na aktibidad na naglalayong magproseso at magsuri ng numerical data.

Ginagawang posible ng mga istatistika na kilalanin at sukatin ang pattern ng pag-unlad ng mga proseso at phenomena ng sosyo-ekonomiko, pati na rin ang ugnayan sa pagitan ng mga ito sa mga tiyak na kondisyon ng lugar at oras.

Ang regularidad ay tumutukoy sa pag-uulit, pagkakasunud-sunod at pagkakasunud-sunod ng mga pagbabago sa mga phenomena.

Statistical regularity - isang regularidad kung saan ang pangangailangan ay inextricably linked sa bawat indibidwal na phenomenon na may pagkakataon at sa maraming phenomena lamang ay nagpapakita ng sarili bilang isang batas. Ang konsepto ng isang statistical regularity ay sinasalungat ng konsepto ng isang dynamic na regularity na nagpapakita ng sarili sa bawat phenomenon. (halimbawa: S circle =pr 2 kaysa sa > r paksa > S circle). Ang object ng statistical research ay isang statistical set - isang set ng mga unit na may mass character, homogeneity, na tinutukoy ng integridad at pagkakaroon ng variation. Ang bawat indibidwal na elemento ay tinatawag na statistical population unit (ESS)

§2. Mga palatandaan ng mga yunit ng istatistikal na populasyon, ang kanilang pag-uuri.

Ang mga ECC ay may ilang mga katangian na tinatawag na mga tampok. Pinag-aaralan ng mga istatistika ang mga phenomena sa pamamagitan ng kanilang mga tampok, mas homogenous ang set, mas karaniwang mga tampok na mayroon ang mga yunit nito at mas mababa ang mga halaga ng mga tampok na ito ay nag-iiba.

Ang tandang naglalarawan ay isang tanda na maaari lamang ipahayag sa salita.

Quantitative sign - isang tanda na maaaring ipahayag sa numero.
Ang isang direktang tanda ay isang pag-aari na direktang likas sa isang katangian na bagay.
Ang isang di-tuwirang tanda ay ang mga katangian hindi ng mismong nailalarawan na bagay, ngunit ng bagay na nauugnay dito o kasama dito.
ang pangunahing katangian ay isang ganap na halaga na maaaring masukat.
pangalawang tampok - ang resulta ng paghahambing ng mga pangunahing tampok, ito ay direktang sinusukat.
natural sign - sinusukat sa mga piraso, kg, tonelada, litro, atbp.
labor sign - sinusukat sa man-days, man-hours.
value attribute - sinusukat sa rubles, $, €, ₤.
sign na walang sukat - pagsukat sa mga bahagi,%
ang isang alternatibong tampok ay isang tampok na kumukuha lamang ng isang halaga sa ilang posibleng mga.
discrete sign - tumatagal lamang ng isang integer na halaga, nang walang isang intermediate.
ang tuluy-tuloy na tampok ay isang tampok na kumukuha ng anumang halaga sa loob ng isang partikular na saklaw.
Ang isang kadahilanan na katangian ay isang katangian na nagbabago ng isa pang katangian.
mabisang katangian - isang katangian na nagbabago sa ilalim ng katangian ng iba
panandaliang tanda - isang palatandaan na sinusukat sa isang tiyak na punto ng oras.
tanda ng pagitan - isang tanda para sa isang tiyak na tagal ng panahon.

Ang parehong tampok ay maaaring maiuri nang sabay-sabay ayon sa iba't ibang mga pag-uuri.

§3. Ang paksa at pamamaraan ng mga istatistika.

Ang paksa ng istatistikal na pananaliksik ay mga pinagsama-samang istatistika - isang hanay ng isang kalidad na iba't ibang bagay.

Tinutukoy ng mga detalye ng paksa ng mga istatistika ang mga detalye ng pamamaraan, kasama nila ang:

pangongolekta ng datos (pagmamasid sa istatistika, publikasyon)
paglalahat ng datos (buod, pagpapangkat)
presentasyon ng datos (mga talahanayan at graph)
pagsusuri at interpretasyon ng numerical data (pagkalkula ng mga average, pagsusuri ng mga variation, KRA, serye ng dynamics, mga indeks)

Paksa 2: Organisasyon ng istatistikal na pagmamasid.

Buod at pagpapangkat ng datos.

§isa. Ang konsepto ng statistical observation, ang paghahanda nito.

§2. Mga uri ng istatistikal na pagmamasid.

§3 Mga pagkakamali sa pagmamasid.

§4 Buod at pagpapangkat

§5 Mga uri ng istatistikal na pagpapangkat.

§6 Mga talahanayan ng istatistika.

§7 Mga istatistikal na graph.

§isa. Ang konsepto ng statistical observation, ang paghahanda nito.

Ang anumang istatistikal na pananaliksik ay nagsisimula sa pagkolekta ng data.

Mga mapagkukunan ng impormasyon:

iba't ibang publikasyon (dyaryo, magasin, atbp.)
ang pangunahing pinagmumulan ng nai-publish na impormasyon sa istatistika ay ang mga publikasyon ng mga katawan ng istatistika ng estado (RF noong 2001, GOSKOMSTAT publishing house).
pagsasagawa ng statistical observation, i.e. pang-agham na organisadong pangongolekta ng datos.

Ang pagmamasid sa istatistika ay isang masa, binalak, organisadong siyentipikong pagmamasid sa kababalaghan ng buhay panlipunan at pang-ekonomiya, na binubuo sa pagrehistro ng mga palatandaan para sa bawat yunit ng pinag-aralan na populasyon.

Proseso ng pagmamasid:

Paghahanda para sa Pagmamasid
Pagsasagawa ng mass data collection
Paghahanda ng data para sa pagproseso
Pagbuo ng mga panukala para sa pagpapabuti ng istatistikal na pagmamasid.

Paghahanda sa pagmamasid:

Pagtukoy sa layunin at bagay ng pagmamasid
Pagpapasiya ng komposisyon ng mga palatandaan na napapailalim sa pagpaparehistro
Pagbuo ng mga dokumento para sa pagkolekta ng data
Ang pagpili ng yunit ng pag-uulat at ang yunit kung saan isasagawa ang pagmamasid.
Kinakailangang tukuyin ang mga pamamaraan at paraan ng pagkuha ng data.

Mga problema sa organisasyon na dapat lutasin:

kinakailangang matukoy ang komposisyon ng mga serbisyong nagsasagawa ng pag-aaral
brief sa mga tauhan
gumuhit ng iskedyul ng trabaho
kopyahin ang mga dokumento para sa pangongolekta ng data

Ang object ng pagmamasid ay socio-economic phenomena at mga proseso.

Ito ay kinakailangan upang malinaw na makilala ang mga palatandaan para sa pagpaparehistro.

Programa ng pagmamasid - isang listahan ng mga palatandaan ng mga palatandaan na napapailalim sa pagpaparehistro sa proseso ng pagmamasid.

Mga kinakailangan sa programa ng pagmamasid:

Ang programa ay dapat maglaman ng mga mahahalagang tampok na direktang nagpapakilala sa kababalaghan na pinag-aaralan; ang mga palatandaan na may pangalawang phenomena o mga palatandaan, na ang mga halaga ay malinaw na hindi maaasahan o ganap na wala, ay hindi dapat isama sa programa.
Ang mga tanong ng programa sa pagmamasid ay dapat na tumpak at hindi malabo, at madaling maunawaan upang maiwasan ang mga kahirapan sa pagkuha ng mga sagot.
Dapat matukoy ang pagkakasunod-sunod ng mga tanong.
Ang programa sa pagsubaybay ay dapat magsama ng mga tanong na may direktang katangian para sa pagsasagawa at paglilinaw ng data na nakolekta.
upang matiyak ang pagkakapareho ng impormasyong natanggap, ang programa ay iginuhit sa anyo ng isang dokumento - tinatawag na isang statistical form.

Ang statistical form ay isang dokumento ng isang sample na naglalaman ng isang programa at ang mga resulta ng mga obserbasyon.

Ang isang pagkakaiba ay ginawa sa pagitan ng isang indibidwal na anyo (mga sagot sa mga tanong sa isang yunit ng pagmamasid) at isinulat (impormasyon sa ilang mga yunit ng istatistikal na populasyon).

Ang form at mga tagubilin para sa pagpuno nito ay mga kasangkapan para sa istatistikal na pagmamasid.

Ang pagpili ng oras ng pagmamasid ay binubuo sa paglutas ng 2 tanong: pagtatatag ng isang kritikal na petsa o pagitan, pagtukoy sa panahon ng pagmamasid.

Kritikal na petsa - isang tiyak na araw ng taon, ang oras ng araw kung saan ang mga palatandaan ay dapat na nakarehistro para sa bawat yunit ng pinag-aralan na populasyon.

Panahon ng pagmamasid - ang oras kung kailan pinupunan ang mga istatistikal na form, i.e. oras na kinakailangan upang mangolekta ng data.

Dapat itong isaalang-alang na ang distansya ng panahon ng pagmamasid mula sa kritikal na petsa o pagitan ay maaaring humantong sa pagbaba sa pagiging maaasahan ng impormasyong nakuha.

§2. Mga uri ng istatistikal na pagmamasid.

Sa domestic statistics, tatlong anyo ng statistical observation ang ginagamit.

istatistikal na pag-uulat ng mga negosyo, organisasyon, institusyon.
espesyal na organisadong istatistikal na pagmamasid (census, atbp.)
rehistro - isang anyo ng patuloy na pagsubaybay sa istatistika ng mga pangmatagalang proseso

Ang pagmamasid sa istatistika ay inuri:

Sa oras ng pagmamasid:

kasalukuyang pagmamasid - ang patuloy na pagpaparehistro ng mga palatandaan ay isinasagawa (tanggapan ng pagpapatala, krimen, atbp.).
pana-panahong pagmamasid - ay isinasagawa sa ilang mga agwat ng oras (pamantayan ng pamumuhay sa lungsod ng Chelyabinsk, ang halaga ng basket ng consumer, sensus ng populasyon).
Isang beses - isang obserbasyon na ginawa ng isang beses para sa isang tiyak na layunin.

Sa pamamagitan ng saklaw ng mga yunit ng populasyon:

Patuloy na pagmamasid - ang impormasyon sa lahat ng ECC ay dapat makuha
Hindi isang kumpletong pagmamasid
- Ang pamamaraan ng pangunahing hanay - ang pinaka makabuluhang mga yunit ng pinag-aralan na populasyon ay sinusuri (upang pag-aralan ang engineering enterprise ng rehiyon ng Chelyabinsk).
- Ang selective observation ay isang random na seleksyon ng mga ECC na obserbahan.
- Monographic na obserbasyon - kapag ang isang ECC ay sinusunod, sila ay madalas na ginagamit upang gumuhit ng isang mass observation program.

Sa paraan ng pagkolekta ng data:

Direktang pagmamasid - ang mga rehistro mismo, sa pamamagitan ng direktang pagsukat, pagtimbang, ay nagtatatag ng katotohanan ng paksang irerehistro (isang batang wala pang 1 taong gulang sa isang polyclinic).
Documentary observation - iba't ibang dokumento ang ginagamit (pagbubuo ng deklarasyon)

Poll - ang kinakailangang impormasyon ay nakuha mula sa mga salita ng respondent.

Pagpasa ng survey - isinasagawa ng mga espesyal na sinanay na empleyado na tumatanggap ng kinakailangang impormasyon batay sa isang survey ng mga may-katuturang tao at naitala ang mga sagot sa kanilang sarili sa form. Ang ekspedisyonaryong survey ay maaaring direkta (harapan) at hindi direkta (survey sa pamamagitan ng telepono)
Correspondent survey - ang impormasyon ay ibinibigay ng mga kawani ng mga boluntaryong kasulatan, ang pamamaraang ito ay nangangailangan ng maliit na gastos sa pananalapi, ngunit hindi nagbibigay ng eksaktong halaga ng pagmamasid.
Self-registration - ang mga form ay pinunan ng mga respondent mismo, at ang mga registrar ay namamahagi lamang ng mga form ng mga questionnaire sa kanila at ipinapaliwanag kung paano sagutan ang mga ito.

§3. Mga pagkakamali sa pagmamasid

Ang pangunahing kinakailangan na inilapat sa istatistikal na pagmamasid ay katumpakan.

Katumpakan - ang antas ng pagsunod ng anumang tagapagpahiwatig ng katangian na may aktwal na halaga na tinutukoy mula sa mga materyales ng istatistikal na pagmamasid.

Ang pagkakaiba sa pagitan ng kinakalkula at aktwal na halaga ay tinatawag na error sa pagmamasid, depende sa mga sanhi ng paglitaw, nakikilala nila: mga error sa pagpaparehistro at mga error sa representasyon. Ang mga error sa pagpaparehistro ay nahahati sa random at sistematiko.

Random na mga error - ang resulta ng mga pagkilos ng mga random na kadahilanan (mga hilera, mga haligi ay pinaghalo)

Mga sistematikong error - palaging may posibilidad na labis na timbangin o maliitin ang tagapagpahiwatig. (edad)

Ang mga error sa pagiging representatibo ay ang likas na katangian ng hindi tuloy-tuloy na pagmamasid at lumitaw bilang resulta ng hindi tumpak na pagpaparami ng sample ng buong orihinal na populasyon.

Pagkatapos matanggap ang mga istatistikal na form, kailangan mong:

suriin ang pagkakumpleto ng mga nakalap na datos.
magsagawa ng kontrol sa aritmetika batay sa ugnayan ng iba't ibang katangian sa bawat isa.
upang magsagawa ng lohikal na kontrol batay sa kaalaman ng mga lohikal na relasyon sa pagitan ng mga tampok.

§apat. Buod at pagpapangkat

Batay sa mga nakolektang data, imposibleng gumawa ng kalkulasyon at gumawa ng mga konklusyon; una, kailangan nilang i-summarized at ibuod sa isang talahanayan. Para sa mga layuning ito, ang buod at pagpapangkat ay ginagamit.

Buod - isang hanay ng mga sunud-sunod na operasyon upang gawing pangkalahatan ang mga partikular na iisang katotohanan na bumubuo ng isang set at tukuyin ang mga tipikal na tampok at pattern na likas sa phenomenon na pinag-aaralan sa kabuuan.

Simple vodka - pagbibilang ng mga kabuuan para sa populasyon.

Ang isang kumplikadong buod ay isang hanay ng mga operasyon para sa pagpapangkat ng mga indibidwal na obserbasyon, pagbibilang ng mga resulta para sa bawat pangkat at para sa buong bagay sa kabuuan, at paglalahad ng mga resulta sa anyo ng mga istatistikal na talahanayan.

Ayon sa anyo ng pagproseso ng materyal, ang buod ay maaaring desentralisado, sentralisado - ang gayong buod ay isinasagawa gamit ang isang beses na pagmamasid sa istatistika.

Pagpapangkat - ang paghahati ng hanay ng mga yunit ng pinag-aralan na populasyon sa mga pangkat ayon sa ilang mga katangian.

§5. Mga uri ng istatistikal na pagpapangkat

Ang mga pagpapangkat ay maaaring uriin ayon sa istraktura at nilalaman.

Inilalarawan ng analytical grouping ang ugnayan sa pagitan ng mga feature, ang isa ay isang salik at ang isa ay produktibo.

edukasyon

Hindi Kumpleto Mas Mataas

§6. Mga talahanayan ng istatistika

Ang mga resulta ng buod at pagpapangkat ay dapat ipakita sa paraang magagamit ang mga ito.

Mayroong 3 paraan upang ipakita ang data:

maaaring isama ang data sa teksto.
presentasyon sa mga talahanayan.
graphic na paraan

Statistical table - isang sistema ng mga row at column kung saan ang istatistikal na impormasyon sa mga socio-economic phenomena ay ipinakita sa isang tiyak na pagkakasunud-sunod.

Matukoy ang pagkakaiba sa pagitan ng paksa at panaguri ng talahanayan.

Ang paksa ay isang bagay na nailalarawan sa pamamagitan ng mga numero, kadalasan ang paksa ay ibinibigay sa kaliwang bahagi ng talahanayan.

Ang panaguri ay isang sistema ng mga tagapagpahiwatig kung saan nailalarawan ang bagay.

Ang talahanayan ng istatistika ay naglalaman ng 3 uri ng mga header: pangkalahatan, gilid

Dapat ipakita ng pangkalahatang pamagat ang nilalaman ng buong talahanayan, na matatagpuan sa itaas ng talahanayan sa gitna.

Mga panuntunan sa talahanayan.

lahat ng tatlong uri ng mga heading na walang mga pagdadaglat ng salita ay kinakailangan, ang mga karaniwang yunit ng pagsukat ay maaaring ilagay sa heading.
ang talahanayan ay hindi dapat magkaroon ng mga karagdagang linya, ang mga vertical na marka ay maaaring nawawala.
Kinakailangan ang huling linya. Maaari itong alinman sa simula o sa dulo ng dokumento. Kung sa simula ng dokumento, kung sa dulo, TOTAL:

digital data sa loob ng isang column ay naitala na may isang antas ng katumpakan. Ang mga digit ay nakasulat nang mahigpit sa ilalim ng mga digit, ang buong bahagi ay pinaghihiwalay ng isang kuwit.
ang talahanayan ay hindi dapat maglaman ng mga walang laman na cell, kung walang data, pagkatapos ay isulat nila ang "Walang impormasyon" o "...", kung ang data ay zero, pagkatapos ay "-". Kung ang halaga ay hindi katumbas ng zero ngunit ang unang makabuluhang digit ay lilitaw pagkatapos ng tinukoy na katumpakan 0.01®0.0 - kung ang tinatanggap na katumpakan ay hanggang sa ikasampu.
kung mayroong maraming mga haligi sa talahanayan, kung gayon ang mga haligi ng paksa ay ipinahiwatig ng malalaking titik, at ang mga haligi ng panaguri sa pamamagitan ng mga numero.
kung ang talahanayan ay batay sa hiniram na data, ang pinagmulan ng data ay ipinahiwatig sa ibaba ng talahanayan; kung kinakailangan, ang talahanayan ay maaaring sinamahan ng mga tala.

§7. Mga Statistical Graph

Ang mga talahanayan ng istatistika ay maaaring dagdagan ng mga graph.

Ang mga statistical graph ay mga conditional na larawan ng mga numerical valuesat ang kanilang mga ratios sa pamamagitan ng mga linya, geometric na hugis, mga drawing.

Mga kalamangan ng isang graphic na imahe

malinaw, kapansin-pansin, nagpapahayag.
ang mga limitasyon ng pagbabago ng indicator, ang comparative rate ng pagbabago at pagkasumpungin ay makikita kaagad

Kahinaan ng isang graphic na larawan

Magsama ng mas kaunting data kaysa sa talahanayan.
ang graph ay nagpapakita ng bilugan na data, ang pangkalahatang sitwasyon, ngunit hindi ang mga detalye.

Mga Statistical Graph

Mga diagram

kulot

Paksa 3: Mga tagapagpahiwatig ng istatistika.

§isa. Ang kakanyahan at kahulugan ng isang istatistikal na tagapagpahiwatig, ang mga katangian nito.

§2. Pag-uuri ng mga istatistikal na tagapagpahiwatig.

§3. Mga uri ng mga kamag-anak na tagapagpahiwatig. Mga prinsipyo ng konstruksiyon.

§apat. Mga sistema ng istatistikal na tagapagpahiwatig.

Ang statistical sign ay isang property na likas sa ESS, ito ay umiral nang obhetibo mula sa kung ito ay pinag-aralan bilang isang agham o hindi.

Ang istatistikal na tagapagpahiwatig ay isang pangkalahatang katangian ng ilang pag-aari ng populasyon.

Ang istraktura ng isang istatistikal na tagapagpahiwatig (mga katangian nito):

Average na mga halaga
Mga tagapagpahiwatig ng pagkakaiba-iba
Mga tagapagpahiwatig ng koneksyon sa tampok
Mga tagapagpahiwatig ng istraktura at kalikasan ng pamamahagi
Mga dynamic na tagapagpahiwatig
Mga tagapagpahiwatig ng pagkakaiba-iba
Mga Tagapagpahiwatig ng Katumpakan at Pagkakaaasahan ng Mga Sample na Pagtantiya
Mga Tagapagpahiwatig ng Katumpakan at Pagkakaaasahan ng Pagtataya

Ayon sa uri: ang kabuuang bilang ng mga yunit o ang kabuuang ari-arian ng bagay. Ito ang kabuuan ng mga pangunahing katangian, na sinusukat sa mga piraso, kg, m, $, atbp.

Relatibong tagapagpahiwatig- nakuha sa pamamagitan ng paghahambing ng ganap o kamag-anak na mga tagapagpahiwatig sa espasyo, sa oras o sa pamamagitan ng paghahambing ng mga tagapagpahiwatig ng iba't ibang katangian ng bagay na pinag-aaralan.

Ang kamag-anak na tagapagpahiwatig ng 1st order ay nakuha sa pamamagitan ng paghahambing ng 2 x ganap na mga tagapagpahiwatig. Nakukuha ang 2nd order relative indicator sa pamamagitan ng paghahambing ng 1st order relative indicator, atbp.

Ang isang kamag-anak na index ng ika-3 order at mas mataas ay napakabihirang.

Mga direktang tagapagpahiwatig - tulad ng mga tagapagpahiwatig, ang halaga nito ay tumataas sa pagtaas ng hindi pangkaraniwang bagay na pinag-aaralan.

Kabaligtaran na mga tagapagpahiwatig - mga tagapagpahiwatig na ang halaga ay bumababa sa pagtaas ng hindi pangkaraniwang bagay na pinag-aaralan.

… mga istruktura

…mga nagsasalita

…relasyon

… tindi

…kaugnayan sa pamantayan

... paghahambing

Mga tagapagpahiwatig ng istraktura ay nakukuha sa pamamagitan ng pag-uugnay ng bahagi sa kabuuan.

Mga kamag-anak na tagapagpahiwatig ng dinamika

ü Mga tagapagpahiwatig ng dinamika (mga rate ng paglago, paglago)

ü Mga indeks

Mga tagapagpahiwatig ng relasyon tukuyin ang kaugnayan sa pagitan ng mga tampok:

ü Koepisyent ng ugnayan

ü Analytical index

Mga tagapagpahiwatig ng intensity tukuyin ang ugnayan ng dalawang bagay sa magkaibang batayan.

ü Labour intensity - ang dami ng oras na ginamit sa paggawa ng isang yunit ng produkto

ü Produksyon - ang dami ng mga produktong ginawa kada yunit ng oras

OUTPUT \u003d 1 / labor intensity

Mga tagapagpahiwatig ng saloobin sa pamantayan- ang ratio ng aktwal na mga halaga ng tanda ng tagapagpahiwatig sa normatibo, binalak, pinakamainam.

Mga tagapagpahiwatig ng paghahambing - paghahambing ng iba't ibang bagay sa parehong batayan.

Pangkalahatang mga prinsipyo para sa pagbuo ng mga istatistikal na tagapagpahiwatig:

ang mga istatistika ay may layuning nauugnay.
Ang mga pinaghahambing na tagapagpahiwatig ay maaaring mag-iba sa isang katangian lamang; hindi mo maihahambing ang isang tagapagpahiwatig sa pamamagitan ng dalawa o higit pang mga katangian.
kinakailangang malaman at isaalang-alang ang mga limitasyon ng tagapagpahiwatig.

Para sa bawat katangian ng isang bagay, kinakailangan ang isang sistema ng mga istatistikal na tagapagpahiwatig.

cognitive function - batay sa pagsusuri ng data
propaganda
stimulating function

Paksa 4: Mga Karaniwan

§isa. konsepto ng average

§2. mga uri ng average

§3. arithmetic mean at mga katangian nito

§apat. harmonic mean, geometric mean, quadratic mean.

§5. multivariate average

Ang pinakakaraniwang anyo ng mga istatistikal na tagapagpahiwatig ay ang average.

Ang pinakamahalagang pag-aari ng average ay na ito ay sumasalamin sa karaniwan na likas sa bawat yunit ng populasyon na pinag-aaralan, bagaman ang halaga ng katangian ng mga indibidwal na yunit ng populasyon ay maaaring magbago sa isang direksyon o sa iba pa.

Ang tipikal ng mean ay direktang nauugnay sa homogeneity ng pinag-aralan na populasyon. Sa kaso ng isang hindi homogenous na populasyon, ito ay kinakailangan upang hatiin ito sa qualitatively homogenous na mga grupo at kalkulahin ang average para sa bawat isa para sa bawat isa sa mga homogenous na grupo.

Maaari mong matukoy ang average sa pamamagitan ng paunang ratio ng average (ISS) ang lohikal na formula nito.

Mga katamtamang istruktura

Fashion - Mo

Median - Ako

Sa serye ng dynamics, ang arithmetic mean at ang chronological mean ay kinakalkula.

ibig sabihin ng aritmetika ay tinatawag na tulad ng isang average na halaga ng tampok sa pagkalkula kung saan ang kabuuang dami ng tampok ay hindi nagbabago.

Halimbawa: timbang.

ikasal simpleng aritmetika

x i– indibidwal na halaga ng tampok

n ay ang kabuuang bilang ng pinag-aralan na populasyon

cf. timbang ng aritmetika

Mga Katangian cf. aritmetika.

Ang kabuuan ng mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa average na halaga nito ay zero

kung ang bawat indibidwal na halaga ng isang tampok ay pinarami o hinati sa parehong pare-parehong numero, ang average ay tataas o bababa ng parehong halaga.

kung ang isa at ang parehong pare-parehong numero ay idinagdag sa bawat indibidwal na halaga ng katangian, ang average na halaga ay magbabago nang naaayon sa parehong numero.

Patunay

kung ang mga timbang f ng weighted average ay pinarami o hinati sa parehong numero, hindi magbabago ang average.

ang kabuuan ng mga squared deviations ng attribute ay mas mababa kaysa sa iba pang numero.

Iba pang mga uri ng average

Uri ng gitna	simpleng average	Weighted average
maharmonya
geometriko
parisukat

Napakahirap ilarawan ang pagpapangkat sa isang batayan at kakaunting impormasyon ang nananatili sa memorya.

Multivariate mean - ang average na halaga para sa ilang feature E.S.S.

Mula sa mga ratio ng mga halaga ng tampok para sa E.S. sa ibig sabihin ng mga halaga ng mga katangiang ito.

Multivariate average para sa mga unit ko

x ij– ang halaga ng feature j para sa i unit

Mean value ng feature j

k ay ang bilang ng mga tampok

j ay ang bilang ng tampok at ang bilang ng populasyon nito

Paksa 5: Pagsusuri ng mga Variasyon

§isa. Pagkakaiba-iba ng mga palatandaan at mga sanhi nito

§2. Mga ranggo ng pamamahagi

§3. Mga katangian ng istruktura ng serye ng variation.

§apat. Kapangyarihan ng mga tagapagpahiwatig ng pagkakaiba-iba.

§5. Variation Intensity Indicator

§6. mga uri ng pagpapakalat. Panuntunan sa pagdaragdag ng pagkakaiba-iba.

Ang pagkakaiba-iba sa halaga ng isang tampok sa isang populasyon ay ang pagkakaiba sa mga halaga nito sa iba't ibang mga yunit ng isang naibigay na populasyon sa parehong panahon o punto ng oras.

Ang dahilan para sa pagkakaiba-iba: iba't ibang mga kondisyon para sa pagkakaroon ng ESS, ito ay pagkakaiba-iba na lumilikha ng pangangailangan para sa naturang agham bilang mga istatistika.

Ang pagsasagawa ng variational analysis ay nagsisimula sa pagbuo ng variational series - isang nakaayos na pamamahagi ng mga unit ng populasyon ayon sa pagtaas o pagbaba ng mga palatandaan at pagbibilang ng kaukulang frequency.

Mga ranggo ng pamamahagi

ü niraranggo

ü discrete

ü pagitan

Serye ng variation ng ranggo- isang listahan ng mga indibidwal na yunit. pinagsama-sama sa pataas na pababang pagkakasunod-sunod ng feature na niraranggo

Discrete variation series - isang talahanayan na binubuo ng 2 mga hilera - mga halaga ng polimer ng isang variable na katangian at ang bilang ng mga yunit na may isang naibigay na halaga ng katangian.

Ang isang serye ng pagkakaiba-iba ng pagitan ay binuo sa mga sumusunod na kaso:

ang tampok ay tumatagal ng mga discrete na halaga, ngunit ang kanilang bilang ay masyadong malaki
ang attribute ay tumatagal ng anumang halaga sa isang partikular na hanay

Kapag gumagawa ng isang serye ng pagkakaiba-iba ng pagitan, kinakailangang piliin ang pinakamainam na bilang ng mga grupo, ang pinakakaraniwang pamamaraan gamit ang formula ng Sturgess

k - bilang ng mga agwat

n ay ang dami ng populasyon

Sa mga kalkulasyon, ang mga fractional na halaga ay halos palaging nakuha, na nag-round off sa isang integer.

Haba ng pagitan - l

Mga uri ng agwat

ang mas mababang limitasyon ng kasunod na agwat ay inuulit ang itaas na limitasyon ng kasunod na agwat

bukas na pagitan, pagitan na may isang hangganan

Kapag nagkalkula para sa isang serye ng pagkakaiba-iba ng pagitan, ang gitna ng pagitan ay kinuha bilang x i.

NME =60 median = 1

Cumulate - mas mababa sa pamamahagi

Ogiva – mas malaki ang pamamahagi kaysa

Ang median ay ang halaga ng isang tampok na naghahati sa buong populasyon sa dalawang pantay na bahagi.

Para sa isang discrete variational series, ang pagkalkula ng median: kung n ay pantay, hindi. Median unit

Serye ng pagkakaiba-iba ng pagitan:

k - bilang ng mga agwat

x 0 - ang mas mababang limitasyon ng median na pagitan

l ay ang haba ng median na pagitan

Kabuuan ng mga frequency

Ang pinagsama-samang dalas ng pagitan bago ang median.

Median Interval Frequency

Median Interval– ang unang agwat na ang naipon na frequency ay lumampas sa kalahati ng kabuuang kabuuan ng mga frequency.

Sa graphically, nasa cumulate ang median.

Quartiles - ang halaga ng katangiang naghahati sa populasyon sa 4 na pantay na bahagi.

1st quartile

3rd quartile

2nd quartile - median.

xQ 1 x Q 3 - ang mas mababang limitasyon ng pagitan na naglalaman ng 1st at 3rd quartile.

l - haba ng pagitan

at - naipon na mga frequency ng mga pagitan ng nakaraang mga pagitan na naglalaman ng 1st at 3rd quartile.

Mga frequency ng quartile interval.

Upang makilala ang serye ng variation, ginagamit ang mga sumusunod:

Deciles - hatiin ang populasyon sa 10 pantay na bahagi, Percitiles - hatiin ang populasyon sa 100 pantay na bahagi.

Ang mode ay isang madalas na nangyayaring katangian ng tampok. Para sa isang discrete variational series - ang pinakamataas na frequency. Para sa isang serye ng pagkakaiba-iba ng pagitan, kinakalkula ang mode gamit ang sumusunod na formula:

Lower bound ng modal interval

l- haba ng agwat ng modal

fMo- dalas ng agwat ng modal

Ang f Mo +1 ay ang dalas ng pagitan kasunod ng modal

Modal interval - ang interval na may pinakamataas na frequency. Sa graphically, ang mode ay matatagpuan sa histogram.

Pagbabago ng span
Average na linear deviation

natimbang

Dispersion:

natimbang

karaniwang lihis

pag-aari ng pagpapakalat.

ang pagbaba sa lahat ng mga halaga ng isang tampok sa parehong halaga ay hindi nagbabago sa halaga ng pagkakaiba.
Ang pagpapababa ng lahat ng mga halaga ng tampok sa pamamagitan ng k beses ay binabawasan ang pagkakaiba ng sa 2 beses, at RMS sa sa minsan
kung kalkulahin mo ang mean square ng deviations mula sa anumang value A na iba sa arithmetic mean, kung gayon ito ay palaging mas malaki kaysa sa mean square ng deviations na kinakalkula mula sa arithmetic mean. Kaya, mula sa average ay palaging mas mababa kaysa sa kinakalkula mula sa anumang iba pang halaga, i.e. ito ay may kaunting pag-aari. RMS = 1.25 - na may mga distribusyon na malapit sa normal.

Sa ilalim ng mga kondisyon ng normal na distribusyon, mayroong sumusunod na kaugnayan sa pagitan at ang bilang ng mga obserbasyon sa loob ng 68.3% ng mga obserbasyon.

95.4% ng mga obserbasyon ay nasa loob ng mga limitasyon

99.7% ng mga obserbasyon ay nasa loob ng mga limitasyon

Upang ihambing ang pagkakaiba-iba ng mga katangian sa iba't ibang populasyon o upang ihambing ang pagkakaiba-iba ng iba't ibang mga katangian sa parehong populasyon, ginagamit ang mga kamag-anak na tagapagpahiwatig, ang base ay ang arithmetic mean.

Relatibong hanay ng variation.
Relatibong linear deviation
Ang koepisyent ng pagkakaiba-iba

ang mga tagapagpahiwatig na ito ay nagbibigay hindi lamang ng isang paghahambing na pagtatasa ngunit bumubuo rin ng homogeneity ng populasyon. Ang hanay ay itinuturing na homogenous kung ang koepisyent ng pagkakaiba-iba ay hindi lalampas sa 33%.

Kasabay ng pag-aaral ng pagkakaiba-iba ng isang katangian sa kabuuan ng populasyon sa kabuuan, kadalasang kinakailangan na subaybayan ang dami ng mga pagbabago sa katangian, ngunit sa mga pangkat kung saan nahahati ang populasyon at sa pagitan nila. Ito ay nakakamit sa pamamagitan ng pag-compute ng iba't ibang view.

Mga uri ng pagpapakalat:

Kabuuang pagkakaiba
pagkakaiba-iba sa pagitan ng pangkat
Pagkakaiba-iba sa loob ng pangkat (nalalabi)

1. sinusukat ang pagkakaiba-iba ng isang katangian sa buong populasyon sa ilalim ng impluwensya ng lahat ng mga salik na naging sanhi ng pagkakaiba-iba na ito

Halimbawa: pagkonsumo ng yogurt: batay sa isang sample ng 100 tao

Katayuang sosyal

x i -indibidwal na halaga ng katangian

Ang average na halaga ng katangian sa buong populasyon

dalas ng tampok na ito.

2. nailalarawan ang pagkakaiba-iba ng katangian sa ilalim ng impluwensya ng katangian ng salik na pinagbabatayan ng pagpapangkat.

Average ng grupo

Pangkalahatang average ng pangkat

Dalas ayon sa pangkat

3. nailalarawan ang pagkakaiba-iba ng isang katangian sa ilalim ng impluwensya ng mga salik na hindi kasama sa pagpapangkat

x ij – Nagtatampok ako ng halaga sa j group

Ang average na halaga ng feature sa j pangkat

f ij - dalasi-th feature saj pangkat

Mayroong isang panuntunan na nag-uugnay sa 3 uri ng pagkakaiba, ito ay tinatawag na panuntunan sa pagdaragdag ng pagkakaiba.

Natirang pagpapakalat sa pamamagitan ng j pangkat

Tapos na ang kabuuan ng mga frequency j pangkat

n ay ang kabuuang kabuuan ng mga frequency

ang pangunahing gawain ng pagsusuri ng variational series ay upang matukoy ang mga pattern ng frequency distribution.

Ang distribution curve ay isang graphic na representasyon sa anyo ng tuluy-tuloy na linya ng pagbabago ng dalas sa isang serye ng variation sa isang pagbabagong nauugnay sa functionally sa halaga ng isang feature.

Maaaring i-plot ang distribution curve gamit ang polygon at histogram. Maipapayo na bawasan ang empirikal na pamamahagi sa isang teoretikal, sa isa sa mga mahusay na pinag-aralan na mga anyo.

Curve ng normal na distribusyon.

Mayroong mga sumusunod na uri ng distribution curves:

unimodal
maraming vertex

Ang mga homogenous na populasyon ay nailalarawan sa pamamagitan ng mga single-vertex curve, ang isang multi-vertex curve ay nagpapahiwatig ng heterogeneity ng populasyon at ang pangangailangan para sa muling pagsasaayos.

Ang paghahanap ng pangkalahatang katangian ng pamamahagi ay nagsasangkot ng pagtatasa ng homogeneity nito, at ang pagkalkula ng skewness at kurtosis. Para sa simetriko distribusyon

Para sa isang paghahambing na pag-aaral ng kawalaan ng simetrya ng iba't ibang mga distribusyon, ang koepisyent ng kawalaan ng simetrya Bilang ay kinakalkula.

Gitnang sandali ng ikatlong pagkakasunud-sunod; - RMS cubed;

Kung, kung gayon ang kawalaan ng simetrya ay makabuluhan

Kung si As<0, то As – левосторонняя, если As>0, pagkatapos ay ang As ay kanang kamay.

Kung, kung gayon ang As ay hindi gaanong mahalaga. Para sa simetriko at katamtamang asymmetrical, ang kurtosis indicator ay kinakalkula: kung E k > 0, kung gayon ang distribusyon ay pinakamataas, kung E k<0, то распределение плосковершинное.

Ang pagkakaiba-iba ng alternatibong tampok ay quantitatively manifested bilang mga sumusunod.

0 - mga yunit na walang tampok na ito;

1 - mga yunit na may tampok na ito;

R- ang proporsyon ng mga yunit na may tampok na ito;

q- ang proporsyon ng mga yunit na walang tampok na ito;

pagkatapos p+q=1.

Ang alternatibong tampok ay tumatagal ng 2 mga halaga 0 at 1 na may mga timbang p at q.

Mga direktang palatandaan- ito ay mga palatandaan, ang halaga nito ay tumataas sa pagtaas ng hindi pangkaraniwang bagay na pinag-aaralan.

Baliktad na mga palatandaan - mga palatandaan, ang magnitude nito ay bumababa sa pagtaas ng hindi pangkaraniwang bagay na pinag-aaralan.

Pagbuo (direkta)

Labour intensity (reverse)

Ang maximum na pagkakaiba ng bahagi ay 0.25.

Paksa 6: Pagmomodelo ng serye ng pamamahagi.

§isa. Aktwal at teoretikal na pamamahagi

§2. Curve ng normal na distribusyon.

§3. Pagsubok sa hypothesis ng isang normal na distribusyon.

§apat. Pamantayan ng pahintulot: Pearson, Romanovsky, Kolmogorov.

§5. Ang praktikal na halaga ng pagmomodelo ng serye ng pamamahagi.

§isa. Aktwal at teoretikal na pamamahagi

Ang isa sa pinakamahalagang layunin ng pag-aaral ng serye ng pamamahagi ay upang ipakita ang pattern ng pamamahagi at matukoy ang kalikasan nito. Ang mga pattern ng pamamahagi ay pinakamalinaw na ipinapakita lamang sa isang malaking bilang ng mga obserbasyon.

Ang aktwal na distribusyon ay maaaring ilarawan nang graphical gamit ang isang distribution curve - graphical na inilalarawan bilang isang tuluy-tuloy na linya ng pagbabago ng dalas sa serye ng variation ng variant na gumaganang nauugnay sa pagbabago.

Ang teoretikal na kurba ng pamamahagi ay nauunawaan bilang isang kurba ng ganitong uri ng pamamahagi sa mga pangkalahatang termino na hindi kasama ang impluwensya ng mga salik na random para sa regularidad.

Ang teoretikal na pamamahagi ay maaaring ipahayag sa pamamagitan ng analytic formula na tinatawag na analytic formula. Ang pinakakaraniwan ay ang normal na pamamahagi.

§2. Curve ng normal na distribusyon.

Normal na batas sa pamamahagi:

y ang ordinate ng normal na distribution

t ay ang normalized deviation.

; e=2.7218; x i - mga pagpipilian sa serye ng pagkakaiba-iba; - karaniwan;

Ari-arian:

Ang normal na function ng pamamahagi ay pantay, i.e. f(t)=f(-t), . Ang normal na distribution function ay ganap na tinutukoy ng standard deviation.

§3. Pagsubok sa hypothesis ng isang normal na distribusyon.

Ang dahilan ng madalas na pagtukoy sa batas ng pamamahagi ay ang pag-asa na nagreresulta mula sa pagkilos ng maraming random na dahilan, wala sa mga ito ang nangingibabaw. Kung ang Mo = Me ay kinakalkula sa variational series, kung gayon ito ay maaaring magpahiwatig ng pagiging malapit sa normal na distribusyon. Ang pinakatumpak na pagsubok ng pagsunod sa normal na batas ay ginagawa gamit ang mga espesyal na pamantayan.

§apat. Pamantayan ng pahintulot: Pearson, Romanovsky, Kolmogorov.

Ang pamantayan ni Pearson.

Teoretikal na dalas

Empirikal na dalas

Paraan para sa pagkalkula ng mga teoretikal na frequency.

Ang ibig sabihin ng aritmetika ay tinutukoy at ayon sa serye ng pagkakaiba-iba ng pagitan, ang t ay kinakalkula para sa bawat pagitan.
Nahanap namin ang halaga ng probability density para sa normalized distribution law. PAHINA 49
Nahanap namin ang teoretikal na dalas.

l - haba ng pagitan

- kabuuan ng mga empirical frequency

- density ng posibilidad

bilugan ang halaga sa integer

Pagkalkula ng ratio ng Pearson
halaga ng talahanayan

d.f. – bilang ng mga agwat – 3

d.f. ay ang bilang ng mga antas ng kalayaan.

kung > , kung gayon ang distribusyon ay hindi normal, ibig sabihin. kinansela ang hypothesis ng isang normal na distribusyon. Kung ang< , то распределение является нормальным.

Romanovsky criterion.

Ang criterion ng Pearson ay kinakalkula;

Ang bilang ng mga degree.

Kung kasama<3, то распределение близко к нормальному.

Ang pamantayan ni Kolmogorov

, D- ang maximum na halaga sa pagitan ng naipon na empirical at theoretical frequency. Isang kinakailangang kondisyon para sa paggamit ng Kolmogorov: Ang bilang ng mga obserbasyon ay higit sa 100. Ayon sa isang espesyal na talahanayan ng probabilidad kung saan maaari itong mapagtatalunan na ang pamamahagi na ito ay normal.

§5. Ang praktikal na halaga ng pagmomodelo ng serye ng pamamahagi.

ang kakayahang ilapat ang mga batas ng normal na distribusyon sa empirical distribution.
ang kakayahang gamitin ang 3 x sigma rule.
Ang kakayahang maiwasan ang mga karagdagang kalkulasyon na nakakaubos ng oras at magastos, sa pamamagitan ng pagsusuri sa populasyon, alam na normal ang pamamahagi.

Paksa 7: Piling pagmamasid.

§isa. Ang konsepto ng selective observation. Mga dahilan para sa paggamit nito.

§2. Mga uri ng piling pagmamasid.

§3. Mga error sa pag-sample.

§apat. Mga Halimbawang Gawain sa Pagmamasid

§5. Pamamahagi ng sample na data ng pagmamasid sa pangkalahatang populasyon.

§6. Maliit na sample.

§isa. Ang konsepto ng selective observation. Mga dahilan para sa paggamit nito.

Selective observation - tulad ng isang hindi tuloy-tuloy na pagmamasid, kung saan ang mga yunit ng pinag-aralan na populasyon, na pinili sa isang tiyak na paraan, ay sumasailalim sa istatistikal na pagsusuri.

Layunin (gawain) ng sample na pagmamasid: para sa napagmasdan na bahagi, upang makilala ang buong populasyon ng mga yunit, napapailalim sa lahat ng mga patakaran at prinsipyo ng istatistikal na pagmamasid.

Mga dahilan para sa paggamit ng selective observation:

pagtitipid ng materyal, gastos sa paggawa at oras;
ang pagkakataong pag-aralan nang mas detalyado at detalyado ang mga indibidwal na yunit ng istatistikal na populasyon at kanilang mga grupo.
ang ilang partikular na problema ay malulutas lamang sa paggamit ng selective observation.
ang karampatang at maayos na pumipili na pagmamasid ay nagbibigay ng mataas na katumpakan ng mga resulta.

Ang pangkalahatang populasyon ay ang hanay ng mga yunit kung saan ginawa ang pagpili.

Ang sampling frame ay ang hanay ng mga unit na pinili para sa survey. Sa mga istatistika, kaugalian na makilala sa pagitan ng mga parameter ng pangkalahatang populasyon at sample na populasyon.

Mga uri ng sampling

Sa pamamagitan ng paraan ng pagpili:

Paulit-ulit

Ang yunit na kasama sa sample, pagkatapos ng pagpaparehistro ng mga naobserbahang katangian, ay ibinalik sa pangkalahatang populasyon upang lumahok sa karagdagang pamamaraan sa pagpili.

Ang dami ng pangkalahatang populasyon ay nananatiling hindi nagbabago, na humahantong sa patuloy na pag-hit sa sample ng anumang unit.

Hindi nauulit

Ang isang sample na unit ay hindi ibinalik sa populasyon kung saan ginawa ang pagpili.

Paraan ng pagpili:

Actually-random ay nauugnay sa mga yunit mula sa pangkalahatang populasyon nang random o nang random na walang anumang elemento ng pagkakapare-pareho. Gayunpaman, bago magsagawa ng naturang sample, dapat tiyakin ng isa na ang lahat ng mga yunit ng pangkalahatang populasyon ay may pantay na pagkakataon na maisama sa sample, i.e. sa buong listahan ng mga yunit ng istatistikal na populasyon ay walang mga pagkukulang o kamangmangan ng mga indibidwal na yunit. Kinakailangan din na malinaw na itatag ang mga hangganan ng pangkalahatang populasyon. Ang teknikal na itinatag na pagpili ay isinasagawa sa pamamagitan ng pagguhit ng mga palabunutan o paggamit ng isang talahanayan ng mga random na numero.

Mechanical sampling (bawat 5 sa listahan) ay ginagamit sa mga kaso kung saan ang pangkalahatang populasyon ay kahit papaano ay nakaayos, i.e. mayroong isang tiyak na pagkakasunud-sunod sa pamamahagi ng mga yunit. Kapag nagsasagawa ng mekanikal na sampling, ang proporsyon ng pagpili ay itinatag, na itinatag ng ratio ng pangkalahatang populasyon at sample na populasyon.

Ang panganib ng error sa mechanical sampling ay maaaring lumitaw dahil sa: random coincidence ng napiling interval at cyclical patterns sa pag-aayos ng mga unit ng pangkalahatang populasyon.

Zoned sampling ay ginagamit kapag ang lahat ng yunit ng pangkalahatang populasyon ay maaaring hatiin sa mga pangkat (rehiyon, bansa) ayon sa ilang katangian.

Pinagsamang sample.

Ang pagpili ng mga yunit ay maaaring gawin:

o ayon sa sukat ng grupo
o sa proporsyon sa pagkakaiba-iba ng intragroup ng katangian
, kung saan ang n ay ang laki ng sample, ang N ay ang laki ng pangkalahatang populasyon, n i – laki ng sample i-mga pangkat, N i – dami i mga sample.
- ang pamamaraang ito ay mas tumpak, ngunit sa kurso ng sampling ay napakahirap matukoy nang maaga tungkol sa pagkakaiba-iba. (bago ang pagmamasid).

pagpili ng serial.

Ginagamit ito kapag pinagsama-sama ang mga ECC sa maliliit na grupo (serye), halimbawa, packaging na may mga natapos na produkto, mga grupo ng mag-aaral. Ang kakanyahan ng serial sampling ay ang mga serye ay pinipili alinman sa random o mekanikal na paraan, at pagkatapos ay isinasagawa ang isang tuluy-tuloy na survey sa loob ng napiling serye.

Pinagsamang pagpili.

Ito ay isang kumbinasyon ng mga pamamaraan ng pagpili na tinalakay sa itaas, mas madalas ang isang kumbinasyon ng tipikal at serial series ay ginagamit, i.e. pagpili ng mga serye mula sa ilang karaniwang grupo.

Ang pagpili ay maaari ding multi-stage at single-stage, poly-phrase at single-phrase.

Multi-stage na pagpili: mula sa pangkalahatang populasyon, una, mas malalaking grupo ang kinukuha, pagkatapos ay mas maliit, at iba pa hanggang sa mapili ang mga yunit na napapailalim sa survey.

Pagpili ng maraming parirala: nagsasangkot ng pangangalaga ng parehong yunit ng pagpili sa lahat ng yugto ng pagpapatupad nito. Kasabay nito, ang mga yunit ng pagpili na napili sa bawat kasunod na yugto ay napapailalim sa pagsusuri, ang programa kung saan ay lumalawak (Halimbawa: mga mag-aaral ng buong institute, pagkatapos ay mga mag-aaral ng ilang mga faculty).

§3. Mga error sa pag-sample.

Sistematiko

Ang mga error sa pagiging representatibo ay nangyayari lamang sa piling pagmamasid. Bumangon dahil sa ang katunayan na ang sample na populasyon ay hindi maaaring tumpak na kopyahin ang pangkalahatang populasyon. Hindi maiiwasan ang mga ito, ngunit madali silang mahulaan at, kung kinakailangan, maaari silang mabawasan.

Ang sampling error ay ang pagkakaiba sa pagitan ng halaga ng isang parameter sa pangkalahatang populasyon at ang halaga nito na kinakalkula mula sa mga resulta ng isang sample na pagmamasid. Dх=-m+ , Dх – marginal error sa sample, m – general average; - sample ibig sabihin.

Ang marginal sampling error ay random na halaga. Ang mga gawa ni Chebyshev ay nakatuon sa pag-aaral ng mga pattern ng random sampling error. Ang theorem ni Chebyshev ay nagpapatunay na ang Dx ay hindi lalampas sa: - average sampling error Ang t-confidence coefficient ay nagpapahiwatig ng posibilidad ng error na ito. pp 42-43.

Sa kaso kung kailan kinakailangan upang matukoy ang t mula sa kilalang F(t), kinukuha namin ang pinakamalapit na malaking F(t) at tinutukoy ang t mula dito.

Limitahan ang fraction ng error

P - ibahagi.

Kung ang pagpili ay isinagawa sa isang hindi paulit-ulit na paraan, pagkatapos ay idinagdag ang mga formula ng error sa limitasyon

Pagwawasto para sa hindi nauulit.

Para sa bawat uri ng sample na pagmamasid, ang ipinakitang error ay kinakalkula nang iba:

wastong random at mekanikal na pagmamasid;
Zoned surveillance
serial sampling

r ay ang bilang ng mga serye sa sample;

Ang R ay ang bilang ng mga serye sa pangkalahatang populasyon;

Intergroup na pagkakaiba-iba ng proporsyon.

§apat. Mga Halimbawang Gawain sa Pagmamasid

Ginagamit para sa mga sumusunod na gawain:

n-? upang matukoy ang laki ng sample mula sa kilalang F(t), Dx.
pagpapasiya ng Dx sample mula sa kilalang F(t), n
pagpapasiya ng F(t) mula sa kilalang Dx at n

1 gawain n - ? Una, ang n ay tinutukoy ng formula ng muling pagpili, para sa hindi paulit-ulit na pagpili:

Mga paraan upang matukoy ang pagkakaiba:

ito ay kinuha sa mga nakaraang katulad na pag-aaral.
RMS na may normal na distribusyon » 1/6 ng hanay ng variation.
kung ang distribusyon ay malinaw na walang simetriko, pagkatapos ay RMS » 1/5 ng hanay ng variation
Para sa bahagi, inilapat ang maximum na posibleng variance p(1-p)=0.25
na may n³100, pagkatapos ay s 2 \u003d S 2 - sample variance

£30 n£100, pagkatapos ay s 2 \u003d S 2 (n / n-1), s 2 - pangkalahatang pagkakaiba

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Kapag kinakalkula ang n, hindi dapat ituloy ang isang malaking halaga ng t at maliit na marginal error, dahil ito ay humahantong sa isang pagtaas sa n at samakatuwid sa isang pagtaas sa mga gastos. Ang sumusunod na batas ay magkatulad.

§5. Pamamahagi ng sample na data ng pagmamasid sa pangkalahatang populasyon.

Ang pangwakas na layunin ng anumang VN ay upang makilala ang pangkalahatang populasyon.

Ang mga halaga na kinakalkula mula sa mga resulta ng VN ay ipinamamahagi sa pangkalahatang populasyon, na isinasaalang-alang ang limitasyon ng kanilang marginal error.

Ipagpalagay na ang pagkonsumo ng yogurt bawat buwan ng isang tao.

£250-20m£250+20; £230m£270

At 1000 tao lang

£230,000m£270,000

48%-5%£p£48%+5%

§6. Maliit na sample.

Sa pagsasagawa ng istatistikal na pananaliksik sa mga modernong kondisyon, lalong kinakailangan na harapin ang maliliit na sample.

Maliit na sample - obserbasyon sample na bilang ng mga yunit na hindi lalampas sa 30, n £ 30 /

Ang pagbuo ng teorya ng maliit na sampling ay ginawa ng English statistician na si Gosset, na sumulat sa ilalim ng pseudonym student noong 1908.

Pinatunayan niya na ang pagtatantya ng pagkakaiba sa pagitan ng mga paraan ng isang maliit na sample at ang pangkalahatang sample ay may isang espesyal na batas sa pamamahagi. Kapag nagkalkula para sa isang maliit na sample, ang halaga ng s 2 ay hindi kinakalkula. t st para sa posibleng mga limitasyon ng error gamitin ang criterion ng mag-aaral. Pahina 44-45. ay ang posibilidad ng kabaligtaran na kaganapan.

Bilang ng antas ng kalayaan

nililimitahan ang maliit na sample na error

marginal share error

Paksa 8: Pagsusuri at pagmomodelo ng ugnayan-regression.

§isa. Ang konsepto ng ugnayan at CRA.

§2. Mga kundisyon para sa paggamit at mga paghihigpit ng KRA.

§3. Ipares ang regression batay sa least squares method.

§apat. Application ng isang ipinares na linear regression equation.

§5. Mga tagapagpahiwatig ng higpit ng koneksyon at lakas ng koneksyon.

§6. Maramihang Kaugnayan.

§isa. Ang konsepto ng ugnayan at CRA.

Functional na koneksyon y=5x

ugnayan

Mayroong 2 uri ng koneksyon sa pagitan ng iba't ibang phenomena at ang kanilang sign, functional at statistical.

Ang ganitong koneksyon ay tinatawag na functional kapag, na may pagbabago sa halaga ng isa sa mga variable, ang pangalawa ay nagbabago sa isang mahigpit na tinukoy na paraan, ibig sabihin, ang halaga ng isang variable ay tumutugma sa isa o higit pang tiyak na tinukoy na mga halaga ng isa pang variable. . Ang isang functional na koneksyon ay posible lamang kapag ang variable na y ay nakasalalay sa variable na x at hindi nakasalalay sa anumang iba pang mga kadahilanan, ngunit sa totoong buhay ito ay imposible.

Ang isang istatistikal na relasyon ay umiiral kapag, na may pagbabago sa halaga ng isa sa mga variable, ang pangalawa ay maaaring kumuha ng anumang mga halaga sa loob ng ilang mga limitasyon, ngunit ang mga istatistikal na katangian nito ay nagbabago ayon sa isang tiyak na batas.

Ang pinakamahalagang partikular na kaso ng isang istatistikal na relasyon ay isang kaugnayang ugnayan. Sa isang ugnayan, ang iba't ibang mga halaga ng isang variable ay tumutugma sa iba't ibang mga average na halaga ng isa pang variable, i.e. na may pagbabago sa halaga ng attribute na x, ang average na halaga ng attribute na y ay nagbabago sa natural na paraan.

Ang salitang correlation ay ipinakilala ng English biologist at statistician na si Francis Gal (correlation)

Maaaring lumitaw ang ugnayan sa iba't ibang paraan:

sanhi ng pag-asa ng pagkakaiba-iba ng nagresultang katangian sa pagkakaiba-iba ng kadahilanang katangian.
Maaaring magkaroon ng ugnayan sa pagitan ng 2 epekto ng parehong dahilan (sunog, bilang ng mga bumbero, laki ng apoy)
Ang relasyon ng mga palatandaan, na ang bawat isa ay parehong sanhi at epekto sa parehong oras (produktibo sa paggawa at suweldo)

Sa mga istatistika, kaugalian na makilala sa pagitan ng mga sumusunod na uri ng pag-asa:

ugnayan ng pares - ang ugnayan sa pagitan ng 2 palatandaan ng resulta at factorial, o sa pagitan ng dalawang factorial.
bahagyang ugnayan - ang ugnayan sa pagitan ng mabisa at isang salik na katangian na may isang nakapirming halaga ng isa pang salik na katangian.
multiple correlation - ang pag-asa ng nagresultang katangian sa dalawa o higit pang mga kadahilanang katangian na kasama sa pag-aaral.

Ang gawain ng pagsusuri ng ugnayan ay upang mabilang ang lapit ng ugnayan sa pagitan ng mga tampok. Sa huling bahagi ng ika-19 na siglo, sinisiyasat nina Galton at Pearson ang kaugnayan sa pagitan ng taas ng mga ama at mga anak.

Sinusuri ng regression ang anyo ng relasyon. Ang gawain ng pagsusuri ng regression ay upang matukoy ang analytical expression ng relasyon.

Ang pagsusuri ng ugnayan-regression bilang isang pangkalahatang konsepto ay kinabibilangan ng pagbabago sa higpit ng koneksyon at ang pagtatatag ng isang analytical na pagpapahayag ng koneksyon.

§2. Mga kundisyon para sa paggamit at mga paghihigpit ng KRA.

ang pagkakaroon ng mass data, dahil ang ugnayan ay istatistikal
kinakailangan ang qualitative homogeneity ng populasyon.
pagpapailalim ng distribusyon ng populasyon ayon sa resulta at mga katangian ng salik, sa batas ng normal na pamamahagi, na nauugnay sa paggamit ng pamamaraan ng least squares.

§3. Ipares ang regression batay sa least squares method.

Ang pagsusuri ng regression ay binubuo sa pagtukoy ng analytical expression ng relasyon. Ang form ay nakikilala sa pagitan ng linear regression, na ipinahayag ng equation ng isang straight line, at non-linear regression o.

Ayon sa direksyon ng komunikasyon, sila ay nakikilala sa isang tuwid na linya, i.e. Habang tumataas ang x, tumataas ang y.

reverse

Baliktarin i.e. habang lumalaki ang x, bumababa ang y.

graphical na paraan - sa pamamagitan ng paglalagay ng empirical na data sa correlation field, ngunit ang isang mas tumpak na pagtatantya ay ginawa gamit ang least squares method.

X - aktwal na tanda

U - isang tanda ng epektibo

Ang pagkakaiba sa pagitan ng aktwal na halaga at ang halaga na kinakalkula ng squared coupling equation ay dapat na may pinakamababa.

Sa LSM min ay ang kabuuan ng mga squared deviations ng empirical values y mula sa theoretical values na nakuha ayon sa napiling regression equation.

Para sa isang linear na relasyon

Þ a,b

para sa parabola

Para sa hyperbole

ang mga parameter a,b,c ay isinusulat sa equation, pagkatapos ay papalitan natin ang resultang equation ng empirical value x i at hanapin ang teoretikal na halaga y i . Tapos nagkukumpara kami y i teoretikal at y i empirikal. Ang kabuuan ng mga parisukat ng pagkakaiba sa pagitan ng mga ito ay dapat na minimal. Pinipili namin ang uri ng pag-asa kung saan ginaganap ang pag-asa na ito.

Sa pairwise linear regression equation:

b ay ang koepisyent ng ipinares na linear regression, sinusukat nito ang lakas ng bono, i.e. nailalarawan ang average na paglihis ng populasyon ng y mula sa average na halaga nito sa bawat tinatanggap na yunit ng pagsukat.

b\u003d 20 kapag ang x ay nagbago ng 1 sign y ay lumihis mula sa average na halaga nito ng 20 sa average sa populasyon.

Ang isang positibong palatandaan sa koepisyent ng pagbabalik ay nagpapahiwatig ng isang direktang ugnayan sa pagitan ng mga tampok, ang tanda na "-" ay nagpapahiwatig ng isang puna sa pagitan ng mga tampok.

§apat. Application ng isang ipinares na linear regression equation.

Ang pangunahing aplikasyon ay ang pagtataya ayon sa regression equation. Ang pagtataya ay nililimitahan ng mga kondisyon ng katatagan ng iba pang mga kadahilanan at mga kondisyon ng proseso. Kung ang kapaligiran ng patuloy na proseso ay nagbabago nang husto sa loob nito, kung gayon ang equation ng regression na ito ay hindi magaganap.

Ang pagtataya ng punto ay nakukuha sa pamamagitan ng pagpapalit ng inaasahang halaga ng salik sa equation ng regression. Ang posibilidad ng eksaktong pagpapatupad ng naturang pagtataya ay napakaliit.

Kung ang isang pagtataya ng punto ay sinamahan ng isang halaga ng average na error sa pagtataya, kung gayon ang gayong pagtataya ay tinatawag na isang pagtataya sa pagitan.

Ang average na error sa pagtataya ay nabuo mula sa dalawang uri ng mga error:

type 1 errors - error sa linya ng regression
error of the 2nd kind - isang error na nauugnay sa error ng variation.

Average na error sa pagtataya.

Error sa posisyon ng linya ng regression sa pangkalahatang populasyon

n - laki ng sample

x k - maling halaga ng salik

RMS ng resultang katangian mula sa linya ng regression sa pangkalahatang populasyon

Ang pagsusuri ng ugnayan ay nagsasangkot ng pagtatasa ng higpit ng koneksyon. Mga tagapagpahiwatig:

linear correlation coefficient - nailalarawan ang higpit at direksyon ng relasyon sa pagitan ng dalawang tampok sa kaso ng isang linear na relasyon sa pagitan nila

sa =-1 ang koneksyon ay functional inverse, =1 ang koneksyon ay functional direct, sa =0 walang koneksyon.

Ito ay ginagamit lamang para sa mga linear na relasyon, ito ay ginagamit upang suriin ang mga relasyon sa pagitan ng quantitative na mga katangian. Kinakalkula lamang sa mga indibidwal na halaga.

ratio ng ugnayan:

Empirical: ang parehong uri ng pagkakaiba ay kinakalkula ayon sa resultang katangian.

Teoretikal:

Ang pagpapakalat ng mga halaga ng epektibong tampok na kinakalkula ng equation ng regression

Ang pagpapakalat ng empirical na halaga ng nagresultang tampok

mataas na antas ng katumpakan
angkop para sa pagtatasa ng lapit ng ugnayan sa pagitan ng isang deskriptibo at quantitative na tampok, ngunit ang quantitative ay dapat na epektibo
angkop para sa lahat ng uri ng koneksyon

Koepisyent ng ugnayan ng Spearman

Mga ranggo - mga serial number ng mga unit ng populasyon sa ranggo na serye. Kinakailangang i-rank ang parehong mga feature sa parehong pagkakasunud-sunod mula sa pinakamaliit hanggang sa pinakamalaki o vice versa. Kung ang mga ranggo ng mga yunit ng populasyon ay tinutukoy ng p x at p y, kung gayon ang koepisyent ng ugnayan ng mga ranggo ay kukuha ng sumusunod na anyo:

Mga kalamangan ng coefficient ng serye ng ugnayan:

Maaari ka ring mag-ranggo ayon sa mga mapaglarawang tampok na hindi maaaring ipahayag ayon sa numero, samakatuwid, ang pagkalkula ng koepisyent ng Spearman ay posible para sa mga sumusunod na pares ng mga tampok: numero - numero; deskriptibo - quantitative; Deskriptibo - naglalarawan. (ang edukasyon ay isang mapaglarawang katangian)
nagpapakita ng direksyon ng koneksyon

Mga disadvantages ng Spearman coefficient.

Ang magkaparehong mga pagkakaiba sa ranggo ay maaaring tumugma sa ganap na magkakaibang mga pagkakaiba sa halaga ng isang katangian (sa kaso ng mga quantitative traits). Halimbawa: Ang pagbuo ng kuryente ng bansa bawat taon

USA 2400 kWh 1

RF 800 kWh 2

Canada 600 kWh 3

Kung maraming magkakaparehong halaga ang naganap sa mga halaga ng Spearman, pagkatapos ay nabuo ang mga kaugnay na ranggo, i.e. parehong gitnang numero

Sa kasong ito, ang koepisyent ng Spearman ay kinakalkula bilang mga sumusunod:

j- bilang ng mga link sa pagkakasunud-sunod para sa tampok na x

Aj- ang bilang ng magkaparehong ranggo sa j na mga link sa pamamagitan ng x

k- ligament number sa pagkakasunud-sunod ng feature y

Bk- ang bilang ng magkatulad na ranggo sa alin isang grupo ng

4. Kendall rank correlation coefficient

Pinakamataas na halaga ng ranggo

S ay ang aktwal na kabuuan ng mga ranggo

Nagbibigay ng mas mahigpit na pagtatantya kaysa sa Spearman coefficient.

Para sa pagkalkula, ang lahat ng mga yunit ay niraranggo ayon sa katangian x ayon sa katangian sa para sa bawat ranggo, ang bilang ng mga kasunod na ranggo na lumalampas sa ibinigay na kabuuan ay kinakalkula, na tinutukoy ng P at ang bilang ng mga kasunod na ranggo sa ibaba ng pagtatalagang Q.

P+Q= 1 / 2 n(n-1)

Fechner rank correlation coefficient.

Koepisyent ng Fechner - isang sukatan ng higpit ng koneksyon sa anyo ng ratio ng pagkakaiba sa bilang ng mga pares ng pagtutugma at di-nagkataon na mga palatandaan sa kabuuan ng mga numerong ito.

pagkalkula ng mga average para sa x at y
ang mga indibidwal na halaga x i y i ay inihambing sa mga average na halaga na may obligadong indikasyon ng "+" o "-" na senyas. Kung ang mga palatandaan ay tumutugma sa x at y, pagkatapos ay tinutukoy namin ang mga ito sa numerong "C", kung hindi, pagkatapos ay sa "H".
bilangin ang bilang ng magkatugma at hindi magkatugmang mga pares.

Ang gawain ng pagsukat ng relasyon ay nauuna sa statistician na may kaugnayan sa mga mapaglarawang katangian, isang mahalagang espesyal na kaso ng naturang gawain, pagsukat ng kaugnayan sa pagitan ng 2 alternatibong mga tampok, ang isa ay ang sanhi ng iba pang kahihinatnan.

Ang higpit ng ugnayan sa pagitan ng 2 alternatibong tampok ay maaaring masukat gamit ang 2 coefficient:

koepisyent ng asosasyon
contingency factor

Ang contingency coefficient ay may disbentaha: kapag ang isa sa dalawang heterogenous na kumbinasyon Av o Ba ay katumbas ng zero, ang koepisyent ay nagiging isa. Siya ay napaka-liberal na tinatasa ang higpit ng koneksyon - pinahahalagahan niya ito.

Ang ratio ng Pearson

Kung walang dalawa, ngunit mas posibleng mga halaga ng bawat isa sa mga magkakaugnay na tampok, ang mga sumusunod na coefficient ay kinakalkula:

Ang ratio ng Pearson
Chuprov coefficient para sa isang mapaglarawang tampok

Ang koepisyent ng Pearson ay kinakalkula mula sa mga square matrice

	Mas mababa sa normal

hanggang 1 at hanggang 2 - ang bilang ng pangkat ayon sa mga palatandaan 1 at 2, ayon sa pagkakabanggit. Ang kawalan ng koepisyent ng Pearson ay hindi ito umabot sa 1 kahit na may pagtaas sa bilang ng mga grupo.

Chuprov coefficient (1874–1926)

ang Chuprov coefficient ay mas mahigpit na tinatantya ang higpit ng koneksyon.

§6. Maramihang Kaugnayan.

Ang pag-aaral ng relasyon sa pagitan ng resulta at dalawa o higit pang mga katangian ng salik ay tinatawag maramihang pagbabalik. Sa pag-aaral ng mga dependency sa pamamagitan ng mga pamamaraan ng multiple regression, 2 gawain ang nakatakda.

pagpapasiya ng analytical expression ng relasyon sa pagitan ng mabisang tampok na y at ang aktwal na mga tampok x 1 , x 2 , x 3 , ... x k, i.e. hanapin ang function na y \u003d f (x 1, x 2, ... x k)
Pagsusuri ng higpit ng ugnayan sa pagitan ng epektibo at bawat isa sa mga palatandaan ng kadahilanan.

Ang Correlation-regression model (CRM) ay isang regression equation na kinabibilangan ng mga pangunahing salik na nakakaapekto sa variation ng resultang attribute.

Ang pagbuo ng isang modelo ng maramihang regression ay kinabibilangan ng mga sumusunod na hakbang:

pagpili ng paraan ng komunikasyon
pagpili ng mga tampok na kadahilanan
Pagtiyak na ang populasyon ay sapat na malaki upang magbigay ng mga tamang pagtatantya.

I. ang buong hanay ng mga ugnayan sa pagitan ng mga variable na nakatagpo sa pagsasanay ay lubos na inilarawan ng mga function ng 5 uri:

linear:
kapangyarihan:
nagpapahiwatig:
parabola:
hyperbola:

bagama't ang lahat ng 5 function ay naroroon sa pagsasagawa ng CRA, ang linear dependence ay kadalasang ginagamit, bilang ang pinakasimple at pinakamadaling maipaliwanag na linear dependence equation: , k - isang set ng mga salik na kasama sa equation, bj

0 - dahil >0.7 samakatuwid binibigyang-pansin namin sila

ECO. Skala ng higpit ng komunikasyon:

Kung ang koneksyon ay 0 - 0.3 - isang mahina na koneksyon

0.3 - 0.5 - kapansin-pansin

0.3 - 0.5 - malapit

0.7 - 0.9 - mataas

higit sa 0.9 - napakataas

pagkatapos ay inihambing namin ang dalawang tampok (kita at kasarian)<0,7, то включаем в уравнение множественной регрессии.

Pagpili ng mga salik na isasama sa multiple regression equation:

dapat mayroong ugnayang sanhi sa pagitan ng epektibo at aktwal na mga palatandaan.
ang epektibo at aktwal na mga palatandaan ay dapat na malapit na nauugnay sa isa't isa, kung hindi, ang kababalaghan ay lumitaw multicollinearity (>06) , ibig sabihin. ang mga palatandaan ng kadahilanan na kasama sa equation ay nakakaapekto hindi lamang sa resulta, ngunit sa bawat isa, na humahantong sa isang hindi tamang interpretasyon ng numerical data.

Mga pamamaraan para sa pagpili ng mga salik na isasama sa multiple regression equation:

1. ekspertong pamamaraan – batay sa intuitive logical analysis na isinagawa ng mga highly qualified na eksperto.

2. ang paggamit ng mga matrice ng ipinares na mga coefficient ng ugnayan ay isinasagawa nang kahanay sa unang pamamaraan, ang matrix ay simetriko na may paggalang sa unit diagonal.

3. stepwise regression analysis - ang sunud-sunod na pagsasama ng mga factor feature sa regression equation at significance testing ay isinasagawa batay sa mga halaga ng dalawang indicator sa bawat hakbang. Kaugnayan, tagapagpahiwatig ng pagbabalik.

Correlation Score: Kalkulahin ang pagbabago sa theoretical correlation ng ratio o ang pagbabago sa mean residual variance. Ang regression indicator ay ang pagbabago sa conditional pure regression coefficient.

Kabuuan

Dapat ipakita ang istatistikal na data sa paraang magagamit ang mga ito. Mayroong 3 pangunahing paraan ng paglalahad ng istatistikal na datos:

1) teksto - ang pagsasama ng data sa teksto;

2) tabular - pagtatanghal ng data sa mga talahanayan;

3) graphic - ang pagpapahayag ng data sa anyo ng mga graph.

Ang text form ay ginagamit kapag may maliit na halaga ng digital data.

Ang tabular form ay madalas na ginagamit, dahil ito ay isang mas mahusay na paraan ng paglalahad ng istatistikal na data. Hindi tulad ng mga talahanayan ng matematika, na, ayon sa mga paunang kundisyon, ay nagpapahintulot sa isa o ibang resulta na makuha, ang mga istatistikal na talahanayan ay nagsasabi sa wika ng mga numero tungkol sa mga bagay na pinag-aaralan.

Talahanayan ng istatistika- ito ay isang sistema ng mga hilera at hanay, kung saan ang istatistikal na impormasyon tungkol sa mga socio-economic phenomena ay ipinakita sa isang tiyak na pagkakasunud-sunod at koneksyon.

Talahanayan 2. Dayuhang kalakalan ng Russian Federation para sa 2000 - 2006, bilyong dolyar

Index	2000	2001	2002	2003	2004	2005	2006
Paglipat ng kalakalan sa dayuhan	149,9	155,6	168,3		280,6	368,9	468,4
I-export		101,9	107,3	135,9	183,2	243,6	304,5
Angkat	44,9	53,8		76,1	97,4	125,3	163,9
Balanse sa kalakalan	60,1	48,1	46,3	59,9	85,8	118,3	140,7
kasama ang:
kasama ang ibang bansa
i-export	90,8	86,6	90,9	114,6		210,1	261,1
angkat	31,4	40,7	48,8		77,5	103,5	138,6
balanse ng kalakalan	59,3	45,9	42,1	53,6	75,5	106,6	122,5

Halimbawa, sa talahanayan. 2 ay naglalahad ng impormasyon tungkol sa kalakalang panlabas ng Russia, na magiging hindi mahusay na ipahayag sa anyong tekstuwal.

Makilala paksa at panaguri talahanayan ng istatistika. Ang paksa ay nagpapahiwatig ng nailalarawan na bagay - alinman sa mga yunit ng populasyon, o mga pangkat ng mga yunit, o ang kabuuan sa kabuuan. Sa panaguri, ang katangian ng paksa ay ibinibigay, kadalasan sa anyong numerical. Sapilitan header talahanayan, na nagsasaad kung saang kategorya at kung anong oras nabibilang ang data sa talahanayan.

Ayon sa likas na katangian ng paksa, ang mga talahanayan ng istatistika ay nahahati sa simple lang, pangkat at kumbinasyonal. Sa paksa ng isang simpleng talahanayan, ang bagay ng pag-aaral ay hindi nahahati sa mga grupo, ngunit alinman sa isang listahan ng lahat ng mga yunit ng populasyon ay ibinigay, o ang populasyon sa kabuuan ay ipinahiwatig (halimbawa, Talahanayan 11). Sa paksa ng talahanayan ng pangkat, ang bagay ng pag-aaral ay nahahati sa mga pangkat ayon sa isang katangian, at ang panaguri ay nagpapahiwatig ng bilang ng mga yunit sa mga pangkat (ganap o bilang isang porsyento) at mga tagapagpahiwatig ng buod para sa mga pangkat (halimbawa, Talahanayan 4). Sa paksa ng talahanayan ng kumbinasyon, ang populasyon ay nahahati sa mga pangkat hindi ayon sa isa, ngunit ayon sa ilang pamantayan (halimbawa, Talahanayan 2).

Kapag gumagawa ng mga talahanayan, dapat kang magabayan ng mga sumusunod pangkalahatang tuntunin.

1. Ang paksa ng talahanayan ay matatagpuan sa kaliwa (mas madalas - itaas) na bahagi, at ang panaguri - sa kanan (mas madalas - mas mababa).

2. Ang mga heading ng column ay naglalaman ng mga pangalan ng mga indicator at ang kanilang mga unit.

3. Kinukumpleto ng huling linya ang talahanayan at matatagpuan sa dulo nito, ngunit kung minsan ito ang una: sa kasong ito, ang pangalawang linya ay nakasulat na "kabilang", at ang mga kasunod na linya ay naglalaman ng mga bahagi ng kabuuang linya.

4. Ang numeric na data ay nakasulat na may parehong antas ng katumpakan sa loob ng bawat column, na may mga digit ng mga numero na matatagpuan sa ilalim ng mga digit, at ang integer na bahagi ay pinaghihiwalay mula sa fractional comma.

5. Hindi dapat may mga walang laman na cell sa talahanayan: kung ang data ay zero, pagkatapos ay ang "–" sign (gitling) ay ilagay; kung ang data ay hindi alam, pagkatapos ay ang entry na "walang impormasyon" ay ginawa o ang sign "..." (ellipsis) ay ilagay. Kung ang halaga ng exponent ay hindi zero, ngunit ang unang makabuluhang digit ay lilitaw pagkatapos ng tinatanggap na antas ng katumpakan, pagkatapos ay 0.0 ang naitala (kung, sabihin nating, isang antas ng katumpakan na 0.1 ang tinanggap).

Minsan ang mga istatistikal na talahanayan ay dinadagdagan ng mga graph kapag ang layunin ay bigyang-diin ang ilang tampok ng data, upang ihambing ang mga ito. Ang graphical na anyo ay ang pinaka-epektibong paraan ng pagtatanghal ng data sa mga tuntunin ng kanilang pang-unawa. Sa tulong ng mga graph, ang kakayahang makita ang mga katangian ng istraktura, dynamics, ang relasyon ng mga phenomena, at ang kanilang paghahambing ay nakakamit.

Mga Statistical Graph- ito ay mga kondisyong larawan ng mga numerical na halaga at ang kanilang mga ratio sa pamamagitan ng mga linya, geometric na hugis, mga guhit o mga geograpikal na tsart. Pinapadali ng graphical na anyo ang pagsasaalang-alang ng istatistikal na data, ginagawa itong visual, nagpapahayag, at nakikita. Gayunpaman, ang mga graph ay may ilang mga limitasyon: una sa lahat, ang isang graph ay hindi maaaring magsama ng mas maraming data na maaari itong magkasya sa isang talahanayan; bilang karagdagan, ang graph ay palaging nagpapakita ng bilugan na data - hindi eksakto, ngunit tinatayang. Kaya, ang graph ay ginagamit lamang upang ipakita ang pangkalahatang sitwasyon, hindi ang mga detalye. Ang huling sagabal ay ang pagiging kumplikado ng paglalagay. Maaari itong malampasan gamit ang isang personal na computer (halimbawa, ang "Diagram Wizard" mula sa package Microsoft Office Excel).

Ayon sa paraan ng pagbuo ng mga graphics, nahahati sila sa mga diagram, mga cartogram at mga diagram ng tsart.

Ang pinakakaraniwang paraan ng graphical na representasyon ng data ay mga chart, na nasa mga sumusunod na uri: linear, radial, scatter, planar, volumetric, curly. Ang uri ng mga diagram ay depende sa uri ng data na ipinakita at ang gawain sa pagtatayo. Sa anumang kaso, ang graph ay dapat na sinamahan ng isang heading - sa itaas o sa ibaba ng field ng graph. Isinasaad ng pamagat kung aling indicator ang ipinapakita, para sa aling teritoryo at para sa anong oras.

Ginagamit ang mga line graph upang kumatawan sa mga quantitative variable: mga katangian ng variation ng kanilang mga value, dynamics, mga relasyon sa pagitan ng mga variable. Nasusuri ang pagkakaiba-iba ng datos gamit ang lugar ng pamamahagi, nag-iipon(mas mababa sa kurba) at ogives(curve "mas malaki kaysa"). Ang polygon ng pamamahagi ay tinalakay sa Paksa 4 (hal. Fig. 5.). Upang bumuo ng isang pinagsama-samang, ang mga halaga ng variable na tampok ay naka-plot sa kahabaan ng abscissa, at ang mga ordinate ay ang mga naipon na kabuuan ng mga frequency o frequency (mula sa f1 sa ∑ f). Upang bumuo ng isang ogive, ang mga naipon na kabuuan ng mga frequency ay inilalagay sa y-axis sa reverse order (mula sa ∑ f dati f1). Pagsama-samahin at ogive ayon sa Talahanayan. 4. ilarawan sa fig. isa.

kanin. 1. Pinagsasama-sama at mga ogives ng pamamahagi ng mga kalakal ayon sa halaga ng halaga ng customs

Ang paggamit ng mga line chart sa trend analysis ay sakop sa Topic 5 (eg Figure 13) at ang kanilang paggamit para sa link analysis sa Topic 6 (eg Figure 21). Ang Paksa 6 ay sumasaklaw din sa paggamit ng mga scatter plot (hal. Figure 20).

Ang mga line chart ay nahahati sa one-dimensional, ginagamit upang kumatawan sa data sa isang variable, at dalawang-dimensional- para sa dalawang variable. Ang isang halimbawa ng isang one-dimensional na line graph ay isang distribution polygon, at ang isang two-dimensional ay isang regression line (hal., Fig. 21).

Minsan, na may malalaking pagbabago sa indicator, ginagamit ang isang logarithmic scale. Halimbawa, kung ang mga halaga ng isang tagapagpahiwatig ay nag-iiba mula 1 hanggang 1000, kung gayon maaari itong magdulot ng mga kahirapan kapag nagpaplano. Sa ganitong mga kaso, lumipat sila sa mga logarithms ng mga halaga ng tagapagpahiwatig, na hindi gaanong magkakaiba: lg 1 = 0, lg 1000 = 3.

Among planar Ang mga graph ng bar (histograms) ay nakikilala ayon sa dalas ng paggamit, kung saan ang tagapagpahiwatig ay ipinakita bilang isang bar, ang taas nito ay tumutugma sa halaga ng tagapagpahiwatig (halimbawa, Fig. 4).

Ang proporsyonalidad ng lugar ng isang partikular na geometric figure sa halaga ng indicator ay sumasailalim sa iba pang mga uri ng planar diagram: tatsulok, parisukat, hugis-parihaba. Maaari ka ring gumamit ng paghahambing ng mga lugar ng isang bilog - sa kasong ito, ang radius ng bilog ay nakatakda.

strip chart nagpapakita ng mga tagapagpahiwatig sa anyo ng mga pahalang na nakaunat na mga parihaba, at kung hindi man ay kapareho ng isang bar chart.

Sa mga planar diagram, madalas itong ginagamit pie chart, na ginagamit upang ilarawan ang istruktura ng pinag-aralan na populasyon. Ang buong set ay kinuha bilang 100%, ito ay tumutugma sa kabuuang lugar ng bilog, ang mga lugar ng mga sektor ay tumutugma sa mga bahagi ng set. Bumuo tayo ng isang diagram ng sektor ng istraktura ng dayuhang kalakalan ng Russian Federation noong 2006 ayon sa Talahanayan. 2 (tingnan ang fig. 2). Kapag gumagamit ng mga programa sa computer, ang mga diagram ng sektor ay binuo sa tatlong-dimensional na anyo, iyon ay, hindi sa dalawa, ngunit sa tatlong eroplano (tingnan ang Fig. 3).

kanin. 2. Simpleng pie chart 3. 3D Pie Chart

Ang mga diagram ng kulot (larawan) ay nagpapahusay sa kalinawan ng imahe, dahil kasama nila ang isang larawan ng ipinapakitang tagapagpahiwatig, ang laki nito ay tumutugma sa laki ng tagapagpahiwatig.

Kapag nagpaplano ng isang graph, ang lahat ay pantay na mahalaga - ang tamang pagpili ng isang graphic na imahe, mga proporsyon, pagsunod sa mga patakaran para sa pagdidisenyo ng mga graph. Ang mga isyung ito ay sakop nang mas detalyado sa at.

Ang mga cartogram at cartogram ay ginagamit upang ilarawan ang mga katangiang heograpikal ng mga phenomena na pinag-aaralan. Ipinakikita nila ang lokasyon ng hindi pangkaraniwang bagay sa ilalim ng pag-aaral, ang intensity nito sa isang tiyak na teritoryo - sa isang republika, rehiyon, pang-ekonomiya o administratibong distrito, atbp Ang pagtatayo ng mga cartogram at cartogram ay isinasaalang-alang sa mga espesyal na panitikan, halimbawa.

Pagtatapos ng trabaho -

Ang paksang ito ay kabilang sa:

Ang konsepto ng istatistika. Ang paksa at pamamaraan ng mga istatistika

Ang konsepto ng istatistika.. paksa at paraan ng istatistika.. istatistikal na pagmamasid..

Kung kailangan mo ng karagdagang materyal sa paksang ito, o hindi mo nakita ang iyong hinahanap, inirerekumenda namin ang paggamit ng paghahanap sa aming database ng mga gawa:

Ano ang gagawin natin sa natanggap na materyal:

Kung ang materyal na ito ay naging kapaki-pakinabang para sa iyo, maaari mo itong i-save sa iyong pahina sa mga social network:

Lahat ng mga paksa sa seksyong ito:

Ang paksa at pamamaraan ng mga istatistika
Ang terminong "statistics" ay ipinakilala sa siyentipikong paggamit ng German scientist na si Gottfried Achenwal noong 1746, na iminungkahi na palitan ang pamagat ng kursong "State Studies" na itinuro sa mga unibersidad ng Aleman ng "St.

Pagmamasid sa istatistika
Ang mga tao ay may iba't ibang mga saloobin sa istatistikal na impormasyon: ang ilan ay hindi naiintindihan ito, ang iba ay walang pasubali na naniniwala, at ang iba pa ay sumasang-ayon sa opinyon ng Ingles na politiko na si Disraeli: "Mayroong 3 uri ng kasinungalingan: kasinungalingan,

Buod at pagpapangkat ng mga istatistika
Buod - organisadong siyentipikong pagproseso ng mga materyales sa pagmamasid (ayon sa isang naunang binuo na programa), na kinabibilangan, bilang karagdagan sa ipinag-uutos na kontrol ng nakolektang data, sistematisasyon, pagpapangkat

Mga ganap na halaga
Upang makilala ang mass phenomena, ang mga istatistika ay gumagamit ng mga istatistikal na dami (mga tagapagpahiwatig) na nagpapakilala sa mga pangkat ng mga yunit o isang pinagsama-samang (phenomenon) sa kabuuan. Mga istatistikal na dami

Mga kamag-anak na halaga
Ang isang kamag-anak na halaga ay ang resulta ng paghahati (paghahambing) ng dalawang ganap na halaga. Ang numerator ng fraction ay ang halagang inihahambing, at ang denominator ay ang halaga na inihahambing sa (ba

Average na mga halaga
Gaya ng nasabi nang maraming beses bago, pinag-aaralan ng mga istatistika ang mga mass phenomena at mga proseso. Ang bawat isa sa mga phenomena na ito ay parehong karaniwan sa buong set at espesyal, indibidwal na mga katangian.

Pagbuo ng serye ng pamamahagi
Ang mga katangiang pinag-aralan ng mga istatistika ay nag-iiba-iba (naiiba sa isa't isa) para sa iba't ibang yunit ng populasyon sa parehong panahon o punto ng oras. Halimbawa, nag-iiba ang halaga ng foreign trade turnover

Pagkalkula ng mga katangian ng istruktura ng serye ng pamamahagi
Kapag nag-aaral ng pagkakaiba-iba, ang mga naturang katangian ng isang serye ng pamamahagi ay ginagamit na naglalarawan sa dami ng istraktura, istraktura nito. Ang ganyan, halimbawa, ay ang median - ang halaga ng variable na katangian

Pagkalkula ng mga sukat ng laki at intensity ng pagkakaiba-iba
Ang pinakasimpleng tagapagpahiwatig ay ang hanay ng pagkakaiba-iba - ang ganap na pagkakaiba sa pagitan ng maximum at minimum na mga halaga ng isang katangian mula sa mga halaga na magagamit sa pinag-aralan na populasyon (24):

Pagkalkula ng mga sandali ng pamamahagi at mga tagapagpahiwatig ng hugis nito
Para sa karagdagang pag-aaral ng likas na katangian ng pagkakaiba-iba, ang mga average na halaga ng iba't ibang antas ng mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa arithmetic mean na halaga nito ay ginagamit. Ang mga tagapagpahiwatig na ito ay tinatawag

Sinusuri kung normal ang serye ng pamamahagi
Ang teoretikal na kurba ng pamamahagi ay nauunawaan bilang isang graphic na representasyon ng isang serye sa anyo ng isang tuluy-tuloy na linya ng pagbabago ng dalas sa isang variational series, na gumagana na nauugnay sa isang pagbabago sa mga opsyon, iba pa

Sinusuri kung ang serye ng pamamahagi ay sumusunod sa batas ni Poisson
Ang customs inspection ay nagsagawa ng inspeksyon pagkatapos ilabas ang mga kalakal. Bilang resulta, nakuha ang sumusunod na discrete distribution series ng bilang ng mga paglabag na natukoy sa bawat pagsubok (Talahanayan 16). Talahanayan 1

Mga ganap at kamag-anak na tagapagpahiwatig ng pagbabago ng istraktura
Ang pag-unlad ng isang istatistikal na populasyon ay ipinakita hindi lamang sa dami ng paglaki o pagbaba sa mga elemento ng sistema, kundi pati na rin sa isang pagbabago sa istraktura nito. Ang istraktura ay ang istraktura ng pinagsama-samang

Mga tagapagpahiwatig ng ranggo ng pagbabago ng istraktura
Upang sukatin ang mga pagkakaiba sa istraktura, hindi gaanong tumpak, ngunit mas madaling kalkulahin, ang mga tagapagpahiwatig ay kadalasang ginagamit, na batay sa pagtatasa ng mga pagkakaiba hindi sa mga halaga ng mga pagbabahagi mismo, ngunit sa kanilang mga ranggo, iyon ay, ordinal.

Ang konsepto ng selective observation
Ang paraan ng sampling ay ginagamit kapag ang paggamit ng tuluy-tuloy na pagmamasid ay pisikal na imposible dahil sa isang malaking halaga ng data o hindi matipid na magagawa. Mayroong pisikal na imposibilidad

Mga pamamaraan ng sampling
1. Talagang random na pagpili: lahat ng mga yunit ng HS ay binibilang, at ang mga numero na iginuhit bilang resulta ng draw ay tumutugma sa mga yunit na nahulog sa sample, at ang bilang ng mga numero ay katumbas ng nakaplanong numero

Average na sampling error
Matapos makumpleto ang pagpili ng kinakailangang bilang ng mga yunit sa sample at pagrehistro ng mga katangian ng mga yunit na ito na ibinigay para sa programa ng pagmamasid, nagpapatuloy sila sa pagkalkula ng mga pangkalahatang tagapagpahiwatig. sa kanila mula sa

Marginal sampling error
Isinasaalang-alang na sa batayan ng isang sample na survey imposibleng tumpak na masuri ang pangkalahatang katangian ng HS, kinakailangan upang mahanap ang mga limitasyon kung saan ito matatagpuan. Sa isang partikular na sample, ang pagkakaiba

Kinakailangang laki ng sample
Kapag bumubuo ng isang programa ng pumipili na pagmamasid, binibigyan sila ng isang tiyak na halaga ng marginal error at ang antas ng posibilidad. Ang pinakamababang laki ng sample na nagbibigay ng ibinigay

Mga Alituntunin
Isang gawain. Sa negosyo, 100 manggagawa sa 1000 ang kinapanayam sa pagkakasunud-sunod ng isang random na hindi paulit-ulit na sample at ang mga sumusunod na data ay nakuha sa kanilang kita para sa buwan (talahanayan 24): Ta

Ang konsepto ng time series
Ang isa sa pinakamahalagang gawain ng mga istatistika ay ang pag-aaral ng mga pagbabago sa nasuri na mga tagapagpahiwatig sa paglipas ng panahon, iyon ay, ang kanilang mga dinamika. Ang problemang ito ay nalutas sa pamamagitan ng pagsusuri sa serye ng mga dinamika (serye ng oras).

Mga tagapagpahiwatig ng mga pagbabago sa mga antas ng isang serye ng mga dinamika
Ang pagsusuri ng mga serye ng oras ay nagsisimula sa pagtukoy kung paano nagbabago ang mga antas ng serye (tumaas, bumaba o nananatiling hindi nagbabago) sa ganap at kaugnay na mga termino. Upang masubaybayan

Mga average na tagapagpahiwatig ng isang serye ng mga dinamika
Ang bawat serye ng dynamics ay maaaring ituring bilang isang tiyak na hanay ng mga n indicator na nagbabago sa paglipas ng panahon, na maaaring ibuod bilang mga average na halaga. Ang mga naturang pangkalahatan (average) na mga tagapagpahiwatig ay lalo na

Mga pamamaraan para sa pagtukoy ng pangunahing kalakaran (trend) sa serye ng dynamics
Ang isa sa mga pangunahing gawain ng pag-aaral ng serye ng mga dinamika ay ang tukuyin ang pangunahing kalakaran (pattern) sa pagbabago ng mga antas ng serye, na tinatawag na trend. Regularidad sa pagbabago ng mga antas ng isang serye sa ilang mga kaso

Trend Adequacy Assessment at Pagtataya
Para sa nahanap na equation ng trend, kinakailangan upang masuri ang pagiging maaasahan nito (kasapatan), na karaniwang isinasagawa gamit ang Fisher criterion, paghahambing ng kinakalkula na halaga nito Fр

Pana-panahong Pagsusuri
Sa serye ng mga dinamika, ang mga antas kung saan ay buwanan o quarterly na mga tagapagpahiwatig, kasama ang mga random na pagbabagu-bago, ang mga pana-panahong pagbabago ay madalas na sinusunod, na nauunawaan bilang pana-panahon.

Mga Alituntunin
Ayon sa Federal State Statistics Service, ang balanse ng dayuhang kalakalan (SVT) ng Russia para sa panahon 2000-2006. nailalarawan sa pamamagitan ng isang bilang ng mga dinamika na ipinakita sa Talahanayan. 36. Talahanayan 36. Foreign trade balance (CBT) ng Russia para sa p

Ang konsepto ng pag-asa sa ugnayan
Ang isa sa mga pinaka-pangkalahatang batas ng layunin ng mundo ay ang batas ng unibersal na koneksyon at pag-asa sa pagitan ng mga phenomena. Naturally, kapag sinisiyasat ang mga phenomena sa pinaka magkakaibang larangan, ang mga istatistika ay hindi maiiwasang magbanggaan

Mga pamamaraan para sa pagtukoy at pagsusuri ng mga ugnayan
Ang isang bilang ng mga pamamaraan ay ginagamit sa mga istatistika upang matukoy ang presensya at likas na katangian ng isang ugnayan sa pagitan ng dalawang mga tampok. 1. Pagsasaalang-alang ng parallel data (kn

I-ranggo ang mga koepisyent ng ugnayan
Ang mga koepisyent ng ugnayan ng ranggo ay hindi gaanong tumpak, ngunit mas madaling kalkulahin, ang mga hindi parametric na tagapagpahiwatig para sa pagsukat ng lapit ng ugnayan sa pagitan ng dalawang magkaugnay na tampok. Kabilang dito ang

Mga kakaiba ng ugnayan ng serye ng oras
Sa maraming mga pag-aaral, kinakailangang pag-aralan ang dinamika ng ilang mga tagapagpahiwatig nang sabay-sabay, i.e. isaalang-alang ang ilang serye ng oras nang magkatulad. Sa kasong ito, kinakailangan upang sukatin ang pagtitiwala

Mga tagapagpahiwatig ng higpit ng ugnayan sa pagitan ng mga katangian ng husay
Ang pamamaraan ng mga talahanayan ng ugnayan ay naaangkop hindi lamang sa dami, kundi pati na rin sa mga deskriptibo (kwalitibo) na mga tampok, ang ugnayan sa pagitan ng kung saan madalas na kailangang pag-aralan kapag nagsasagawa ng iba't ibang mga sosyologo.

Maramihang Kaugnayan
Kapag nilulutas ang mga praktikal na problema, nahaharap ang mga mananaliksik sa katotohanan na ang mga ugnayan ay hindi limitado sa mga relasyon sa pagitan ng dalawang tampok: epektibong y at kadahilanan x. Sa aksyon

Layunin at uri ng mga indeks
Ang index ay isang kamag-anak na halaga na nagpapakita kung gaano karaming beses ang antas ng pinag-aralan na phenomenon sa ilalim ng mga partikular na kundisyon ay naiiba sa antas ng parehong phenomenon sa ilalim ng ibang mga kundisyon. Ang pagkakaiba sa mga kondisyon ay maaaring

Indibidwal na mga indeks
Ang kamag-anak na halaga na nakuha sa pamamagitan ng paghahambing ng mga antas ay tinatawag na isang indibidwal na index kung ang istraktura ng hindi pangkaraniwang bagay na pinag-aaralan ay hindi mahalaga. Ang mga indibidwal na index ay tinutukoy ng i

Mga pangkalahatang index
Kung ang hindi pangkaraniwang bagay na pinag-aaralan ay heterogenous at ang paghahambing ng mga antas ay maaari lamang gawin pagkatapos na dalhin ang mga ito sa isang karaniwang sukat, ang pagsusuri sa ekonomiya ay isinasagawa sa pamamagitan ng pangkalahatang mga indeks. Ang index ay nagiging pangkalahatan

Mean Index
Kapag nag-aaral ng mga tagapagpahiwatig ng husay, madalas na kinakailangang isaalang-alang ang pagbabago sa oras (o espasyo) ng average na halaga ng isang na-index na tagapagpahiwatig para sa isang tiyak na homogenous na populasyon.

Mga indeks ng teritoryo
Ginagamit ang mga indeks ng teritoryo para sa spatial, interregional na paghahambing ng iba't ibang indicator. Ang kanilang pagkalkula ay mas kumplikado kaysa sa pagkalkula ng tradisyonal (dynamic) na mga indeks na isinasaalang-alang

Dapat ipakita ang istatistikal na data sa paraang magagamit ang mga ito. Mayroong 3 pangunahing paraan ng paglalahad ng istatistikal na datos:

1) teksto - ang pagsasama ng data sa teksto;

2) tabular - pagtatanghal ng data sa mga talahanayan;

3) graphic - ang pagpapahayag ng data sa anyo ng mga graph.

Ang text form ay ginagamit kapag may maliit na halaga ng digital data.

Talahanayan 2. Dayuhang kalakalan ng Russian Federation para sa 2000 - 2006, bilyong dolyar

Index	2000	2001	2002	2003	2004	2005	2006
Paglipat ng kalakalan sa dayuhan	149,9	155,6	168,3		280,6	368,9	468,4
I-export		101,9	107,3	135,9	183,2	243,6	304,5
Angkat	44,9	53,8		76,1	97,4	125,3	163,9
Balanse sa kalakalan	60,1	48,1	46,3	59,9	85,8	118,3	140,7
kasama ang:
kasama ang ibang bansa
i-export	90,8	86,6	90,9	114,6		210,1	261,1
angkat	31,4	40,7	48,8		77,5	103,5	138,6
balanse ng kalakalan	59,3	45,9	42,1	53,6	75,5	106,6	122,5

Halimbawa, sa talahanayan. 2 ay naglalahad ng impormasyon tungkol sa kalakalang panlabas ng Russia, na magiging hindi mahusay na ipahayag sa anyong tekstuwal.

Kapag gumagawa ng mga talahanayan, dapat kang magabayan ng mga sumusunod pangkalahatang tuntunin.

1. Ang paksa ng talahanayan ay matatagpuan sa kaliwa (mas madalas - itaas) na bahagi, at ang panaguri - sa kanan (mas madalas - mas mababa).

2. Ang mga heading ng column ay naglalaman ng mga pangalan ng mga indicator at ang kanilang mga unit.

Ayon sa paraan ng pagbuo ng mga graphics, nahahati sila sa mga diagram, mga cartogram at mga diagram ng tsart.

kanin. 1. Pinagsasama-sama at mga ogives ng pamamahagi ng mga kalakal ayon sa halaga ng halaga ng customs

strip chart nagpapakita ng mga tagapagpahiwatig sa anyo ng mga pahalang na nakaunat na mga parihaba, at kung hindi man ay kapareho ng isang bar chart.

kanin. 2. Simpleng pie chart 3. 3D Pie Chart

Ang halaga ng graphical na pamamaraan sa pagsusuri at paglalahat ng data ay mahusay. Ang graphic na imahe, una sa lahat, ay nagbibigay-daan upang makontrol ang pagiging maaasahan ng mga istatistikal na tagapagpahiwatig, dahil, na ipinakita sa graph, mas malinaw nilang ipinapakita ang mga umiiral na mga kamalian na nauugnay alinman sa pagkakaroon ng mga error sa pagmamasid o sa kakanyahan ng kababalaghan sa ilalim ng pag-aaral. Sa tulong ng isang graphic na imahe, posible na pag-aralan ang mga pattern ng pag-unlad ng isang kababalaghan, upang magtatag ng mga umiiral na relasyon. Ang isang simpleng paghahambing ng data ay hindi palaging ginagawang posible upang mahuli ang pagkakaroon ng mga ugnayang sanhi, sa parehong oras, ang kanilang graphical na representasyon ay nakakatulong upang makilala ang mga ugnayang sanhi, lalo na sa kaso ng pagtatatag ng mga paunang hypotheses, na pagkatapos ay napapailalim sa karagdagang pag-unlad.

Statistical Graph- ito ay isang pagguhit kung saan ang mga pinagsama-samang istatistika na nailalarawan ng ilang mga tagapagpahiwatig ay inilalarawan gamit ang mga kondisyong geometric na imahe o mga palatandaan. Graphic na larawan ay isang koleksyon ng mga punto, linya at hugis na kumakatawan sa istatistikal na datos. Mga pantulong na elemento ang mga graphics ay:

Ang field ng graph ay isang bahagi ng eroplano kung saan matatagpuan ang mga graphic na larawan. Ang field ng graph ay may ilang partikular na dimensyon, na nakadepende sa layunin nito.

Ang mga spatial landmark ng graph ay itinakda sa anyo ng isang sistema ng mga coordinate grid. Ang sistema ng coordinate ay kinakailangan para sa paglalagay ng mga geometric na simbolo sa field ng graph. Parehong hugis-parihaba at polar coordinate system ang ginagamit.

Ginagamit ang mga scale landmark upang ihambing ang graphical na pagpapakita ng bagay at ang aktwal na laki nito. Ang mga iskala na palatandaan ay itinatakda ng isang sistema ng mga sukat ng sukat o mga palatandaan ng sukat.

Ang pagpapaliwanag ng graph ay binubuo ng paliwanag ng bagay na inilalarawan ng graph (pangalan), at ang semantikong kahulugan ng bawat sign na ginamit sa graph.

Ang mga istatistikang graph ay inuri ayon sa kanilang layunin (nilalaman), ang paraan ng pagbuo at ang likas na katangian ng graphic na imahe (Larawan 1).

Fig.1. Pag-uuri ng mga istatistikal na graph

Ayon sa paraan ng pagbuo ng mga graphic na imahe, mayroong:

Mga diagram- isang graphical na representasyon ng istatistikal na data, na malinaw na nagpapakita ng kaugnayan sa pagitan ng mga inihambing na halaga.

Mga mapa ng istatistika

Mayroong mga sumusunod na pangunahing uri ng mga tsart: linya, bar, strip, sektor, parisukat, pabilog, kulot.

Mga line chart ay ginagamit upang makilala ang dinamika, i.e. pagtatasa ng mga pagbabago sa phenomena sa paglipas ng panahon. Ang abscissa ay nagpapakita ng mga yugto ng oras o mga petsa, at ang ordinate ay nagpapakita ng mga antas ng isang serye ng mga dinamika. Maaaring ilagay ang ilang chart sa isang graph, na nagbibigay-daan sa iyong paghambingin ang dynamics ng iba't ibang indicator, o isang indicator para sa iba't ibang rehiyon o bansa.

Fig.2. Ang dinamika ng dami ng mga pag-import ng mga pampasaherong sasakyan sa Russian Federation

para sa 2006-1q. 2010

Mga bar chart maaaring gamitin:

upang pag-aralan ang dynamics ng socio-economic phenomena;

pagsusuri ng pagpapatupad ng plano;

mga katangian ng pagkakaiba-iba sa serye ng mga pamamahagi;

para sa spatial na paghahambing (mga paghahambing sa mga teritoryo, bansa, kumpanya);

upang pag-aralan ang istruktura ng mga phenomena.

Ang mga haligi ay matatagpuan malapit o hiwalay sa parehong distansya. Ang taas ng mga column ay dapat na proporsyonal sa mga numerical na halaga ng mga antas ng tampok.

Fig.3. Dynamics ng bahagi ng Belarus sa trade turnover ng Russian Federation kasama ang mga bansang CIS

Upang makilala ang istraktura ng socio-economic phenomena ay malawakang ginagamit pie chart. Upang maitayo ito, ang bilog ay dapat nahahati sa mga sektor na proporsyon sa tiyak na gravity ng mga bahagi sa kabuuang dami. Ang kabuuan ng mga tiyak na timbang ay katumbas ng 100%, na tumutugma sa kabuuang dami ng hindi pangkaraniwang bagay na pinag-aaralan.

Fig.4. Geographic na pamamahagi ng trade turnover sa pagitan ng Russian Federation at ng mga bansang CIS

Mga bar chart binubuo ng mga parihaba na nakaayos nang pahalang (mga guhit).

Minsan para sa paghahambing na pagsusuri ayon sa rehiyon, ginagamit ng mga bansa figure sign diagram(mga diagram ng mga geometric na hugis). Ang mga diagram na ito ay sumasalamin sa laki ng pinag-aralan na bagay alinsunod sa laki ng lugar nito.

Mga mapa ng istatistika ay ginagamit upang masuri ang heograpikal na pamamahagi ng mga phenomena at paghahambing na pagsusuri ayon sa teritoryo.

Kasama sa mga istatistikang mapa ang mga cartogram at cartogram. Ang pagkakaiba sa pagitan ng mga ito ay nakasalalay sa paraan ng pagpapakita ng mga istatistika sa mga mapa.

Cartogram ay nagpapakita ng teritoryal na pamamahagi ng katangiang pinag-aaralan sa magkakahiwalay na mga lugar at ginagamit upang matukoy ang mga pattern ng pamamahagi na ito. Ang mga Cartogram ay nahahati sa background at point. Ang mga background cartogram na may iba't ibang density ng kulay ay nagpapakilala sa intensity ng anumang indicator sa loob ng isang teritoryal na yunit. Sa isang tuldok na cartogram, ang antas ng napiling phenomenon ay inilalarawan gamit ang mga tuldok.

Cartogram- ito ay isang kumbinasyon ng isang heograpikal na mapa o ang scheme nito na may diagram. Pinapayagan ka nitong ipakita ang mga detalye ng bawat rehiyon sa pamamahagi ng hindi pangkaraniwang bagay na pinag-aaralan, ang mga tampok na istruktura nito.

Sa kasalukuyan, ang iba't ibang mga pakete ng software para sa mga computer graphics ay binuo, halimbawa, Excel, Statgraf, Statistica.