Charakterystyka statystyczna i badania. Graficzna prezentacja informacji statystycznych


1. Pojęcie statystyki

Statystyka to jedna z najstarszych gałęzi wiedzy, które powstały na gruncie rachunkowości ekonomicznej. Jej pojawienie się wiąże się z potrzebami społeczeństwa w różnego rodzaju informacjach.

Uważa się, że termin statystyka pochodzi od łacińskich słów stato (państwo) i status (stanowisko, państwo).

W szerokim sensie statystyka jest rozumiana jako nauka badająca zjawiska masowe i ich prawidłowości z ilościowego punktu widzenia.

Ogólna teoria statystyki jest nauką metodologiczną, nauką o metodzie, która ma zastosowanie do identyfikacji wzorców w dowolnym obszarze, w którym wnioski oparte są na obserwacji masowej, gdzie występuje zmienność znaku w poszczególnych elementach populacji, gdzie ogólne wzorce mogą przejawiać się jedynie poprzez wzajemne zniesienie losowości w poszczególnych jednostkach.

2. Statystyka jako nauka

2.1 Sposoby tworzenia statystyk

Rozwój statystyki jako nauki szedł w dwóch kierunkach:

Pierwszy kierunek powstał w Niemczech i jest znany jako studia państwowe lub szkoła opisowa. Przedstawiciele tej szkoły za swoje główne zadanie uważali opisywanie zabytków państwa bez analizowania schematów i relacji między nimi. Założycielem szkoły opisowej był niemiecki naukowiec Hermann Konring.

Drugi kierunek rozwoju statystyki powstał w Anglii i jest znany jako arytmetyka polityczna. Przedstawiciele tej szkoły za swoje główne zadanie uznali ujawnienie, na podstawie dużej liczby obserwacji, różnych prawidłowości i wzajemnych powiązań badanych zjawisk. Założycielem szkoły był William Petty.

2.2 Przedmiot statystyki i podstawowe pojęcia

Belgijski matematyk Adolphe Ketie podsumował teoretyczne informacje z badań państwowych oraz praktyczną pracę przedstawicieli szkoły arytmetyki politycznej. On również dał definicja przedmiotu statystyki – są to zjawiska masowe, związane z życiem społeczeństwa i człowieka. Widział też w statystyce narzędzie poznania społecznego.

Charakterystyczne cechy zjawisk masowych:

1. Każdy element zestawu posiada zarówno cechy indywidualne lub wyróżniające, jak i wspólne lub podobne.

2. Charakterystyki jednego z elementów zjawiska masowego nie można uzyskać na podstawie charakterystyk innych elementów.

Definicja: Zjawiska masowe badane przez statystykę w postaci zbioru jednostek podobnej jakości o różnych indywidualnych cechach nazywane są agregatami statystycznymi. Na tej podstawie możemy powiedzieć, że przedmiotem statystyki są różne agregaty statystyczne, których badanie wiąże się z charakterystyką ilościową i identyfikacją ich nieodłącznych wzorców. Całość statystyczna jest jednym z głównych pojęć nauk statystycznych. Wiąże się również z takimi pojęciami jak: jednostka populacji. Definicja: Elementy, których zbiór tworzy badany zbiór, nazywamy jednostkami. Znaki jednostek populacji:

Każdą jednostkę populacji można scharakteryzować różnego rodzaju cechami jakościowymi i ilościowymi.

Jeśli dany atrybut ma różne wartości dla określonych jednostek populacji, nazywa się to zmiennością. Definicja: wzorzec zidentyfikowany na podstawie obserwacji masowej, tj. przejawiająca się w dużej masie zjawisk poprzez przezwyciężenie wrodzonej przypadkowości jej poszczególnego elementu, nazywana jest prawidłowością statystyczną. Głównym zadaniem statystyki jest abstrahowanie od losowości i identyfikacja typowa, regularna.

Istnieją trzy sposoby identyfikacji wzorców:

1. logiczne;

2. empiryczne;

3. w oparciu o prawo wielkich liczb.


2.3 Metoda statystyki

Obserwacja masowa, grupowanie i podsumowywanie jej wyników, obliczanie i analiza wskaźników uogólniających. Wszystko to razem daje metodę statystyki.

3. Obserwacja statystyczna

3.1 Obserwacja statystyczna jako etap badań statystycznych. Plan obserwacji statystycznych

Obserwacja statystyczna to pierwszy etap badań statystycznych.

Definicja: Obserwacja statystyczna to naukowo zorganizowany zbiór danych masowych na temat badanych procesów i zjawisk, który jest przeprowadzany zgodnie z wcześniej zaprojektowanym programem.

Wymagania dotyczące danych zbiorczych:

Dane statystyczne muszą być wystarczająco kompletne. Każde zjawisko ma wiele powiązanych ze sobą cech. Kompletność danych zapewnia pokrycie najważniejszych cech niezbędnych do uzyskania obiektywnych wniosków. Jeżeli dane z obserwacji statystycznych odnoszą się do różnych okresów, terytoriów, to konieczne jest zapewnienie ich porównywalności. Przez porównywalność informacji statystycznych rozumie się jednolitość ich jednostek miary, szacunkowych kosztów, granic terytoriów administracyjnych, charakterystyk czasowych itp. Przed rozpoczęciem obserwacji statystycznej wymagane jest ustalenie procedury jej realizacji. W tym celu opracowywany jest szczegółowy plan monitorowania, który zawiera:

1. część programowa i metodyczna:

2. część organizacyjna.

1. Zagadnienia programowe i metodologiczne planu obserwacji.

Ta część planu powinna zawierać:

a) cel i cele obserwacji:

b) obiekt i jednostki podlegające pomiarom;

c) program monitorowania.

Program obserwacji to lista pytań, na które oczekuje się odpowiedzi podczas ankiety. Program powinien wyróżniać się kompletnością informacji i szerokością zasięgu. Sformułowania pytań powinny być jak najkrótsze i jasne, wykluczać nieścisłości i niejasności w odpowiedziach, w razie potrzeby podana jest wskazówka dla jednolitej interpretacji i zrozumienia pytań. Programowa część metodologiczna obserwacji wskazuje na specyficzne narzędzia badania statystycznego, tj. formularze, które powinny zawierać odpowiedzi na sformułowane pytania, a także instrukcje ich wypełniania.

2. Zagadnienia organizacyjne planu obserwacji.

W celu pomyślnej organizacji obserwacji i kompletności pokrycia populacji opracowywany jest plan organizacyjny obserwacji.

W Stanach:

a) przedmiot obserwacji:

b) termin i miejsce badania;

c) organizacja zbierania danych i technologii ich przetwarzania.


3.2 Formy i rodzaje obserwacji statystycznych

Formy, rodzaje i metody obserwacji statystycznej.

Formy organizacyjne obserwacji statystycznych

Rodzaje obserwacji statystycznych

Metody obserwacji statystycznej

do czasu rejestracji faktów

przez pokrycie jednostek ludności

1. Sprawozdawczość statystyczna.

2. Specjalnie zorganizowana obserwacja.

3. Zarejestruj obserwację.

1. Aktualny lub ciągły.

2. Nieciągły:

a) okresowe;

b) jeden raz.

1. Solidny.

2. Nieciągły:

a) selektywne;

b) główna tablica;

c) monografia.


1. Natychmiast.

2. Dokument.

a) spedycja;

b) samorejestracja;

c) korespondent;

d) kwestionariusz;

e) asystent.

W statystyce krajowej stosuje się trzy formy organizacyjne (typy) obserwacji statystycznej:

1. Raportowanie- jest to główna forma obserwacji statystycznej, za pomocą której urzędy statystyczne otrzymują niezbędne dane od przedsiębiorstw, instytucji i organizacji w określonym czasie w postaci prawnie ustalonych dokumentów sprawozdawczych, podpisanych przez osoby odpowiedzialne za ich dostarczanie i wiarygodność zebranych informacji.

Wspólne: telefon, dalekopis, poczta.

2. Specjalnie zorganizowany nadzór ma na celu uzyskanie informacji, których nie ma w zgłoszeniu, lub weryfikację jego danych. Statystyka praktyczna prowadzi spisy ludności, zasobów materialnych, plantacji wieloletnich, sprzętu zdemontowanego, budowy sprzętu w toku itp. Oprócz spisów w statystyce prowadzone są również inne specjalnie zorganizowane obserwacje, w szczególności badania budżetowe charakteryzujące strukturę wydatków konsumentów i dochód rodziny.

3. Nadzór nad rejestrem jest formą ciągłej statystycznej obserwacji długotrwałych procesów, które mają ustalony początek, etap rozwoju i ustalony koniec. Opiera się na prowadzeniu rejestru statystycznego. Rejestr to system, który stale monitoruje stan jednostki obserwacji i ocenia siłę wpływu różnych czynników na badane wskaźniki.

W praktyce statystycznej rozróżnia się ewidencje ludności i ewidencje przedsiębiorstw.

Rodzaje obserwacji statystycznych do czasu rejestracji faktów

Bieżąca obserwacja prowadzona jest systematycznie w miarę zachodzących zjawisk. Przy okresowych obserwacjach rejestracja badanych zjawisk odbywa się w określonych, zwykle identycznych odstępach czasu. Jednorazową obserwację przeprowadza się jednorazowo w celu rozwiązania problemu lub w razie potrzeby powtarza się epizodycznie po określonym czasie.

Rodzaje obserwacji statystycznych według pokrycia jednostek populacji

Przy ciągłej obserwacji rejestrowane są wszystkie jednostki populacji bez wyjątku. W obserwacji wybiórczej bada się losowo wybraną część jednostek populacji w celu scharakteryzowania całej populacji.

Przy niedoskonale ciągłej obserwacji (matrycy głównej) bada się główną część populacji i celowo wyklucza się pewną część, o której wiadomo, że nie odgrywa ona dużej roli w charakterystyce całej populacji. Obserwacja monograficzna polega na szczegółowym opisie niewielkiej liczby lub pojedynczych typowych jednostek populacji.

Metody rejestrowania faktów lub metody pozyskiwania materiału pierwotnego

Bezpośrednia obserwacja odbywa się poprzez rejestrację badanych jednostek i ich charakterystyk przez specjalnie wyznaczone osoby na podstawie bezpośredniego oględzin, liczenia, ważenia, odczytów przyrządów itp. Obserwacja dokumentacyjna opiera się na wykorzystaniu różnych podstawowych dokumentów księgowych przedsiębiorstw, instytucji i organizacji jako źródła informacji statystycznych. W trakcie badania materiały statystyczne pozyskiwane są poprzez rejestrację odpowiedzi udzielonych przez ankietowane osoby. Spedycja polega na tym, że specjalnie przeszkoleni rejestratorzy wypełniają formuły za pomocą ankiety, jednocześnie kontrolując swobodę otrzymywanych informacji. Podczas samodzielnej rejestracji lub samokalkulacji pracownicy urzędów statystycznych rozdają ankietowanym ankiety, instruują ich, a następnie zbierają wypełnione formularze, kontrolując kompletność i poprawność otrzymanych informacji. Badanie ankietowe polega na tym, że opracowana ankieta jest wysyłana do kręgu osób, a po wypełnieniu zwracana jest organom prowadzącym obserwacje. Korespondent polega na zorganizowaniu przez urzędy statystyczne specjalnej sieci korespondentów z osób mieszkających w terenie, którzy prowadzą obserwacje zgodnie z opracowanym formularzem i instrukcjami oraz przekazują informacje urzędom statystycznym. Niezamówione przewiduje przekazywanie informacji organom prowadzącym nadzór na zasadzie niezamówionej.

4. Podsumowanie i grupowanie statystyk

4.1 Zadania i rodzaje podsumowania statystycznego


Definicja: Podsumowanie to zestaw sekwencyjnych operacji uogólniających określone pojedyncze fakty, które tworzą zbiór w celu zidentyfikowania typowych cech i wzorców nieodłącznie związanych z badanym zjawiskiem jako całością.

Tak więc, jeśli podczas obserwacji statystycznych zbierane są dane dotyczące każdej jednostki obiektu, to wynikiem podsumowania są dane szczegółowe, które odzwierciedlają jego całość jako całość.

Podsumowanie statystyczne powinno opierać się na wstępnej teoretycznej analizie zjawisk i procesów.

Zgodnie z głębokością obróbki materiału podsumowania są zarówno proste, jak i złożone.

Proste podsumowanie to operacja obliczania sum dla zestawu jednostek obserwacji.

Kompleksowe zestawienie to zestaw operacji obejmujący grupowanie jednostek obserwacji, zliczanie sum dla każdej grupy i całego obiektu oraz prezentowanie wyników grupowania i podsumowania w postaci tabel statystycznych.

Podsumowanie poprzedzone jest opracowaniem programu, na który składają się następujące kroki:

Wybór funkcji grupowania;

Ustalenie kolejności tworzenia grup;

Opracowanie systemu wskaźników statystycznych do scharakteryzowania grup i obiektu jako całości;

Opracowanie układów tabel statystycznych, w których należy prezentować wyniki podsumowania.

Zgodnie z przetwarzaniem materiału podsumowanie jest zdecentralizowane i scentralizowane.

Dzięki zdecentralizowanemu podsumowaniu (jest ono wykorzystywane z reguły w przetwarzaniu sprawozdawczości statystycznej) opracowanie materiału odbywa się w kolejnych etapach. W ten sposób raporty przedsiębiorstw są podsumowywane przez urzędy statystyczne podmiotów wchodzących w skład Federacji Rosyjskiej, a wyniki dla regionu są już przesyłane do Państwowego Komitetu Statystycznego Rosji, a tam wskaźniki dla gospodarki narodowej jako całości są ustalona. Dzięki scentralizowanemu podsumowaniu cały materiał pierwotny trafia do jednej organizacji, gdzie jest przetwarzany od początku do końca. Scentralizowane podsumowanie jest zwykle wykorzystywane do przetwarzania materiałów z jednorazowych badań statystycznych. Zgodnie z techniką wykonania podsumowanie statystyczne dzieli się na zmechanizowane i ręczne.

W celu przeprowadzenia podsumowania sporządzany jest plan określający kwestie organizacyjne: przez kogo i kiedy będą wykonywane wszystkie operacje, tryb ich przeprowadzania oraz skład informacji publikowanych w prasie periodycznej.


4.2 Metoda grupowania w statystyce

Grupowanie statystyczne to podział całego zbioru materiałów na grupy i podgrupy według cech istotnych dla kompleksowego badania zjawisk i procesów życia społecznego.

Podstawowy znak nazywa się grupowaniem.

Do budowania grup w statystykach wykorzystuje się głównie dwa rodzaje funkcji:

1. ilościowe (liczbowe);

2. jakościowe (atrybucyjne).

Grupowanie na tej samej podstawie nazywa się prosty, a grupowanie według dwóch lub więcej cech wziętych w połączeniu ze sobą nazywa się kombinacyjny(trudny).

Po wybraniu atrybutu grupującego wybierana jest liczba grup. Jeżeli grupowanie opiera się na cesze jakościowej, to kwestia liczby grup rozwiązuje się automatycznie – będzie ich tyle, ile stanów jakościowych badanej populacji (jej jednostek).

Podczas grupowania według cech ilościowych pojawia się pytanie o określenie przedziałów grupowania. Wartość interwału to różnica między maksymalną a minimalną wartością atrybutu w każdej grupie. W zależności od charakteru rozkładów jednostek populacji dla danej cechy, przedziały mogą być różne i nierówne pod względem wielkości. Jeżeli rozkład cechy w granicach jej zmienności jest wystarczająco równomierny, to zakres wahań cechy dzieli się na równe przedziały, których długość określa wzór:

gdzie XMak oraz Xmin odpowiednio maksymalna i minimalna wartość cechy w tej populacji,

n to liczba utworzonych grup.

Liczbę grup można ustalić na podstawie wcześniejszych badań. W przypadku, gdy musisz sam zdecydować o liczbie grup, możesz użyć formuły Sturgess, aby określić optymalną liczbę grup:



n - liczba grup

N to liczba jednostek populacji

Istnieją przedziały zamknięte, w których podane są granice górna i dolna, oraz przedziały otwarte, w których jest tylko jedna granica: górna lub dolna.

Grupowania statystyczne według zadań rozwiązywanych za ich pomocą dzielą się na:

Grupowanie typologiczne- jest to podział badanej populacji niejednorodnej jakościowo na klasy, typy społeczno-ekonomiczne, jednorodne grupy jednostek zgodnie z zasadami grupowania naukowego.

Strukturalny nazywana zgrupowaniem, w którym jednorodna populacja jest podzielona na grupy, które charakteryzują jej strukturę według jakiejś różnej cechy.

analityczny zwane grupowaniem, które ujawnia związek między badanymi zjawiskami a ich cechami.


4.3 Szeregi dystrybucyjne w statystyce

Szereg rozkładu statystycznego to uporządkowany rozkład jednostek populacji na grupy według pewnego zmiennego atrybutu.

W zależności od znaku będącego podstawą powstania szeregu rozdzielczego, istnieją:

1. Atrybutowe - szeregi dystrybucyjne zbudowane na podstawach jakościowych.

2. Wariacyjne - szeregi dystrybucyjne budowane na podstawie ilościowej. Każdy znak wariacji składa się z 2 elementów: wariantów i częstotliwości.

Warianty to indywidualne wartości cechy, które przybiera w serii wariacyjnej.

Częstotliwości to liczby poszczególnych wariantów lub każdej grupy serii odmian.

Częstotliwości nazywane są częstotliwościami, wyrażonymi w ułamkach jednostki lub jako procent całości.

W zależności od charakteru zmienności cechy istnieją:

1. Dyskretny szereg wariacyjny charakteryzuje rozkład jednostek populacji według atrybutu dyskretnego (wartość atrybutu ilościowego przyjmuje tylko wartości całkowite).

2. Seria zmienności interwałowej - jest odpowiednia dla ciągłej zmienności cechy, a także gdy zmienność dyskretna przejawia się w szerokim zakresie, tj. liczba opcji dla dyskretnej funkcji jest dość duża.

Najwygodniej jest analizować serie dystrybucji na podstawie ich wizerunku Ugaric.

Wielokąt jest używany podczas wyświetlania dyskretnych serii wariacyjnych.

Histogram jest pobierany w celu wyświetlenia serii zmian interwałowych.

5. Wskaźniki statystyczne

Wskaźnik statystyczny jest ilościową charakterystyką zjawisk i procesów społeczno-gospodarczych pod względem jakościowej pewności. Jakościowa pewność wskaźnika polega na tym, że jest on bezpośrednio powiązany z wewnętrzną treścią badanego zjawiska lub procesu, jego istotą.

Z reguły procesy i zjawiska badane przez statystykę są dość złożone, a ich istoty nie można odzwierciedlić za pomocą jednego pojedynczego wskaźnika. W takich przypadkach stosuje się system wskaźników statystycznych (zestaw powiązanych ze sobą wskaźników, który ma strukturę jednopoziomową lub wielopoziomową i ma na celu rozwiązanie określonego problemu statystycznego).


5.1 Wskaźniki bezwzględne i względne

Statystyki absolutne.

Wskaźniki statystyczne w postaci wartości bezwzględnych charakteryzują bezwzględne wymiary procesów i zjawisk badanych przez statystykę: ich masę, powierzchnię, objętość, długość; odzwierciedlają ich charakterystykę czasową, a także mogą reprezentować wielkość populacji, tj. liczba jego jednostek składowych.

Poszczególne wskaźniki bezwzględne z reguły uzyskuje się bezpośrednio w procesie obserwacji statystycznej w wyniku pomiaru, ważenia, liczenia i oceny interesującej nas cechy ilościowej.

Skonsolidowane wskaźniki wolumetryczne uzyskuje się w wyniku podsumowania i grupowania poszczególnych wartości (charakteryzują one objętość cechy lub objętość populacji zarówno jako całość dla badanego obiektu, jak i dla dowolnej jego części).

Bezwzględne wskaźniki statystyczne wyrażone są w następujących jednostkach miary:

Naturalne (tony, kilogramy, kilometry, sztuki);

Koszt (ocena pieniężna zjawisk i procesów społeczno-gospodarczych);

Praca (osobodni, roboczogodziny).

Statystyki względne.

Wskaźnik względny jest wynikiem podzielenia jednego wskaźnika bezwzględnego przez drugi i wyraża stosunek między ilościowymi charakterystykami procesów i zjawisk społeczno-gospodarczych. W liczniku wskaźnik nazywany jest wskaźnikiem bieżącym lub porównywanym, w mianowniku jest nazywany podstawą lub podstawą porównania.

Jeżeli przyjmie się podstawę porównania jako 1, to wskaźnik względny wyrażony jest we współczynnikach, jeżeli przyjmie się podstawę jako 100, to wyrażony jest w procentach (%), jeżeli dla 1000 wyrażony jest w ppm (% 0 ), jeśli za podstawę przyjmuje się 10.000, to jest ona wyrażona w decymiliach .

Procent z reguły stosuje się w przypadkach, gdy porównywany wskaźnik bezwzględny przekracza podstawowy wskaźnik nie więcej niż 2-3 razy. Odsetki powyżej 200-300 są zwykle zastępowane przez wielokrotność współczynnika.


5.2 Średnie (wartości)

Najpopularniejszą formą wskaźników statystycznych jest wartość średnia, będąca uogólnioną cechą ilościową cechy w populacji statystycznej w określonych warunkach miejsca i czasu.

Rozważ rodzaje średnich, które są obliczane dla przypadków, w których każdy z wariantów szeregu wariacyjnego występuje tylko raz (wówczas średnia nazywana jest prostą lub nieważoną) oraz gdy wariant lub przedziały się powtarzają (średnia ważona). Opcja liczby powtórzeń - częstotliwość. Przy wyborze takiego lub innego rodzaju średniej należy kierować się zasadą sensowności wyniku przy sumowaniu lub ważenia.

Średnia arytmetyczna.

X jest średnią mocy;

Z jest wykładnikiem, który określa typ średniej;

Xi - opcje;

mi – częstotliwości lub wagi statystyczne wariantów.

Średnia harmoniczna (z=-1).


Korepetycje

Potrzebujesz pomocy w nauce tematu?

Nasi eksperci doradzą lub zapewnią korepetycje z interesujących Cię tematów.
Złożyć wniosek wskazanie tematu już teraz, aby dowiedzieć się o możliwości uzyskania konsultacji.

§ 1. Pojęcia statystyki, prawidłowość statystyczna i totalność ..... 2

§2. Znaki jednostek populacji statystycznej, ich klasyfikacja ...... 2

§jeden. Pojęcie obserwacji statystycznej, jej przygotowanie ............... 4

§2. Rodzaje obserwacji statystycznych ............................................. .................. 5

§3. Błędy obserwacji ................................................ ............................................. 6

§4. Podsumowanie i grupowanie ................................................ ............... ................. 6

§5. Rodzaje grupowań statystycznych ............................................. ............ 6

§6. Tabele statystyczne ............................................. ... ............ 7

§7. Wykresy statystyczne ................................................ ............. ............ osiem

§jeden. Dystrybucja rzeczywista i teoretyczna ............................................. 21

§2. Krzywa rozkładu normalnego ............................................. 21

§3. Testowanie hipotezy o rozkładzie normalnym ...................... 21

§4. Kryteria zgodności: Pearson, Romanovsky, Kołmogorov........... 21

§5. Praktyczna wartość modelowania szeregów dystrybucyjnych ..... 22

§jeden. Pojęcie obserwacji selektywnej. Powody jego użycia ...... 23

§3. Błędy próbkowania ................................................ ............... 24

§4. Przykładowe zadania obserwacyjne............................................. 25

§5. Rozszerzenie danych z obserwacji próby na populację ogólną... 26

§6. Mała próbka ................................................ .............................. 26

§jeden. Pojęcie korelacji i CRA ............................................ 27

§2. Warunki korzystania i ograniczenia KPA ........................................... 27

§3. Regresja parowa oparta na metodzie najmniejszych kwadratów.. 28

§4. Zastosowanie sparowanego równania regresji liniowej ...... 29

§6. Korelacja wielokrotna............................................. 32


Temat 1.: Wprowadzenie do statystyki.

  1. pojęcia statystyki, prawidłowość statystyczna i populacja.
  2. znaki jednostek populacji statystycznej, ich klasyfikacja.
  3. przedmiot i metoda statystyki.

§ 1. Pojęcia statystyki, prawidłowość statystyczna i totalność.

Słowo statystyka pochodzi z łaciny „ status” w tłumaczeniu - stan, stan rzeczy.

Termin statystyka powstał w drugiej połowie XVIII wieku. W związku ze znajomością stanów badanie ich cech. Z tego samego czasu datuje się początek nauczania statystyki na uniwersytecie. W zależności od gałęzi badań statystycznych są to: statystyki ludności, przemysłu, rolnictwa itp. - stosowane statystyki.

Ogólna teoria statystyki to zbiór metod i technik gromadzenia, przetwarzania, prezentowania i analizowania danych liczbowych. Termin statystyka jest dziś używany w 3 znaczeniach:

  1. jako synonim słowa „dane”
  2. gałąź znaczeń, która łączy zasady i metody pracy z danymi liczbowymi charakteryzującymi zjawiska masowe (długość życia mężczyzn jest niższa niż kobiet)
  3. gałąź działalności praktycznej, której celem jest przetwarzanie i analiza danych liczbowych.

Statystyka umożliwia identyfikację i pomiar przebiegu procesów i zjawisk społeczno-gospodarczych oraz relacji między nimi w określonych warunkach miejsca i czasu.

Regularność odnosi się do powtarzalności, kolejności i kolejności zmian zjawisk.

Prawidłowość statystyczna – prawidłowość, w której konieczność jest nierozerwalnie związana w każdym pojedynczym zjawisku z przypadkiem i tylko w mnogości zjawisk przejawia się jako prawo. Koncepcji prawidłowości statystycznej przeciwstawia się pojęcie prawidłowości dynamicznej, która przejawia się w każdym zjawisku. (przykład: S koło =pr 2 niż > r tematy > S koło). Przedmiotem badań statystycznych jest zbiór statystyczny - zbiór jednostek, które mają charakter masowy, jednorodność, zdeterminowany integralnością i obecnością zmienności. Każdy pojedynczy element nazywany jest statystyczną jednostką populacji (ESS)

§2. Znaki jednostek zbiorowości statystycznej, ich klasyfikacja.

ECK mają pewne właściwości, które nazywamy cechami. Statystyka bada zjawiska poprzez ich cechy, im bardziej jednorodny zbiór, tym więcej cech wspólnych mają jego jednostki i tym mniej różnią się wartości tych cech.

Znak opisowy to znak, który można wyrazić tylko werbalnie.

  1. Znak ilościowy - znak, który można wyrazić liczbowo.
  2. Znak bezpośredni to właściwość bezpośrednio związana z charakterystycznym obiektem.
  3. Znak pośredni to właściwości nie samego obiektu charakteryzowanego, ale obiektu z nim związanego lub w nim zawartego.
  4. atrybut podstawowy jest wartością bezwzględną, którą można zmierzyć.
  5. cecha wtórna - wynik porównania cech pierwotnych jest mierzony bezpośrednio.
  6. znak naturalny - mierzony w sztukach, kg, tonach, litrach itp.
  7. znak pracy - mierzony w osobodniach, roboczogodzinach.
  8. atrybut wartości - mierzony w rublach, $, €, ₤.
  9. znak bezwymiarowy - pomiar w udziałach,%
  10. alternatywną cechą jest cecha, która przyjmuje tylko jedną wartość z kilku możliwych.
  11. znak dyskretny - przyjmuje tylko liczbę całkowitą, bez pośredniej.
  12. cecha ciągła to cecha, która przyjmuje dowolną wartość z określonego zakresu.
  13. Cecha czynnikowa to cecha, która zmienia inną cechę.
  14. cecha efektywna – cecha, która zmienia się pod cechą innej osoby
  15. chwilowy znak - znak mierzony w pewnym momencie.
  16. znak interwału - znak na określony czas.

Ta sama cecha może być jednocześnie sklasyfikowana według różnych klasyfikacji.

§3. Przedmiot i metoda statystyki.

Przedmiotem badań statystycznych są agregaty statystyczne – zbiór jednogatunkowych, zmiennych obiektów.

Specyfika przedmiotu statystyki determinuje specyfikę metody, obejmują one:

  1. zbieranie danych (obserwacja statystyczna, publikacja)
  2. generalizacja danych (podsumowanie, grupowanie)
  3. prezentacja danych (tabele i wykresy)
  4. analiza i interpretacja danych liczbowych (obliczanie średnich, analiza zmienności, KRA, szeregi dynamiki, indeksy)

Temat 2: Organizacja obserwacji statystycznych.

Podsumowanie i grupowanie danych.

§jeden. Pojęcie obserwacji statystycznej, jej przygotowanie.

§2. Rodzaje obserwacji statystycznych.

§3 Błędy obserwacji.

§4 Podsumowanie i grupowanie

§5 Rodzaje grupowań statystycznych.

§6 Tabele statystyczne.

§7 Wykresy statystyczne.

§jeden. Pojęcie obserwacji statystycznej, jej przygotowanie.

Wszelkie badania statystyczne rozpoczynają się od zebrania danych.

Źródła informacji:

  1. różne publikacje (gazety, czasopisma itp.)
  2. głównym źródłem publikowanych informacji statystycznych są publikacje organów statystyki państwowej (RF w 2001 r., Wydawnictwo GOSKOMSTAT).
  3. prowadzenie obserwacji statystycznych, tj. naukowo zorganizowane gromadzenie danych.

Obserwacja statystyczna to masowa, zaplanowana, naukowo zorganizowana obserwacja zjawiska życia społecznego i gospodarczego, polegająca na rejestrowaniu znaków dla każdej jednostki badanej populacji.

Proces obserwacji:

  1. Przygotowanie do obserwacji
  2. Prowadzenie masowego zbierania danych
  3. Przygotowywanie danych do przetwarzania
  4. Opracowanie propozycji usprawnienia obserwacji statystycznych.

Przygotowanie do obserwacji:

  1. Ustalenie celu i przedmiotu obserwacji
  2. Określenie składu znaków podlegających rejestracji
  3. Opracowanie dokumentów do zbierania danych
  4. Wybór jednostki sprawozdawczej i jednostki, względem której będzie prowadzona obserwacja.
  5. Konieczne jest określenie metod i środków pozyskiwania danych.

Problemy organizacyjne do rozwiązania:

  1. konieczne jest ustalenie składu służb prowadzących badanie
  2. poinformuj personel
  3. sporządzić harmonogram prac
  4. replikować dokumenty do zbierania danych

Przedmiotem obserwacji są zjawiska i procesy społeczno-gospodarcze.

Konieczne jest wyraźne zidentyfikowanie znaków do rejestracji.

Program obserwacyjny - lista znaków znaków podlegających rejestracji w procesie obserwacji.

Wymagania programu obserwacji:

  1. Program powinien zawierać istotne cechy, które bezpośrednio charakteryzują badane zjawisko, nie należy umieszczać w programie znaków posiadających zjawiska wtórne lub znaki, których wartości będą oczywiście zawodne lub w ogóle ich nie będzie.
  2. Pytania programu obserwacji powinny być precyzyjne i niedwuznaczne oraz łatwe do zrozumienia, aby uniknąć trudności w uzyskaniu odpowiedzi.
  3. Należy ustalić kolejność pytań.
  4. Program monitoringu powinien zawierać pytania o charakterze bezpośrednim w celu przeprowadzenia i wyjaśnienia zebranych danych.
  5. Aby zapewnić jednolitość otrzymywanych informacji, program sporządzany jest w formie dokumentu - zwanego formularzem statystycznym.

Formularz statystyczny to dokument pojedynczej próbki zawierający program i wyniki obserwacji.

Rozróżnia się formularz indywidualny (odpowiedzi na pytania dotyczące jednej jednostki obserwacji) i odpisany (informacje o kilku jednostkach populacji statystycznej).

Formularz i instrukcje jego wypełniania są narzędziami obserwacji statystycznej.

Wybór czasu obserwacji polega na rozwiązaniu 2 pytań: ustalenie daty krytycznej lub interwału, wyznaczenie okresu obserwacji.

Data krytyczna - konkretny dzień w roku, godzina dnia, od której znaki muszą być zarejestrowane dla każdej jednostki badanej populacji.

Okres obserwacji – czas, w którym wypełniane są formularze statystyczne, tj. czas potrzebny na zebranie danych.

Należy wziąć pod uwagę, że odległość okresu obserwacji od daty lub interwału krytycznego może prowadzić do obniżenia wiarygodności uzyskiwanych informacji.

§2. Rodzaje obserwacji statystycznych.

W statystyce krajowej stosuje się trzy formy obserwacji statystycznych.

  1. sprawozdawczość statystyczna przedsiębiorstw, organizacji, instytucji.
  2. specjalnie zorganizowana obserwacja statystyczna (spis itp.)
  3. rejestr - forma ciągłego statystycznego monitorowania długofalowych procesów

Obserwacja statystyczna jest klasyfikowana:

Według czasu obserwacji:

  • obserwacja bieżąca – prowadzona jest ciągła rejestracja znaków (urząd stanu cywilnego, przestępstwo itp.).
  • obserwacja okresowa - prowadzona jest w określonych odstępach czasu (standard życia w mieście Czelabińsk, koszt koszyka konsumenckiego, spis ludności).
  • Jednorazowa - obserwacja dokonana raz w określonym celu.

Według zasięgu jednostek ludności:

  • Ciągła obserwacja - należy uzyskać informacje o wszystkich ECC
  • Niepełna obserwacja
    • Metoda głównej tablicy - badane są najważniejsze jednostki badanej populacji (w celu zbadania przedsiębiorstwa inżynieryjnego regionu Czelabińska).
    • Selektywna obserwacja to losowy wybór ECC do obserwacji.
    • Obserwacja monograficzna - gdy obserwuje się jeden ECC, często wykorzystuje się je do opracowania programu obserwacji masowej.

W drodze zbierania danych:

  • Bezpośrednia obserwacja - sami rejestratorzy, poprzez bezpośredni pomiar, ważenie, ustalają fakt rejestracji podmiotu (dziecko w wieku poniżej 1 roku w poliklinice).
  • Obserwacja dokumentacyjna - wykorzystywane są różne dokumenty (sporządzanie deklaracji)

Sonda - niezbędne informacje uzyskujemy ze słów respondenta.

  • Ankieta spedycyjna – realizowana przez specjalnie przeszkolonych pracowników, którzy otrzymują niezbędne informacje na podstawie ankiety odpowiednich osób i sami zapisują odpowiedzi w formularzu. Badanie ekspedycyjne może być bezpośrednie (twarzą w twarz) lub pośrednie (ankieta telefoniczna)
  • Ankieta korespondencka - informacji udziela personel korespondentów wolontariuszy, metoda ta wymaga niewielkich nakładów finansowych, ale nie daje dokładnej wartości obserwacji.
  • Samodzielna rejestracja – formularze wypełniają sami respondenci, a rejestratorzy jedynie rozdają im formularze kwestionariuszy i wyjaśniają, jak je wypełnić.

§3. Błędy obserwacji

Głównym wymogiem stosowanym do obserwacji statystycznych jest dokładność.

Dokładność - stopień zgodności dowolnego charakterystycznego wskaźnika z wartością rzeczywistą ustaloną z materiałów obserwacji statystycznej.

Rozbieżność pomiędzy wartością obliczoną a rzeczywistą nazywamy błędem obserwacji, w zależności od przyczyn wystąpienia rozróżnia się: błędy rejestracji i błędy reprezentatywności. Błędy rejestracyjne dzielą się na losowe i systematyczne.

Błędy losowe - wynik działania czynników losowych (przemieszane wiersze, kolumny)

Błędy systematyczne - zawsze mają tendencję do przeszacowywania lub niedoszacowania wskaźnika. (wiek)

Błędy reprezentatywności są naturą obserwacji nieciągłych i powstają w wyniku niedokładnego odwzorowania próby całej pierwotnej populacji.

Po otrzymaniu formularzy statystycznych należy:

  1. sprawdzić kompletność zebranych danych.
  2. przeprowadzić kontrolę arytmetyczną opartą na wzajemnych relacjach różnych cech.
  3. przeprowadzić kontrolę logiczną w oparciu o znajomość relacji logicznych między cechami.

§4. Podsumowanie i grupowanie

Na podstawie zebranych danych nie można dokonać obliczeń i wyciągnąć wniosków, najpierw należy je podsumować i podsumować w jednej tabeli. Do tych celów stosuje się podsumowanie i grupowanie.

Podsumowanie - zestaw operacji sekwencyjnych służących do uogólnienia określonych pojedynczych faktów, które tworzą zbiór i identyfikują typowe cechy i wzorce tkwiące w badanym zjawisku jako całości.

Wódka prosta - licząca sumę dla ludności.

Kompleksowe podsumowanie to zestaw operacji służących do grupowania poszczególnych obserwacji, zliczania wyników dla każdej grupy i dla całego obiektu jako całości oraz prezentowania wyników w postaci tabel statystycznych.

W zależności od formy obróbki materiału podsumowanie może być zdecentralizowane, scentralizowane – takie podsumowanie jest realizowane z jednorazową obserwacją statystyczną.

Grupowanie - podział zbioru jednostek badanej populacji na grupy według określonych cech.

§5. Rodzaje grupowań statystycznych

Grupy można klasyfikować według struktury i treści.

Grupowanie analityczne charakteryzuje związek między cechami, z których jedna jest czynnikiem, a druga jest produktywna.

Edukacja

Niepełne wyższe

§6. Tabele statystyczne

Wyniki podsumowania i grupowania należy przedstawić w taki sposób, aby można było z nich korzystać.

Istnieją 3 sposoby prezentacji danych:

  1. dane mogą być zawarte w tekście.
  2. prezentacja w tabelach.
  3. graficzny sposób

Tabela statystyczna - układ wierszy i kolumn, w którym w określonej kolejności prezentowane są informacje statystyczne o zjawiskach społeczno-gospodarczych.

Rozróżnij podmiot i orzeczenie tabeli.

Temat to przedmiot, który charakteryzuje się liczbami, zwykle temat jest podany po lewej stronie tabeli.

Predykat to system wskaźników, którymi charakteryzuje się obiekt.

Tabela statystyczna zawiera 3 rodzaje nagłówków: ogólne, boczne

Ogólny tytuł powinien odzwierciedlać zawartość całej tabeli, znajdującej się nad tabelą pośrodku.

Zasady tabeli.

  1. wymagane są wszystkie trzy rodzaje nagłówków bez skrótów wyrazów, w nagłówku można umieścić wspólne jednostki miary.
  2. tabela nie powinna mieć dodatkowych linii, może brakować oznaczeń pionowych.
  3. Konieczna jest ostatnia linia. Może znajdować się na początku lub na końcu dokumentu. Jeśli na początku dokumentu to jeśli na końcu to RAZEM:
  1. dane cyfrowe w jednej kolumnie są rejestrowane z dokładnością jednego stopnia. Cyfry są pisane ściśle pod cyframi, cała część jest oddzielona przecinkiem.
  2. tabela nie powinna zawierać pustych komórek, jeśli nie ma danych, to piszą „Brak informacji” lub „...”, jeśli dane wynoszą zero, to „-”. Jeśli wartość nie jest równa zero, ale pierwsza cyfra znacząca pojawia się po określonej precyzji 0,01®0,0 - jeśli zaakceptowana precyzja wynosi do dziesiątych części.
  3. jeśli w tabeli jest wiele kolumn, kolumny tematu są oznaczone wielkimi literami, a kolumny predykatu cyframi.
  4. jeżeli tabela oparta jest na danych zapożyczonych, to źródło danych wskazuje się pod tabelą, w razie potrzeby do tabeli mogą być dołączone uwagi.

§7. Wykresy statystyczne

Tabele statystyczne można uzupełnić wykresami.

Wykresy statystyczne to warunkowe obrazy wartości liczbowych​​i ich proporcji poprzez linie, kształty geometryczne, rysunki.

Zalety obrazu graficznego

  1. wyraźnie, rzucając się w oczy, wyraziście.
  2. granice zmiany wskaźnika, porównawcze tempo zmian i zmienność są od razu widoczne

Wady obrazu graficznego

  1. Uwzględnij mniej danych niż w tabeli.
  2. wykres pokazuje zaokrąglone dane, ogólną sytuację, ale nie szczegóły.

Wykresy statystyczne

Schematy

kręcony

Temat 3: Wskaźniki statystyczne.

§jeden. Istota i znaczenie wskaźnika statystycznego, jego atrybuty.

§2. Klasyfikacja wskaźników statystycznych.

§3. Rodzaje wskaźników względnych. Zasady budowy.

§4. Systemy wskaźników statystycznych.

Znak statystyczny jest właściwością nieodłączną od ESS, istnieje obiektywnie na podstawie tego, czy jest badany jako nauka, czy nie.

Wskaźnik statystyczny jest uogólniającą cechą pewnej właściwości populacji.

Struktura wskaźnika statystycznego (jego atrybuty):

  • Wartości średnie
  • Wskaźniki zmienności
  • Wskaźniki połączenia funkcji
  • Wskaźniki struktury i charakteru dystrybucji
  • Wskaźniki dynamiczne
  • Wskaźniki zmienności
  • Wskaźniki dokładności i wiarygodności szacunków próbek
  • Wskaźniki dokładności i niezawodności prognoz

Według rodzaju: całkowita liczba jednostek lub całkowita własność obiektu. Jest to suma podstawowych cech mierzonych w sztukach, kg, m, $ itp.

Wskaźnik względny- uzyskane przez porównanie wskaźników bezwzględnych lub względnych w przestrzeni, w czasie lub przez porównanie wskaźników różnych właściwości badanego obiektu.

Względny wskaźnik pierwszego rzędu uzyskuje się porównując 2 x wskaźniki bezwzględne. Wskaźnik względny drugiego rzędu uzyskuje się przez porównanie wskaźników względnych pierwszego rzędu itp.

Względny wskaźnik trzeciego rzędu i wyższego jest bardzo rzadki.

Wskaźniki bezpośrednie – takie wskaźniki, których wartość wzrasta wraz ze wzrostem badanego zjawiska.

Wskaźniki odwrotne - wskaźniki, których wartość maleje wraz ze wzrostem badanego zjawiska.

… Struktury

…głośniki

…związki

… intensywność

…stosunek do normy

... porównania

Wskaźniki struktury uzyskuje się przez odniesienie części do całości.

Względne wskaźniki dynamiki

ü Wskaźniki dynamiki (tempa wzrostu, wzrost)

ü Indeksy

Wskaźniki relacji scharakteryzować związek między cechami:

ü Współczynnik korelacji

ü Wskaźniki analityczne

Wskaźniki intensywności scharakteryzować związek dwóch obiektów na różnych podstawach.

ü Pracochłonność - ilość czasu poświęcona na wyprodukowanie jednej jednostki produktu

ü Produkcja - ilość produktów wytworzonych na jednostkę czasu

PRODUKT \u003d 1 / pracochłonność

Wskaźniki stosunku do normy- stosunek rzeczywistych wartości znaku wskaźnika do normatywnego, planowanego, optymalnego.

Wskaźniki porównawcze - porównanie różnych obiektów na tej samej podstawie.

Ogólne zasady konstruowania wskaźników statystycznych:

  1. statystyki są obiektywnie powiązane.
  2. Porównywane wskaźniki mogą różnić się tylko jednym atrybutem; nie można porównywać wskaźnika według dwóch lub więcej atrybutów.
  3. konieczne jest poznanie i uwzględnienie granic wskaźnika.

Dla każdej cechy obiektu wymagany jest system wskaźników statystycznych.

  1. funkcja poznawcza - na podstawie analizy danych
  2. propaganda
  3. funkcja stymulująca

Temat 4: Średnie

§jeden. pojęcie średniej

§2. rodzaje średnich

§3. średnia arytmetyczna i jej właściwości

§4. średnia harmoniczna, średnia geometryczna, średnia kwadratowa.

§5. średnia wielowymiarowa

Najpopularniejszą formą wskaźników statystycznych jest średnia.

Najważniejszą właściwością średniej jest to, że odzwierciedla ona dobro wspólne, które jest nieodłącznie związane z każdą jednostką badanej populacji, chociaż wartość atrybutu poszczególnych jednostek populacji może się zmieniać w tym czy innym kierunku.

Typowość średniej jest bezpośrednio związana z jednorodnością badanej populacji. W przypadku populacji niejednorodnej konieczne jest rozbicie jej na grupy jakościowo jednorodne i obliczenie średniej dla każdej z grup jednorodnych.

Możesz określić średnią poprzez początkowy stosunek średniej (ISS) jej wzór logiczny.

Średnie strukturalne

Moda - Mo

Mediana - Me

W szeregu dynamicznym obliczana jest średnia arytmetyczna i średnia chronologiczna.

Średnia arytmetyczna nazywa się taką średnią wartością cechy, w obliczeniach której całkowita objętość cechy nie zmienia się.

Przykład: waga.

Poślubić prosta arytmetyka

x i– indywidualna wartość cechy

n to całkowita liczba badanej populacji

por. ważona arytmetycznie

Właściwości por. arytmetyka.

Suma odchyleń poszczególnych wartości cechy od jej średniej wartości wynosi zero

jeśli każda pojedyncza wartość cechy zostanie pomnożona lub podzielona przez tę samą stałą liczbę, to średnia wzrośnie lub zmniejszy się o tę samą wartość.

jeśli do każdej indywidualnej wartości atrybutu zostanie dodana jedna i ta sama liczba stała, to średnia wartość zmieni się odpowiednio o tę samą liczbę.

Dowód

jeśli wagi f średniej ważonej zostaną pomnożone lub podzielone przez tę samą liczbę, to średnia nie ulegnie zmianie.

suma kwadratów odchyleń atrybutu jest mniejsza niż z jakiejkolwiek innej liczby.

Inne rodzaje średnich

Rodzaj środka

prosta średnia

Średnia ważona

harmoniczny

geometryczny

kwadratowy

Bardzo trudno jest scharakteryzować zgrupowanie na jednej podstawie i niewiele informacji pozostaje w pamięci.

Średnia wielowymiarowa — średnia wartość dla kilku cech E.S.S.

Ze wskaźników wartości cech dla E.S. do średnich wartości tych cech.

Średnia wielowymiarowa dla ja jednostek

x ij– wartość cechy j dla jednostki i

Średnia wartość cechy j

k to liczba cech

j to numer obiektu i liczba jego populacji

Temat 5: Analiza Wariacji

§jeden. Odmiana znaków i jej przyczyny

§2. Stopnie dystrybucji

§3. Charakterystyki strukturalne szeregu wariacyjnego.

§4. Moc wskaźników zmienności.

§5. Wskaźniki intensywności zmienności

§6. rodzaje dyspersji. Reguła dodawania wariancji.

Zmienność wartości cechy w populacji to różnica jej wartości pomiędzy różnymi jednostkami danej populacji w tym samym okresie lub momencie.

Powód zmienności: różne warunki istnienia ESS, to zmienność stwarza potrzebę takiej nauki jak statystyka.

Przeprowadzenie analizy wariacyjnej rozpoczyna się od zbudowania szeregu wariacyjnego - uporządkowanego rozkładu jednostek populacji według znaków rosnących lub malejących i zliczenia odpowiednich liczności.

Stopnie dystrybucji

ü w rankingu

ü dyskretny

ü interwał

Seria wariacji rankingowych- wykaz poszczególnych jednostek. agregaty w porządku rosnącym malejącym według cechy rangowanej

Seria odmian dyskretnych - tabela składająca się z 2 wierszy - wartości polimerów o zmiennej cesze oraz ilość jednostek o danej wartości cechy.

Przedziałowy szereg wariacyjny konstruowany jest w następujących przypadkach:

  1. funkcja przyjmuje wartości dyskretne, ale ich liczba jest zbyt duża
  2. atrybut przyjmuje dowolną wartość z określonego zakresu

Konstruując szeregi zmienności przedziałowej konieczne jest dobranie optymalnej liczby grup, najpowszechniejsza metoda wykorzystująca formułę Sturgess

k - liczba interwałów

n to wielkość populacji

W obliczeniach prawie zawsze uzyskuje się wartości ułamkowe, zaokrąglając do liczby całkowitej.

Długość interwału - ja

Rodzaje interwałów

dolna granica kolejnego interwału powtarza górną granicę kolejnego interwału

interwał otwarty, interwał z jedną granicą

Przy obliczaniu serii zmienności przedziałowej środek przedziału przyjmuje się jako x i.

NME =60 mediana = 1

Kumuluj — dystrybucja mniejsza niż

Ogiva – rozkład większy niż

Mediana to wartość cechy, która dzieli całą populację na dwie równe części.

Dla dyskretnego szeregu wariacyjnego obliczenie mediany: jeśli n jest parzyste, to nie. Jednostka mediany

Seria odmian interwałowych:

k - liczba interwałów

x 0 - dolna granica przedziału mediany

ja jest długością mediany przedziału

Suma częstotliwości

Skumulowana częstotliwość przedziału poprzedzającego medianę.

Mediana częstotliwości interwału

Mediana interwału– pierwszy interwał, którego skumulowana częstotliwość przekracza połowę sumy częstotliwości.

Graficznie mediana znajduje się na kumulacie.

  1. Kwartyle - wartość atrybutu dzieląca populację na 4 równe części.

1. kwartyl

trzeci kwartyl

II kwartyl - mediana.

xQ 1 x Q 3 - dolna granica przedziału zawierającego 1. i 3. kwartyl.

l - długość interwału

oraz - skumulowane częstotliwości interwałów poprzednich interwałów zawierających 1. i 3. kwartyl.

Częstotliwości przedziałów kwartylowych.

Do scharakteryzowania serii odmian stosuje się:

Deciles - podziel populację na 10 równych części, Percitiles - podziel populację na 100 równych części.

  1. Tryb jest często występującą cechą charakterystyczną. Dla dyskretnej serii wariacyjnej - najwyższa częstotliwość. W przypadku serii zmienności przedziałowej tryb obliczany jest według następującego wzoru:

Dolna granica przedziału modalnego

ja– długość interwału modalnego

fMo- częstotliwość interwału modalnego

f Mo +1 jest częstotliwością przedziału po modalnym

Interwał modalny - interwał o największej częstotliwości. Graficznie tryb znajduje się na histogramie.

  1. Zmienność rozpiętości
  2. Średnie odchylenie liniowe

ważony

  1. Dyspersja:

ważony

  1. odchylenie standardowe

właściwość dyspersji.

  1. spadek wszystkich wartości cechy o tę samą kwotę nie zmienia wartości wariancji.
  2. Zmniejszenie wszystkich wartości cech o k razy zmniejsza wariancję o do 2 razy, a RMS w do raz
  3. jeśli obliczysz średni kwadrat odchyleń od dowolnej wartości A różnej od średniej arytmetycznej, to zawsze będzie on większy niż średni kwadrat odchyleń obliczonych ze średniej arytmetycznej. Zatem od średniej jest zawsze mniejsza niż obliczona z dowolnej innej wartości, tj. ma minimalną właściwość. RMS = 1,25 - z rozkładami zbliżonymi do normalnego.

W warunkach rozkładu normalnego istnieje następująca zależność między a liczbą obserwacji w ramach 68,3% obserwacji.

95,4% obserwacji mieści się w granicach

99,7% obserwacji mieści się w granicach

Aby porównać zmienność cech w różnych populacjach lub porównać zmienność różnych cech w tej samej populacji, stosuje się wskaźniki względne, podstawą jest średnia arytmetyczna.

  1. Względny zakres zmienności.
  2. Względne odchylenie liniowe
  3. Współczynnik zmienności

wskaźniki te dają nie tylko ocenę porównawczą, ale także tworzą jednorodność populacji. Zestaw uważa się za jednorodny, jeśli współczynnik zmienności nie przekracza 33%.

Wraz z badaniem zmienności cechy w całej populacji, często konieczne jest prześledzenie ilościowych zmian cechy, ale do grup, na które podzielona jest populacja i między nimi. Osiąga się to poprzez obliczanie różnych widoków.

Rodzaje dyspersji:

  1. Całkowita wariancja
  2. Wariancja międzygrupowa
  3. Wariancja wewnątrzgrupowa (rezydualna)

1. mierzy zmienność cechy w całej populacji pod wpływem wszystkich czynników, które spowodowały tę zmienność

Przykład: spożycie jogurtu: na próbie 100 osób

Status społeczny

x i – indywidualna wartość cechy

Średnia wartość cechy w całej populacji

częstotliwość tej funkcji.

  1. 2. charakteryzuje zmienność cechy pod wpływem cechy czynnika stanowiącego podstawę grupowania.

Średnia grupowa

Ogólna średnia grupy

Częstotliwość według grupy

  1. 3. charakteryzuje zmienność cechy pod wpływem czynników nieuwzględnionych w zgrupowaniu

x iji wartość cechy w grupie j

Średnia wartość cechy w j Grupa

f ij - częstotliwośći-ta funkcja wgrupa j

Istnieje zasada, która łączy 3 rodzaje wariancji, nazywana jest zasadą dodawania wariancji.

Dyspersja szczątkowa o j Grupa

Suma częstotliwości powyżej j Grupa

n to całkowita suma częstotliwości

głównym zadaniem analizy szeregów wariacyjnych jest identyfikacja wzorców rozkładu częstości.

Krzywa rozkładu jest graficzną reprezentacją w postaci ciągłej linii zmiany częstotliwości w szeregu wariacji w funkcjonalnie powiązanej zmianie wartości cechy.

Krzywą rozkładu można wykreślić za pomocą wielokąta i histogramu. Wskazane jest sprowadzenie rozkładu empirycznego do teoretycznego, do jednej z dobrze poznanych form.

Krzywa rozkładu normalnego.

Istnieją następujące rodzaje krzywych rozkładu:

  1. unimodalny
  2. wiele wierzchołków

Populacje jednorodne charakteryzują się krzywymi jednowierzchołkowymi, krzywa wielowierzchołkowa wskazuje na niejednorodność populacji i potrzebę rearanżacji.

Ustalenie ogólnego charakteru rozkładu obejmuje ocenę jego jednorodności oraz obliczenie skośności i kurtozy. Dla rozkładów symetrycznych

W celu przeprowadzenia porównawczego badania asymetrii różnych rozkładów obliczany jest współczynnik asymetrii As.

Moment centralny trzeciego rzędu; - kostka RMS;

Jeśli, to asymetria jest znacząca

Jeśli jak<0, то As – левосторонняя, если As>0, to As jest praworęczny.

Jeśli, to As jest nieistotne. Dla symetrycznego i umiarkowanie asymetrycznego oblicza się wskaźnik kurtozy: jeśli E k > 0, to rozkład jest szczytowy, jeśli E k<0, то распределение плосковершинное.

Zmienność alternatywnej cechy przejawia się ilościowo w następujący sposób.

0 - jednostki, które nie mają tej funkcji;

1 - jednostki z tą funkcją;

R- odsetek jednostek z tą cechą;

q- odsetek jednostek, które nie posiadają tej funkcji;

następnie p+q=1.

Alternatywna funkcja przyjmuje 2 wartości 0 i 1 z wagami p oraz q.

Znaki bezpośrednie- są to znaki, których wartość wzrasta wraz ze wzrostem badanego zjawiska.

Odwróć znaki - znaki, których wielkość maleje wraz ze wzrostem badanego zjawiska.

Generowanie (bezpośrednie)

Intensywność pracy (rewers)

Maksymalna wariancja udziału wynosi 0,25.

Temat 6: Modelowanie szeregów dystrybucyjnych.

§jeden. Rozkład rzeczywisty i teoretyczny

§2. Krzywa rozkładu normalnego.

§3. Testowanie hipotezy o rozkładzie normalnym.

§4. Kryteria zgody: Pearson, Romanovsky, Kołmogorov.

§5. Praktyczna wartość modelowania szeregów dystrybucyjnych.

§jeden. Rozkład rzeczywisty i teoretyczny

Jednym z najważniejszych celów badania szeregów dystrybucyjnych jest ujawnienie wzoru rozkładu i określenie jego natury. Wzorce rozmieszczenia najdobitniej manifestują się dopiero przy dużej liczbie obserwacji.

Rzeczywisty rozkład można przedstawić graficznie za pomocą krzywej rozkładu - graficznie przedstawionej jako ciągła linia zmian częstotliwości w szeregu wariacji wariantu funkcjonalnie powiązanego ze zmianą.

Krzywa rozkładu teoretycznego jest rozumiana jako krzywa tego typu rozkładu ogólnie, która wyklucza wpływ czynników losowych na prawidłowość.

Rozkład teoretyczny można wyrazić wzorem analitycznym zwanym wzorem analitycznym. Najczęstszym jest rozkład normalny.

§2. Krzywa rozkładu normalnego.

Prawo rozkładu normalnego:

y jest rzędną rozkładu normalnego

t jest znormalizowanym odchyleniem.

; e=2,7218; x ja - warianty serii wariantów; - przeciętny;

Nieruchomości:

Funkcja rozkładu normalnego jest parzysta, tj. f(t)=f(-t), . Funkcja rozkładu normalnego jest całkowicie określona przez odchylenie standardowe.

§3. Testowanie hipotezy o rozkładzie normalnym.

Powodem częstego odwoływania się do prawa dystrybucji jest zależność wynikająca z działania wielu przyczyn losowych, z których żadna nie jest dominująca. Jeśli Mo = Me obliczono w szeregu wariacyjnym, może to wskazywać na bliskość rozkładu normalnego. Najdokładniejszy test zgodności z normalnym prawem jest przeprowadzany przy użyciu specjalnych kryteriów.

§4. Kryteria zgody: Pearson, Romanovsky, Kołmogorov.

Kryterium Pearsona.

Częstotliwość teoretyczna

Częstotliwość empiryczna

Metoda obliczania częstotliwości teoretycznych.

  1. Wyznacza się średnią arytmetyczną i zgodnie z szeregiem zmienności przedziału oblicza t dla każdego przedziału.
  2. Znajdujemy wartość gęstości prawdopodobieństwa dla znormalizowanego prawa rozkładu. STRONA 49
  3. Znajdujemy częstotliwość teoretyczną.

l - długość interwału

- suma częstości empirycznych

- gęstości prawdopodobieństwa

zaokrąglić wartość do liczb całkowitych

  1. Obliczanie wskaźnika Pearsona
  2. wartość tabeli

d.f. – ilość interwałów – 3

d.f. to liczba stopni swobody.

  1. jeśli > , to rozkład nie jest normalny, tj. hipoteza o rozkładzie normalnym zostaje anulowana. Jeśli< , то распределение является нормальным.

Kryterium Romanowskiego.

Oblicza się kryterium Pearsona;

Liczba stopni.

Jeśli z<3, то распределение близко к нормальному.

Kryterium Kołmogorowa

, D- maksymalna wartość między zakumulowanymi częstotliwościami empirycznymi i teoretycznymi. Warunek konieczny do użycia Kołmogorowa: Liczba obserwacji jest większa niż 100. Zgodnie ze specjalną tabelą prawdopodobieństwa, z którą można argumentować, że ten rozkład jest normalny.

§5. Praktyczna wartość modelowania szeregów dystrybucyjnych.

  1. umiejętność zastosowania praw rozkładu normalnego do rozkładu empirycznego.
  2. umiejętność posługiwania się zasadą 3 x sigma.
  3. Możliwość uniknięcia dodatkowych czasochłonnych i kosztownych obliczeń poprzez badanie populacji, wiedząc, że rozkład jest normalny.

Temat 7: Selektywna obserwacja.

§jeden. Pojęcie obserwacji selektywnej. Powody jego użycia.

§2. Rodzaje obserwacji selektywnej.

§3. Błędy próbkowania.

§4. Przykładowe zadania obserwacyjne

§5. Dystrybucja danych z obserwacji próby do populacji ogólnej.

§6. Mała próbka.

§jeden. Pojęcie obserwacji selektywnej. Powody jego użycia.

Selektywna obserwacja - takiej nieciągłej obserwacji, w której wybrane w określony sposób jednostki badanej populacji poddawane są badaniu statystycznemu.

Cel (zadanie) obserwacji próby: dla części badanej scharakteryzować całą populację jednostek, z zachowaniem wszystkich reguł i zasad obserwacji statystycznej.

Powody stosowania obserwacji wybiórczej:

  1. oszczędność materiału, kosztów pracy i czasu;
  2. możliwość bardziej szczegółowego i szczegółowego badania poszczególnych jednostek zbiorowości statystycznej i ich grup.
  3. niektóre specyficzne problemy można rozwiązać tylko za pomocą obserwacji wybiórczej.
  4. kompetentna i dobrze zorganizowana obserwacja selektywna daje wysoką dokładność wyników.

Ogólna populacja to zbiór jednostek, z których dokonuje się selekcji.

Operat losowania to zbiór jednostek wybranych do badania. W statystyce zwyczajowo rozróżnia się parametry populacji ogólnej i populacji próbnej.

Rodzaje pobierania próbek

Według metody wyboru:

Powtarzający się

Jednostka uwzględniona w próbie, po zarejestrowaniu obserwowanych cech, wraca do populacji ogólnej w celu wzięcia udziału w dalszej procedurze selekcji.

Wielkość populacji ogólnej pozostaje niezmieniona, co prowadzi do stałego trafienia w próbie dowolnej jednostki.

Nie powtarzające się

Próbkowana jednostka nie jest zwracana do populacji, z której dokonuje się selekcji.

Metoda selekcji:

Właściwie losowo odnosi się do jednostek z populacji ogólnej losowo lub losowo bez żadnych elementów spójności. Jednak przed przeprowadzeniem takiej próby należy upewnić się, że wszystkie jednostki populacji ogólnej mają równe szanse na włączenie się do próby, tj. w pełnym wykazie jednostek zbiorowości statystycznej nie ma pominięć ani nieznajomości poszczególnych jednostek. Konieczne jest również wyraźne określenie granic populacji ogólnej. Technicznie ustalona selekcja odbywa się poprzez losowanie lub przy użyciu tabeli liczb losowych.

Pobieranie próbek mechanicznych (każde 5 na liście) jest używany w przypadkach, gdy ogólna populacja jest w jakiś sposób uporządkowana, tj. w dystrybucji jednostek istnieje pewna kolejność. Podczas przeprowadzania mechanicznego pobierania próbek ustala się proporcję selekcji, która jest ustalana przez stosunek populacji ogólnej do populacji próby.

Niebezpieczeństwo błędu w mechanicznym próbkowaniu może wynikać z: losowej koincydencji wybranego przedziału oraz cykliczności w układzie jednostek populacji ogólnej.

Strefowe pobieranie próbek jest używany, gdy wszystkie jednostki populacji ogólnej można podzielić na grupy (regiony, kraje) według jakiegoś atrybutu.

Połączona próbka.

Doboru jednostek można dokonać:

  1. lub proporcjonalnie do wielkości grupy
  2. lub proporcjonalnie do wewnątrzgrupowego zróżnicowania cechy
  3. , gdzie n to wielkość próby, N to wielkość populacji ogólnej, n i wielkość próbki i-grupy, N i tom i próbki.
  4. - ta metoda jest dokładniejsza, ale w trakcie próbkowania bardzo trudno jest z góry określić zmienność. (przed obserwacją).

wybór seryjny.

Stosuje się go, gdy ECK są łączone w małe grupy (serie), na przykład opakowania z gotowymi produktami, grupy studenckie. Istotą losowania seryjnego jest to, że serie dobierane są w sposób losowy lub mechaniczny, a następnie w ramach wybranych serii przeprowadza się ciągłe badanie.

Połączony wybór.

Jest to połączenie omówionych powyżej metod selekcji, częściej stosuje się kombinację serii typowych i seryjnych, tj. wybór serii z kilku typowych grup.

Wybór może być również wieloetapowy i jednoetapowy, wielowyrazowy i jednofrazowy.

Wybór wielostopniowy: z populacji ogólnej najpierw wyodrębnia się większe grupy, następnie mniejsze i tak dalej, aż do wyselekcjonowania jednostek objętych badaniem.

Wybór wielu fraz: wiąże się z zachowaniem tej samej jednostki selekcji na wszystkich etapach jej realizacji. Jednocześnie wybrane na każdym kolejnym etapie jednostki selekcyjne podlegają egzaminowi, którego program się poszerza (przykład: studenci całego instytutu, następnie studenci niektórych wydziałów).

§3. Błędy próbkowania.

Systematyczny

Błędy reprezentatywności występują tylko w obserwacji wybiórczej. Powstają ze względu na fakt, że populacja próby nie może dokładnie odtworzyć populacji ogólnej. Nie da się ich uniknąć, ale są łatwe do przewidzenia iw razie potrzeby można je zminimalizować.

Błąd próbkowania to różnica między wartością parametru w populacji ogólnej a jego wartością obliczoną na podstawie wyników obserwacji próby. Dх=-m+ , Dх – błąd krańcowy w próbie, m – średnia ogólna; - średnia próbki.

Krańcowy błąd próbkowania jest wielkością losową Prace Czebyszewa poświęcone są badaniu wzorców losowych błędów próbkowania. Twierdzenie Czebyszewa dowodzi, że Dx nie przekracza: - średniego błędu próbkowania, współczynnik ufności t wskazuje prawdopodobieństwo tego błędu. s. 42-43.

W przypadku, gdy konieczne jest wyznaczenie t ze znanego F(t), bierzemy najbliższe duże F(t) i wyznaczamy z niego t.

Limit błędu frakcji

P - udział.

Jeżeli selekcja została przeprowadzona w sposób nie powtarzalny, to dodawane są formuły błędu granicznego

Korekta za niepowtarzanie się.

Dla każdego rodzaju obserwacji próbki prezentowany błąd obliczany jest inaczej:

  1. właściwa obserwacja wyrywkowa i mechaniczna;
  2. Nadzór strefowy
  3. seryjne pobieranie próbek

r jest liczbą serii w próbie;

R to liczba serii w populacji ogólnej;

Międzygrupowa wariancja proporcji.

§4. Przykładowe zadania obserwacyjne

Używany do następujących zadań:

  1. n-? aby określić wielkość próbki ze znanych F(t), Dx.
  2. wyznaczenie próbki Dx ze znanego F(t), n
  3. wyznaczenie F(t) ze znanych Dx i n

1 zadanie n - ? Po pierwsze, n jest określone przez wzór na reselekcja, dla selekcji nie powtarzalnej:

Sposoby określenia wariancji:

  1. pochodzi z poprzednich podobnych badań.
  2. RMS z rozkładem normalnym » 1/6 zakresu zmienności.
  3. jeśli rozkład jest oczywiście asymetryczny, to RMS » 1/5 zakresu zmienności
  4. Dla udziału stosuje się maksymalną możliwą wariancję p(1-p)=0,25
  5. z n³100, a następnie s 2 \u003d S 2 - wariancja próbki

30 zł n 100 £, następnie s 2 \u003d S 2 (n / n-1), s 2 - ogólna wariancja

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Przy obliczaniu n nie należy dążyć do dużej wartości t i małych błędów krańcowych, ponieważ prowadzi to do wzrostu n, a tym samym do wzrostu kosztów. Poniższe prawo jest podobne.

§5. Dystrybucja danych z obserwacji próby do populacji ogólnej.

Ostatecznym celem każdej VN jest scharakteryzowanie populacji ogólnej.

Wartości obliczone z wyników VN są dystrybuowane do populacji ogólnej, z uwzględnieniem granicy ich błędu krańcowego.

Załóżmy, że co miesiąc spożywa jogurt przez jedną osobę.

250-20 mln GBP 250+20; 230 mln £270

I tylko 1000 osób

230 000 mln £ 270 000

48%-5%£p£48%+5%

§6. Mała próbka.

W praktyce badań statystycznych we współczesnych warunkach coraz bardziej konieczne jest zajmowanie się małymi próbami.

Mała próbka - obserwacyjna liczba jednostek, których nie przekracza 30, n £ 30 /

Opracowaniem teorii małego próbkowania dokonał angielski statystyk Gosset, który pisał pod pseudonimem student w 1908 roku.

Udowodnił, że oszacowanie rozbieżności między średnimi próby małej i próby ogólnej ma specjalne prawo rozkładu. Przy obliczaniu dla małej próbki wartość s 2 nie jest obliczana. t st dla możliwych granic błędów użyj kryterium studenta. Strony 44-45. jest prawdopodobieństwem odwrotnego zdarzenia.

Liczba stopni swobody

ograniczenie małego błędu próbki

marginalny błąd udziału

Temat 8: Analiza i modelowanie korelacji i regresji.

§jeden. Pojęcie korelacji i CRA.

§2. Warunki korzystania i ograniczenia KRA.

§3. Regresja par oparta na metodzie najmniejszych kwadratów.

§4. Zastosowanie sparowanego równania regresji liniowej.

§5. Wskaźniki szczelności połączenia i siły połączenia.

§6. Korelacja wielokrotna.

§jeden. Pojęcie korelacji i CRA.

Połączenie funkcjonalne y=5x

korelacja

Istnieją 2 rodzaje powiązań między różnymi zjawiskami i ich znakiem, funkcjonalne i statystyczne.

Takie powiązanie nazywamy funkcjonalnym, gdy wraz ze zmianą wartości jednej ze zmiennych druga zmienia się w ściśle określony sposób, tj. wartość jednej zmiennej odpowiada jednej lub dokładniej określonej wartości innej zmiennej . Powiązanie funkcjonalne jest możliwe tylko wtedy, gdy zmienna y zależy od zmiennej x i nie zależy od innych czynników, ale w rzeczywistości jest to niemożliwe.

Zależność statystyczna istnieje wtedy, gdy wraz ze zmianą wartości jednej ze zmiennych, druga może przyjmować dowolne wartości w określonych granicach, ale jej cechy statystyczne zmieniają się zgodnie z pewnym prawem.

Najważniejszym szczególnym przypadkiem relacji statystycznej jest relacja korelacji. Przy korelacji różnym wartościom jednej zmiennej odpowiadają różne średnie wartości innej zmiennej, tj. wraz ze zmianą wartości atrybutu x średnia wartość atrybutu y zmienia się w naturalny sposób.

Słowo korelacja zostało wprowadzone przez angielskiego biologa i statystyka Francisa Gala (korelacja)

Korelacja może powstać na różne sposoby:

  • przyczynowa zależność zmienności cechy wynikowej od zmienności cechy czynnika.
  • Może wystąpić korelacja między 2 skutkami tej samej przyczyny (pożary, liczba strażaków, rozmiar pożaru)
  • Związek znaków, z których każdy jest jednocześnie przyczyną i skutkiem (wydajność pracy i wynagrodzenie)

W statystykach zwyczajowo rozróżnia się następujące rodzaje zależności:

  1. korelacja par - relacja między 2 znakami wypadkowej i silni lub między dwoma znakami silniowymi.
  2. korelacja cząstkowa - związek między efektywnym a jednym atrybutem czynnika z ustaloną wartością innego atrybutu czynnika.
  3. korelacja wielokrotna – zależność uzyskanej cechy od dwóch lub więcej cech czynnikowych uwzględnionych w badaniu.

Zadaniem analizy korelacji jest ilościowe określenie bliskości związku między cechami. Pod koniec XIX wieku Galton i Pearson zbadali związek między wzrostem ojców i dzieci.

Regresja bada formę relacji. Zadaniem analizy regresji jest określenie analitycznego wyrazu zależności.

Analiza korelacji i regresji jako ogólna koncepcja obejmuje zmianę szczelności połączenia i ustalenie analitycznego wyrazu połączenia.

§2. Warunki korzystania i ograniczenia KRA.

  1. obecność danych masowych, ponieważ korelacja jest statystyczna
  2. wymagana jest jakościowa jednorodność populacji.
  3. podporządkowanie rozkładu populacji zgodnie z charakterystyką wypadkową i czynnikową prawu rozkładu normalnego, co wiąże się z zastosowaniem metody najmniejszych kwadratów.

§3. Regresja par oparta na metodzie najmniejszych kwadratów.

Analiza regresji polega na określeniu analitycznego wyrazu zależności. W formularzu rozróżnia się regresję liniową wyrażoną równaniem linii prostej i regresję nieliniową lub.

Zgodnie z kierunkiem komunikacji rozróżnia się je w linii prostej, tj. Wraz ze wzrostem x rośnie y.

odwrócić

Odwróć tj. gdy x rośnie, y maleje.

  1. metoda graficzna - poprzez wykreślenie danych empirycznych na polu korelacji, ale dokładniejsze oszacowanie wykonuje się metodą najmniejszych kwadratów.

X - rzeczywisty znak

U - znak skuteczności

Różnica między wartością rzeczywistą a wartością obliczoną przez równanie kwadratu sprzężenia powinna dążyć do minimum.

Przy LSM min jest sumą kwadratów odchyleń wartości empirycznych y od wartości teoretycznych uzyskanych zgodnie z wybranym równaniem regresji.

Dla zależności liniowej

a,b

dla paraboli

Dla hiperboli

parametry a,b,c są wpisywane do równania, następnie wynikowe równanie podstawiamy wartością empiryczną x ja i znajdź wartość teoretyczną y ja . Następnie porównujemy ja ja teoretyczne i ja ja empiryczny. Suma kwadratów różnicy między nimi powinna być minimalna. Wybieramy rodzaj zależności, w której ta zależność jest wykonywana.

W równaniu regresji liniowej parami:

b jest współczynnikiem sparowanej regresji liniowej, mierzy siłę wiązania, tj. charakteryzuje średnie odchylenie populacji y od jej średniej wartości na przyjętą jednostkę miary.

b\u003d 20, gdy x zmienia się o 1 znak y odbiega od średniej wartości średnio o 20 w populacji.

Znak dodatni przy współczynniku regresji wskazuje na bezpośredni związek między cechami, znak „-” wskazuje na sprzężenie zwrotne między cechami.

§4. Zastosowanie sparowanego równania regresji liniowej.

Głównym zastosowaniem jest prognozowanie według równania regresji. Prognozowanie jest ograniczone warunkami stabilności innych czynników oraz warunkami procesu. Jeśli środowisko toczącego się procesu zmieni się w nim gwałtownie, to równanie regresji nie będzie miało miejsca.

Prognozę punktową uzyskuje się przez podstawienie oczekiwanej wartości czynnika do równania regresji. Prawdopodobieństwo dokładnej realizacji takiej prognozy jest niezwykle małe.

Jeżeli prognozie punktowej towarzyszy wartość średniego błędu prognozy, to taką prognozę nazywa się prognozą przedziałową.

Średni błąd prognozy składa się z dwóch rodzajów błędów:

  1. błędy typu 1 - błąd linii regresji
  2. błąd II rodzaju - błąd związany z błędem zmienności.

Średni błąd prognozy.

Błąd położenia linii regresji w populacji ogólnej

n - wielkość próbki

x k - błędna wartość współczynnika

RMS cechy wypadkowej z linii regresji w populacji ogólnej

Analiza korelacji polega na ocenie szczelności połączenia. Wskaźniki:

  1. współczynnik korelacji liniowej - charakteryzuje ścisłość i kierunek związku między dwiema cechami w przypadku liniowej zależności między nimi

przy =-1 połączenie działa odwrotnie, przy =1 połączenie działa bezpośrednio, przy =0 nie ma połączenia.

Jest używany tylko do relacji liniowych, służy do oceny relacji między cechami ilościowymi. Obliczane tylko na podstawie indywidualnych wartości.

Współczynnik korelacji:

Empiryczne: oba typy wariancji są obliczane zgodnie z otrzymanym atrybutem.

Teoretyczny:

Rozrzut wartości efektywnej cechy obliczonej równaniem regresji

Rozproszenie wartości empirycznej otrzymanej cechy

  • wysoki stopień dokładności
  • nadaje się do oceny bliskości związku między cechą opisową a ilościową, ale ilościowa powinna być skuteczna
  • nadaje się do wszystkich typów połączeń

Współczynnik korelacji Spearmana

Szeregi - numery seryjne jednostek populacji w szeregach rankingowych. Konieczne jest uszeregowanie obu funkcji w tej samej kolejności od najmniejszej do największej lub odwrotnie. Jeżeli rangi jednostek populacji oznaczymy przez p x i p y, to współczynnik korelacji rang przyjmie postać:

Zalety współczynnika szeregu korelacji:

  1. Można również uszeregować według cech opisowych, których nie można wyrazić liczbowo, dlatego obliczenie współczynnika Spearmana jest możliwe dla następujących par cech: liczba - liczba; opisowo – ilościowe; Opisowe - opisowe. (edukacja jest atrybutem opisowym)
  2. pokazuje kierunek połączenia

Wady współczynnika Spearmana.

  1. identyczne różnice rang mogą odpowiadać zupełnie innym różnicom w wartości cechy (w przypadku cech ilościowych). Przykład: Roczna produkcja energii elektrycznej w kraju

USA 2400 kWh 1

RF 800 kWh 2

Kanada 600 kWh 3

Jeśli wśród wartości Spearmana występuje kilka identycznych wartości, powstają powiązane rangi, tj. te same środkowe liczby

W takim przypadku współczynnik Spearmana oblicza się w następujący sposób:

j- liczba linków w kolejności dla funkcji x

Aj- liczba identycznych rang w j linkach wg x

k- numery więzadeł w kolejności cechy y

Bk- liczba identycznych rang w który pęczek

  1. 4. Współczynnik korelacji rang Kendalla

Maksymalna kwota rangi

S to rzeczywista suma rang

Daje bardziej rygorystyczne oszacowanie niż współczynnik Spearmana.

Do obliczeń wszystkie jednostki są uszeregowane według atrybutu x według atrybutu w dla każdej rangi obliczana jest liczba kolejnych rang przekraczających podaną sumę, oznaczona przez P oraz liczba kolejnych rang poniżej tego oznaczenia Q.

P+Q= 1/2 n(n-1)

  1. Współczynnik korelacji rang Fechnera.

Współczynnik Fechnera - miara szczelności połączenia w postaci stosunku różnicy liczby par pasujących i nieprzypadkowych znaków do sumy tych liczb.

  1. obliczanie średnich dla x i y
  2. poszczególne wartości x i y i są porównywane z wartościami średnimi z obowiązkowym oznaczeniem znaku „+” lub „-”. Jeśli znaki pasują do x i y, to odnosimy je do liczby „C”, jeśli nie, to do „H”.
  3. policz liczbę pasujących i niepasujących par.

Zadanie pomiaru związku staje się przed statystykem w odniesieniu do cech opisowych, ważnym szczególnym przypadkiem takiego zadania, pomiaru związku między 2 alternatywnymi cechami, z których jedna jest przyczyną drugiej konsekwencji.

Ścisłość związku między 2 alternatywnymi cechami można zmierzyć za pomocą 2 współczynników:

  1. współczynnik asocjacji
  2. czynnik awaryjny

Współczynnik kontyngencji ma wadę: gdy jedna z dwóch heterogenicznych kombinacji Av lub Ba jest równa zeru, współczynnik zmienia się w jeden. Bardzo liberalnie ocenia szczelność połączenia – przecenia to.

stosunek Pearsona

Jeśli nie ma dwóch, ale więcej możliwych wartości każdej z powiązanych ze sobą cech, obliczane są następujące współczynniki:

  1. stosunek Pearsona
  2. Współczynnik Chuprova dla cechy opisowej

Współczynnik Pearsona jest obliczany z macierzy kwadratowych

Poniżej średniej

do 1 i do 2 - numer grupy odpowiednio zgodnie ze znakami 1 i 2. Wadą współczynnika Pearsona jest to, że nie osiąga 1 nawet przy wzroście liczby grup.

Współczynnik Czuprowa (1874-1926)

współczynnik Chuprova bardziej rygorystycznie ocenia szczelność połączenia.

§6. Korelacja wielokrotna.

Badanie związku między wypadkową a dwiema lub więcej charakterystykami czynnikowymi nazywa się wielokrotna regresja. W badaniu zależności metodami regresji wielokrotnej ustala się 2 zadania.

  1. określenie analitycznego wyrażenia zależności między cechą efektywną y a cechami rzeczywistymi x 1 , x 2 , x 3 , ... x k, tj. znajdź funkcję y \u003d f (x 1, x 2, ... x k)
  2. Ocena szczelności związku między skutecznym a każdym ze znaków czynnika.

Model korelacji i regresji (CRM) to równanie regresji, które obejmuje główne czynniki wpływające na zmienność otrzymanego atrybutu.

Budowanie modelu regresji wielokrotnej obejmuje następujące kroki:

  1. wybór formy komunikacji
  2. dobór cech czynnikowych
  3. Zapewnienie, że populacja jest wystarczająco duża, aby zapewnić prawidłowe szacunki.

I. cały zbiór relacji między zmiennymi spotykany w praktyce jest dość w pełni opisany funkcjami 5 typów:

  1. liniowy:
  2. moc:
  3. orientacyjny:
  4. parabola:
  5. hiperbola:

chociaż w praktyce CRA występuje wszystkie 5 funkcji, najczęściej stosuje się zależność liniową, jako najprostsze i najłatwiejsze do interpretacji równanie zależności liniowej: , k - zbiór czynników zawartych w równaniu, b j

0 - ponieważ >0,7 dlatego zwracamy na nie szczególną uwagę

EKO. Skala szczelności komunikacji:

Jeśli połączenie wynosi 0 - 0,3 - słabe połączenie

0,3 - 0,5 - zauważalne

0,3 - 0,5 - zamknij

0,7 - 0,9 - wysoki

ponad 0,9 - bardzo wysoki

następnie porównujemy dwie cechy (dochód i płeć)<0,7, то включаем в уравнение множественной регрессии.

Wybór czynników do uwzględnienia w równaniu regresji wielokrotnej:

  1. musi istnieć związek przyczynowy między skutecznymi a rzeczywistymi znakami.
  2. skuteczne i rzeczywiste znaki muszą być ze sobą ściśle powiązane, w przeciwnym razie pojawia się zjawisko wielokoliniowość (>06) , tj. znaki czynników zawarte w równaniu wpływają nie tylko na wynik, ale na siebie nawzajem, co prowadzi do nieprawidłowej interpretacji danych liczbowych.

Metody wyboru czynników do uwzględnienia w równaniu regresji wielokrotnej:

1. metoda ekspercka – w oparciu o intuicyjną analizę logiczną wykonaną przez wysoko wykwalifikowanych ekspertów.

2. wykorzystanie macierzy sparowanych współczynników korelacji odbywa się równolegle z metodą pierwszą, macierz jest symetryczna względem przekątnej jednostki.

3. analiza regresji krokowej - sekwencyjne włączanie cech czynników do równania regresji i testowanie istotności odbywa się na podstawie wartości dwóch wskaźników na każdym kroku. Korelacja, wskaźnik regresji.

Wynik korelacji: Oblicz zmianę teoretycznej korelacji stosunku lub zmianę średniej wariancji rezydualnej. Wskaźnik regresji to zmiana warunkowo czystego współczynnika regresji.

Całkowity

31

32

22

85

Dane statystyczne powinny być prezentowane w taki sposób, aby można było z nich korzystać. Istnieją 3 główne formy prezentacji danych statystycznych:

1) tekst - zamieszczenie danych w tekście;

2) tabelaryczne – prezentacja danych w tabelach;

3) graficzny - wyrażenie danych w postaci wykresów.

Forma tekstowa jest używana, gdy istnieje niewielka ilość danych cyfrowych.

Najczęściej używana jest forma tabelaryczna, ponieważ jest to wydajniejsza forma prezentacji danych statystycznych. W przeciwieństwie do tabel matematycznych, które zgodnie z warunkami początkowymi pozwalają na uzyskanie takiego lub innego wyniku, tabele statystyczne mówią językiem liczb o badanych obiektach.

Tabela statystyczna- jest to układ wierszy i kolumn, w którym w określonej kolejności i połączeniu prezentowane są informacje statystyczne o zjawiskach społeczno-gospodarczych.

Tabela 2. Handel zagraniczny Federacji Rosyjskiej w latach 2000 - 2006, miliard dolarów

Indeks 2000 2001 2002 2003 2004 2005 2006
Obroty handlu zagranicznego 149,9 155,6 168,3 280,6 368,9 468,4
Eksport 101,9 107,3 135,9 183,2 243,6 304,5
Import 44,9 53,8 76,1 97,4 125,3 163,9
Bilans handlowy 60,1 48,1 46,3 59,9 85,8 118,3 140,7
włącznie z:
z zagranicą
eksport 90,8 86,6 90,9 114,6 210,1 261,1
import 31,4 40,7 48,8 77,5 103,5 138,6
Bilans handlowy 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Na przykład w tabeli. 2 przedstawia informacje o handlu zagranicznym Rosji, których nie dałoby się wyrazić w formie tekstowej.

Wyróżnić Przedmiot oraz orzec tabela statystyczna. Podmiot wskazuje scharakteryzowany obiekt - albo jednostki populacji, albo grupy jednostek, albo całość jako całość. W predykacie podana jest charakterystyka podmiotu, zwykle w postaci liczbowej. Obowiązkowe nagłówek tabeli, która wskazuje, do jakiej kategorii i do jakiego czasu należą dane w tabeli.

W zależności od przedmiotu, tabele statystyczne są podzielone na prosty, Grupa oraz kombinacyjny. W przedmiocie prostej tabeli przedmiot badań nie jest podzielony na grupy, ale podana jest albo lista wszystkich jednostek populacji, albo wskazana jest populacja jako całość (na przykład tabela 11). W przedmiocie tabeli grup obiekt badań jest podzielony na grupy według jednego atrybutu, a predykat wskazuje liczbę jednostek w grupach (bezwzględną lub procentowo) oraz wskaźniki sumaryczne dla grup (np. Tabela 4). W temacie tabeli kombinacji populacja jest podzielona na grupy nie według jednego, ale według kilku kryteriów (np. Tabela 2).

Konstruując tabele, musisz kierować się następującymi Główne zasady.

1. Przedmiot tabeli znajduje się w lewej (rzadziej - górnej) części, a orzeczenie - w prawej (rzadziej - dolnej).

2. Nagłówki kolumn zawierają nazwy wskaźników i ich jednostek.

3. Ostatni wiersz uzupełnia tabelę i znajduje się na jej końcu, ale czasami jest to pierwszy: w tym przypadku drugi wiersz jest napisany „w tym”, a kolejne wiersze zawierają składniki wiersza całkowitego.

4. Dane liczbowe są zapisywane z taką samą dokładnością w każdej kolumnie, przy czym cyfry liczb znajdują się pod cyframi, a część całkowitą oddziela się od przecinka ułamkowego.

5. W tabeli nie powinno być pustych komórek: jeśli dane są zerowe, to wstawiany jest znak „–” (myślnik); jeśli dane nie są znane, wprowadza się wpis „brak informacji” lub wstawia się znak „…” (wielokropek). Jeśli wartość wykładnika nie jest równa zeru, ale pierwsza cyfra znacząca pojawia się po zaakceptowanym stopniu dokładności, to rejestrowane jest 0,0 (jeśli, powiedzmy, zaakceptowano stopień dokładności 0,1).

Czasami tabele statystyczne są uzupełniane wykresami, gdy celem jest podkreślenie jakiejś cechy danych, ich porównanie. Forma graficzna jest najbardziej efektywną formą prezentacji danych z punktu widzenia ich percepcji. Za pomocą wykresów uzyskuje się widoczność cech struktury, dynamiki, relacji zjawisk i ich porównania.

Wykresy statystyczne- są to warunkowe obrazy wartości liczbowych i ich proporcji za pomocą linii, kształtów geometrycznych, rysunków lub wykresów geograficznych. Forma graficzna ułatwia uwzględnienie danych statystycznych, czyni je wizualnymi, wyrazistymi i widocznymi. Wykresy mają jednak pewne ograniczenia: po pierwsze, wykres nie może zawierać tylu danych, ile zmieści się w tabeli; dodatkowo wykres zawsze pokazuje zaokrąglone dane - nie dokładne, ale przybliżone. Tak więc wykres służy jedynie do pokazania ogólnej sytuacji, a nie szczegółów. Ostatnią wadą jest złożoność kreślenia. Można go pokonać za pomocą komputera osobistego (na przykład „Kreatora diagramów” z pakietu Microsoft Office Excel).

Zgodnie z metodą konstruowania grafiki dzieli się je na diagramy, kartogramy oraz diagramy wykresów.

Najpopularniejszym sposobem graficznej reprezentacji danych są wykresy, które są następujących typów: liniowy, promieniowy, rozproszony, planarny, wolumetryczny, kręcony. Rodzaj wykresów zależy od rodzaju prezentowanych danych oraz zadania konstrukcyjnego. W każdym przypadku wykresowi musi towarzyszyć nagłówek - nad lub pod polem wykresu. Tytuł wskazuje, który wskaźnik jest wyświetlany, dla jakiego terytorium i na jaki czas.

Wykresy liniowe służą do reprezentowania zmiennych ilościowych: charakterystyk zmienności ich wartości, dynamiki, relacji między zmiennymi. Zmienność danych jest analizowana za pomocą obszar dystrybucji, kumuluje się(mniej niż krzywa) i ostrołuki(krzywa „większa niż”). Wielokąt rozkładu jest omówiony w Temacie 4 (np. Rys. 5.). Aby zbudować kumulację, wartości cechy zmiennej są wykreślane wzdłuż odciętej, a rzędne są skumulowanymi sumami częstotliwości lub częstotliwości (od f1 do f). Aby zbudować ostrołuk, skumulowane sumy częstotliwości są umieszczane na osi y w odwrotnej kolejności (od ∑ f zanim f1). Kumuluj i ostrołukuj zgodnie z tabelą. 4. zobrazować na ryc. jeden.

Ryż. 1. Kumulacje i okazania podziału towarów według wartości wartości celnej

Wykorzystanie wykresów liniowych w analizie trendów omówiono w Temacie 5 (np. Rysunek 13), a ich wykorzystanie do analizy połączeń w Temacie 6 (np. Rysunek 21). Temat 6 obejmuje również wykorzystanie wykresów punktowych (np. Rysunek 20).

Wykresy liniowe są podzielone na jednowymiarowy, używany do reprezentowania danych na pojedynczej zmiennej, oraz dwuwymiarowy- dla dwóch zmiennych. Przykładem jednowymiarowego wykresu liniowego jest wielokąt rozkładu, a dwuwymiarowego – linia regresji (np. rys. 21).

Czasami przy dużych zmianach wskaźnika stosuje się skalę logarytmiczną. Na przykład, jeśli wartości wskaźnika wahają się od 1 do 1000, może to powodować trudności podczas kreślenia. W takich przypadkach przechodzą na logarytmy wartości wskaźników, które nie będą się tak bardzo różnić: LG 1 = 0, LG 1000 = 3.

Wśród planarny Wykresy słupkowe (histogramy) rozróżnia się według częstotliwości użycia, w których wskaźnik jest prezentowany w postaci słupka, którego wysokość odpowiada wartości wskaźnika (przykładowo rys. 4).

Proporcjonalność obszaru określonej figury geometrycznej do wartości wskaźnika leży u podstaw innych rodzajów diagramów planarnych: trójkątny, kwadrat, prostokątny. Można również skorzystać z porównania pól koła - w tym przypadku ustalany jest promień koła.

Wykres paskowy przedstawia wskaźniki w postaci poziomo rozciągniętych prostokątów, a poza tym jest tożsame z wykresem słupkowym.

Spośród planarnych diagramów jest często używany wykres kołowy, który służy do zilustrowania struktury badanej populacji. Cały zestaw jest traktowany jako 100%, odpowiada całkowitej powierzchni koła, obszary sektorów odpowiadają częściom zestawu. Zbudujmy diagram sektorowy struktury handlu zagranicznego Federacji Rosyjskiej w 2006 roku według tabeli. 2 (patrz rys. 2). Podczas korzystania z programów komputerowych diagramy sektorowe są budowane w formie trójwymiarowej, to znaczy nie w dwóch, ale w trzech płaszczyznach (patrz ryc. 3).

Ryż. 2. Prosty wykres kołowy 3. Wykres kołowy 3D

Diagramy kręcone (obrazowe) zwiększają przejrzystość obrazu, ponieważ zawierają obraz wyświetlanego wskaźnika, którego rozmiar odpowiada rozmiarowi wskaźnika.

Przy kreśleniu wykresu wszystko jest równie ważne – właściwy dobór obrazu graficznego, proporcje, przestrzeganie zasad projektowania wykresów. Kwestie te omówiono bardziej szczegółowo w i.

Kartogramy i kartogramy służą do zobrazowania cech geograficznych badanych zjawisk. Pokazują one lokalizację badanego zjawiska, jego natężenie na określonym terytorium - w republice, regionie, powiecie gospodarczym, administracyjnym itp. Konstrukcja kartogramów i kartogramów jest rozważana na przykład w literaturze specjalistycznej.

Koniec pracy -

Ten temat należy do:

Pojęcie statystyki. Przedmiot i metoda statystyki

Pojęcie statystyki.. przedmiot i metoda statystyki.. obserwacja statystyczna..

Jeśli potrzebujesz dodatkowych materiałów na ten temat lub nie znalazłeś tego, czego szukałeś, zalecamy skorzystanie z wyszukiwania w naszej bazie prac:

Co zrobimy z otrzymanym materiałem:

Jeśli ten materiał okazał się dla Ciebie przydatny, możesz zapisać go na swojej stronie w sieciach społecznościowych:

Wszystkie tematy w tej sekcji:

Przedmiot i metoda statystyki
Termin „statystyka” został wprowadzony do użytku naukowego przez niemieckiego uczonego Gottfrieda Achenwala w 1746 r., który zaproponował zastąpienie tytułu prowadzonego na niemieckich uniwersytetach przedmiotu „State Studies” tytułem „St.

Obserwacja statystyczna
Ludzie mają różne podejście do informacji statystycznych: jedni ich nie dostrzegają, inni bezwarunkowo wierzą, a jeszcze inni zgadzają się z opinią angielskiego polityka Disraeli: „Istnieją 3 rodzaje kłamstw: kłamstwa,

Podsumowanie i grupowanie statystyk
Podsumowanie - naukowo zorganizowane przetwarzanie materiałów obserwacyjnych (według opracowanego wcześniej programu), które obejmuje oprócz obowiązkowej kontroli zebranych danych, systematyzację, grupowanie

Wartości bezwzględne
W celu scharakteryzowania zjawisk masowych statystyka wykorzystuje wielkości statystyczne (wskaźniki), które charakteryzują grupy jednostek lub agregat (zjawisko) jako całość. Ilości statystyczne

Wartości względne
Wartość względna jest wynikiem podzielenia (porównania) dwóch wartości bezwzględnych. Licznikiem ułamka jest porównywana wartość, a mianownikiem porównywana wartość (ba

Wartości średnie
Jak już wielokrotnie mówiono, statystyka bada zjawiska i procesy masowe. Każde z tych zjawisk ma zarówno wspólne dla całego zbioru, jak i szczególne, indywidualne właściwości.

Budowanie serii dystrybucyjnej
Charakterystyki badane przez statystyki różnią się (różnią się od siebie) dla różnych jednostek populacji w tym samym okresie lub momencie. Na przykład wartość obrotów handlu zagranicznego jest zróżnicowana

Obliczanie cech strukturalnych szeregu rozdzielczego
Przy badaniu zmienności wykorzystuje się takie charakterystyki szeregu rozkładów, które ilościowo opisują jego strukturę, strukturę. Taka jest na przykład mediana – wartość atrybutu zmiennej

Obliczanie miar wielkości i intensywności zmienności
Najprostszym wskaźnikiem jest zakres zmienności – bezwzględna różnica między maksymalnymi i minimalnymi wartościami cechy od wartości dostępnych w badanej populacji (24):

Obliczanie momentów rozkładu i wskaźników jego postaci
Do dalszego badania charakteru zmienności wykorzystuje się średnie wartości różnych stopni odchyleń poszczególnych wartości cechy od jej średniej arytmetycznej. Te wskaźniki nazywają się

Sprawdzanie, czy szereg rozkładu jest normalny
Krzywa rozkładu teoretycznego rozumiana jest jako graficzna reprezentacja szeregu w postaci ciągłej linii zmiany częstotliwości w szeregu wariacyjnym, funkcjonalnie związanej ze zmianą opcji, innych

Sprawdzanie, czy szereg rozkładów jest zgodny z prawem Poissona
Kontrola celna przeprowadziła kontrolę po zwolnieniu towaru. W rezultacie otrzymano następującą dyskretną serię rozkładu liczby naruszeń zidentyfikowanych w każdym teście (tabela 16). Tabela 1

Bezwzględne i względne wskaźniki zmiany struktury
Rozwój populacji statystycznej przejawia się nie tylko ilościowym wzrostem lub spadkiem elementów systemu, ale także zmianą jego struktury. Struktura to struktura agregatu

Wskaźniki rangi zmiany struktury
Do pomiaru różnic w strukturze, mniej dokładne, ale łatwiejsze do obliczenia, często stosuje się wskaźniki, które opierają się na ocenie różnic nie w wartościach samych akcji, ale w ich szeregach, czyli porządkowych

Pojęcie selektywnej obserwacji
Metodę próbkowania stosuje się, gdy zastosowanie ciągłej obserwacji jest fizycznie niemożliwe ze względu na ogromną ilość danych lub nieopłacalne ekonomicznie. Jest fizyczna niemożliwość

Metody pobierania próbek
1. Właściwie losowy wybór: wszystkie jednostki HS są ponumerowane, a liczby wylosowane w wyniku losowania odpowiadają jednostkom, które wpadły do ​​próby, a liczba liczb jest równa liczbie planowanej

Średni błąd próbkowania
Po dokonaniu wyboru wymaganej liczby jednostek w próbie i zarejestrowaniu przewidzianych przez program obserwacji charakterystyk tych jednostek przystępują do obliczania wskaźników uogólniających. do nich od

Krańcowy błąd próbkowania
Biorąc pod uwagę, że na podstawie badania reprezentacyjnego nie można dokładnie ocenić uogólniającej charakterystyki HS, konieczne jest znalezienie granic, w których się znajduje. W konkretnej próbce różnica

Wymagana wielkość próbki
Opracowując program obserwacji wybiórczej, podaje się im określoną wartość błędu krańcowego i poziom prawdopodobieństwa. Minimalna wielkość próbki, która zapewnia dane

Wytyczne
Zadanie. W przedsiębiorstwie przeprowadzono wywiady z 100 pracownikami na 1000 w kolejności losowej próby nie powtarzalnej i uzyskano następujące dane o ich dochodach za miesiąc (tabela 24): Ta

Pojęcie szeregów czasowych
Jednym z najważniejszych zadań statystyki jest badanie zmian analizowanych wskaźników w czasie, czyli ich dynamiki. Problem ten rozwiązuje analiza szeregów dynamiki (szeregów czasowych).

Wskaźniki zmian poziomów szeregu dynamiki
Analiza szeregów czasowych rozpoczyna się od określenia, jak zmieniają się poziomy szeregu (wzrost, spadek lub pozostanie bez zmian) w ujęciu bezwzględnym i względnym. Śledzić

Średnie wskaźniki szeregu dynamiki
Każdą serię dynamiki można uznać za pewien zbiór n zmieniających się w czasie wskaźników, które można podsumować jako wartości średnie. Takie uogólnione (średnie) wskaźniki są szczególnie

Metody identyfikacji głównego trendu (trendu) w szeregach dynamiki
Jednym z głównych zadań badania szeregów dynamiki jest identyfikacja głównego trendu (wzorca) zmiany poziomów szeregu, zwanego trendem. Regularność zmiany poziomów szeregu w niektórych przypadkach

Ocena adekwatności trendów i prognozowanie
Dla znalezionego równania trendu należy ocenić jego wiarygodność (adekwatność), co zwykle przeprowadza się za pomocą kryterium Fishera, porównując jego obliczoną wartość Fр

Analiza sezonowa
W szeregach dynamiki, których poziomami są wskaźniki miesięczne lub kwartalne, wraz z wahaniami losowymi często obserwuje się wahania sezonowe, rozumiane jako okresowe

Wytyczne
Według Federalnej Służby Statystycznej, bilans handlu zagranicznego (SVT) Rosji za lata 2000-2006. charakteryzuje się szeregiem dynamik przedstawionych w tabeli. 36. Tabela 36. Bilans handlu zagranicznego (CBT) Rosji dla p

Pojęcie zależności korelacji
Jednym z najbardziej ogólnych praw świata obiektywnego jest prawo uniwersalnego związku i zależności między zjawiskami. Oczywiście przy badaniu zjawisk w najróżniejszych dziedzinach statystyki nieuchronnie się zderzają

Metody identyfikacji i oceny korelacji
W statystyce stosuje się szereg metod do identyfikacji obecności i charakteru korelacji między dwiema cechami. 1. Uwzględnienie danych równoległych (kn

Współczynniki korelacji rang
Współczynniki korelacji rang są mniej dokładnymi, ale łatwiejszymi do obliczenia, nieparametrycznymi wskaźnikami do pomiaru bliskości związku między dwiema skorelowanymi cechami. Obejmują one

Osobliwości korelacji szeregów czasowych
W wielu opracowaniach konieczne jest badanie dynamiki kilku wskaźników jednocześnie, tj. rozważ kilka szeregów czasowych równolegle. W takim przypadku konieczne staje się zmierzenie zależności

Wskaźniki ścisłości związku między cechami jakościowymi
Metoda tabel korelacyjnych ma zastosowanie nie tylko do cech ilościowych, ale także do cech opisowych (jakościowych), których zależność często trzeba badać prowadząc różnych socjologów.

Korelacja wielokrotna
Rozwiązując praktyczne problemy, badacze mają do czynienia z faktem, że korelacje nie ograniczają się do relacji między dwiema cechami: efektywnym y i czynnikiem x. W akcji

Cel i rodzaje indeksów
Wskaźnik jest wartością względną pokazującą, ile razy poziom badanego zjawiska w danych warunkach różni się od poziomu tego samego zjawiska w innych warunkach. Różnica w warunkach może być:

Indeksy indywidualne
Względną wartość uzyskaną przez porównanie poziomów nazywamy wskaźnikiem indywidualnym, jeśli struktura badanego zjawiska nie ma znaczenia. Poszczególne indeksy oznaczone są przez i

Indeksy ogólne
Jeżeli badane zjawisko jest niejednorodne i porównania poziomów można dokonać dopiero po sprowadzeniu ich do wspólnej miary, analizę ekonomiczną przeprowadza się za pomocą wskaźników ogólnych. Indeks staje się ogólny

Średnie indeksy
Podczas badania wskaźników jakościowych często konieczne jest uwzględnienie zmiany w czasie (lub przestrzeni) średniej wartości indeksowanego wskaźnika dla pewnej jednorodnej populacji.

Wskaźniki terytorialne
Wskaźniki terytorialne służą do przestrzennych, międzyregionalnych porównań różnych wskaźników. Ich obliczenie jest bardziej skomplikowane niż obliczenie rozważanych tradycyjnych (dynamicznych) indeksów

Dane statystyczne powinny być prezentowane w taki sposób, aby można było z nich korzystać. Istnieją 3 główne formy prezentacji danych statystycznych:

1) tekst - zamieszczenie danych w tekście;

2) tabelaryczne – prezentacja danych w tabelach;

3) graficzny - wyrażenie danych w postaci wykresów.

Forma tekstowa jest używana, gdy istnieje niewielka ilość danych cyfrowych.

Najczęściej używana jest forma tabelaryczna, ponieważ jest to wydajniejsza forma prezentacji danych statystycznych. W przeciwieństwie do tabel matematycznych, które zgodnie z warunkami początkowymi pozwalają na uzyskanie takiego lub innego wyniku, tabele statystyczne mówią językiem liczb o badanych obiektach.

Tabela statystyczna- jest to układ wierszy i kolumn, w którym w określonej kolejności i połączeniu prezentowane są informacje statystyczne o zjawiskach społeczno-gospodarczych.

Tabela 2. Handel zagraniczny Federacji Rosyjskiej w latach 2000 - 2006, miliard dolarów

Indeks 2000 2001 2002 2003 2004 2005 2006
Obroty handlu zagranicznego 149,9 155,6 168,3 280,6 368,9 468,4
Eksport 101,9 107,3 135,9 183,2 243,6 304,5
Import 44,9 53,8 76,1 97,4 125,3 163,9
Bilans handlowy 60,1 48,1 46,3 59,9 85,8 118,3 140,7
włącznie z:
z zagranicą
eksport 90,8 86,6 90,9 114,6 210,1 261,1
import 31,4 40,7 48,8 77,5 103,5 138,6
Bilans handlowy 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Na przykład w tabeli. 2 przedstawia informacje o handlu zagranicznym Rosji, których nie dałoby się wyrazić w formie tekstowej.

Wyróżnić Przedmiot oraz orzec tabela statystyczna. Podmiot wskazuje scharakteryzowany obiekt - albo jednostki populacji, albo grupy jednostek, albo całość jako całość. W predykacie podana jest charakterystyka podmiotu, zwykle w postaci liczbowej. Obowiązkowe nagłówek tabeli, która wskazuje, do jakiej kategorii i do jakiego czasu należą dane w tabeli.

W zależności od przedmiotu, tabele statystyczne są podzielone na prosty, Grupa oraz kombinacyjny. W przedmiocie prostej tabeli przedmiot badań nie jest podzielony na grupy, ale podana jest albo lista wszystkich jednostek populacji, albo wskazana jest populacja jako całość (na przykład tabela 11). W przedmiocie tabeli grup obiekt badań jest podzielony na grupy według jednego atrybutu, a predykat wskazuje liczbę jednostek w grupach (bezwzględną lub procentowo) oraz wskaźniki sumaryczne dla grup (np. Tabela 4). W temacie tabeli kombinacji populacja jest podzielona na grupy nie według jednego, ale według kilku kryteriów (np. Tabela 2).

Konstruując tabele, musisz kierować się następującymi Główne zasady.

1. Przedmiot tabeli znajduje się w lewej (rzadziej - górnej) części, a orzeczenie - w prawej (rzadziej - dolnej).

2. Nagłówki kolumn zawierają nazwy wskaźników i ich jednostek.

3. Ostatni wiersz uzupełnia tabelę i znajduje się na jej końcu, ale czasami jest to pierwszy: w tym przypadku drugi wiersz jest napisany „w tym”, a kolejne wiersze zawierają składniki wiersza całkowitego.

4. Dane liczbowe są zapisywane z taką samą dokładnością w każdej kolumnie, przy czym cyfry liczb znajdują się pod cyframi, a część całkowitą oddziela się od przecinka ułamkowego.

5. W tabeli nie powinno być pustych komórek: jeśli dane są zerowe, to wstawiany jest znak „–” (myślnik); jeśli dane nie są znane, wprowadza się wpis „brak informacji” lub wstawia się znak „…” (wielokropek). Jeśli wartość wykładnika nie jest równa zeru, ale pierwsza cyfra znacząca pojawia się po zaakceptowanym stopniu dokładności, to rejestrowane jest 0,0 (jeśli, powiedzmy, zaakceptowano stopień dokładności 0,1).

Czasami tabele statystyczne są uzupełniane wykresami, gdy celem jest podkreślenie jakiejś cechy danych, ich porównanie. Forma graficzna jest najbardziej efektywną formą prezentacji danych z punktu widzenia ich percepcji. Za pomocą wykresów uzyskuje się widoczność cech struktury, dynamiki, relacji zjawisk i ich porównania.

Wykresy statystyczne- są to warunkowe obrazy wartości liczbowych i ich proporcji za pomocą linii, kształtów geometrycznych, rysunków lub wykresów geograficznych. Forma graficzna ułatwia uwzględnienie danych statystycznych, czyni je wizualnymi, wyrazistymi i widocznymi. Wykresy mają jednak pewne ograniczenia: po pierwsze, wykres nie może zawierać tylu danych, ile zmieści się w tabeli; dodatkowo wykres zawsze pokazuje zaokrąglone dane - nie dokładne, ale przybliżone. Tak więc wykres służy jedynie do pokazania ogólnej sytuacji, a nie szczegółów. Ostatnią wadą jest złożoność kreślenia. Można go pokonać za pomocą komputera osobistego (na przykład „Kreatora diagramów” z pakietu Microsoft Office Excel).

Zgodnie z metodą konstruowania grafiki dzieli się je na diagramy, kartogramy oraz diagramy wykresów.

Najpopularniejszym sposobem graficznej reprezentacji danych są wykresy, które są następujących typów: liniowy, promieniowy, rozproszony, planarny, wolumetryczny, kręcony. Rodzaj wykresów zależy od rodzaju prezentowanych danych oraz zadania konstrukcyjnego. W każdym przypadku wykresowi musi towarzyszyć nagłówek - nad lub pod polem wykresu. Tytuł wskazuje, który wskaźnik jest wyświetlany, dla jakiego terytorium i na jaki czas.

Wykresy liniowe służą do reprezentowania zmiennych ilościowych: charakterystyk zmienności ich wartości, dynamiki, relacji między zmiennymi. Zmienność danych jest analizowana za pomocą obszar dystrybucji, kumuluje się(mniej niż krzywa) i ostrołuki(krzywa „większa niż”). Wielokąt rozkładu jest omówiony w Temacie 4 (np. Rys. 5.). Aby zbudować kumulację, wartości cechy zmiennej są wykreślane wzdłuż odciętej, a rzędne są skumulowanymi sumami częstotliwości lub częstotliwości (od f1 do f). Aby zbudować ostrołuk, skumulowane sumy częstotliwości są umieszczane na osi y w odwrotnej kolejności (od ∑ f zanim f1). Kumuluj i ostrołukuj zgodnie z tabelą. 4. zobrazować na ryc. jeden.

Ryż. 1. Kumulacje i okazania podziału towarów według wartości wartości celnej

Wykorzystanie wykresów liniowych w analizie trendów omówiono w Temacie 5 (np. Rysunek 13), a ich wykorzystanie do analizy połączeń w Temacie 6 (np. Rysunek 21). Temat 6 obejmuje również wykorzystanie wykresów punktowych (np. Rysunek 20).

Wykresy liniowe są podzielone na jednowymiarowy, używany do reprezentowania danych na pojedynczej zmiennej, oraz dwuwymiarowy- dla dwóch zmiennych. Przykładem jednowymiarowego wykresu liniowego jest wielokąt rozkładu, a dwuwymiarowego – linia regresji (np. rys. 21).

Czasami przy dużych zmianach wskaźnika stosuje się skalę logarytmiczną. Na przykład, jeśli wartości wskaźnika wahają się od 1 do 1000, może to powodować trudności podczas kreślenia. W takich przypadkach przechodzą na logarytmy wartości wskaźników, które nie będą się tak bardzo różnić: LG 1 = 0, LG 1000 = 3.

Wśród planarny Wykresy słupkowe (histogramy) rozróżnia się według częstotliwości użycia, w których wskaźnik jest prezentowany w postaci słupka, którego wysokość odpowiada wartości wskaźnika (przykładowo rys. 4).

Proporcjonalność obszaru określonej figury geometrycznej do wartości wskaźnika leży u podstaw innych rodzajów diagramów planarnych: trójkątny, kwadrat, prostokątny. Można również skorzystać z porównania pól koła - w tym przypadku ustalany jest promień koła.

Wykres paskowy przedstawia wskaźniki w postaci poziomo rozciągniętych prostokątów, a poza tym jest tożsame z wykresem słupkowym.

Spośród planarnych diagramów jest często używany wykres kołowy, który służy do zilustrowania struktury badanej populacji. Cały zestaw jest traktowany jako 100%, odpowiada całkowitej powierzchni koła, obszary sektorów odpowiadają częściom zestawu. Zbudujmy diagram sektorowy struktury handlu zagranicznego Federacji Rosyjskiej w 2006 roku według tabeli. 2 (patrz rys. 2). Podczas korzystania z programów komputerowych diagramy sektorowe są budowane w formie trójwymiarowej, to znaczy nie w dwóch, ale w trzech płaszczyznach (patrz ryc. 3).

Ryż. 2. Prosty wykres kołowy 3. Wykres kołowy 3D

Diagramy kręcone (obrazowe) zwiększają przejrzystość obrazu, ponieważ zawierają obraz wyświetlanego wskaźnika, którego rozmiar odpowiada rozmiarowi wskaźnika.

Przy kreśleniu wykresu wszystko jest równie ważne – właściwy dobór obrazu graficznego, proporcje, przestrzeganie zasad projektowania wykresów. Kwestie te omówiono bardziej szczegółowo w i.

Kartogramy i kartogramy służą do zobrazowania cech geograficznych badanych zjawisk. Pokazują one lokalizację badanego zjawiska, jego natężenie na określonym terytorium - w republice, regionie, powiecie gospodarczym, administracyjnym itp. Konstrukcja kartogramów i kartogramów jest rozważana na przykład w literaturze specjalistycznej.

Wartość metody graficznej w analizie i uogólnianiu danych jest ogromna. Obraz graficzny pozwala przede wszystkim kontrolować wiarygodność wskaźników statystycznych, gdyż przedstawione na wykresie wyraźniej pokazują istniejące nieścisłości związane bądź z występowaniem błędów obserwacji, bądź z istotą badanego zjawiska. Za pomocą obrazu graficznego można badać schematy rozwoju zjawiska, nawiązywać istniejące relacje. Proste porównanie danych nie zawsze umożliwia wychwycenie obecności związków przyczynowych, jednocześnie ich graficzna reprezentacja pomaga zidentyfikować związki przyczynowe, szczególnie w przypadku stawiania hipotez wstępnych, które następnie podlegają dalszemu rozwijaniu.

Wykres statystyczny- jest to rysunek, na którym agregaty statystyczne charakteryzujące się określonymi wskaźnikami są opisane za pomocą warunkowych obrazów geometrycznych lub znaków. Obraz graficzny to zbiór punktów, linii i kształtów reprezentujących dane statystyczne. Elementy pomocnicze grafika to:

    Pole wykresu jest częścią płaszczyzny, na której znajdują się obrazy graficzne. Pole wykresu ma określone wymiary, które zależą od jego przeznaczenia.

    Przestrzenne punkty orientacyjne grafu ułożone są w postaci układu siatek współrzędnych. Układ współrzędnych jest niezbędny do umieszczania symboli geometrycznych w polu wykresu. Stosowane są zarówno prostokątne, jak i biegunowe układy współrzędnych.

    Punkty orientacyjne skali służą do porównywania graficznego wyświetlania obiektu i jego rzeczywistego rozmiaru. Punkty orientacyjne skali są wyznaczane przez system podziałek lub znaków skali.

    Objaśnienie wykresu składa się z wyjaśnienia obiektu przedstawionego na wykresie (nazwy) oraz znaczenia semantycznego każdego znaku użytego na wykresie.

Wykresy statystyczne są klasyfikowane według ich przeznaczenia (zawartości), sposobu budowy i charakteru obrazu graficznego (rys. 1).

Rys.1. Klasyfikacja wykresów statystycznych

Zgodnie z metodą konstruowania obrazów graficznych istnieją:

    Schematy- graficzna reprezentacja danych statystycznych, wyraźnie pokazująca zależność między porównywanymi wartościami.

    Mapy statystyczne

Istnieją następujące główne typy wykresów: liniowy, słupkowy, paskowy, sektorowy, kwadratowy, kołowy, kręcony.

Wykresy liniowe służą do scharakteryzowania dynamiki, tj. ocena zmian zjawisk w czasie. Odcięta pokazuje okresy czasu lub daty, a rzędna pokazuje poziomy szeregu dynamiki. Na jednym wykresie można umieścić kilka wykresów, co pozwala porównać dynamikę różnych wskaźników lub jeden wskaźnik dla różnych regionów lub krajów.

Rys.2. Dynamika wielkości importu samochodów osobowych w Federacji Rosyjskiej

za lata 2006-1q. 2010

Wykresy słupkowe może być użyte:

    analizować dynamikę zjawisk społeczno-gospodarczych;

    ocena realizacji planu;

    charakterystyka zmienności w szeregach rozkładów;

    do porównań przestrzennych (porównania między terytoriami, krajami, firmami);

    badać strukturę zjawisk.

Kolumny znajdują się blisko lub osobno w tej samej odległości. Wysokość kolumn powinna być proporcjonalna do wartości liczbowych poziomów cech.

Rys.3. Dynamika udziału Białorusi w obrotach handlowych Federacji Rosyjskiej z krajami WNP

Do scharakteryzowania struktury zjawisk społeczno-gospodarczych są szeroko stosowane wykresy kołowe. Aby go zbudować, okrąg należy podzielić na sektory proporcjonalnie do ciężaru właściwego części w całkowitej objętości. Suma wag właściwych wynosi 100%, co odpowiada całkowitej objętości badanego zjawiska.

Rys.4. Rozkład geograficzny obrotów handlowych między Federacją Rosyjską a krajami WNP

Wykresy słupkowe składają się z prostokątów ułożonych poziomo (paski).

Czasami do analizy porównawczej według regionu kraje używają schematy znaków graficznych(diagramy kształtów geometrycznych). Wykresy te odzwierciedlają wielkość badanego obiektu zgodnie z wielkością jego powierzchni.

Mapy statystyczne służą do oceny rozmieszczenia geograficznego zjawisk i analizy porównawczej według terytoriów.

Mapy statystyczne obejmują kartogramy i kartogramy. Różnica między nimi polega na sposobie wyświetlania statystyk na mapach.

Kartogram przedstawia rozmieszczenie terytorialne badanej cechy w poszczególnych obszarach i służy do identyfikacji wzorców tego rozmieszczenia. Kartogramy podzielone są na tło i punkt. Kartogramy tła o różnej gęstości barw charakteryzują intensywność dowolnego wskaźnika w obrębie jednostki terytorialnej. Na kartogramie punktowym poziom wybranego zjawiska jest przedstawiony za pomocą kropek.

Kartogram- jest to połączenie mapy geograficznej lub jej schematu z diagramem. Pozwala na odzwierciedlenie specyfiki każdego regionu w rozkładzie badanego zjawiska, jego cech strukturalnych.

Obecnie opracowywane są różne pakiety oprogramowania do grafiki komputerowej, np. Excel, Statgraf, Statistica.