Graficzne przedstawienie danych statystycznych. Graficzna prezentacja informacji statystycznych


Wartość metody graficznej w analizie i generalizacji danych jest ogromna. Obraz graficzny przede wszystkim pozwala kontrolować rzetelność wskaźników statystycznych, gdyż przedstawione na wykresie wyraźniej pokazują istniejące nieścisłości związane albo z obecnością błędów obserwacji, albo z istotą badanego zjawiska. Za pomocą obrazu graficznego można zbadać wzorce rozwoju zjawiska, ustalić istniejące relacje. Proste porównanie danych nie zawsze pozwala na uchwycenie obecności związków przyczynowych, jednocześnie ich graficzna reprezentacja pomaga zidentyfikować związki przyczynowe, zwłaszcza w przypadku postawienia wstępnych hipotez, które następnie podlegają dalszemu rozwojowi.

Wykres statystyczny- jest to rysunek, na którym agregaty statystyczne charakteryzujące się określonymi wskaźnikami są opisane za pomocą warunkowych obrazów lub znaków geometrycznych. Obraz graficzny to zbiór punktów, linii i kształtów reprezentujących dane statystyczne. Elementy pomocnicze grafika to:

    Pole wykresu jest częścią płaszczyzny, na której znajdują się obrazy graficzne. Pole wykresu ma określone wymiary, które zależą od jego przeznaczenia.

    Przestrzenne punkty orientacyjne wykresu ustawione są w postaci układu siatek współrzędnych. Układ współrzędnych jest niezbędny do umieszczenia symboli geometrycznych w polu wykresu. Stosowane są zarówno prostokątne, jak i biegunowe układy współrzędnych.

    Punkty orientacyjne skali służą do porównania graficznego wyświetlania obiektu i jego rzeczywistego rozmiaru. Punkty orientacyjne skali są wyznaczane przez system łusek lub znaków skali.

    Wyjaśnienie wykresu polega na wyjaśnieniu obiektu przedstawionego na wykresie (nazwa) oraz semantycznego znaczenia każdego znaku użytego na wykresie.

Wykresy statystyczne klasyfikuje się ze względu na ich przeznaczenie (zawartość), sposób budowy oraz charakter obrazu graficznego (ryc. 1).

Ryc.1. Klasyfikacja grafów statystycznych

Zgodnie z metodą konstruowania obrazów graficznych istnieją:

    Diagramy- graficzne przedstawienie danych statystycznych, wyraźnie pokazujące zależność pomiędzy porównywanymi wartościami.

    Mapy statystyczne

Istnieją następujące główne typy wykresów: liniowy, słupkowy, paskowy, sektorowy, kwadratowy, kołowy, kręcony.

Wykresy liniowe służą do charakteryzowania dynamiki, tj. ocena zmian zjawisk w czasie. Odcięta przedstawia okresy czasu lub daty, a rzędna przedstawia poziomy szeregu dynamiki. Na jednym wykresie można umieścić kilka wykresów, co pozwala porównać dynamikę różnych wskaźników lub jednego wskaźnika dla różnych regionów lub krajów.

Ryc.2. Dynamika wielkości importu samochodów osobowych w Federacji Rosyjskiej

za lata 2006-1 kw. 2010

Wykresy słupkowe może być użyte:

    analizować dynamikę zjawisk społeczno-gospodarczych;

    ocena realizacji planu;

    charakterystyka zmienności szeregu rozkładów;

    do porównań przestrzennych (porównania między terytoriami, krajami, firmami);

    studiować strukturę zjawisk.

Kolumny znajdują się blisko lub osobno w tej samej odległości. Wysokość kolumn powinna być proporcjonalna do wartości liczbowych poziomów cech.

Ryc.3. Dynamika udziału Białorusi w obrotach handlowych Federacji Rosyjskiej z krajami WNP

Do scharakteryzowania struktury zjawisk społeczno-gospodarczych są szeroko stosowane wykresy kołowe. Aby go zbudować, okrąg należy podzielić na sektory proporcjonalnie do ciężaru właściwego części w całkowitej objętości. Suma ciężarów właściwych jest równa 100%, co odpowiada całkowitej objętości badanego zjawiska.

Ryc.4. Rozkład geograficzny obrotów handlowych między Federacją Rosyjską a krajami WNP

Wykresy słupkowe składają się z prostokątów ułożonych poziomo (paski).

Czasami do analizy porównawczej według regionów używają krajów diagramy znakowe(schematy kształtów geometrycznych). Diagramy te odzwierciedlają wielkość badanego obiektu zgodnie z wielkością jego powierzchni.

Mapy statystyczne służą do oceny geograficznego rozmieszczenia zjawisk i analizy porównawczej według terytorium.

Mapy statystyczne obejmują kartogramy i kartogramy. Różnica między nimi polega na sposobie wyświetlania statystyk na mapach.

Kartogram pokazuje rozmieszczenie terytorialne badanej cechy na poszczególnych obszarach i służy do identyfikacji wzorców tego rozmieszczenia. Kartogramy dzielą się na tło i punkt. Kartogramy tła o różnej gęstości kolorów charakteryzują intensywność dowolnego wskaźnika w obrębie jednostki terytorialnej. Na kartogramie kropkowym poziom wybranego zjawiska jest przedstawiany za pomocą kropek.

Kartogram- jest to połączenie mapy geograficznej lub jej schematu z diagramem. Pozwala odzwierciedlić specyfikę każdego regionu w rozkładzie badanego zjawiska, jego cechy strukturalne.

Obecnie opracowano różne pakiety oprogramowania do grafiki komputerowej, na przykład Excel, Statgraf, Statistica.

Dane statystyczne powinny być prezentowane w taki sposób, aby można było z nich korzystać. Istnieją 3 główne formy prezentacji danych statystycznych:

1) tekst – umieszczenie danych w tekście;

2) tabelaryczne – przedstawienie danych w tabelach;

3) graficzny – przedstawienie danych w postaci wykresów.

Formularz tekstowy jest używany, gdy istnieje niewielka ilość danych cyfrowych.

Najczęściej stosowana jest forma tabelaryczna, która jest bardziej efektywną formą prezentacji danych statystycznych. W przeciwieństwie do tablic matematycznych, które zgodnie z warunkami początkowymi pozwalają uzyskać taki lub inny wynik, tablice statystyczne mówią językiem liczb o badanych obiektach.

Tabela statystyczna- jest to system wierszy i kolumn, w którym informacje statystyczne o zjawiskach społeczno-gospodarczych są prezentowane w określonej kolejności i powiązaniu.

Tabela 2. Handel zagraniczny Federacji Rosyjskiej w latach 2000 - 2006, miliardy dolarów

Indeks 2000 2001 2002 2003 2004 2005 2006
Obroty handlu zagranicznego 149,9 155,6 168,3 280,6 368,9 468,4
Eksport 101,9 107,3 135,9 183,2 243,6 304,5
Import 44,9 53,8 76,1 97,4 125,3 163,9
Bilans handlowy 60,1 48,1 46,3 59,9 85,8 118,3 140,7
w tym:
z zagranicą
eksport 90,8 86,6 90,9 114,6 210,1 261,1
import 31,4 40,7 48,8 77,5 103,5 138,6
Bilans handlowy 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Na przykład w tabeli. 2 przedstawia informacje o handlu zagranicznym Rosji, których przedstawienie w formie tekstowej byłoby nieefektywne.

Wyróżnić temat I orzec tabela statystyczna. Podmiot wskazuje charakteryzowany obiekt - albo jednostki populacji, albo grupy jednostek, albo całość jako całość. W orzeczeniu podawana jest charakterystyka podmiotu, zwykle w postaci liczbowej. Obowiązkowy nagłówek table, który wskazuje do jakiej kategorii i do jakiego czasu należą dane w tabeli.

Ze względu na charakter przedmiotu tabele statystyczne dzielą się na prosty, Grupa I kombinowany. W temacie prostej tabeli przedmiot badań nie jest podzielony na grupy, ale albo podano listę wszystkich jednostek populacji, albo wskazano populację jako całość (na przykład tabela 11). W temacie tabeli grup przedmiot badania jest podzielony na grupy według jednego atrybutu, a predykat wskazuje liczbę jednostek w grupach (bezwzględną lub procentową) oraz wskaźniki podsumowujące dla grup (na przykład Tabela 4). W temacie tabeli kombinacji populacja jest podzielona na grupy nie według jednego, ale według kilku kryteriów (na przykład tabela 2).

Podczas konstruowania tabel należy kierować się następującymi wskazówkami Główne zasady.

1. Temat tabeli znajduje się w lewej (rzadziej - górnej) części, a predykat - w prawej (rzadziej - dolnej).

2. Nagłówki kolumn zawierają nazwy wskaźników i ich jednostki.

3. Ostatni wiersz uzupełnia tabelę i znajduje się na jego końcu, ale czasami jest to pierwszy: w tym przypadku drugi wiersz jest zapisany „w tym”, a kolejne wiersze zawierają składowe wiersza sumarycznego.

4. Dane liczbowe są zapisywane z taką samą dokładnością w każdej kolumnie, cyfry liczb znajdują się pod cyframi, a część całkowita jest oddzielona od przecinka ułamkowego.

5. W tabeli nie powinno być pustych komórek: jeśli dane są zerowe, to wstawiany jest znak „–” (myślnik); jeżeli dane nie są znane, to dokonuje się wpisu „brak informacji” lub umieszcza się znak „…” (wielokropek). Jeśli wartość wykładnika nie jest zerowa, ale pierwsza cyfra znacząca pojawia się po zaakceptowanym stopniu dokładności, to rejestrowane jest 0,0 (jeśli, powiedzmy, zaakceptowano stopień dokładności 0,1).

Czasami tabele statystyczne są uzupełniane wykresami, gdy celem jest podkreślenie jakiejś cechy danych, ich porównanie. Forma graficzna jest najbardziej efektywną formą prezentacji danych pod względem ich percepcji. Za pomocą wykresów uzyskuje się widoczność cech konstrukcji, dynamiki, zależności zjawisk i ich porównanie.

Wykresy statystyczne- są to obrazy warunkowe wartości liczbowych i ich stosunków za pomocą linii, kształtów geometrycznych, rysunków lub wykresów geograficznych. Forma graficzna ułatwia rozpatrywanie danych statystycznych, czyni je wizualnymi, wyrazistymi i widocznymi. Wykresy mają jednak pewne ograniczenia: po pierwsze, wykres nie może zawierać tylu danych, ile mieści się w tabeli; dodatkowo wykres pokazuje zawsze dane zaokrąglone - nie dokładne, ale przybliżone. W związku z tym wykres jest używany tylko do pokazania ogólnej sytuacji, a nie szczegółów. Ostatnią wadą jest złożoność kreślenia. Można temu zaradzić za pomocą komputera osobistego (na przykład „Kreator diagramów” z pakietu Microsoft OfficeExcel).

Zgodnie z metodą konstruowania grafiki dzielą się na diagramy, kartogramy I diagramy wykresów.

Najbardziej powszechnym sposobem graficznej reprezentacji danych są wykresy, które dzielą się na następujące typy: liniowy, radialny, punktowy, planarny, wolumetryczny, kędzierzawy. Rodzaj wykresów zależy od rodzaju prezentowanych danych oraz zadania konstrukcyjnego. W każdym przypadku wykresowi musi towarzyszyć nagłówek – nad lub pod polem wykresu. Tytuł wskazuje, który wskaźnik jest wyświetlany, dla jakiego terytorium i o której godzinie.

Wykresy liniowe służą do reprezentacji zmiennych ilościowych: charakterystyki zmienności ich wartości, dynamiki, relacji między zmiennymi. Zmienność danych jest analizowana za pomocą obszar dystrybucji, kumuluje się(mniej niż krzywa) i ostrołuki(krzywa „większa niż”). Wielokąt rozkładu jest omówiony w Temacie 4 (np. Rys. 5.). Aby zbudować kumulację, wartości cechy zmiennej są wykreślane wzdłuż odciętych, a rzędne są skumulowanymi sumami częstotliwości lub częstotliwości (od f1 do ∑ F). Aby zbudować ostrołuk, skumulowane sumy częstotliwości są umieszczane na osi y w odwrotnej kolejności (od ∑ F zanim f1). Kumulacja i ostrołuk zgodnie z tabelą. 4. przedstaw na ryc. 1.

Ryż. 1. Kumuluje i ostrołukuje podział towarów według wartości wartości celnej

Wykorzystanie wykresów liniowych w analizie trendów omówiono w Temacie 5 (np. Ryc. 13), a ich użycie do analizy powiązań w Temacie 6 (np. Ryc. 21). Temat 6 obejmuje również wykorzystanie wykresów punktowych (np. rysunek 20).

Wykresy liniowe dzielą się na jednowymiarowy, używany do reprezentowania danych dotyczących pojedynczej zmiennej, oraz dwuwymiarowy- dla dwóch zmiennych. Przykładem jednowymiarowego wykresu liniowego jest wielokąt rozkładu, a dwuwymiarowego – linia regresji (np. ryc. 21).

Czasami przy dużych zmianach wskaźnika stosuje się skalę logarytmiczną. Na przykład, jeśli wartości wskaźnika wahają się od 1 do 1000, może to powodować trudności podczas kreślenia. W takich przypadkach przechodzą na logarytmy wartości wskaźników, które nie będą się tak bardzo różnić: lg 1 = 0, lg 1000 = 3.

Wśród płaski Wykresy słupkowe (histogramy) wyróżnia się w zależności od częstotliwości używania, w których wskaźnik jest przedstawiony jako słupek, którego wysokość odpowiada wartości wskaźnika (na przykład ryc. 4).

Proporcjonalność obszaru określonej figury geometrycznej do wartości wskaźnika leży u podstaw innych typów diagramów planarnych: trójkątny, kwadrat, prostokątny. Możesz także skorzystać z porównania obszarów koła - w tym przypadku ustawiony jest promień okręgu.

Wykres paskowy przedstawia wskaźniki w postaci poziomo rozciągniętych prostokątów, a poza tym jest taki sam jak wykres słupkowy.

Spośród diagramów planarnych jest często używany wykres kołowy, który służy do zobrazowania struktury badanej populacji. Cały zestaw jest traktowany jako 100%, odpowiada całkowitej powierzchni koła, obszary sektorów odpowiadają częściom zestawu. Zbudujmy diagram sektorowy struktury handlu zagranicznego Federacji Rosyjskiej w 2006 roku zgodnie z tabelą. 2 (patrz rys. 2). Podczas korzystania z programów komputerowych diagramy sektorowe są budowane w formie trójwymiarowej, to znaczy nie w dwóch, ale w trzech płaszczyznach (patrz ryc. 3).

Ryż. 2. Prosty wykres kołowy 3. Wykres kołowy 3D

Diagramy kręcone (obrazowe) poprawiają przejrzystość obrazu, ponieważ zawierają obraz wyświetlanego wskaźnika, którego rozmiar odpowiada rozmiarowi wskaźnika.

Podczas kreślenia wykresu wszystko jest równie ważne - właściwy wybór obrazu graficznego, proporcje, przestrzeganie zasad projektowania wykresów. Kwestie te są omówione bardziej szczegółowo w i.

Kartogramy i kartogramy służą do przedstawiania geograficznych cech badanych zjawisk. Pokazują lokalizację badanego zjawiska, jego intensywność na określonym terytorium - w republice, regionie, okręgu gospodarczym lub administracyjnym itp. Konstrukcja kartogramów i kartogramów jest rozważana na przykład w literaturze specjalistycznej.

Koniec pracy -

Ten temat należy do:

Pojęcie statystyki. Przedmiot i metoda statystyki

Pojęcie statystyki.. przedmiot i metoda statystyki.. obserwacja statystyczna..

Jeśli potrzebujesz dodatkowych materiałów na ten temat lub nie znalazłeś tego, czego szukałeś, polecamy skorzystanie z wyszukiwarki w naszej bazie prac:

Co zrobimy z otrzymanym materiałem:

Jeśli ten materiał okazał się dla Ciebie przydatny, możesz zapisać go na swojej stronie w sieciach społecznościowych:

Wszystkie tematy w tej sekcji:

Przedmiot i metoda statystyki
Termin „statystyka” został wprowadzony do użytku naukowego przez niemieckiego naukowca Gottfrieda Achenwala w 1746 roku, który zaproponował zastąpienie tytułu kursu „Studia państwowe” prowadzonego na niemieckich uniwersytetach tytułem „Studia św.

Obserwacja statystyczna
Ludzie mają różny stosunek do informacji statystycznych: jedni ich nie dostrzegają, inni bezwarunkowo wierzą, a jeszcze inni zgadzają się z opinią angielskiego polityka Disraeli: „Istnieją 3 rodzaje kłamstw: kłamstwa,

Podsumowanie i grupowanie statystyk
Podsumowanie – naukowo zorganizowane przetwarzanie materiałów obserwacyjnych (według wcześniej opracowanego programu), które obejmuje, oprócz obowiązkowej kontroli zebranych danych, systematyzację, grupowanie

Wartości bezwzględne
Do scharakteryzowania zjawisk masowych statystyka wykorzystuje wielkości statystyczne (wskaźniki), które charakteryzują grupy jednostek lub agregat (zjawisko) jako całość. Wielkości statystyczne

Wartości względne
Wartość względna jest wynikiem podzielenia (porównania) dwóch wartości bezwzględnych. Licznik ułamka to porównywana wartość, a mianownik to porównywana wartość (ba

Średnie wartości
Jak już wielokrotnie mówiono, statystyka bada zjawiska i procesy masowe. Każde z tych zjawisk ma zarówno wspólne dla całego zbioru, jak i szczególne, indywidualne właściwości.

Budowanie serii dystrybucji
Cechy badane przez statystyki różnią się (różnią się od siebie) dla różnych jednostek populacji w tym samym okresie lub punkcie w czasie. Na przykład wartość obrotów handlu zagranicznego jest zróżnicowana

Obliczanie charakterystyk strukturalnych szeregów dystrybucyjnych
Podczas badania zmienności stosuje się takie cechy szeregu dystrybucji, które opisują ilościowo jego strukturę, strukturę. Taka jest na przykład mediana - wartość atrybutu zmiennej

Obliczanie miar wielkości i intensywności zmienności
Najprostszym wskaźnikiem jest zakres zmienności – bezwzględna różnica między maksymalną a minimalną wartością cechy od wartości dostępnych w badanej populacji (24):

Obliczanie momentów rozkładu i wskaźników jego kształtu
Do dalszych badań natury zmienności stosuje się średnie wartości różnych stopni odchyleń poszczególnych wartości cechy od jej średniej arytmetycznej. Te wskaźniki to tzw

Sprawdzenie, czy szereg rozkładu jest normalny
Przez teoretyczną krzywą rozkładu rozumie się graficzną reprezentację szeregu w postaci ciągłej linii zmian częstotliwości w szeregu wariacyjnym, funkcjonalnie powiązaną ze zmianą opcji, innych

Sprawdzenie, czy szereg rozkładów jest zgodny z prawem Poissona
Kontrola celna przeprowadziła kontrolę po zwolnieniu towarów. W rezultacie uzyskano następujące dyskretne szeregi rozkładów liczby naruszeń stwierdzonych w każdym teście (tab. 16). Tabela 1

Bezwzględne i względne wskaźniki zmiany struktury
Rozwój populacji statystycznej przejawia się nie tylko w ilościowym wzroście lub ubytku elementów systemu, ale także w zmianie jego struktury. Struktura jest strukturą agregatu

Rankingowe wskaźniki zmiany struktury
Do pomiaru różnic w strukturze często stosuje się mniej dokładne, ale łatwiejsze do obliczenia wskaźniki, które opierają się na ocenie różnic nie w wartościach samych udziałów, ale w ich szeregach, czyli porządkowych

Koncepcja obserwacji wybiórczej
Metodę doboru próby stosuje się, gdy zastosowanie obserwacji ciągłej jest fizycznie niemożliwe ze względu na ogromną ilość danych lub nie jest ekonomicznie wykonalne. Istnieje fizyczna niemożliwość

Metody pobierania próbek
1. Właściwie losowy wybór: wszystkie jednostki HS są ponumerowane, a liczby wylosowane w wyniku losowania odpowiadają jednostkom, które wpadły do ​​​​próby, a liczba liczb jest równa planowanej liczbie

Średni błąd próbkowania
Po dokonaniu wyboru wymaganej liczby jednostek w próbie i zarejestrowaniu cech tych jednostek przewidzianych w programie obserwacji, przystępują do obliczania wskaźników uogólniających. do nich od

Krańcowy błąd próbkowania
Biorąc pod uwagę, że na podstawie badania reprezentacyjnego nie jest możliwe dokładne oszacowanie uogólniającej charakterystyki HS, konieczne jest znalezienie granic, w których się ona mieści. W konkretnej próbce różnica

Wymagana wielkość próbki
Opracowując program selektywnej obserwacji, otrzymują określoną wartość błędu krańcowego i poziom prawdopodobieństwa. Minimalna wielkość próbki, która zapewnia daną

Wytyczne
Zadanie. W przedsiębiorstwie przeprowadzono wywiady ze 100 pracownikami na 1000 w kolejności niepowtarzającej się próby losowej i uzyskano następujące dane dotyczące ich dochodów za miesiąc (tabela 24): Ta

Pojęcie szeregów czasowych
Jednym z najważniejszych zadań statystyki jest badanie zmian analizowanych wskaźników w czasie, czyli ich dynamiki. Problem ten rozwiązuje się analizując szeregi dynamiki (szeregi czasowe).

Wskaźniki zmian poziomów szeregu dynamiki
Analiza szeregów czasowych rozpoczyna się od określenia, jak zmieniają się poziomy szeregu (zwiększają się, maleją lub pozostają niezmienione) w wartościach bezwzględnych i względnych. Śledzić

Średnie wskaźniki szeregu dynamiki
Każda seria dynamiki może być traktowana jako określony zestaw n wskaźników zmieniających się w czasie, które można podsumować jako wartości średnie. Takie uogólnione (średnie) wskaźniki są szczególnie

Metody identyfikacji głównego trendu (trendu) w szeregach dynamiki
Jednym z głównych zadań badania szeregów dynamiki jest identyfikacja głównego trendu (wzorca) zmian poziomów szeregu, zwanego trendem. Regularność w zmianie poziomów serii w niektórych przypadkach

Ocena i prognozowanie adekwatności trendów
Dla znalezionego równania trendu konieczna jest ocena jego wiarygodności (adekwatności), co zwykle przeprowadza się za pomocą kryterium Fishera, porównując jego obliczoną wartość Fр

Analiza sezonowa
W szeregach dynamiki, których poziomy są wskaźnikami miesięcznymi lub kwartalnymi, obok wahań losowych często obserwuje się wahania sezonowe, rozumiane jako okresowe

Wytyczne
Według Federalnej Państwowej Służby Statystycznej bilans handlu zagranicznego (SVT) Rosji za lata 2000-2006. charakteryzuje się szeregiem dynamiki przedstawionych w tabeli. 36. Tabela 36. Saldo handlu zagranicznego (CBT) Rosji dla s

Pojęcie zależności korelacyjnej
Jednym z najbardziej ogólnych praw obiektywnego świata jest prawo uniwersalnego związku i zależności między zjawiskami. Naturalnie, badając zjawiska w najróżniejszych dziedzinach, statystyki nieuchronnie się zderzają

Metody identyfikacji i oceny korelacji
W statystyce stosuje się szereg metod w celu określenia obecności i charakteru korelacji między dwiema cechami. 1. Uwzględnienie danych równoległych (kn

Współczynniki korelacji rang
Współczynniki korelacji rang są mniej dokładnymi, ale łatwiejszymi do obliczenia, nieparametrycznymi wskaźnikami do pomiaru bliskości związku między dwiema skorelowanymi cechami. Obejmują one

Osobliwości korelacji szeregów czasowych
W wielu badaniach konieczne jest jednoczesne badanie dynamiki kilku wskaźników, tj. rozważ kilka szeregów czasowych równolegle. W takim przypadku konieczny staje się pomiar zależności

Wskaźniki ścisłości związku między cechami jakościowymi
Metoda tablic korelacji ma zastosowanie nie tylko do cech ilościowych, ale także opisowych (jakościowych), których związek często musi być badany podczas prowadzenia różnych socjologów.

Wielokrotna korelacja
Rozwiązując problemy praktyczne, badacze stają przed faktem, że korelacje nie ograniczają się do relacji między dwiema cechami: efektywnym y i czynnikiem x. w akcji

Cel i rodzaje indeksów
Wskaźnik jest wartością względną pokazującą, ile razy poziom badanego zjawiska w danych warunkach różni się od poziomu tego samego zjawiska w innych warunkach. Różnica w warunkach może być

Indeksy indywidualne
Względna wartość uzyskana przez porównanie poziomów nazywana jest indeksem indywidualnym, jeśli struktura badanego zjawiska nie ma znaczenia. Poszczególne indeksy są oznaczone przez i

Indeksy ogólne
Jeżeli badane zjawisko jest heterogeniczne i porównania poziomów można dokonać dopiero po sprowadzeniu ich do wspólnej miary, analizę ekonomiczną przeprowadza się za pomocą wskaźników ogólnych. Indeks staje się ogólny

Średnie indeksy
Podczas badania wskaźników jakościowych często konieczne jest uwzględnienie zmiany w czasie (lub przestrzeni) średniej wartości wskaźnika indeksowanego dla pewnej jednorodnej populacji.

Indeksy terytorialne
Wskaźniki terytorialne służą do przestrzennych, międzyregionalnych porównań różnych wskaźników. Ich obliczenie jest bardziej skomplikowane niż obliczenie rozważanych wskaźników tradycyjnych (dynamicznych).

GRAFICZNA REPREZENTACJA DANYCH STATYSTYCZNYCH, metoda wizualnej reprezentacji i uogólniania danych o zjawiskach społeczno-gospodarczych poprzez obrazy geometryczne, rysunki lub schematyczne mapy geograficzne i objaśniające je napisy. Graficzne przedstawienie danych statystycznych w przejrzysty i wizualny sposób ukazuje zależność między zjawiskami i procesami życia społecznego, główne tendencje w ich rozwoju, stopień ich rozmieszczenia w przestrzeni; pozwala zobaczyć zarówno całokształt zjawisk jako całość, jak i poszczególne jego części.

Do graficznej prezentacji danych statystycznych stosuje się różnego rodzaju wykresy statystyczne. Każdy wykres składa się z obrazu graficznego oraz elementów pomocniczych. Należą do nich: wyjaśnienie wykresu, odniesienia przestrzenne, odniesienia do skali, pole wykresu. Elementy pomocnicze umożliwiają odczytanie wykresu, jego zrozumienie i wykorzystanie. Grafy można klasyfikować według wielu cech: w zależności od kształtu obrazu graficznego mogą to być punkty, linie, planarne, przestrzenne i krzywe. Ze względu na sposób konstruowania grafik dzielą się one na diagramy i mapy statystyczne.

Najpopularniejszym sposobem przedstawiania obrazów graficznych jest diagram. Jest to rysunek, na którym dane statystyczne są przedstawione w postaci geometrycznych kształtów lub znaków, a terytorium, którego te dane dotyczą, jest wskazane tylko werbalnie. Jeśli diagram jest nałożony na mapę geograficzną lub plan terytorium, którego dotyczą dane statystyczne, wówczas wykres nazywa się diagramem mapy. Jeśli dane statystyczne są pokazane przez cieniowanie lub kolorowanie odpowiedniego terytorium na mapie lub planie geograficznym, wówczas wykres nazywa się kartogramem.

Do porównania podobnych danych statystycznych charakteryzujących różne obiekty lub terytoria można użyć różnych typów wykresów. Najbardziej oczywiste są wykresy słupkowe, w których dane statystyczne są wyświetlane jako wydłużone pionowo prostokąty. Ich przejrzystość uzyskuje się przez porównanie wysokości kolumn (ryc. 1).

Jeśli linia bazowa jest pionowa, a słupki poziome, wówczas wykres nazywany jest wykresem paskowym. Rysunek 2 przedstawia porównawczy wykres słupkowy charakteryzujący terytorium globu.

Wykresy przeznaczone do popularyzacji budowane są niekiedy w formie standardowych rycin – rysunków charakterystycznych dla wyświetlanych danych statystycznych, co czyni wykres bardziej wyrazistym i zwraca na niego uwagę. Takie diagramy nazywane są kręconymi lub obrazkowymi (ryc. 3).

Dużą grupę grafów orientacyjnych stanowią diagramy strukturalne. Metoda graficznego przedstawienia struktury danych statystycznych polega na sporządzeniu kołowego lub kołowego wykresu strukturalnego (ryc. 4).

Dla obrazu i analizy rozwoju zjawisk w czasie konstruowane są diagramy dynamiki: słupkowy, paskowy, kwadratowy, kołowy, liniowy, radialny itp. Wybór rodzaju diagramu zależy od charakterystyki danych wyjściowych, cel badania. Na przykład, jeśli istnieje seria dynamiki o nieco nierównych poziomach w czasie (1913, 1940, 1950, 1980, 2000, 2005), wówczas stosuje się wykresy słupkowe, kwadratowe lub kołowe. Są efektowne wizualnie, dobrze zapamiętywane, ale nie nadają się do przedstawiania dużej liczby poziomów. Jeśli liczba poziomów w szeregu dynamiki jest duża, stosuje się diagramy liniowe, które odtwarzają proces rozwoju w postaci ciągłej linii przerywanej (ryc. 5).

Dość często na jednym wykresie liniowym pokazywanych jest kilka krzywych, które dają porównawczy opis dynamiki różnych wskaźników lub tego samego wskaźnika w różnych krajach (ryc. 6).

Aby wyświetlić zależność jednego wskaźnika od drugiego, budowany jest diagram zależności. Jeden wskaźnik jest traktowany jako X, a drugi jako Y (tj. Funkcja X). Tworzony jest prostokątny układ współrzędnych ze skalami dla wskaźników i rysowany jest w nim wykres (ryc. 7).

Rozwój techniki komputerowej i stosowanego oprogramowania umożliwił stworzenie systemów informacji geograficznej (GIS), które stanowią jakościowo nowy etap w graficznym przedstawianiu informacji. GIS zapewniają gromadzenie, przechowywanie, przetwarzanie, dostęp, wyświetlanie i dystrybucję przestrzennie skoordynowanych danych; zawierają dużą liczbę graficznych i tematycznych baz danych w połączeniu z funkcjami modelowymi i obliczeniowymi, które umożliwiają prezentację informacji w formie przestrzennej (kartograficznej), uzyskiwanie wielowarstwowych map elektronicznych regionu w różnych skalach. Ze względu na zasięg terytorialny wyróżnia się globalne, subkontynentalne, stanowe, regionalne i lokalne rodzaje GIS. Orientacja podmiotowa GIS jest określona przez zadania rozwiązywane za jego pomocą, wśród których może być inwentaryzacja zasobów, analiza, ocena, monitorowanie, zarządzanie i planowanie.

Lit.: Gerchuk Ya. P. Metody graficzne w statystyce. M., 1968; Teoria statystyki / pod redakcją RA Shmoylova. wyd. 4 M., 2005. S. 150-83.

Wykres statystyczny to rysunek, na którym populacje statystyczne charakteryzujące się określonymi wskaźnikami są opisane za pomocą warunkowych obrazów lub znaków geometrycznych. W grafach statystycznych najczęściej stosuje się układ współrzędnych prostokątnych, ale zdarzają się również grafy oparte na zasadzie współrzędnych biegunowych (wykresy kołowe).

Klasyfikacja typów wykresów:

a) sposób konstruowania obrazu graficznego;

b) znaki geometryczne przedstawiające wskaźniki i zależności statystyczne;

c) zadania rozwiązywane za pomocą obrazu graficznego.

Wykresy statystyczne w postaci obrazu graficznego:

1. Liniowy: krzywe statystyczne.

2. Planarne: kreska, pasek, kwadrat, koło, sektor, kędzierzawy, kropka, tło.

3. Objętość: powierzchnie dystrybucji.

Wykresy statystyczne według metody konstrukcji i zadań obrazkowych:

1. Diagramy: diagramy porównawcze, diagramy dynamiki, diagramy strukturalne (najpowszechniejszy sposób przedstawiania obrazów graficznych. Są to wykresy zależności ilościowych).

2. Mapy statystyczne: kartogramy, kartogramy (wykresy rozkładu ilościowego na powierzchni. W swoim głównym celu ściśle przylegają do diagramów i są specyficzne tylko w tym sensie, że są warunkowymi obrazami danych statystycznych na konturowej mapie geograficznej, tj. , pokazują rozkład przestrzenny lub przestrzenny rozkład statystyk)

10/ Liczby bezwzględne

Wskaźniki bezwzględne odzwierciedlają fizyczne wymiary procesów i zjawisk badanych przez statystykę, a mianowicie ich masę, powierzchnię, objętość, długość, charakterystykę czasową. Zawsze są to numery nazwane. Wyrażone w naturalne, wartość lub praca jednostki miary.

Jednostki naturalne - tony, kilometry, litry, baryłki, sztuki.

Warunkowo naturalne jednostki są stosowane, gdy produkt ma kilka odmian, a całkowitą objętość można określić tylko na podstawie właściwości konsumpcyjnej wspólnej dla wszystkich odmian. Przeliczenie na jednostki konwencjonalne odbywa się na podstawie specjalnych współczynników obliczanych jako stosunek właściwości konsumenckich poszczególnych odmian produktu do wartości referencyjnej.

Jednostki miary kosztów dają pieniężną ocenę zjawisk społeczno-gospodarczych (wartość PKB). Jednostki miary pracy umożliwiają uwzględnienie całkowitych kosztów pracy w przedsiębiorstwie oraz pracochłonności poszczególnych operacji procesu technologicznego (roboczodni, roboczogodzin).

Indywidualne wskaźniki bezwzględne uzyskanych bezpośrednio w procesie obserwacji statystycznej w wyniku interesującej nas cechy ilościowej.

Sumaryczne wskaźniki bezwzględne wolumenu uzyskuje się przez sumowanie i grupowanie poszczególnych wartości.

11/ Wskaźniki względne

Wskaźnik względny jest wynikiem podzielenia jednego wskaźnika bezwzględnego przez inny i wyraża stosunek ilościowych cech zjawisk społeczno-gospodarczych.

Bez wskaźników względnych nie można mierzyć intensywności rozwoju badanego zjawiska w czasie, oceniać poziomu rozwoju jednego zjawiska na tle innych zjawisk z nim powiązanych, dokonywać porównań przestrzennych i terytorialnych.

Podczas obliczania wskaźnika względnego wywoływany jest wskaźnik bezwzględny, który znajduje się w liczniku wynikowego stosunku aktualne lub porównywalne, a wykładnik w mianowniku nazywa się podstawa porównania lub podstawa.

Wskaźniki względne mogą być wyrażone we współczynnikach, procentach, ppm, dziesiętnych lub mogą być nazwane wartościami. Procenty stosuje się w przypadkach, gdy porównywany wskaźnik bezwzględny przekracza wskaźnik bazowy nie więcej niż 2-3 razy. Jeśli przewaga jest większa, wówczas stosuje się współczynnik.

Są następujące rodzaje wskaźników względnych.

    Względny wskaźnik dynamiki (RDI) to stosunek poziomu badanego procesu lub zjawiska w danym okresie czasu do poziomu tego samego zjawiska w przeszłości. OPD jest mierzone w procentach lub wyrażane jako współczynnik.

    Ta wartość pokazuje, ile razy bieżący poziom jest wyższy niż linia bazowa lub jaka jest jej proporcja do linii bazowej. Jeśli GPV jest wyrażona jako wielokrotność, to jest to czynnik wzrostu. Po pomnożeniu tego współczynnika przez 100 otrzymuje się tempo wzrostu.

    Wskaźnik względny planu (RPI) to stosunek planowanego poziomu wskaźnika do wskaźnika osiągniętego już w przeszłości. RPO, podobnie jak RAP, wyraża się w procentach lub jako wskaźnik.

    Względny Wskaźnik Realizacji Planu (PRRP) to stosunek faktycznie osiągniętego poziomu do planowanego poziomu wskaźnika. PRRP jest również wyrażany w procentach lub jako stosunek.

    Względny wskaźnik struktury (RPS) jest stosunkiem części strukturalnych badanego obiektu i jest określany przez stosunek wskaźnika charakteryzującego część populacji do wskaźnika charakteryzującego całą populację. OPS wyraża się w ułamkach jednostek lub w procentach.

    Względny wskaźnik koordynacji (RIC) - stosunek różnych części należących do jednego obiektu.

    Relative Comparison Index (RPCr) to stosunek bezwzględnych wskaźników o tej samej nazwie, które charakteryzują różne obiekty.

    Wskaźnik względnej intensywności (RII) charakteryzuje stopień rozprzestrzeniania się badanego procesu lub zjawiska w jego nieodłącznym środowisku i jest określony przez stosunek wskaźnika charakteryzującego zjawisko do wskaźnika charakteryzującego środowisko dla rozkładu tego zjawiska. OPI są mierzone w procentach, ppm, dziesiętnych. Wskaźnik ten oblicza się, gdy wartość bezwzględna jest niewystarczająca do sformułowania rozsądnych wniosków na temat skali zjawiska. Różne OPII to wskaźniki poziom rozwoju gospodarczego charakteryzujące produkcję PKB per capita, obrót handlowy per capita itp. Wskaźniki poziomu rozwoju gospodarczego są nazywane wartościami i są mierzone w rublach na mieszkańca itp.

§ 1. Pojęcia statystyki, prawidłowości statystycznej i całościowości..... 2

§2. Znaki jednostek populacji statystycznej, ich klasyfikacja ...... 2

§1. Pojęcie obserwacji statystycznej, jej przygotowanie .............. 4

§2. Rodzaje obserwacji statystycznych ......................................................... .............. .. 5

§3. Błędy obserwacji ......................................................... ........................................... 6

§4. Podsumowanie i grupowanie ......................................................... ......................... 6

§5. Rodzaje grup statystycznych ................................................................ ............ 6

§6. Tabele statystyczne ......................................................... ... .............. 7

§7. Wykresy statystyczne ......................................................... ........................................... 8

§1. Rzeczywista i teoretyczna dystrybucja ......................................................... 21

§2. Krzywa rozkładu normalnego .............................................................. 21

§3. Testowanie hipotezy o rozkładzie normalnym............................................ 21

§4. Kryteria zgodności: Pearson, Romanovsky, Kołmogorow........... 21

§5. Praktyczna wartość modelowania szeregów rozdzielczych ..... 22

§1. Koncepcja obserwacji wybiórczej. Powody jego stosowania ...... 23

§3. Błędy próbkowania ......................................................... ............... 24

§4. Przykładowe zadania obserwacyjne............................................................ 25

§5. Rozszerzenie przykładowych danych obserwacyjnych na populację ogólną... 26

§6. Mała próbka ......................................................... .............................. 26

§1. Pojęcie korelacji i CRA .......................................................... 27

§2. Warunki korzystania i ograniczenia KPA ............................................ 27

§3. Regresja par oparta na metodzie najmniejszych kwadratów. 28

§4. Zastosowanie równania regresji liniowej dla par .......... 29

§6. Wielokrotna korelacja........................................................... 32


Temat 1.: Wprowadzenie do statystyki.

  1. pojęcia statystyki, prawidłowości statystycznej i populacji.
  2. oznaki jednostek populacji statystycznej, ich klasyfikacja.
  3. przedmiot i metoda statystyki.

§ 1. Pojęcia statystyki, prawidłowości statystycznej i całościowości.

Słowo statystyka pochodzi z łac. status” w tłumaczeniu - stan, stan rzeczy.

Termin statystyka powstał w drugiej połowie XVIII wieku. W związku z poznaniem stanów, badaniem ich cech. Z tego samego okresu datuje się początek nauczania statystyki na uczelni. W zależności od gałęzi badań statystycznych wyróżnia się: statystykę ludności, przemysłu, rolnictwa itp. - statystyki stosowane.

Ogólna teoria statystyki to zbiór metod i technik gromadzenia, przetwarzania, prezentacji i analizy danych liczbowych. Termin statystyka jest dziś używany w 3 znaczeniach:

  1. jako synonim słowa „dane”
  2. gałąź znaczeń, która łączy zasady i metody pracy z danymi liczbowymi charakteryzującymi zjawiska masowe (średnia długość życia mężczyzn jest krótsza niż kobiet)
  3. gałąź działalności praktycznej, której celem jest przetwarzanie i analiza danych liczbowych.

Statystyka pozwala identyfikować i mierzyć schemat rozwoju procesów i zjawisk społeczno-gospodarczych oraz zależności między nimi w określonych warunkach miejsca i czasu.

Regularność odnosi się do powtarzalności, kolejności i porządku zmian zjawisk.

Regularność statystyczna - prawidłowość, w której konieczność jest nierozerwalnie związana w każdym pojedynczym zjawisku z przypadkiem i tylko w mnogości zjawisk przejawia się jako prawo. Pojęciu prawidłowości statystycznej przeciwstawia się pojęcie prawidłowości dynamicznej, która przejawia się w każdym zjawisku. (przykład: S koło = pr 2 niż > r tematy > S koło). Przedmiotem badań statystycznych jest zbiór statystyczny – zbiór jednostek, które mają charakter masowy, jednorodność, określoną integralnością i obecnością zmienności. Każdy pojedynczy element nazywany jest jednostką populacji statystycznej (ESS)

§2. Oznaki jednostek populacji statystycznej, ich klasyfikacja.

ECC mają pewne właściwości, które są nazywane funkcjami. Statystyka bada zjawiska poprzez ich cechy, im bardziej jednorodny zbiór, tym więcej wspólnych cech mają jego jednostki i tym mniej wartości tych cech się różnią.

Znak opisowy to znak, który można wyrazić tylko ustnie.

  1. Znak ilościowy - znak, który można wyrazić liczbowo.
  2. Znak bezpośredni to właściwość, która jest bezpośrednio związana z charakterystycznym przedmiotem.
  3. Znak pośredni to właściwości nie samego przedmiotu charakteryzowanego, ale przedmiotu z nim związanego lub w nim zawartego.
  4. głównym atrybutem jest wartość bezwzględna, którą można zmierzyć.
  5. cecha wtórna - wynik porównania cech pierwotnych, jest mierzona bezpośrednio.
  6. znak naturalny - mierzony w sztukach, kg, tonach, litrach itp.
  7. znak pracy - mierzony w osobodniach, roboczogodzinach.
  8. atrybut wartości - mierzony w rublach, $, €, ₤.
  9. znak bezwymiarowy - pomiar w udziałach,%
  10. cecha alternatywna to cecha, która przyjmuje tylko jedną wartość z kilku możliwych.
  11. znak dyskretny - przyjmuje tylko wartość całkowitą, bez pośredniej.
  12. cecha ciągła to cecha, która przyjmuje dowolną wartość w określonym zakresie.
  13. Cecha czynnika to cecha, która zmienia inną cechę.
  14. efektywna cecha - cecha, która zmienia się pod wpływem innej cechy
  15. znak chwilowy – znak mierzony w określonym momencie.
  16. znak interwału - znak na określony czas.

Ta sama cecha może być jednocześnie klasyfikowana według różnych klasyfikacji.

§3. Przedmiot i metoda statystyki.

Przedmiotem badań statystycznych są agregaty statystyczne - zbiór jednogatunkowych obiektów zmiennych.

Specyfika przedmiotu statystyki określa specyfikę metody, obejmują:

  1. zbieranie danych (obserwacja statystyczna, publikacja)
  2. uogólnienie danych (podsumowanie, grupowanie)
  3. prezentacja danych (tabele i wykresy)
  4. analiza i interpretacja danych liczbowych (wyliczanie średnich, analiza wariancji, KRA, szeregi dynamiki, wskaźniki)

Temat 2: Organizacja obserwacji statystycznej.

Podsumowanie i grupowanie danych.

§1. Pojęcie obserwacji statystycznej, jej przygotowanie.

§2. Rodzaje obserwacji statystycznych.

§3 Błędy obserwacji.

§4 Podsumowanie i grupowanie

§5 Rodzaje grup statystycznych.

§6 Tabele statystyczne.

§7 Wykresy statystyczne.

§1. Pojęcie obserwacji statystycznej, jej przygotowanie.

Wszelkie badania statystyczne rozpoczynają się od zebrania danych.

Źródła informacji:

  1. różne publikacje (gazety, czasopisma itp.)
  2. głównym źródłem publikowanych informacji statystycznych są publikacje urzędów statystyki państwowej (RF w 2001 r., wydawnictwo GOSKOMSTAT).
  3. prowadzenie obserwacji statystycznych tj. naukowo zorganizowane gromadzenie danych.

Obserwacja statystyczna to masowa, planowa, naukowo zorganizowana obserwacja zjawiska życia społecznego i gospodarczego, która polega na rejestrowaniu znaków dla każdej jednostki badanej populacji.

Proces obserwacji:

  1. Przygotowanie do obserwacji
  2. Prowadzenie masowego zbierania danych
  3. Przygotowanie danych do przetwarzania
  4. Opracowanie propozycji usprawnienia obserwacji statystycznej.

Przygotowanie obserwacji:

  1. Określenie celu i przedmiotu obserwacji
  2. Ustalenie składu znaków podlegających rejestracji
  3. Opracowanie dokumentów do zbierania danych
  4. Wybór jednostki sprawozdawczej oraz jednostki, wobec której prowadzona będzie obserwacja.
  5. Konieczne jest określenie metod i środków pozyskiwania danych.

Problemy organizacyjne do rozwiązania:

  1. konieczne jest ustalenie składu służb prowadzących badanie
  2. poinstruować personel
  3. sporządzić harmonogram pracy
  4. replikować dokumenty do gromadzenia danych

Przedmiotem obserwacji są zjawiska i procesy społeczno-gospodarcze.

Konieczne jest wyraźne zidentyfikowanie znaków do rejestracji.

Program obserwacji - wykaz znaków znaków podlegających rejestracji w procesie obserwacji.

Wymagania programu obserwacji:

  1. Program powinien zawierać istotne cechy, które bezpośrednio charakteryzują badane zjawisko; znaki, które mają wtórne zjawiska lub znaki, których wartości będą oczywiście niewiarygodne lub będą całkowicie nieobecne, nie powinny być uwzględniane w programie.
  2. Pytania programu obserwacji powinny być precyzyjne, niejednoznaczne i łatwe do zrozumienia, aby uniknąć trudności w uzyskaniu odpowiedzi.
  3. Należy ustalić kolejność pytań.
  4. Program monitoringu powinien zawierać pytania o charakterze bezpośrednim w celu przeprowadzenia i wyjaśnienia zebranych danych.
  5. w celu zapewnienia jednolitości otrzymywanych informacji program sporządzany jest w formie dokumentu – zwanego formularzem statystycznym.

Formularz statystyczny to dokument pojedynczej próby zawierający program i wyniki obserwacji.

Rozróżnia się formularz indywidualny (odpowiedzi na pytania dotyczące jednej jednostki obserwacji) i spisany (informacje o kilku jednostkach populacji statystycznej).

Formularz i instrukcja jego wypełnienia są narzędziami obserwacji statystycznej.

Wybór czasu obserwacji polega na rozwiązaniu 2 pytań: ustaleniu krytycznej daty lub przedziału czasowego, określeniu okresu obserwacji.

Data krytyczna - określony dzień w roku, godzina dnia, od której należy zarejestrować znaki dla każdej jednostki badanej populacji.

Okres obserwacji – czas, w którym wypełniane są formularze statystyczne, tj. czas potrzebny do zebrania danych.

Należy wziąć pod uwagę, że odległość okresu obserwacji od krytycznej daty lub interwału może prowadzić do obniżenia wiarygodności uzyskanych informacji.

§2. Rodzaje obserwacji statystycznych.

W statystyce krajowej stosuje się trzy formy obserwacji statystycznych.

  1. sprawozdawczość statystyczna przedsiębiorstw, organizacji, instytucji.
  2. specjalnie zorganizowana obserwacja statystyczna (spis ludności itp.)
  3. rejestr – forma ciągłego statystycznego monitoringu procesów długookresowych

Obserwacja statystyczna jest klasyfikowana:

Według czasu obserwacji:

  • bieżąca obserwacja - prowadzona jest ciągła rejestracja znaków (urząd stanu cywilnego, przestępstwo itp.).
  • obserwacja okresowa - przeprowadzana jest w określonych odstępach czasu (standard życia w mieście Czelabińsk, koszt koszyka konsumenckiego, spis ludności).
  • Jednorazowa – obserwacja dokonana raz w określonym celu.

Według zasięgu jednostek populacji:

  • Ciągła obserwacja – należy uzyskać informacje o wszystkich ECC
  • Nie pełna obserwacja
    • Metoda głównej tablicy - badane są najważniejsze jednostki badanej populacji (w celu zbadania przedsiębiorstwa inżynieryjnego regionu Czelabińska).
    • Selektywna obserwacja to losowy wybór ECC do obserwacji.
    • Obserwacje monograficzne - w przypadku zaobserwowania jednego ECC często wykorzystuje się je do opracowania programu obserwacji masowej.

W ramach zbierania danych:

  • Bezpośrednia obserwacja - sami rejestratorzy, poprzez bezpośredni pomiar, ważenie, ustalają fakt rejestracji podmiotu (dziecko w wieku poniżej 1 roku w poliklinice).
  • Obserwacja dokumentacyjna – wykorzystuje się różne dokumenty (sporządzanie oświadczenia)

Ankieta - niezbędne informacje uzyskuje się ze słów respondenta.

  • Ankieta spedycyjna – realizowana przez specjalnie przeszkolonych pracowników, którzy otrzymują niezbędne informacje na podstawie ankiety zainteresowanych osób i samodzielnie odnotowują odpowiedzi w formularzu. Ankieta ekspedycyjna może być bezpośrednia (twarzą w twarz) i pośrednia (ankieta telefoniczna)
  • Ankieta korespondencyjna – informacji udziela personel korespondentów dobrowolnych, metoda ta wymaga niewielkich nakładów finansowych, ale nie oddaje dokładnej wartości obserwacji.
  • Samodzielna rejestracja – formularze wypełniają sami respondenci, a rejestratorzy jedynie rozdają im formularze ankiet i wyjaśniają, jak je wypełnić.

§3. Błędy obserwacji

Głównym wymaganiem stawianym obserwacji statystycznej jest dokładność.

Dokładność - stopień zgodności dowolnego charakterystycznego wskaźnika z rzeczywistą wartością określoną na podstawie materiałów obserwacji statystycznej.

Rozbieżność między wartością obliczoną a rzeczywistą nazywana jest błędem obserwacji, w zależności od przyczyn wystąpienia rozróżnia się: błędy rejestracji i błędy reprezentatywności. Błędy rejestracji dzielą się na przypadkowe i systematyczne.

Błędy losowe - wynik działania czynników losowych (wiersze, kolumny są pomieszane)

Błędy systematyczne - zawsze mają tendencję do przeszacowania lub niedoszacowania wskaźnika. (wiek)

Błędy reprezentatywności mają charakter obserwacji nieciągłej i powstają w wyniku niedokładnego odtworzenia próby całej pierwotnej populacji.

Po otrzymaniu formularzy statystycznych należy:

  1. sprawdzić kompletność zebranych danych.
  2. przeprowadzić kontrolę arytmetyczną opartą na wzajemnych relacjach różnych cech.
  3. do przeprowadzania sterowania logicznego w oparciu o znajomość logicznych relacji między cechami.

§4. Podsumowanie i grupowanie

Na podstawie zebranych danych niemożliwe jest dokonanie obliczeń i wyciągnięcie wniosków, po pierwsze należy je zestawić i zestawić w jednej tabeli. W tym celu stosuje się podsumowanie i grupowanie.

Podsumowanie - zestaw kolejnych operacji w celu uogólnienia określonych pojedynczych faktów, które tworzą zbiór i zidentyfikowania typowych cech i wzorców właściwych badanemu zjawisku jako całości.

Prosta wódka - licząc sumy dla ludności.

Podsumowanie złożone to zestaw operacji służących do grupowania poszczególnych obserwacji, zliczania wyników dla każdej grupy i dla całego obiektu jako całości oraz prezentowania wyników w postaci tabel statystycznych.

W zależności od formy przetwarzania materiału podsumowanie może być zdecentralizowane, scentralizowane - takie zestawienie przeprowadza się z jednorazową obserwacją statystyczną.

Grupowanie - podział zbioru jednostek badanej populacji na grupy według określonych cech.

§5. Rodzaje grup statystycznych

Grupy można klasyfikować według struktury i zawartości.

Grupowanie analityczne charakteryzuje związek między cechami, z których jedna jest czynnikiem, a druga jest produktywna.

Edukacja

Niepełne wyższe

§6. Tabele statystyczne

Wyniki podsumowania i grupowania należy przedstawić w sposób umożliwiający ich wykorzystanie.

Istnieją 3 sposoby prezentacji danych:

  1. dane mogą być zawarte w tekście.
  2. prezentacja w tabelach.
  3. graficzny sposób

Tabela statystyczna - układ wierszy i kolumn, w którym w określonej kolejności prezentowane są informacje statystyczne dotyczące zjawisk społeczno-gospodarczych.

Rozróżnij podmiot i orzeczenie tabeli.

Podmiot to przedmiot scharakteryzowany liczbami, zwykle temat jest podany po lewej stronie tabeli.

Predykat to system wskaźników, za pomocą których charakteryzuje się obiekt.

Tabela statystyczna zawiera 3 rodzaje nagłówków: ogólny, boczny

Ogólny tytuł powinien odzwierciedlać zawartość całej tabeli, znajdującej się nad tabelą pośrodku.

Zasady tabeli.

  1. wymagane są wszystkie trzy rodzaje nagłówków bez skrótów wyrazowych, w nagłówku można umieścić wspólne jednostki miary.
  2. tabela nie powinna mieć dodatkowych linii, może brakować oznaczeń pionowych.
  3. Ostatnia linia jest wymagana. Może znajdować się na początku lub na końcu dokumentu. Jeśli na początku dokumentu, to jeśli na końcu, to RAZEM:
  1. dane cyfrowe w obrębie jednej kolumny są zapisywane z dokładnością do jednego stopnia. Cyfry są pisane ściśle pod cyframi, cała część jest oddzielona przecinkiem.
  2. tabela nie powinna zawierać pustych komórek, jeśli nie ma danych, wówczas piszą „Brak informacji” lub „...”, jeśli dane wynoszą zero, to „-”. Jeżeli wartość nie jest równa zeru, ale po podanej dokładności pojawia się pierwsza cyfra znacząca 0.01®0.0 - jeśli przyjęta dokładność jest do dziesiątych części.
  3. jeśli w tabeli jest wiele kolumn, wówczas kolumny podmiotu są oznaczone dużymi literami, a kolumny predykatu cyframi.
  4. jeśli tabela oparta jest na danych zapożyczonych, to źródło danych jest wskazane pod tabelą, w razie potrzeby do tabeli mogą być dołączone przypisy.

§7. Wykresy statystyczne

Tabele statystyczne można uzupełnić wykresami.

Wykresy statystyczne to warunkowe obrazy wartości liczbowych i ich stosunków poprzez linie, kształty geometryczne, rysunki.

Zalety obrazu graficznego

  1. jasno, wyraźnie, wyraźnie.
  2. granice zmian wskaźnika, porównywalne tempo zmian i zmienność są natychmiast widoczne

Wady obrazu graficznego

  1. Uwzględnij mniej danych niż w tabeli.
  2. wykres pokazuje zaokrąglone dane, ogólną sytuację, ale nie szczegóły.

Wykresy statystyczne

Diagramy

kręcony

Temat 3: Wskaźniki statystyczne.

§1. Istota i znaczenie wskaźnika statystycznego, jego atrybuty.

§2. Klasyfikacja wskaźników statystycznych.

§3. Rodzaje wskaźników względnych. Zasady budowy.

§4. Systemy wskaźników statystycznych.

Znak statystyczny jest właściwością nieodłączną od ESS, istnieje obiektywnie niezależnie od tego, czy jest badany jako nauka, czy nie.

Wskaźnik statystyczny jest uogólniającą cechą pewnej właściwości populacji.

Struktura wskaźnika statystycznego (jego atrybuty):

  • Średnie wartości
  • Wskaźniki zmienności
  • Wskaźniki połączenia funkcji
  • Wskaźniki struktury i charakteru dystrybucji
  • Wskaźniki dynamiczne
  • Wskaźniki zmienności
  • Wskaźniki dokładności i wiarygodności przykładowych szacunków
  • Wskaźniki trafności i wiarygodności prognozy

Według rodzaju: całkowita liczba jednostek lub całkowita właściwość obiektu. Jest to suma podstawowych cech, mierzona w sztukach, kg, m, $ itd.

Wskaźnik względny- uzyskiwane przez porównanie wskaźników bezwzględnych lub względnych w przestrzeni, w czasie lub poprzez porównanie wskaźników różnych właściwości badanego obiektu.

Wskaźnik względny pierwszego rzędu uzyskuje się przez porównanie 2 x wskaźników bezwzględnych. Wskaźnik względny drugiego rzędu uzyskuje się przez porównanie wskaźników względnych pierwszego rzędu itp.

Względny indeks trzeciego rzędu i wyższych jest bardzo rzadki.

Wskaźniki bezpośrednie - takie wskaźniki, których wartość rośnie wraz ze wzrostem badanego zjawiska.

Wskaźniki odwrotne - wskaźniki, których wartość maleje wraz ze wzrostem badanego zjawiska.

… Struktury

…głośniki

…związki

… intensywność

…stosunek do normy

... porównania

Wskaźniki struktury uzyskuje się poprzez odniesienie części do całości.

Względne wskaźniki dynamiki

ü Wskaźniki dynamiki (stopy wzrostu, wzrost)

ü Indeksy

Wskaźniki relacji scharakteryzuj związek między cechami:

ü Współczynnik korelacji

ü Wskaźniki analityczne

Wskaźniki intensywności scharakteryzować związek dwóch obiektów na różnych podstawach.

ü Pracochłonność – ilość czasu zużyta na wytworzenie jednej jednostki produktu

ü Produkcja - ilość produktów wytworzonych w jednostce czasu

PRODUKCJA \u003d 1 / pracochłonność

Wskaźniki stosunku do normy- stosunek rzeczywistych wartości znaku wskaźnika do normatywnego, planowanego, optymalnego.

Wskaźniki porównawcze - porównywanie różnych obiektów na tej samej podstawie.

Ogólne zasady konstruowania wskaźników statystycznych:

  1. statystyki są obiektywnie powiązane.
  2. Porównywane wskaźniki mogą różnić się tylko jednym atrybutem; nie można porównać wskaźnika dwoma lub więcej atrybutami.
  3. konieczne jest poznanie i uwzględnienie ograniczeń wskaźnika.

Dla każdej cechy obiektu wymagany jest system wskaźników statystycznych.

  1. funkcja poznawcza - na podstawie analizy danych
  2. propaganda
  3. funkcja stymulująca

Temat 4: Średnie

§1. pojęcie średniej

§2. rodzaje średnich

§3. średnia arytmetyczna i jej własności

§4. średnia harmoniczna, średnia geometryczna, średnia kwadratowa.

§5. średnia wielowymiarowa

Najbardziej rozpowszechnioną formą wskaźników statystycznych jest średnia.

Najważniejszą właściwością średniej jest to, że odzwierciedla ona to, co wspólne, właściwe dla każdej jednostki badanej populacji, chociaż wartość atrybutu poszczególnych jednostek populacji może wahać się w tym czy innym kierunku.

Typowość średniej jest bezpośrednio związana z jednorodnością badanej populacji. W przypadku populacji niejednorodnej konieczne jest rozbicie jej na grupy jakościowo jednorodne i obliczenie średniej dla każdej z nich dla każdej z grup jednorodnych.

Możesz określić średnią za pomocą początkowego stosunku średniej (ISS) do jej wzoru logicznego.

Średnie strukturalne

Moda - Mo

Mediana - ja

W szeregu dynamiki obliczana jest średnia arytmetyczna i średnia chronologiczna.

Średnia arytmetyczna nazywa się taką średnią wartością cechy, przy obliczaniu której całkowita objętość cechy się nie zmienia.

Przykład: waga.

Poślubić prosta arytmetyka

X I– indywidualna wartość cechy

n to całkowita liczba badanej populacji

por. ważone arytmetycznie

Właściwości por. arytmetyka.

Suma odchyleń poszczególnych wartości cechy od jej wartości średniej wynosi zero

jeśli każda pojedyncza wartość cechy zostanie pomnożona lub podzielona przez tę samą stałą liczbę, to średnia wzrośnie lub spadnie o tę samą wartość.

jeśli do każdej indywidualnej wartości atrybutu dodamy jedną i tę samą stałą liczbę, to średnia wartość zmieni się odpowiednio o tę samą liczbę.

Dowód

jeśli wagi f średniej ważonej zostaną pomnożone lub podzielone przez tę samą liczbę, to średnia nie ulegnie zmianie.

suma kwadratów odchyleń atrybutu jest mniejsza niż z jakiejkolwiek innej liczby.

Inne rodzaje średnich

Rodzaj środka

prosta średnia

Średnia ważona

harmoniczny

geometryczny

kwadratowy

Bardzo trudno jest scharakteryzować zgrupowanie na jednej podstawie i niewiele informacji pozostaje w pamięci.

Średnia wielowymiarowa - średnia wartość dla kilku cech E.S.S.

Ze stosunków wartości cech dla E.S. do średnich wartości tych cech.

Średnia wielowymiarowa dla ja jednostki

X ij– wartość cechy j dla i jednostki

Średnia wartość cechy j

k to liczba cech

j to numer obiektu i liczba jego populacji

Temat 5: Analiza wariantów

§1. Zmienność znaków i jej przyczyny

§2. Rangi dystrybucji

§3. Charakterystyka strukturalna szeregu wariacyjnego.

§4. Siła wskaźników zmienności.

§5. Wskaźniki intensywności zmienności

§6. rodzaje dyspersji. Reguła dodawania wariancji.

Zmienność wartości cechy w populacji to różnica jej wartości pomiędzy różnymi jednostkami danej populacji w tym samym okresie lub punkcie czasu.

Powód zmienności: różne warunki istnienia ESS, to właśnie zmienność stwarza potrzebę takiej nauki jak statystyka.

Przeprowadzenie analizy wariacyjnej rozpoczyna się od zbudowania szeregu wariacyjnego – uporządkowanego rozkładu jednostek populacji według rosnących lub malejących znaków i zliczenia odpowiadających im częstości.

Rangi dystrybucji

ü w rankingu

ü dyskretny

interwał

Rankingowe serie odmian- wykaz poszczególnych jednostek. agreguje w porządku rosnącym malejącym cechy sklasyfikowanej

Dyskretne serie zmienności - tabela składająca się z 2 rzędów - wartości polimeru zmiennej cechy oraz ilości jednostek o danej wartości cechy.

Interwałowy szereg wariacyjny konstruuje się w następujących przypadkach:

  1. cecha przyjmuje wartości dyskretne, ale ich liczba jest zbyt duża
  2. atrybut przyjmuje dowolną wartość z określonego zakresu

Przy konstruowaniu szeregów zmienności interwałowej konieczne jest dobranie optymalnej liczby grup, najpowszechniejsza metoda wykorzystująca wzór Sturgessa

k - liczba przedziałów

n to wielkość populacji

W obliczeniach prawie zawsze uzyskuje się wartości ułamkowe, zaokrąglając do liczby całkowitej.

Długość interwału - l

Typy interwałów

dolna granica kolejnego przedziału powtarza górną granicę kolejnego przedziału

przedział otwarty, przedział z jedną granicą

Podczas obliczania serii zmian przedziału środek przedziału przyjmuje się jako x i.

NME = 60 mediana = 1

Kumulacja - dystrybucja mniejsza niż

Ogiva – dystrybucja większa niż

Mediana to wartość cechy, która dzieli całą populację na dwie równe części.

Dla dyskretnych szeregów wariacyjnych obliczenie mediany: jeśli n jest parzyste, to nie. Mediana jednostki

Seria zmian interwałowych:

k - liczba przedziałów

x 0 - dolna granica przedziału mediany

l jest długością średniego przedziału

Suma częstotliwości

Skumulowana częstotliwość przedziału poprzedzającego medianę.

Mediana częstotliwości interwału

Mediana interwału– pierwszy interwał, którego skumulowana częstotliwość przekracza połowę całkowitej sumy częstotliwości.

Graficznie mediana jest na kumulacji.

  1. Kwartyle - wartość atrybutu dzieląca populację na 4 równe części.

1. kwartyl

3. kwartyl

2. kwartyl - mediana.

xQ 1 x Q 3 - dolna granica przedziału zawierającego 1. i 3. kwartyl.

l - długość interwału

oraz - skumulowane częstości przedziałów poprzednich przedziałów zawierających 1. i 3. kwartyl.

Częstotliwości przedziałów kwartylowych.

Aby scharakteryzować serię wariacji, stosuje się:

Decyle - dzielą populację na 10 równych części, Percytyle - dzielą populację na 100 równych części.

  1. Tryb jest często występującą cechą charakterystyczną. Dla dyskretnego szeregu wariacyjnego - najwyższa częstotliwość. W przypadku szeregu zmian interwałowych modę oblicza się za pomocą następującego wzoru:

Dolna granica przedziału modalnego

l– modalna długość przedziału

fMo- częstotliwość interwałów modalnych

f Mo +1 jest częstotliwością przedziału następującego po modalu

Przedział modalny - przedział o największej częstotliwości. Graficznie tryb znajduje się na histogramie.

  1. Zmienność rozpiętości
  2. Średnie odchylenie liniowe

ważony

  1. Dyspersja:

ważony

  1. odchylenie standardowe

właściwość dyspersji.

  1. spadek wszystkich wartości cechy o tę samą wielkość nie zmienia wartości wariancji.
  2. Zmniejszenie wszystkich wartości cech o k razy zmniejsza wariancję o do 2 razy i RMS w Do raz
  3. jeśli obliczysz średni kwadrat odchyleń od dowolnej wartości A różnej od średniej arytmetycznej, to zawsze będzie on większy niż średni kwadrat odchyleń obliczony od średniej arytmetycznej. Tak więc od średniej zawsze jest mniej niż wyliczonej z jakiejkolwiek innej wartości, tj. ma minimalną właściwość. RMS = 1,25 - z rozkładami zbliżonymi do normalnych.

W warunkach rozkładu normalnego istnieje następująca zależność pomiędzy liczbą obserwacji w obrębie 68,3% obserwacji.

95,4% obserwacji mieści się w granicach

99,7% obserwacji mieści się w granicach

Aby porównać zmienność cech w różnych populacjach lub porównać zmienność różnych cech w tej samej populacji, stosuje się wskaźniki względne, których podstawą jest średnia arytmetyczna.

  1. Względny zakres zmienności.
  2. Względne odchylenie liniowe
  3. Współczynnik zmienności

wskaźniki te dają nie tylko ocenę porównawczą, ale także kształtują jednorodność populacji. Zbiór uważa się za jednorodny, jeżeli współczynnik zmienności nie przekracza 33%.

Wraz z badaniem zmienności cechy w całej populacji często konieczne jest prześledzenie ilościowych zmian cechy, ale w grupach, na które podzielona jest populacja, i między nimi. Osiąga się to poprzez obliczanie różnych widoków.

Rodzaje dyspersji:

  1. Całkowita wariancja
  2. Wariancja międzygrupowa
  3. Wariancja wewnątrzgrupowa (rezydualna)

1. mierzy zmienność cechy w całej populacji pod wpływem wszystkich czynników, które tę zmienność spowodowały

Przykład: spożycie jogurtu: na podstawie próby 100 osób

Status społeczny

x i -indywidualna wartość atrybutu

Średnia wartość cechy w całej populacji

częstotliwość tej cechy.

  1. 2. charakteryzuje zmienność cechy pod wpływem cechy czynnika leżącego u podstaw grupowania.

Średnia grupowa

Ogólna średnia grupy

Częstotliwość według grupy

  1. 3. charakteryzuje zmienność cechy pod wpływem czynników nieuwzględnionych w ugrupowaniu

X iji wartość cechy w grupie j

Średnia wartość cechy w J Grupa

f ij - częstotliwośći-ta funkcja wgrupa j

Istnieje reguła, która łączy 3 rodzaje wariancji, nazywana jest regułą dodawania wariancji.

Dyspersja resztkowa wg J Grupa

Suma częstotliwości powyżej J Grupa

N jest całkowitą sumą częstotliwości

głównym zadaniem analizy szeregów wariacyjnych jest identyfikacja wzorców rozkładu częstotliwości.

Krzywa rozkładu jest graficzną reprezentacją w postaci ciągłej linii zmian częstotliwości w szeregu zmian w funkcjonalnie powiązanej zmianie wartości cechy.

Krzywą rozkładu można wykreślić za pomocą wielokąta i histogramu. Wskazane jest sprowadzenie rozkładu empirycznego do teoretycznego, do jednej z dobrze przebadanych form.

Krzywa rozkładu normalnego.

Istnieją następujące typy krzywych dystrybucji:

  1. jednomodalny
  2. wiele wierzchołków

Homogeniczne populacje charakteryzują się krzywymi z jednym wierzchołkiem, krzywa z wieloma wierzchołkami wskazuje na heterogeniczność populacji i potrzebę przegrupowania.

Poznanie ogólnego charakteru rozkładu polega na ocenie jego jednorodności oraz obliczeniu skośności i kurtozy. Dla rozkładów symetrycznych

Do porównawczego badania asymetrii różnych rozkładów obliczany jest współczynnik asymetrii As.

Centralny moment trzeciego rzędu; - RMS w kostkach;

Jeśli, to asymetria jest znacząca

Jeśli jako<0, то As – левосторонняя, если As>0, to As jest praworęczny.

Jeśli, to As jest nieistotne. Dla symetrycznego i umiarkowanie asymetrycznego obliczany jest wskaźnik kurtozy: jeśli E k > 0, to rozkład jest szczytowy, jeśli E k<0, то распределение плосковершинное.

Zmienność cechy alternatywnej przejawia się ilościowo w następujący sposób.

0 - jednostki nie posiadające tej cechy;

1 - jednostki z tą cechą;

R- odsetek jednostek z tą cechą;

Q- odsetek jednostek nieposiadających tej cechy;

Następnie p+q=1.

Cecha alternatywna przyjmuje 2 wartości 0 i 1 wraz z wagami P I Q.

Bezpośrednie znaki- są to znaki, których wartość wzrasta wraz ze wzrostem badanego zjawiska.

Odwróć znaki - znaki, których wielkość maleje wraz ze wzrostem badanego zjawiska.

Generacja (bezpośrednia)

Intensywność pracy (rewers)

Maksymalna wariancja udziału wynosi 0,25.

Temat 6: Modelowanie szeregów dystrybucyjnych.

§1. Rozkład rzeczywisty i teoretyczny

§2. Krzywa rozkładu normalnego.

§3. Testowanie hipotezy o rozkładzie normalnym.

§4. Kryteria zgody: Pearson, Romanovsky, Kolmogorov.

§5. Praktyczna wartość modelowania szeregów rozdzielczych.

§1. Rozkład rzeczywisty i teoretyczny

Jednym z najważniejszych celów badania szeregów dystrybucji jest ujawnienie wzorca dystrybucji i określenie jego charakteru. Wzorce dystrybucji są najwyraźniej widoczne tylko przy dużej liczbie obserwacji.

Rzeczywisty rozkład można przedstawić graficznie za pomocą krzywej rozkładu – graficznie przedstawionej jako ciągła linia zmiany częstotliwości w szeregu wariacyjnym wariantu funkcjonalnie powiązanego ze zmianą.

Przez teoretyczną krzywą rozkładu rozumie się krzywą tego rodzaju rozkładu, która w ogólności wyklucza wpływ czynników losowych na prawidłowość.

Rozkład teoretyczny można wyrazić wzorem analitycznym zwanym wzorem analitycznym. Najbardziej powszechny jest rozkład normalny.

§2. Krzywa rozkładu normalnego.

Prawo dystrybucji normalnej:

y jest rzędną rozkładu normalnego

t jest znormalizowanym odchyleniem.

; e=2,7218; x ja - opcje serii wariacji; - przeciętny;

Nieruchomości:

Funkcja rozkładu normalnego jest parzysta, tj. f(t)=f(-t), . Funkcja rozkładu normalnego jest całkowicie określona przez odchylenie standardowe.

§3. Testowanie hipotezy o rozkładzie normalnym.

Powodem częstego odwoływania się do prawa dystrybucji jest to, że zależność wynikająca z działania wielu przypadkowych przyczyn, z których żadna nie jest dominująca. Jeżeli Mo = Me obliczono w szeregu wariacyjnym, może to wskazywać na bliskość rozkładu normalnego. Najdokładniejszy test zgodności z prawem powszechnym przeprowadza się za pomocą specjalnych kryteriów.

§4. Kryteria zgody: Pearson, Romanovsky, Kolmogorov.

Kryterium Pearsona.

Częstotliwość teoretyczna

Częstotliwość empiryczna

Metoda obliczania częstotliwości teoretycznych.

  1. Wyznaczana jest średnia arytmetyczna i zgodnie z serią zmian przedziałów, t jest obliczane dla każdego przedziału.
  2. Znajdujemy wartość gęstości prawdopodobieństwa dla znormalizowanego prawa dystrybucji. STRONA 49
  3. Znajdujemy częstotliwość teoretyczną.

l - długość interwału

- suma częstości empirycznych

- gęstości prawdopodobieństwa

zaokrąglij wartość do liczb całkowitych

  1. Obliczanie współczynnika Pearsona
  2. wartość tabeli

df – ilość interwałów – 3

df jest liczbą stopni swobody.

  1. jeśli > , to rozkład nie jest normalny, tj. hipoteza o rozkładzie normalnym jest odrzucona. Jeśli< , то распределение является нормальным.

Kryterium Romanowskiego.

Obliczane jest kryterium Pearsona;

Liczba stopni.

jeśli z<3, то распределение близко к нормальному.

Kryterium Kołmogorowa

, D- maksymalna wartość między skumulowanymi częstotliwościami empirycznymi i teoretycznymi. Warunek konieczny użycia Kołmogorowa: Liczba obserwacji jest większa niż 100. Zgodnie ze specjalną tabelą prawdopodobieństwa, z którą można argumentować, że ten rozkład jest normalny.

§5. Praktyczna wartość modelowania szeregów rozdzielczych.

  1. umiejętność zastosowania praw rozkładu normalnego do rozkładu empirycznego.
  2. umiejętność posługiwania się zasadą 3 x sigma.
  3. Możliwość uniknięcia dodatkowych czasochłonnych i kosztownych obliczeń poprzez badanie populacji, wiedząc, że rozkład jest normalny.

Temat 7: Selektywna obserwacja.

§1. Koncepcja obserwacji wybiórczej. Powody jego stosowania.

§2. Rodzaje obserwacji wybiórczej.

§3. Błędy próbkowania.

§4. Przykładowe zadania obserwacyjne

§5. Dystrybucja przykładowych danych obserwacyjnych do populacji ogólnej.

§6. Mała próbka.

§1. Koncepcja obserwacji wybiórczej. Powody jego stosowania.

Selektywna obserwacja - taka obserwacja nieciągła, w której badaniom statystycznym poddawane są wybrane w określony sposób jednostki badanej populacji.

Cel (zadanie) obserwacji próbnej: dla części badanej scharakteryzowanie całej populacji jednostek, z zachowaniem wszelkich reguł i zasad obserwacji statystycznej.

Powody zastosowania obserwacji wybiórczej:

  1. oszczędność materiału, kosztów pracy i czasu;
  2. możliwość bardziej szczegółowego i szczegółowego badania poszczególnych jednostek populacji statystycznej i ich grup.
  3. niektóre specyficzne problemy można rozwiązać tylko za pomocą wybiórczej obserwacji.
  4. kompetentna i dobrze zorganizowana obserwacja wybiórcza daje dużą dokładność wyników.

Populacja ogólna to zbiór jednostek, z których dokonywana jest selekcja.

Operat losowania to zbiór jednostek wybranych do badania. W statystyce zwyczajowo rozróżnia się parametry populacji ogólnej i populacji próby.

Rodzaje próbkowania

Według metody wyboru:

Powtarzający się

Jednostka, która znalazła się w próbie, po zarejestrowaniu obserwowanych cech, wraca do populacji generalnej w celu udziału w dalszej procedurze selekcyjnej.

Wielkość populacji ogólnej pozostaje niezmieniona, co prowadzi do ciągłego trafienia w próbie dowolnej jednostki.

Nie powtarzające się

Wybrana jednostka nie jest zwracana do populacji, z której dokonano selekcji.

Metoda selekcji:

Właściwie losowo jest w stosunku do jednostek z populacji ogólnej losowo lub losowo bez elementów spójności. Jednak przed przeprowadzeniem takiej próby należy upewnić się, że wszystkie jednostki populacji generalnej mają równe szanse znalezienia się w próbie, tj. w pełnym wykazie jednostek zbiorowości statystycznej nie ma pominięć ani nieznajomości poszczególnych jednostek. Konieczne jest również jasne określenie granic populacji ogólnej. Technicznie ustalona selekcja odbywa się w drodze losowania lub przy użyciu tabeli liczb losowych.

Pobieranie próbek mechanicznych (każde 5 na liście) jest używane w przypadkach, gdy populacja ogólna jest w jakiś sposób uporządkowana, tj. istnieje pewna kolejność w rozmieszczeniu jednostek. Podczas przeprowadzania mechanicznego pobierania próbek ustala się proporcję selekcji, która jest ustalana na podstawie stosunku populacji ogólnej do populacji próby.

Niebezpieczeństwo błędu w doborze mechanicznym może pojawić się z powodu: losowej koincydencji wybranego przedziału oraz cykliczności w układzie jednostek populacji generalnej.

Próbkowanie strefowe stosuje się, gdy wszystkie jednostki populacji ogólnej można podzielić na grupy (regiony, kraje) według jakiegoś atrybutu.

Próbka połączona.

Wyboru jednostek można dokonać:

  1. lub proporcjonalnie do wielkości grupy
  2. lub proporcjonalnie do wewnątrzgrupowego zróżnicowania cechy
  3. , gdzie n to wielkość próby, N to wielkość populacji ogólnej, n I wielkość próbki I-grupy, n I tom I próbki.
  4. - ta metoda jest dokładniejsza, ale w trakcie pobierania próbek bardzo trudno jest z góry określić zmienność. (przed obserwacją).

wybór seryjny.

Stosuje się go, gdy EKK są łączone w małe grupy (serie), np. opakowania z gotowymi produktami, grupy studenckie. Istota losowania seryjnego polega na tym, że serie są wybierane losowo lub mechanicznie, a następnie w ramach wybranej serii przeprowadzane jest badanie ciągłe.

Wybór łączony.

Jest to połączenie omówionych powyżej metod selekcji, częściej stosuje się kombinację szeregu typowego i seryjnego, tj. wybór serii z kilku typowych grup.

Selekcja może być również wieloetapowa i jednoetapowa, wielofrazowa i jednofrazowa.

Selekcja wieloetapowa: z ogólnej populacji wyodrębnia się najpierw większe grupy, potem mniejsze i tak dalej, aż do wyselekcjonowania tych jednostek, które są przedmiotem badania.

Wybór wielu fraz: polega na zachowaniu tej samej jednostki wyboru na wszystkich etapach jej realizacji. Jednocześnie wybrane na każdym kolejnym etapie jednostki selekcyjne podlegają egzaminowi, którego program jest rozszerzany (Przykład: studenci całego instytutu, następnie studenci niektórych wydziałów).

§3. Błędy próbkowania.

Systematyczny

Błędy reprezentatywności występują tylko w obserwacji wybiórczej. Powstają z powodu faktu, że populacja próbna nie może dokładnie odtworzyć populacji ogólnej. Nie da się ich uniknąć, ale łatwo je przewidzieć iw razie potrzeby zminimalizować.

Błąd próbkowania to różnica między wartością parametru w populacji ogólnej a jego wartością obliczoną na podstawie wyników obserwacji próbnej. Dх=-m+ , Dх – błąd graniczny w próbie, m – średnia ogólna; - próbka średnia.

Krańcowy błąd próbkowania jest wartością losową Prace Czebyszewa poświęcone są badaniu wzorców losowych błędów próbkowania. Twierdzenie Czebyszewa dowodzi, że Dx nie przekracza: - średniego błędu próbkowania Współczynnik ufności t wskazuje prawdopodobieństwo tego błędu. s. 42-43.

W przypadku, gdy trzeba wyznaczyć t ze znanej F(t), bierzemy najbliższą dużą F(t) i wyznaczamy z niej t.

Ułamek błędu granicznego

P - udostępnij.

Jeżeli selekcji dokonano w sposób niepowtarzający się, to dodaje się formuły błędu granicznego

Korekta za niepowtarzalność.

Dla każdego rodzaju obserwacji próbnej prezentowany błąd obliczany jest inaczej:

  1. właściwa przypadkowa i mechaniczna obserwacja;
  2. Obserwacja strefowa
  3. próbkowanie seryjne

r jest liczbą serii w próbce;

R to liczba serii w populacji ogólnej;

Międzygrupowa wariancja proporcji.

§4. Przykładowe zadania obserwacyjne

Używany do następujących zadań:

  1. N-? aby określić wielkość próby ze znanego F(t), Dx.
  2. wyznaczenie próbki Dx ze znanego F(t), n
  3. wyznaczenie F(t) ze znanych Dx i n

1 zadanie n- ? Po pierwsze, n jest określane przez formułę ponownego wyboru, dla wyboru jednorazowego:

Sposoby wyznaczania wariancji:

  1. pochodzi z poprzednich podobnych badań.
  2. RMS o rozkładzie normalnym » 1/6 zakresu zmienności.
  3. jeśli rozkład jest oczywiście asymetryczny, to RMS » 1/5 zakresu zmienności
  4. Dla udziału stosuje się maksymalną możliwą wariancję p(1-p)=0,25
  5. z n³100, a następnie s 2 \u003d S 2 - wariancja próbki

30 funtów N 100 £, wtedy s 2 \u003d S 2 (n / n-1), s 2 - ogólna wariancja

N<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Przy obliczaniu n nie należy bowiem kierować się dużą wartością t i małymi błędami krańcowymi prowadzi to do wzrostu n, a tym samym do wzrostu kosztów. Poniższe prawo jest podobne.

§5. Dystrybucja przykładowych danych obserwacyjnych do populacji ogólnej.

Ostatecznym celem każdej VN jest scharakteryzowanie populacji ogólnej.

Wartości obliczone na podstawie wyników VN są rozdzielane na populację ogólną, biorąc pod uwagę granicę ich błędu krańcowego.

Załóżmy miesięczne spożycie jogurtu przez jedną osobę.

250-20 mln GBP 250 GBP + 20; 230 milionów funtów 270 funtów

I tylko 1000 osób

230 000 mln GBP 270 000 GBP

48%-5%£p£48%+5%

§6. Mała próbka.

W praktyce badań statystycznych we współczesnych warunkach coraz częściej konieczne jest zajmowanie się małymi próbami.

Mała próbka - liczba próbek obserwacyjnych jednostek, których nie przekracza 30, n 30 zł/

Rozwinięcia teorii małych próbek dokonał angielski statystyk Gosset, który pisał pod pseudonimem student w 1908 roku.

Udowodnił, że oszacowanie rozbieżności między średnimi z małej próby i próby ogólnej podlega szczególnemu prawu rozkładu. Podczas obliczania dla małej próbki wartość s 2 nie jest obliczana. t st dla możliwych granic błędu użyj kryterium studenta. Strony 44-45. jest prawdopodobieństwem zdarzenia przeciwnego.

Liczba stopni swobody

ograniczenie małego błędu próbki

marginalny błąd udziału

Temat 8: Analiza i modelowanie korelacyjno-regresyjne.

§1. Pojęcie korelacji i CRA.

§2. Warunki korzystania i ograniczenia KPA.

§3. Regresja par oparta na metodzie najmniejszych kwadratów.

§4. Zastosowanie równania regresji liniowej w parach.

§5. Wskaźniki szczelności połączenia i wytrzymałości połączenia.

§6. Wielokrotna korelacja.

§1. Pojęcie korelacji i CRA.

Połączenie funkcjonalne y=5x

korelacja

Istnieją 2 rodzaje powiązań między różnymi zjawiskami i ich znakami, funkcjonalne i statystyczne.

Takie połączenie nazywa się funkcjonalnym, gdy wraz ze zmianą wartości jednej ze zmiennych druga zmienia się w ściśle określony sposób, tj. wartość jednej zmiennej odpowiada jednej lub większej liczbie precyzyjnie określonych wartości innej zmiennej . Połączenie funkcjonalne jest możliwe tylko wtedy, gdy zmienna y zależy od zmiennej x i nie zależy od żadnych innych czynników, ale w rzeczywistości jest to niemożliwe.

Zależność statystyczna istnieje wtedy, gdy przy zmianie wartości jednej ze zmiennych druga może przyjmować dowolne wartości w określonych granicach, ale jej charakterystyka statystyczna zmienia się zgodnie z pewnym prawem.

Najważniejszym szczególnym przypadkiem związku statystycznego jest związek korelacyjny. Przy korelacji różne wartości jednej zmiennej odpowiadają różnym średnim wartościom innej zmiennej, tj. wraz ze zmianą wartości atrybutu x średnia wartość atrybutu y zmienia się w naturalny sposób.

Słowo korelacja zostało wprowadzone przez angielskiego biologa i statystyka Francisa Gala (korelacja)

Korelacja może powstać na różne sposoby:

  • zależność przyczynowa zmienności cechy wynikowej od zmienności cechy czynnikowej.
  • Może wystąpić korelacja między 2 skutkami tej samej przyczyny (pożary, liczba strażaków, wielkość pożaru)
  • Związek znaków, z których każdy jest jednocześnie przyczyną i skutkiem (wydajność pracy i wynagrodzenie)

W statystyce zwyczajowo rozróżnia się następujące rodzaje zależności:

  1. korelacja par - związek między 2 znakami wypadkowej i silni lub między dwoma znakami silni.
  2. korelacja cząstkowa - związek między efektywnym i jednym atrybutem czynnika ze stałą wartością innego atrybutu czynnika.
  3. korelacja wielokrotna – zależność otrzymanej cechy od dwóch lub więcej cech czynnikowych uwzględnionych w badaniu.

Zadaniem analizy korelacji jest ilościowe określenie bliskości związku między cechami. Pod koniec XIX wieku Galton i Pearson badali związek między wzrostem ojców i dzieci.

Regresja bada formę relacji. Zadaniem analizy regresji jest określenie analitycznego wyrazu zależności.

Analiza korelacyjno-regresyjna jako ogólna koncepcja obejmuje zmianę szczelności połączenia i ustalenie analitycznego wyrażenia związku.

§2. Warunki korzystania i ograniczenia KRA.

  1. obecność danych masowych, ponieważ korelacja jest statystyczna
  2. wymagana jest jakościowa jednorodność populacji.
  3. podporządkowanie rozkładu populacji według charakterystyki wypadkowej i czynnikowej prawu rozkładu normalnego, co wiąże się z zastosowaniem metody najmniejszych kwadratów.

§3. Regresja par oparta na metodzie najmniejszych kwadratów.

Analiza regresji polega na wyznaczeniu analitycznego wyrazu zależności. Formularz rozróżnia regresję liniową, która jest wyrażona równaniem linii prostej, oraz regresję nieliniową lub.

Zgodnie z kierunkiem komunikacji wyróżnia się je w linii prostej, tj. Gdy x rośnie, y rośnie.

odwracać

Odwróć, tj. gdy x rośnie, y maleje.

  1. metodą graficzną - poprzez naniesienie danych empirycznych na pole korelacji, ale dokładniejsze oszacowanie wykonuje się metodą najmniejszych kwadratów.

X - rzeczywisty znak

U - znak skuteczny

Różnica między wartością rzeczywistą a wartością obliczoną za pomocą równania sprzężenia do kwadratu powinna dążyć do minimum.

Przy LSM min jest sumą kwadratów odchyleń wartości empirycznych y od wartości teoretycznych uzyskanych zgodnie z wybranym równaniem regresji.

Dla zależności liniowej

Þ a,B

dla paraboli

Dla hiperboli

wpisujemy parametry a,b,c do równania, następnie otrzymane równanie podstawiamy wartością empiryczną x ja i znaleźć wartość teoretyczną y ja. Następnie porównujemy y ja teoretyczne i y ja empiryczny. Suma kwadratów różnicy między nimi powinna być minimalna. Wybieramy typ zależności, w której ta zależność jest realizowana.

W równaniu regresji liniowej parami:

b jest współczynnikiem sparowanej regresji liniowej, mierzy siłę wiązania, tj. charakteryzuje średnie odchylenie populacji y od jego średniej wartości na przyjętą jednostkę miary.

B\u003d 20, gdy x zmienia się o 1 znak, y odbiega od swojej średniej wartości średnio o 20 w populacji.

Znak dodatni przy współczynniku regresji wskazuje na bezpośredni związek między cechami, znak „-” na sprzężenie zwrotne między cechami.

§4. Zastosowanie równania regresji liniowej w parach.

Głównym zastosowaniem jest prognozowanie według równania regresji. Prognozowanie jest ograniczone warunkami stabilności innych czynników oraz warunkami procesu. Jeśli środowisko trwającego procesu gwałtownie się w nim zmieni, to równanie regresji nie będzie miało miejsca.

Prognozę punktową uzyskuje się przez podstawienie oczekiwanej wartości czynnika do równania regresji. Prawdopodobieństwo dokładnej realizacji takiej prognozy jest niezwykle małe.

Jeżeli prognozie punktowej towarzyszy wartość średniego błędu prognozy, to taka prognoza nazywana jest prognozą przedziałową.

Średni błąd prognozy składa się z dwóch rodzajów błędów:

  1. błędy typu 1 - błąd linii regresji
  2. błąd drugiego rodzaju - błąd związany z błędem zmienności.

Średni błąd prognozy.

Błąd w położeniu linii regresji w populacji ogólnej

n - wielkość próbki

x k - błędna wartość współczynnika

RMS cechy wypadkowej z linii regresji w populacji ogólnej

Analiza korelacji polega na ocenie szczelności połączenia. Wskaźniki:

  1. współczynnik korelacji liniowej - charakteryzuje ścisłość i kierunek związku między dwiema cechami w przypadku liniowej zależności między nimi

przy =-1 połączenie jest funkcjonalne odwrotne, =1 połączenie jest funkcjonalne bezpośrednie, przy =0 nie ma połączenia.

Stosowany jest tylko do zależności liniowych, służy do oceny zależności między cechami ilościowymi. Obliczone tylko na podstawie indywidualnych wartości.

Współczynnik korelacji:

Empiryczna: oba typy wariancji są obliczane zgodnie z wynikającym atrybutem.

Teoretyczny:

Rozrzut wartości efektywnej cechy obliczonej równaniem regresji

Rozrzut wartości empirycznej cechy wynikowej

  • wysoki stopień dokładności
  • nadaje się do oceny bliskości związku między cechą opisową a ilościową, ale ilościowa powinna być skuteczna
  • nadaje się do wszystkich rodzajów połączeń

Współczynnik korelacji Spearmana

Szeregi - numery seryjne jednostek populacji w szeregu rankingowym. Konieczne jest uszeregowanie obu cech w tej samej kolejności od najmniejszej do największej lub odwrotnie. Jeżeli rangi jednostek populacji oznaczymy p x i p y, to współczynnik korelacji rang będzie miał następującą postać:

Zalety współczynnika szeregów korelacji:

  1. Można również uszeregować według cech opisowych, których nie można wyrazić liczbowo, dlatego obliczenie współczynnika Spearmana jest możliwe dla następujących par cech: liczba - liczba; opisowo - ilościowy; Opisowy - opisowy. (wykształcenie jest atrybutem opisowym)
  2. wskazuje kierunek połączenia

Wady współczynnika Spearmana.

  1. identycznym różnicom rang mogą odpowiadać zupełnie różne różnice w wartości cechy (w przypadku cech ilościowych). Przykład: roczna produkcja energii elektrycznej w kraju

Stany Zjednoczone 2400 kWh 1

RF 800 kWh 2

Kanada 600 kWh 3

Jeżeli wśród wartości Spearmana występuje kilka identycznych wartości, wówczas powstają powiązane ze sobą rangi, tj. same środkowe liczby

W tym przypadku współczynnik Spearmana oblicza się w następujący sposób:

J- liczbę linków w kolejności dla funkcji x

Aj- liczba identycznych rang w j linkach przez x

k- numery więzadeł w kolejności cechy y

Bk- liczba identycznych stopni w Który pęczek

  1. 4. Współczynnik korelacji rang Kendalla

Maksymalna kwota rangi

S jest rzeczywistą sumą rang

Daje dokładniejsze oszacowanie niż współczynnik Spearmana.

Na potrzeby obliczeń wszystkie jednostki są uszeregowane według atrybutu x według atrybutu Na dla każdej rangi obliczana jest liczba kolejnych rang przekraczających zadaną sumę, oznaczonych przez P oraz liczbę kolejnych rang poniżej tego oznaczenia Q.

P+Q= 1 / 2 n(n-1)

  1. Współczynnik korelacji rang Fechnera.

współczynnik Fechnera - miarą szczelności połączenia w postaci stosunku różnicy liczby par pasujących i nie pokrywających się znaków do sumy tych liczb.

  1. obliczenie średnich dla x i y
  2. poszczególne wartości x i y i porównuje się z wartościami średnimi z obowiązkowym oznaczeniem znaku „+” lub „-”. Jeśli znaki pasują do x i y, to odsyłamy je do liczby „C”, jeśli nie, to do „H”.
  3. policz liczbę pasujących i niepasujących par.

Zadanie pomiaru związku staje się dla statystyka w odniesieniu do cech opisowych ważnym przypadkiem szczególnym takiego zadania, pomiaru związku między 2 alternatywnymi cechami, z których jedna jest przyczyną drugiej konsekwencji.

Ścisłość związku między 2 alternatywnymi cechami można zmierzyć za pomocą 2 współczynników:

  1. współczynnik asocjacji
  2. czynnik awaryjny

Współczynnik kontyngencji ma wadę: gdy jedna z dwóch heterogenicznych kombinacji Av lub Ba jest równa zeru, współczynnik zmienia się w jeden. Bardzo liberalnie ocenia szczelność połączenia - przecenia.

Współczynnik Pearsona

Jeśli nie ma dwóch, ale więcej możliwych wartości każdej ze współzależnych cech, obliczane są następujące współczynniki:

  1. Współczynnik Pearsona
  2. Współczynnik Czuprowa dla cechy opisowej

Współczynnik Pearsona oblicza się z macierzy kwadratowych

Poniżej średniej

do 1 i do 2 - numer grupy zgodnie ze znakami odpowiednio 1 i 2. Wadą współczynnika Pearsona jest to, że nie osiąga on 1 nawet przy wzroście liczby grup.

Współczynnik Czuprowa (1874–1926)

współczynnik Chuprov bardziej rygorystycznie szacuje szczelność połączenia.

§6. Wielokrotna korelacja.

Badanie związku między wypadkową a dwiema lub więcej cechami czynnikowymi nazywa się regresja wielokrotna. W badaniu zależności metodami regresji wielokrotnej postawiono 2 zadania.

  1. wyznaczenie analitycznego wyrażenia związku między efektywną cechą y a rzeczywistymi cechami x 1 , x 2 , x 3 , ... x k, tj. znajdź funkcję y \u003d f (x 1, x 2, ... x k)
  2. Ocena ścisłości związku między skutecznym a każdym ze znaków czynnika.

Model korelacyjno-regresyjny (CRM) to równanie regresji, które obejmuje główne czynniki wpływające na zmienność wynikowego atrybutu.

Budowanie modelu regresji wielokrotnej obejmuje następujące kroki:

  1. wybór formy komunikacji
  2. dobór cech czynnikowych
  3. Zapewnienie, że populacja jest wystarczająco duża, aby zapewnić prawidłowe oszacowania.

I. cały zestaw zależności między zmiennymi spotykanymi w praktyce jest dość obszernie opisany funkcjami 5 typów:

  1. liniowy:
  2. moc:
  3. orientacyjny:
  4. parabola:
  5. hiperbola:

chociaż w praktyce CRA występuje wszystkie 5 funkcji, to najczęściej stosuje się zależność liniową, jako najprostszą i najłatwiejszą do interpretacji równanie zależności liniowej: , k - zbiór czynników wchodzących w skład równania, bj

0 - ponieważ >0,7 dlatego zwracamy na nie szczególną uwagę

EKO. Skala szczelności komunikacji:

Jeśli połączenie wynosi 0 - 0,3 - słabe połączenie

0,3 - 0,5 - zauważalne

0,3 - 0,5 - zamknij

0,7 - 0,9 - wysoka

ponad 0,9 - bardzo wysoka

następnie porównujemy dwie cechy (dochód i płeć)<0,7, то включаем в уравнение множественной регрессии.

Wybór czynników do uwzględnienia w równaniu regresji wielokrotnej:

  1. musi istnieć związek przyczynowy między skutecznymi a rzeczywistymi znakami.
  2. znaki skuteczne i rzeczywiste muszą być ze sobą ściśle powiązane, w przeciwnym razie zjawisko to wystąpi współliniowość (>06) , tj. znaki czynnika zawarte w równaniu wpływają nie tylko na wynik, ale na siebie nawzajem, co prowadzi do błędnej interpretacji danych liczbowych.

Metody wyboru czynników do uwzględnienia w równaniu regresji wielokrotnej:

1. metoda ekspercka – oparty na intuicyjnej analizie logicznej wykonywanej przez wysoko wykwalifikowanych ekspertów.

2. użycie macierzy sparowanych współczynników korelacji odbywa się równolegle z pierwszą metodą, macierz jest symetryczna względem przekątnej jednostki.

3. krokowa analiza regresji - sekwencyjne włączanie cech czynnikowych do równania regresji i testowanie istotności przeprowadzane jest na podstawie wartości dwóch wskaźników na każdym kroku. Korelacja, wskaźnik regresji.

Wynik korelacji: Oblicz zmianę teoretycznej korelacji współczynnika lub zmianę średniej wariancji resztkowej. Wskaźnik regresji to zmiana warunkowo czystego współczynnika regresji.

Całkowity

31

32

22

85