Методи за представяне на статистически данни. Графично представяне на статистически данни


Стойността на графичния метод при анализа и обобщаването на данни е голяма. Графичното изображение, на първо място, позволява да се контролира надеждността на статистическите показатели, тъй като, представени на графиката, те по-ясно показват съществуващите неточности, свързани или с наличието на грешки в наблюдението, или със същността на изследваното явление. С помощта на графично изображение е възможно да се изследват моделите на развитие на дадено явление, да се установят съществуващи връзки. Простото сравнение на данни не винаги дава възможност да се улови наличието на причинно-следствени връзки, в същото време тяхното графично представяне помага да се идентифицират причинно-следствените връзки, особено в случай на установяване на първоначални хипотези, които след това подлежат на по-нататъшно развитие.

Статистическа графика- това е чертеж, в който статистическите агрегати, характеризиращи се с определени показатели, са описани с помощта на условни геометрични изображения или знаци. Графично изображениее колекция от точки, линии и форми, които представляват статистически данни. Помощни елементиграфиките са:

    Графичното поле е част от равнината, в която са разположени графичните изображения. Полето на графиката има определени размери, които зависят от предназначението му.

    Пространствените ориентири на графиката са зададени под формата на система от координатни мрежи. Координатната система е необходима за поставяне на геометрични символи в полето на диаграмата. Използват се както правоъгълна, така и полярна координатна система.

    Мащабните ориентири се използват за сравняване на графичното показване на обекта и действителния му размер. Мащабните ориентири се задават чрез система от мащабни везни или мащабни знаци.

    Експликацията на графиката се състои от обяснение на обекта, изобразен от графиката (име), и семантичното значение на всеки знак, използван върху графиката.

Статистическите графики се класифицират според тяхното предназначение (съдържание), метода на изграждане и характера на графичното изображение (фиг. 1).

Фиг. 1. Класификация на статистическите графики

Според метода на конструиране на графични изображения има:

    Диаграми- графично представяне на статистически данни, ясно показващо връзката между сравняваните стойности.

    Статистически карти

Има следните основни типове диаграми: линейни, стълбовидни, лентови, секторни, квадратни, кръгли, къдрави.

Линейни диаграмисе използват за характеризиране на динамиката, т.е. оценка на промените в явленията във времето. Абсцисата показва периоди от време или дати, а ординатата показва нивата на поредица от динамики. Няколко диаграми могат да бъдат поставени на една графика, което ви позволява да сравнявате динамиката на различни индикатори или един индикатор за различни региони или държави.

Фиг.2. Динамика на обема на вноса на леки автомобили в Руската федерация

за 2006-1q. 2010 г

Стълбови диаграмиможе да се използва:

    да анализира динамиката на социално-икономическите явления;

    оценка на изпълнението на плана;

    характеристики на вариацията в серията от разпределения;

    за пространствени сравнения (сравнения между територии, държави, фирми);

    да изучават структурата на явленията.

Колоните са разположени близо или отделно на еднакво разстояние. Височината на колоните трябва да е пропорционална на числените стойности на нивата на характеристиките.

Фиг.3. Динамика на дела на Беларус в търговския оборот на Руската федерация със страните от ОНД

За характеризиране на структурата на социално-икономическите явления се използват широко кръгови диаграми. За изграждането му кръгът трябва да бъде разделен на сектори пропорционално на специфичното тегло на частите в общия обем. Сумата от специфичните тегла е равна на 100%, което съответства на общия обем на изследваното явление.

Фиг.4. Географско разпределение на търговския оборот между Руската федерация и страните от ОНД

Стълбови диаграмисъстоят се от правоъгълници, разположени хоризонтално (ивици).

Понякога за сравнителен анализ по регион, страни използват фигура знак диаграми(схеми на геометрични фигури). Тези диаграми отразяват размера на изследвания обект в съответствие с размера на неговата площ.

Статистически картисе използват за оценка на географското разпределение на явленията и сравнителен анализ по територия.

Статистическите карти включват картограми и картограми. Разликата между тях е в начина, по който статистиката се показва на картите.

Картограмапоказва териториалното разпределение на изследвания признак в отделни райони и се използва за идентифициране на моделите на това разпределение. Картограмите се делят на фонови и точкови. Фоновите картограми с различна плътност на цвета характеризират интензитета на всеки показател в рамките на териториална единица. На точкова картограма нивото на избраното явление се изобразява с точки.

Картограма- това е комбинация от географска карта или нейна схема с диаграма. Тя ви позволява да отразявате спецификата на всеки регион в разпределението на изследваното явление, неговите структурни характеристики.

В момента са разработени различни софтуерни пакети за компютърна графика, например Excel, Statgraf, Statistica.

Статистическите данни трябва да бъдат представени по такъв начин, че да могат да бъдат използвани. Има 3 основни форми за представяне на статистически данни:

1) текст - включването на данни в текста;

2) табличен - представяне на данните в таблици;

3) графичен - изразяване на данни под формата на графики.

Текстовата форма се използва, когато има малко количество цифрови данни.

Табличната форма се използва най-често, тъй като е по-ефективна форма за представяне на статистически данни. За разлика от математическите таблици, които според началните условия позволяват да се получи един или друг резултат, статистическите таблици разказват на езика на числата за изследваните обекти.

Статистическа таблица- това е система от редове и колони, в които се представя в определена последователност и връзка статистическа информация за социално-икономическите явления.

Таблица 2. Външна търговия на Руската федерация за 2000 - 2006 г., млрд. долара

Индекс 2000 2001 2002 2003 2004 2005 2006
Външнотърговски оборот 149,9 155,6 168,3 280,6 368,9 468,4
Експортиране 101,9 107,3 135,9 183,2 243,6 304,5
Импортиране 44,9 53,8 76,1 97,4 125,3 163,9
Търговски баланс 60,1 48,1 46,3 59,9 85,8 118,3 140,7
включително:
с чужди държави
износ 90,8 86,6 90,9 114,6 210,1 261,1
импортиране 31,4 40,7 48,8 77,5 103,5 138,6
търговски баланс 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Например в табл. 2 представя информация за външната търговия на Русия, която би било неефективно да се изразява в текстова форма.

Разграничете предмети предикатстатистическа таблица. Субектът показва характеризирания обект - или единици от съвкупността, или групи от единици, или съвкупността като цяло. В сказуемото се дава характеристиката на субекта, обикновено в числова форма. Задължителен заглавкатаблица, която показва към коя категория и към кое време принадлежат данните в таблицата.

Според характера на предмета статистическите таблици се делят на просто, групаи комбиниран. В предмета на проста таблица обектът на изследване не е разделен на групи, а е даден списък на всички единици от съвкупността или е посочена популацията като цяло (например таблица 11). В предмета на груповата таблица обектът на изследване е разделен на групи по един признак, а предикатът посочва броя на единиците в групите (абсолютен или като процент) и обобщени показатели за групите (например табл. 4). В предмета на комбинираната таблица съвкупността е разделена на групи не по един, а по няколко критерия (например таблица 2).

Когато конструирате таблици, трябва да се ръководите от следното Общи правила.

1. Субектът на таблицата се намира в лявата (по-рядко - горната) част, а сказуемото - в дясната (по-рядко - долната).

2. Заглавията на колоните съдържат имената на индикаторите и техните единици.

3. Последният ред допълва таблицата и се намира в нейния край, но понякога е първият: в този случай вторият ред се изписва „включително“, а следващите редове съдържат компонентите на общия ред.

4. Числовите данни се записват с еднаква степен на точност във всяка колона, като цифрите на числата са разположени под цифрите, а целочислената част е отделена от дробната запетая.

5. В таблицата не трябва да има празни клетки: ако данните са нула, тогава се поставя знакът "–" (тире); ако данните не са известни, тогава се прави запис „няма информация“ или се поставя знакът „…“ (многоточие). Ако стойността на показателя не е нула, но първата значима цифра се появява след приетата степен на точност, тогава се записва 0,0 (ако, да речем, е приета степен на точност 0,1).

Понякога статистическите таблици се допълват с графики, когато целта е да се подчертае някаква характеристика на данните, да се сравнят. Графичната форма е най-ефективната форма за представяне на данни по отношение на тяхното възприемане. С помощта на графики се постига видимост на характеристиките на структурата, динамиката, връзката на явленията и тяхното сравнение.

Статистически графики- това са условни изображения на числени стойности и техните съотношения чрез линии, геометрични фигури, рисунки или географски диаграми. Графичната форма улеснява разглеждането на статистически данни, прави ги визуални, изразителни и видими. Графиките обаче имат определени ограничения: на първо място, една графика не може да включва толкова данни, колкото могат да се поберат в таблица; освен това графиката винаги показва закръглени данни - не точни, а приблизителни. По този начин графиката се използва само за показване на общата ситуация, а не на детайлите. Последният недостатък е сложността на чертежа. Може да се преодолее с помощта на персонален компютър (например "Съветник за диаграми" от пакета Microsoft Office Excel).

Според метода на изграждане на графиките те се разделят на диаграми, картограмии диаграми на диаграми.

Най-често срещаният начин за графично представяне на данни са диаграми, които са от следните видове: линейни, радиални, точкови, равнинни, обемни, къдрави. Видът на диаграмите зависи от вида на представените данни и задачата за конструиране. Във всеки случай графиката трябва да бъде придружена от заглавие - над или под графичното поле. Заглавието показва кой индикатор се показва, за коя територия и за колко време.

Линейните графики се използват за представяне на количествени променливи: характеристики на изменението на техните стойности, динамика, връзки между променливите. Вариацията на данните се анализира с помощта на зона на разпространение, кумулира(по-малко от крива) и огиви(крива "по-голямо от"). Разпределителният полигон е разгледан в Тема 4 (напр. Фиг. 5.). За да се изгради кумулация, стойностите на променливата характеристика се нанасят по абсцисата, а ординатите са натрупаните суми от честоти или честоти (от f1към ∑ f). За да се изгради огив, натрупаните суми от честоти се поставят на оста y в обратен ред (от ∑ fпреди f1). Кумулат и огив съгласно табл. 4. изобразете на фиг. един.

Ориз. 1. Кумулати и огиви на разпределението на стоките според стойността на митническата стойност

Използването на линейни диаграми в анализа на тенденциите е разгледано в Тема 5 (напр. Фигура 13), а използването им за анализ на връзки в Тема 6 (напр. Фигура 21). Тема 6 също обхваща използването на точкови диаграми (напр. Фигура 20).

Линейните диаграми се подразделят на едноизмерен, използвани за представяне на данни за една променлива, и двуизмерен- за две променливи. Пример за едномерна линейна графика е полигон на разпределение, а за двумерна е регресионна линия (напр. фиг. 21).

Понякога при големи промени в индикатора се използва логаритмична скала. Например, ако стойностите на даден индикатор варират от 1 до 1000, това може да доведе до затруднения при чертането. В такива случаи те преминават към логаритмите на стойностите на индикатора, които няма да се различават толкова много: lg 1 = 0, lg 1000 = 3.

Между планаренСпоред честотата на използване се разграничават лентови графики (хистограми), в които индикаторът е представен като лента, чиято височина съответства на стойността на индикатора (например фиг. 4).

Пропорционалността на площта на определена геометрична фигура към стойността на индикатора е в основата на други видове равнинни диаграми: триъгълна, квадрат, правоъгълен. Можете също така да използвате сравнение на площите на кръг - в този случай радиусът на кръга е зададен.

лентова диаграмапредставя индикатори под формата на хоризонтално разтегнати правоъгълници и иначе е същата като стълбовидна диаграма.

От равнинните диаграми често се използва кръгова диаграма, който се използва за онагледяване на структурата на изследваната популация. Целият набор се приема за 100%, съответства на общата площ на кръга, площите на секторите съответстват на части от комплекта. Нека изградим секторна диаграма на структурата на външната търговия на Руската федерация през 2006 г. съгласно таблица. 2 (виж фиг. 2). При използване на компютърни програми секторните диаграми се изграждат в триизмерна форма, т.е. не в две, а в три равнини (виж фиг. 3).

Ориз. 2. Проста кръгова диаграма 3. 3D кръгова диаграма

Къдравите (картинни) диаграми подобряват яснотата на изображението, тъй като включват изображение на показания индикатор, чийто размер съответства на размера на индикатора.

При изчертаването на графика всичко е еднакво важно - правилният избор на графично изображение, пропорции, спазване на правилата за проектиране на графики. Тези въпроси са разгледани по-подробно в и.

Картограмите и картограмите се използват за изобразяване на географските характеристики на изучаваните явления. Те показват местоположението на изследваното явление, неговата интензивност на определена територия - в република, област, стопански или административен район и т. н. Построяването на картограми и картограми се разглежда в специална литература напр.

1. Понятието статистика

Статистиката е един от най-старите клонове на знанието, възникнал на основата на икономическото счетоводство. Появата му е свързана с нуждите на обществото от различни видове информация.

Смята се, че терминът статистика произлиза от латинските думи stato (състояние) и status (позиция, състояние).

В широк смисъл статистиката се разбира като наука, която изучава масовите явления и техните закономерности от количествена гледна точка.

Общата теория на статистиката е методологическа наука, наука за метод, който е приложим за идентифициране на модели във всяка област, където заключенията се основават на масово наблюдение, където има вариация на знак в отделни елементи на популация, където общи модели могат да се проявят само чрез взаимно премахване на случайността в отделните единици.

2. Статистиката като наука

2.1 Начини за развитие на статистиката

Развитието на статистиката като наука върви в две посоки:

Първото направление възниква в Германия и е известно като държавни изследвания или описателна школа. Представителите на тази школа смятат основната си задача за описание на забележителностите на държавата, без да анализират моделите и връзките между тях. Основател на дескриптивната школа е немският учен Херман Конринг.

Второто направление в развитието на статистиката възниква в Англия и е известно като политическа аритметика. Представителите на тази школа смятаха за основна задача да разкрият въз основа на голям брой наблюдения различни закономерности и взаимовръзки на изучаваните явления. Основателят на училището е Уилям Пети.

2.2 Предмет на статистиката и основни понятия

Белгийският математик Адолф Кети обобщи теоретичните сведения от държавните изследвания и практическата работа на представители на школата на политическата аритметика. Той също даде определение на предмета на статистиката - това са масови явления, свързани с живота на обществото и човека.Той също така вижда в статистиката инструмент за социално познание.

Отличителни черти на масовите явления:

1. Всеки елемент от комплекта има както индивидуални или отличителни черти, така и общи или сходни.

2. Характеристиките на един от елементите на масовото явление не могат да бъдат получени въз основа на характеристиките на други елементи.

Определение: Масовите явления, изучавани от статистиката под формата на съвкупност от единици със сходно качество с различни индивидуални характеристики, се наричат ​​статистически съвкупности. Въз основа на това можем да кажем, че обектът на статистиката са различни статистически агрегати, чието изследване е свързано с количествена характеристика и идентифициране на присъщите им модели. Статистическата съвкупност е една от основните концепции на статистическата наука. Свързва се и с такива понятия като: единица от населението. Определение: Елементите, съвкупността от които образува изследваното множество, се наричат ​​единици. Признаци на единици на населението:

Всяка единица от съвкупността може да се характеризира с различни видове качествени и количествени характеристики.

Ако даден атрибут има различни стойности за определени единици от съвкупността, тогава това се нарича вариация. Определение: Модел, идентифициран въз основа на масово наблюдение, т.е. проявяваща се в голяма маса от явления чрез преодоляване на присъщата случайност на нейния отделен елемент, се нарича статистическа закономерност. Основната задача на статистиката е да се абстрахира от случайното и да идентифицира типичното, редовното.

Има три начина за идентифициране на модели:

1. логичен;

2. емпиричен;

3. основан на закона за големите числа.


2.3 Метод на статистиката

Масово наблюдение, групиране и обобщаване на резултатите от него, изчисляване и анализ на обобщаващи показатели. Всичко това заедно дава метода на статистиката.

3.Статистическо наблюдение

3.1 Статистическото наблюдение като етап от статистическото изследване. План за статистическо наблюдение

Статистическото наблюдение е първият етап на статистическото изследване.

Определение: Статистическото наблюдение е научно организиран сбор от масови данни за изследваните процеси и явления, който се извършва по предварително разработена програма.

Изисквания за групови данни:

Статистическите данни трябва да бъдат достатъчно пълни. Всяко явление има различни взаимосвързани характеристики. Пълнотата на данните осигурява покриване на най-съществените характеристики, необходими за получаване на обективни заключения. Ако данните от статистическото наблюдение се отнасят за различни периоди от време, територии, тогава е необходимо да се осигури тяхната съпоставимост. Под съпоставимост на статистическата информация се разбира еднаквостта на техните мерни единици, оценки на разходите, граници на административни територии, времеви характеристики и др. Преди започване на статистическото наблюдение е необходимо да се установи редът за неговото провеждане. За целта се разработва подробен план за мониторинг, който съдържа:

1. програмно-методическа част:

2. организационна част.

1. Програмни и методически въпроси на плана за наблюдение.

Тази част от плана трябва да включва:

а) целта и целите на наблюдението:

б) обект и звена за изследване;

в) програма за мониторинг.

Програмата за наблюдение е списък с въпроси, на които се очаква да се отговори по време на проучването. Програмата трябва да се отличава с пълнотата на информацията и широчината на покритието. Формулировката на въпросите трябва да бъде възможно най-кратка и ясна, да изключва неточности и неясноти в отговорите, ако е необходимо, се дава подсказка за единно тълкуване и разбиране на въпросите. Програмната методологична част на наблюдението посочва специфичния инструментариум на статистическото изследване, т.е. бланки, които да съдържат отговори на формулираните въпроси, както и указания за попълването им.

2. Организационни въпроси на плана за наблюдение.

За успешната организация на наблюдението и пълното обхващане на населението се разработва организационен план за наблюдение.

В него се посочва:

а) обект на наблюдение:

б) времето и мястото на изследването;

в) организация на събиране на данни и технологии за тяхната обработка.


3.2 Форми и видове статистическо наблюдение

Форми, видове и методи на статистическо наблюдение.

Организационни форми на статистическото наблюдение

Видове статистическо наблюдение

Методи за статистическо наблюдение

към момента на регистриране на фактите

чрез обхват на единици съвкупност

1. Статистическа отчетност.

2. Специално организирано наблюдение.

3. Регистрирайте наблюдение.

1. Текущи или непрекъснати.

2. Прекъснат:

а) периодични;

б) еднократно.

1. Твърди.

2. Прекъснат:

а) избирателни;

б) основният масив;

в) монографичен.


1. Незабавно.

2. Документален.

а) препращане;

б) саморегистрация;

в) кореспондент;

г) въпросник;

д) придружител.

Във вътрешната статистика се използват три организационни форми (вида) статистическо наблюдение:

1. Докладване- това е основната форма на статистическо наблюдение, с помощта на която органите на статистиката получават необходимите данни от предприятия, институции и организации в определен период от време под формата на законово установени отчетни документи, подписани от лицата, отговорни за тяхното предоставянето и надеждността на събраната информация.

Споделени: телефон, телетайп, поща.

2. Специално организирано наблюдениесе извършва с цел получаване на информация, която не е в отчетността, или за проверка на нейните данни. Практическата статистика извършва преброявания на населението, материалните ресурси, трайните насаждения, немонтираното оборудване, строителните обекти на оборудването в процес и др. В допълнение към преброяванията статистиката извършва и други специално организирани наблюдения, по-специално бюджетни изследвания, които характеризират структурата на потребителските разходи и семейни доходи.

3. Регистър надзоре форма на непрекъснато статистическо наблюдение на дългосрочни процеси, които имат фиксирано начало, етап на развитие и фиксиран край. Базира се на поддържането на статистически регистър. Регистърът е система, която постоянно следи състоянието на обекта на наблюдение и оценява силата на въздействието на различни фактори върху изследваните показатели.

В статистическата практика се прави разлика между регистри на населението и бизнес регистри.

Видове статистическо наблюдение по време на регистриране на фактите

Текущото наблюдение се извършва систематично при възникване на явления. При периодичното наблюдение регистрирането на изследваните явления се извършва през определени, обикновено еднакви интервали от време. Еднократното наблюдение се извършва веднъж за решаване на проблем или се повтаря епизодично след определени периоди от време, ако е необходимо.

Видове статистическо наблюдение по обхват на единиците съвкупност

При непрекъснато наблюдение се записват всички единици от съвкупността без изключение. При селективно наблюдение се изследва произволно избрана част от единиците на популацията, за да се характеризира цялата популация.

При несъвършено непрекъснато наблюдение (на основния масив) се изследва основната част от популацията и умишлено се изключва определена част, за която се знае, че не играе голяма роля в характеристиката на цялата популация. Монографското наблюдение се състои в подробно описание на малък брой или отделни типични единици от съвкупността.

Методи за регистриране на факти или методи за получаване на първичен материал

Прякото наблюдение се осъществява чрез регистриране на изследваните единици и техните характеристики от специално определени лица въз основа на непосредствен преглед, броене, претегляне, показания на прибори и др. Документалното наблюдение се основава на използването на различни първични счетоводни документи на предприятия, институции и организации като източник на статистическа информация. По време на изследването се получават статистически материали чрез регистриране на отговорите, дадени от анкетираните лица. Методът на препращане се състои в това, че специално обучени регистратори попълват формулите чрез анкета, като същевременно контролират свободата на получената информация. По време на саморегистрация или самоизчисляване служителите на статистическите органи раздават формуляри с въпросници на интервюираните, инструктират ги и след това събират попълнените формуляри, като контролират пълнотата и коректността на получената информация. Анкетното проучване се състои в това, че разработеният въпросник се изпраща на кръг от хора и след попълване се връща на органите, извършващи наблюдения. Кореспондентът се състои в организирането от статистическите органи на специална мрежа от кореспонденти от лица, живеещи на място, които извършват наблюдения в съответствие с разработената форма и инструкции и съобщават информация на статистическите органи. Непоискано предоставяне на информация на органите, извършващи наблюдение, на непоискана основа.

4. Обобщение и групиране на статистиките

4.1 Задачи и видове статистическа сводка


Определение: Резюмето е набор от последователни операции за обобщаване на конкретни единични факти, които образуват набор, за да се идентифицират типични характеристики и модели, присъщи на изследваното явление като цяло.

Така, ако по време на статистическото наблюдение се събират данни за всяка единица от даден обект, тогава резултатът от обобщението е подробна информация, която отразява неговата съвкупност като цяло.

Статистическото обобщение трябва да се основава на предварителен теоретичен анализ на явленията и процесите.

Според дълбочината на обработка на материаларезюметата са както прости, така и сложни.

Простото обобщение е операция за изчисляване на сумите за набор от единици за наблюдение.

Комплексното обобщение е набор от операции, който включва групиране на единици за наблюдение, преброяване на суми за всяка група и за целия обект и представяне на резултатите от групирането и обобщението под формата на статистически таблици.

Резюмето е предшествано от разработването на неговата програма, която се състои от следните стъпки:

Изборът на групиращи характеристики;

Определяне на реда за формиране на групите;

Разработване на система от статистически показатели за характеризиране на групите и обекта като цяло;

Разработване на оформления на статистически таблици, в които да се представят резултатите от обобщението.

Според обработката на материаларезюмето е децентрализирано и централизирано.

С децентрализирано резюме (използва се, като правило, при обработката на статистическата отчетност), разработването на материала се извършва на последователни етапи. Така отчетите на предприятията се обобщават от статистическите органи на съставните образувания на Руската федерация, а резултатите за региона вече се изпращат в Държавния статистически комитет на Русия, а там са показателите за националната икономика като цяло определен. При централизирано обобщение всички основни материали влизат в една организация, където се обработват от началото до края. Централизираната сводка обикновено се използва за обработка на материали от еднократни статистически изследвания. Според техниката на изпълнение статистическото обобщение се разделя на механизирано и ръчно.

За провеждане на обобщение се изготвя план, който определя организационни въпроси: от кого и кога ще се извършват всички операции, процедурата за провеждането им и съставът на информацията, която трябва да бъде публикувана в периодичния печат.


4.2 Метод на групиране в статистиката

Статистическото групиране е разделянето на цялата съвкупност от материали на групи и подгрупи по съществени признаци за цялостно изследване на явленията и процесите на социалния живот.

Основният знак се нарича групиране.

За изграждане на групи в статистиката се използват главно два типа функции:

1. количествен (числов);

2. качествен (атрибутивен).

Групирането на една и съща основа се нарича просто, и се наричат ​​групи според два или повече признака, взети в комбинация един с друг комбиниран(труден).

След като бъде избран атрибутът за групиране, се избира броят на групите. Ако групирането се основава на качествен признак, тогава въпросът за броя на групите се решава автоматично - те ще бъдат толкова, колкото са качествените състояния на изследваната съвкупност (нейните единици).

При групирането по количествени признаци възниква въпросът за определяне на интервалите на групиране. Стойността на интервала е разликата между максималната и минималната стойност на атрибута във всяка група.В зависимост от характера на разпределението на единиците на съвкупността за даден признак интервалите могат да бъдат различни и неравномерни. Ако разпределението на признака в границите на неговата вариация е достатъчно равномерно, тогава обхватът на колебанията на признака се разделя на равни интервали, чиято дължина се определя по формулата:

където хМаки хминсъответно максималната и минималната стойност на характеристиката в тази популация,

n е броят на образуваните групи.

Броят на групите може да бъде зададен въз основа на предишни проучвания. В случай, че трябва сами да решите броя на групите, тогава можете да използвате формулата на Стърджис, за да определите оптималния брой групи:



n - брой групи

N е броят на единиците от съвкупността

Има затворени интервали, в които са дадени горната и долната граница, и отворени интервали, в които има само една граница: горна или долна.

Статистическите групи според задачите, решени с тяхна помощ, се разделят на:

Типологично групиране- това е разделянето на изследваната качествено разнородна популация на класове, социално-икономически типове, хомогенни групи единици в съответствие с правилата на научното групиране.

Структурнинаречено групиране, при което хомогенна популация е разделена на групи, които характеризират нейната структура според някакъв различен признак.

аналитиченнарича групиране, което разкрива връзката между изучаваните явления и техните характеристики.


4.3 Серии на разпределение в статистиката

Статистическата серия на разпределение е подредено разпределение на единиците от съвкупността в групи според определен променлив признак.

В зависимост от знака, който е в основата на формирането на разпределителна серия, има:

1. Атрибутивни - разпределителни серии, изградени по качествени признаци.

2. Вариационни - редове за разпределение, изградени на количествена основа. Всеки знак за вариация се състои от 2 елемента: варианти и честоти.

Вариантите са индивидуални стойности на характеристика, които тя приема в серия от варианти.

Честотите са номерата на отделните варианти или всяка група от вариационната серия.

Честотите се наричат ​​честоти, изразени в части от единица или като процент от общата сума.

В зависимост от характера на изменението на признака има:

1. Дискретна вариационна серия характеризира разпределението на единиците на съвкупността според дискретен признак (стойността на количествения признак приема само цели числа).

2. Интервална вариационна серия - подходяща е за непрекъсната вариация на признак, а също и ако дискретната вариация се проявява в широк диапазон, т.е. броят на опциите за отделна функция е доста голям.

Най-удобно е да анализирате сериите за разпространение, като използвате техния угарски образ.

Полигонът се използва при показване на дискретни вариационни серии.

Хистограмата се взема за показване на серията от интервални вариации.

5. Статистически показатели

Статистическият показател е количествена характеристика на социално-икономическите явления и процеси от гледна точка на качествена достоверност. Качествената сигурност на показателя се състои в това, че той е пряко свързан с вътрешното съдържание на изучаваното явление или процес, неговата същност.

По правило процесите и явленията, изучавани от статистиката, са доста сложни и тяхната същност не може да бъде отразена с помощта на един показател. В такива случаи се използва система от статистически показатели (набор от взаимосвързани показатели, който има едностепенна или многостепенна структура и е насочен към решаване на конкретен статистически проблем).


5.1 Абсолютни и относителни показатели

Абсолютна статистика.

Статистическите показатели под формата на абсолютни стойности характеризират абсолютните размери на процесите и явленията, изучавани от статистиката: тяхната маса, площ, обем, дължина; отразяват времевите им характеристики и могат да представят и обема на населението, т.е. броят на съставните му единици.

Индивидуалните абсолютни показатели, като правило, се получават директно в процеса на статистическо наблюдение в резултат на измерване, претегляне, преброяване и оценка на представляващ интерес количествен признак.

Консолидираните обемни показатели се получават в резултат на обобщение и групиране на отделни стойности (те характеризират обема на характеристика или обема на съвкупността както като цяло за обекта, който се изследва, така и за всяка част от него).

Абсолютните статистически показатели се изразяват в следните мерни единици:

Натурални (тонове, килограми, километри, парчета);

Себестойност (парична оценка на социално-икономическите явления и процеси);

Труд (човекодни, човекочасове).

Относителна статистика.

Относителният показател е резултат от разделянето на един абсолютен показател на друг и изразява съотношението между количествените характеристики на социално-икономическите процеси и явления. В числителя индикаторът се нарича текущ или сравняван индикатор, в знаменателя се нарича база или база за сравнение.

Ако базата за сравнение се приема като 1, тогава относителният показател се изразява в коефициенти, ако базата се приема като 100, тогава се изразява като процент (%), ако за 1000 се изразява в ppm (% 0 ), ако основата е приета като 10 000, тогава тя се изразява в децимили.

Процентът, като правило, се използва в случаите, когато сравненият абсолютен показател надвишава базовия не повече от 2-3 пъти. Лихвите над 200-300 обикновено се заменят с многократно съотношение, коефициент.


5.2 Средни стойности (стойности)

Средната стойност, която е обобщена количествена характеристика на признак в статистическа съвкупност при конкретни условия на място и време, е най-често срещаната форма на статистически показатели.

Помислете за видовете средни стойности, които се изчисляват за случаите, когато всеки от вариантите на вариационната серия се среща само веднъж (тогава средната стойност се нарича проста или непретеглена) и когато вариантът или интервалите се повтарят (претеглена средна). Опция брой повторения - честота. При избора на един или друг вид средна стойност трябва да се изхожда от принципа на значимостта на резултата при сумиране или при претегляне.

Средноаритметично.

X е средната мощност;

Z е показателят, който определя вида на средната стойност;

Xi - опции;

mi – честоти или статистически тегла на варианти.

Средно хармонично (z=-1).


Обучение

Нуждаете се от помощ при изучаването на тема?

Нашите експерти ще съветват или предоставят услуги за обучение по теми, които ви интересуват.
Подайте заявлениепосочване на темата точно сега, за да разберете за възможността за получаване на консултация.

:

Текстова форма

таблична форма

Статистическа таблица

Статистическите графики са условни изображения на числови стойности и техните съотношения чрез линии, геометрични фигури, рисунки или географски диаграми. Графичната форма улеснява разглеждането на статистически данни, прави ги визуални, изразителни и видими. Графиките обаче имат определени ограничения: на първо място, една графика не може да включва толкова данни, колкото могат да се поберат в таблица; освен това графиката винаги показва закръглени данни - не точни, а приблизителни. По този начин графиката се използва само за показване на общата ситуация, а не на детайлите. Последният недостатък е сложността на чертежа. Може да се преодолее с помощта на персонален компютър (например "Chart Wizard" от пакета Microsoft Office Excel).

Определяне на емпиричната функция на разпределение.

Функция на извадково (емпирично) разпределениев математическата статистика това е приближение на теоретична функция на разпределение, конструирана с помощта на извадка от нея.

Определение

Нека е извадка от разпределението на случайна променлива, дадена от функцията на разпределение. Предполагаме, че , където са независими случайни променливи, дефинирани в някакво пространство от елементарни резултати. Позволявам . Нека дефинираме случайна променлива по следния начин:

където е индикаторът за събитие, е функцията на Хевисайд. По този начин функцията на разпределение на извадката в точка е равна на относителната честота на елементите на извадката, които не надвишават стойността . Случайната променлива се нарича функция на извадковото разпределение на случайната променлива и е приближение за функцията. Има резултат, показващ, че за , функцията се сближава равномерно към и показва скоростта на сближаване.

стълбовидна диаграма

Хистограмата се използва за графично представяне на разпределенията непрекъснато променящи се чертии се състои от съседни правоъгълници, както е показано на фиг. 2.1. Основата на всеки правоъгълник е равна на ширината на групиращия интервал, а височината му е такава, че квадратправоъгълник е пропорционален на честотата (или честотата) на удряне на дадения интервал. Ако редът е неинтервален, тогава ширината на всички колони се избира произволно, но една и съща. По този начин височините на правоъгълниците трябва да са пропорционални на стойностите

където n i- честота аз-ти интервал на групиране; з аз- ширина аз-ти интервал на групиране.

На диаграмата на хистограмата основата на правоъгълниците е изчертана по оста x ( х), а височината е по оста y ( при) на правоъгълна координатна система.

Въпреки това, в случаите, когато ширината на всички интервали на групиране е една и съща, външният вид на хистограмата няма да се промени, ако стойностите не са нанесени по оста y p i, и интервални честоти n i.

Ориз. 2.1. Хистограма на разпределението на резултатите в предишния пример (когато ширината на някои интервали на групиране не е еднаква).

В този случай, за да не се нарушава принципът на построяване на хистограма (площите на правоъгълниците са пропорционални на честотите на интервалите), честотите вече не могат да се нанасят по оста y, а височините на правоъгълниците (който трябва да е пропорционален на съотношенията) трябва да се начертае.

Честотен полигон

Друго обичайно графично представяне е честотният полигон.

Честотният многоъгълник се формира от прекъсната линия, свързваща точките, съответстващи на средните стойности на груповите интервали и честотите на тези интервали, средните стойности са нанесени по оста х, а честотите - по оста при.

От сравнението на двата разгледани метода за графично представяне на емпирични разпределения следва, че за да се получи честотен многоъгълник от построената хистограма, е необходимо да се свържат средите на върховете на правоъгълниците, които образуват хистограмата, чрез свързване на права линейни сегменти. Пример за честотен полигон е показан на фиг. 2.2.

Ориз. 2.2. Честотен полигон

Честотният полигон се използва за представяне на разпределения както на непрекъснати, така и на дискретни характеристики. В случай на непрекъснато разпределение честотният полигон е по-предпочитан начин за графично представяне от хистограмата, ако графиката на емпиричното разпределение се описва с гладка зависимост.

21.Хипотеза(старогръцки ὑπόθεσις - предположение; от ὑπό - отдолу, под + θέσις - теза) - предположение или догадка; твърдение, което предполага доказателство, за разлика от аксиомите

Постулати, които не изискват доказателство. Една хипотеза се счита за научна, ако удовлетворява критерия на Попър, т.е. потенциално може да бъде тествано чрез критичен експеримент, както и ако отговаря на други критерии, които разграничават науката от ненауката.

Статистическа хипотезае предположение за свойствата на случайни променливи или събития, които искаме да тестваме спрямо наличните данни. Примери за статистически хипотези в образователни изследвания:

Хипотеза 1. Представянето на клас стохастично (вероятно) зависи от нивото на учене на учениците.

Хипотеза 2. Усвояването на началния курс по математика няма значителни разлики сред учениците, които са започнали обучението си на 6 или 7-годишна възраст.

Хипотеза 3. Проблемното обучение в първи клас е по-ефективно от традиционните методи на обучение по отношение на цялостното развитие на учениците.

Пример 1Производственият процес на някои медицински продукти е много сложен. На пръв поглед незначителни отклонения от технологията предизвикват появата на силно токсичен страничен примес. Токсичността на този примес може да бъде толкова висока, че дори количество, което не може да бъде открито чрез конвенционален химичен анализ, може да бъде опасно за човек, който приема това лекарство. В резултат на това, преди да бъде пусната на пазара новопроизведена партида, тя се подлага на изследване за токсичност с биологични методи. Малки дози от лекарството се прилагат на редица опитни животни, като мишки, и резултатът се записва. Ако лекарството е токсично, всички или почти всички животни умират. Иначе процентът на оцелелите е висок.

Изследването на лекарство може да доведе до един от възможните курсове на действие: освобождаване на партидата за продажба (a 1), връщане на партидата на доставчика за преработка или може би унищожаване (a 2).

Двата вида грешки, свързани с действия a 1 и a 2, са напълно различни и значението на избягването им също е различно. Първо разгледайте случая, при който се прилага действие 1, докато 2 е за предпочитане. Лекарството е опасно за пациента, докато е признато за безопасно. Грешка от този вид може да причини смърт при пациенти, използващи това лекарство. Това е грешка от тип I, тъй като за нас е по-важно да я избегнем.

Помислете за случая, когато се предприема действие 2, докато 1 е по-предпочитано. Това означава, че поради неточности в провеждането на експеримента партидата нетоксично лекарство е класифицирана като опасна. Последствията от грешка могат да се изразят във финансови загуби и в увеличаване на цената на лекарството. Въпреки това, случайното отхвърляне на напълно безопасно лекарство е очевидно по-малко нежелателно от случайната смърт на пациенти. Отхвърлянето на нетоксична партида от лекарство е грешка тип II.

Допустима вероятност за грешка тип I(Rkr)може да бъде равно на 5% или 1% (0,05 или 0,01).

22. Тест за статистическа хипотеза(тестване на статистически хипотези) е процес на решаване дали дадена статистическа хипотеза е несъвместима с наблюдавана извадка от данни.

статистически тестили статистически тест- строго математическо правило, чрез което се приема или отхвърля статистическа хипотеза.

· 23.класификация на хипотезите

· просто- посочва се едно обстоятелство, при наличието или липсата на което правната норма е валидна;

· комплекс- наличието в хипотезата на две или повече обстоятелства едновременно, които заедно определят действието на нормата;

· алтернатива- посочени са няколко варианта на обстоятелства (алтернативни), при които може да се приложи правилото. В този случай, когато се появи едно от тях, нормата е валидна;

параметрична хипотезанаречена хипотеза стойности на параметрите на разпределениетоили за сравнителната стойност на параметрите на две разпределения. Пример за параметрична статистическа хипотеза е хипотезата за равенство на математическите очакваниядва нормални комплекта.

Непараметрични хипотезинаречени хипотези за произволно разпределениеколичества.

Нула,основната или проверявана хипотеза е първоначално изложената хипотеза, която се обозначава H0.

Статистическа хипотезапредставлява някакво предположение за закона за разпределение на случайна величина или за параметрите на този закон, формулирано въз основа на извадка. Примери за статистически хипотези са предположенията: генералната съвкупност е разпределена по експоненциалния закон; математическите очаквания на две експоненциално разпределени извадки са равни една на друга. В първия от тях се прави предположение за формата на закона за разпределение, а във втория – за параметрите на две разпределения. Наричат ​​се хипотези, въз основа на които няма предположения за определен вид закон на разпределение непараметрични, в противен случай - параметричен.

Хипотезата, че няма разлика между сравняваните характеристики, а наблюдаваните отклонения се обясняват само със случайни колебания в извадките, на базата на които се прави сравнението, се нарича нула(основна) хипотеза и обознач з 0 . Наред с основната хипотеза разглеждаме и алтернатива(съревноваваща се, противоречаща) нейната хипотеза зедин . И ако нулевата хипотеза бъде отхвърлена, тогава ще се осъществи алтернативната хипотеза.

Правете разлика между прости и сложни хипотези. Хипотезата се нарича просто, ако еднозначно характеризира параметъра на разпределението на случайната променлива. Например, ако  е параметър на експоненциално разпределение, тогава хипотезата з 0 за равенството  = 10 е проста хипотеза. комплекснаречена хипотеза, която се състои от краен или безкраен набор от прости хипотези. Сложна хипотеза з 0 за неравенството  > 10 се състои от безкраен брой прости хипотези з 0 за равенството =b i, където b i- всяко число, по-голямо от 10. Хипотеза з 0, че очакването за нормално разпределение е две за неизвестна дисперсия също е трудно. Сложна хипотеза ще бъде предположението за разпределението на случайна променлива хспоред нормалния закон, ако специфичните стойности на математическото очакване и дисперсията не са фиксирани.

Проверката на хипотези се основава на изчисляването на някаква случайна величина - критерий, чието точно или приблизително разпределение е известно. Нека означим това количество с z, стойността му е функция на елементите на извадката z=z(x 1, x 2, …, x n). Процедурата за проверка на хипотеза предписва на всяка стойност на критерия едно от двете решения - да приеме или отхвърли хипотезата. По този начин цялото пространство на извадката и съответно наборът от стойности на критериите се разделят на две неприпокриващи се подгрупи С 0 и Седин . Ако стойността на критерия zпопада в района С 0 , тогава хипотезата е приета и ако С 1 , – хипотезата се отхвърля. Много С 0 се извиква област на приемане на хипотезата или област на приемливи стойности, и комплекта С 1 – област на отхвърляне на хипотеза или критична област. Изборът на една област еднозначно определя другата област.

Приемане или отхвърляне на хипотезата з 0 според произволна извадка отговаря на истината с известна вероятност и съответно са възможни два вида грешки. Грешка от тип I възниква с вероятност , когато правилната хипотеза бъде отхвърлена. з 0 и конкурентната хипотеза се приема зедин . Грешка от втори род възниква с вероятност  в случай, че се приеме неправилна хипотеза з 0, докато конкурентната хипотеза е вярна з 1 . Вероятност за довериее вероятността да не допуснете грешка от тип I и да приемете правилната хипотеза з 0 . Вероятност за отхвърляне на невярна хипотеза з 0 се извиква силата на критерия. Следователно при проверка на хипотезата има четири възможни изхода, табл. 3.1.

Таблица 3.1.

Например, разгледайте случая, когато някаква безпристрастна оценка на параметъра  се изчислява от извадка от обем ни тази оценка има плътност на разпределение f(), фиг. 3.1.

Ориз. 3.1. Области и отклонения на хипотезата

Да приемем, че истинската стойност на оценения параметър е равна на T. Ако разгледаме хипотезата з 0 относно равенството  = T, тогава колко голяма трябва да е разликата между  и Tда отхвърли тази хипотеза. На този въпрос може да се отговори в статистически смисъл, като се вземе предвид вероятността за достигане на дадена разлика между  и Tвъз основа на извадковото разпределение на параметъра  .

Препоръчително е да се приемат еднакви стойности на вероятността параметърът  да надхвърли долната и горната граница на интервала. Такова предположение в много случаи позволява да се минимизира доверителният интервал, т.е. увеличаване на силата на тестовия критерий. Общата вероятност параметърът  да излезе извън интервала с границите  1– /2 и   /2 е  . Тази стойност трябва да бъде избрана толкова малка, че е малко вероятно да надхвърли интервала. Ако оценката на параметъра попада в даден интервал, тогава в този случай няма причина да се поставя под въпрос изпитваната хипотеза, следователно хипотезата за равенство  = Tможе да се приеме. Но ако след получаване на пробата се окаже, че оценката е извън установените граници, тогава в този случай има сериозни основания за отхвърляне на хипотезата з 0 . От това следва, че вероятността да се направи грешка от тип I е равна на  (равна на нивото на значимост на критерия).

Ако приемем например, че истинската стойност на параметъра всъщност е равна на T+д, то според хипотезата з 0 относно равенството  = T– вероятността оценката на параметъра  да попадне в зоната на приемане на хипотезата ще бъде  , фиг. 3.2.

За даден размер на извадката, вероятността от допускане на грешка от тип I може да бъде намалена чрез понижаване на нивото на значимост . В този случай обаче вероятността от грешка от втори род  се увеличава (силата на критерия намалява). Подобно разсъждение може да се направи за случая, когато истинската стойност на параметъра е равна на Tд.

Единственият начин да се намалят и двете вероятности е да се увеличи размерът на извадката (плътността на разпределението на оценката на параметъра става по-„тясна“). При избора на критичен регион те се ръководят от правилото на Нойман-Пиърсън: трябва да се избере критичен регион по такъв начин, че вероятността  да е малка, ако хипотезата е вярна, и голяма в противен случай. Изборът на конкретна стойност на  обаче е относително произволен. Общите стойности варират от 0,001 до 0,2. За да се опростят ръчните изчисления, са съставени таблици с интервали с граници  1– /2 и   /2 за типични стойности на  и различни методи за конструиране на критерия.

При избора на ниво на значимост е необходимо да се вземе предвид силата на критерия при алтернативна хипотеза. Понякога голяма мощност на критерия се оказва по-значима от малкото ниво на значимост и стойността му се избира сравнително голяма, например 0,2. Такъв избор е оправдан, ако последиците от грешки от втори вид са по-значими от грешки от първи вид. Например, ако правилното решение „продължете с потребители с текущи пароли“ бъде отхвърлено, тогава грешка от тип I ще доведе до известно забавяне в нормалното функциониране на системата поради промени в паролата. Ако се реши да не се променят паролите, въпреки опасността от неоторизиран достъп до информация от неоторизирани лица, тогава тази грешка ще доведе до по-сериозни последици.

В зависимост от естеството на проверяваната хипотеза и мерките за несъответствие между оценката на дадена характеристика и нейната теоретична стойност се използват различни критерии. Най-често използваните критерии за тестване на хипотези относно законите за разпределение включват тестовете на Пиърсън, Колмогоров, Мизес, Уилкоксън хи-квадрат и тестовете на Фишър и Стюдънт за стойностите на параметрите.

25. КРИТИЧНА ЗОНА- част от пространството на извадката, така че въвеждането в нея на наблюдаваната стойност на случайна променлива, с чието разпределение е свързана тестваната хипотеза, води до отхвърляне на тази хипотеза

критични точки(граници) к cr са точките, разделящи критичната област от областта на приемане на хипотезата.
Има едностранни (дясно или ляво) и двустранни критични региони.

Случайната грешка при измерване се формира под въздействието на голям брой факторипридружаващи процеса на измерване. Всяка конкретна ситуация има свой механизъм за генериране на грешки. Следователно е естествено да се предположи, че всяка ситуация трябва да има свой собствен тип разпределение на грешките. Въпреки това, в много случаи е възможно да се направят някои предположения за формата на функцията на разпределение дори преди измерванията, така че след измерванията остава само да се определят стойностите на някои параметри, които са включени в израза за оценката разпределителна функция.

Случайната грешка характеризира несигурността на нашето знание за истинската стойност на измерената стойност, получена в резултат на наблюденията. Според К. Шанън мярката за неопределеността на ситуацията, описана от случайната променлива X, е ентропията


който е функционал на диференциалната функция на разпределение. Може да се приеме, че всеки процес на измерване се формира по такъв начин, че неопределеността на резултата от наблюдението да се окаже най-голяма в определени граници, определени от стойностите на допустимата грешка. Следователно най-вероятни би трябвало да са такива разпределения, при които ентропията достига максимум.

За да идентифицираме вида на най-вероятните разпределения, нека разгледаме някои от най-типичните случаи.

1. В класа на разпределенията на резултатите от наблюденията, които имат определена зона на разсейване между стойностите x = bи х = аширина б-а=, намираме такъв, който максимизира ентропията при наличието на ограничаващи условия:
, , ,
където е математическото очакване на резултатите от наблюдението. Решението на задачата се намира по метода на множителите на Лагранж.

Желаната плътност на разпределение на резултатите от наблюденията се описва с израза

Нека дефинираме числените характеристики на равномерното разпределение. Математическото очакване на случайна грешка се намира по формула (10):

Дисперсията на случайна равномерно разпределена грешка може да се намери по формула (18):

Поради симетрията на разпределението по отношение на математическото очакване, коефициентът на асиметрия трябва да бъде равен на нула:

За да определим ексцеса, първо намираме четвъртия момент на случайната грешка:

Ето защо

В заключение намираме вероятността случайна грешка да попадне в даден интервал, равен на защрихованата област на Фиг. 7

2. В класа на разпределенията на резултатите от наблюденията, имащи определена дисперсия, намираме такава, която максимизира ентропията при наличие на ограничения:

, , , .

Решението на тази задача също се намира по метода на множителите на Лагранж. Желаната плътност на разпределение на резултатите от наблюденията се описва с израза

Разпределението, описано с уравнения (25) и (26), се нарича нормалноили Гаусово разпределение.

Фигура 8 показва кривите на нормалното разпределение на случайните грешки за различни стойности на стандартното отклонение .

Фигурата показва, че с увеличаване на стандартното отклонение разпределението се разпространява все повече и повече, вероятността от големи грешки се увеличава и вероятността от по-малки грешки намалява, т.е. разсейването на резултатите от наблюденията се увеличава.

Нека изчислим вероятността резултатът от наблюдението да попадне в даден интервал:

Нека променим променливите:

Тогава получаваме следния израз за желаната вероятност:

Интегралите в квадратни скоби не се изразяват в елементарни функции, така че се изчисляват с помощта на така нареченото нормализирано нормално разпределение с диференциална функция

С помощта на функция F( z) вероятност намерете как

(29)

Когато използвате тази формула, трябва да имате предвид идентичността

Следвайки директно от дефиницията на функцията Ф( z).

Широкото разпространение на нормалното разпределение на грешките в измервателната практика се обяснява с централната гранична теорема на теорията на вероятностите, която е една от най-забележителните математически теореми, в чието разработване са участвали много видни математици - Де Моавър, Лаплас, Гаус. , Чебишев и Ляпунов. Централна гранична теоремазаявява, че разпределението на случайните грешки ще бъде близко до нормалното, когато резултатите от едно наблюдение се формират под въздействието на голям брой независимо действащи фактори, всеки от които има само малък ефект в сравнение с общия ефект на всички останали.

3. Да предположим, че резултатите от наблюденията са нормално разпределени, но тяхното стандартно отклонение е произволна стойност, която варира от опит до опит. Това предположение е по-предпазливо от предположението за неизменност през цялото време на измерване. В този случай, разсъждавайки по същия начин както преди, е лесно да се установи, че ентропията е максимална, ако резултатите от наблюденията имат разпределение на Лаплас с плътност

(30)

където е математическото очакване, е стандартното отклонение на резултатите от наблюдението. Разпределението на Лаплас трябва да се използва в случаите, когато характеристиките на точността не са известни предварително или са нестабилни във времето.

Функцията на диференциалното разпределение на случайните грешки се получава чрез заместване и в израз (30):

Изкривеността на разпределението е равна на нула, тъй като разпределението е симетрично около нулата, а ексцесът, в съответствие с формула (22), е

Така в сравнение с нормалното разпределение ( Пр= 0) равномерното разпределение е по-плоско ( Пр= -1,2), а разпределението на Лаплас е с по-пикови точки ( Пр = 3).

Форми на представяне на статистически данни.

Статистическите данни трябва да бъдат представени по такъв начин, че да могат да бъдат използвани. Има 3 основни форми на представяне на статистически данни:

Текст – включване на данни в текста;

Табличен - представяне на данните в таблици;

Графичен - изразяване на данни под формата на графики.

Текстова формаизползвани с малко количество цифрови данни.

таблична формасе използва най-често, тъй като е по-ефективна форма за представяне на статистически данни. За разлика от математическите таблици, които според началните условия позволяват да се получи един или друг резултат, статистическите таблици разказват на езика на числата за изследваните обекти.

Статистическа таблица- това е система от редове и колони, в които се представя в определена последователност и връзка статистическа информация за социално-икономическите явления.

Разграничете субекта и предиката на статистическата таблица. Субектът показва характеризирания обект - или единици от съвкупността, или групи от единици, или съвкупността като цяло. В сказуемото се дава характеристиката на субекта, обикновено в числова форма. Изисква се заглавието на таблицата, което показва към коя категория и към кое време принадлежат данните от таблицата.

Според характера на предмета статистическите таблици се делят на прости, групови и комбинирани. В предмета на проста таблица обектът на изследване не е разделен на групи, а е даден списък на всички единици от съвкупността или е посочена популацията като цяло. В предмета на груповата таблица обектът на изследване е разделен на групи по един признак, а предикатът посочва броя на единиците в групите (абсолютен или като процент) и обобщени показатели за групите. В предмета на комбинираната таблица съвкупността е разделена на групи не по един, а по няколко критерия.

При конструирането на таблици трябва да се спазват следните общи правила.

Субектът на таблицата се намира в лявата (рядко - горната) част, а сказуемото - в дясната (по-рядко - долната).

Заглавията на колоните съдържат наименованията на показателите и техните мерни единици.

Последният ред допълва таблицата и се намира в нейния край, но понякога е първият: в този случай вторият ред е написан "включително", а следващите редове съдържат компонентите на общия ред.

Числовите данни се записват с еднаква степен на точност във всяка колона, като цифрите на числата са разположени под цифрите, а целочислената част е отделена от дробната запетая.

Таблицата не трябва да съдържа празни клетки: ако данните са нула, тогава се поставя знакът „–“ (тире); ако данните не са известни, тогава се прави запис „няма информация“ или се поставя знакът „…“ (многоточие). Ако стойността на показателя не е нула, но първата значима цифра се появява след приетата степен на точност, тогава се записва 0,0 (ако, да речем, е приета степен на точност 0,1).

Понякога статистическите таблици се допълват с графики, когато целта е да се подчертае някаква характеристика на данните, да се сравнят. Графичната форма е най-ефективната форма за представяне на данни по отношение на тяхното възприемане. С помощта на графики се постига видимост на характеристиките на структурата, динамиката, връзката на явленията и тяхното сравнение.

Графичното изображение, на първо място, позволява да се контролира надеждността на статистическите показатели, тъй като, представени на графиката, те по-ясно показват съществуващите неточности, свързани или с наличието на грешки в наблюдението, или със същността на изследваното явление. С помощта на графично изображение е възможно да се изследват моделите на развитие на дадено явление, да се установят съществуващи връзки. Простото сравнение на данни не винаги дава възможност да се установи наличието на причинно-следствени връзки, в същото време тяхното графично представяне помага да се идентифицират причинно-следствените връзки, особено в случаите на установяване на първоначални хипотези, които след това подлежат на по-нататъшно развитие. Графиките се използват широко и за изследване на структурата на влиянията, тяхната промяна във времето и разположението им в пространството. В тях сравняваните характеристики се проявяват по-изразително и ясно се виждат основните тенденции на развитие и връзки, присъщи на изследваното явление или процес.

В статистиката графиката е визуално представяне на статистически величини и техните взаимоотношения с помощта на геометрични точки, линии, фигури или географски карти.

Графиките придават на представянето на статистически данни по-голяма яснота от таблиците, изразителност, улесняват тяхното възприемане и анализ. Статистическата графика ви позволява визуално да оцените естеството на изследваното явление, неговите присъщи модели, тенденции на развитие, връзки с други показатели и географската разделителна способност на изследваните явления. Дори в древни времена китайците казаха, че едно изображение може да замени хиляда думи. Графиките правят статистическите материали по-разбираеми, достъпни за неспециалисти, привличат вниманието на широка аудитория към статистическите данни и популяризират статистиката и статистическата информация.

Когато е възможно, се препоръчва винаги да започвате анализа на статистическите данни с тяхното графично представяне. Графиката ви позволява незабавно да получите обща представа за целия набор от статистически показатели. Графичният метод на анализ действа като логическо продължение на табличния метод и служи за получаване на обобщаващи статистически характеристики на процесите, присъщи на масовите явления.

С помощта на графично представяне на статистически данни се решават много задачи на статистическите изследвания:

  • 1) визуално представяне на величината на показателите (явленията) в сравнение един с друг;
  • 2) характеристика на структурата на всяко явление;
  • 3) промяна на явлението във времето;
  • 4) напредъка на плана;
  • 5) зависимостта на промяната в едно явление от промяната в друго;
  • 6) разпространението или разпространението на каквито и да е количества на територията.

С други думи, голямо разнообразие от графики се използват в статистическите изследвания.

Всяка графика има следните основни елементи:

  • 1) пространствени референтни точки (координатна система);
  • 2) графично изображение;
  • 3) поле за диаграма;
  • 4) мащабни ориентири;
  • 5) обяснение на графика;
  • 6) име на диаграмата

Пространствените ориентири се задават като система от координатни мрежи. В статистическите графики най-често се използва системата от правоъгълни координати. Понякога се използва принципът на полярните (ъглови) координати (кръгови графики). В картограмите средствата за пространствена ориентация са границите на държавите, границите на нейните административни части, географски ориентири (контури на реки, брегови линии на морета и океани).

По осите на координатната система или върху картата в определен ред са разположени характеристиките на статистическите признаци на изобразяваните явления или процеси. Характеристиките, разположени върху координатните оси, могат да бъдат качествени и количествени.

Графичното изображение на статистически данни е съвкупност от линии, фигури, точки, които образуват геометрични фигури с различна форма (кръг, квадрат, правоъгълник и др.) с различна щриховка, оцветяване, плътност на точките.

Всяко явление, изследвано от статистиката, може да бъде представено графично. За да направите това, трябва да намерите правилното графично решение, да определите графичното изображение, което най-добре отговаря на това явление, по-ясно изобразява статистическите данни. Графичното изображение трябва да отговаря на предназначението на диаграмата. Ето защо, преди да се начертае графика, е необходимо да се разбере същността на явлението и целта, която се поставя пред графичното изображение. Избраната форма на графиката трябва да съответства на вътрешното съдържание и характер на статистическия показател. Например, сравнение на графика се прави според такива измервания като площта, дължината на една от страните на фигурите, местоположението на точките, тяхната плътност и т.н.

И така, за изобразяване на промените в дадено явление с течение на времето, най-естественият тип графика е линията. За серии на разпределение - полигон или хистограма.

Графичното поле е пространството, в което са разположени графични изображения (геометрични тела, които образуват графики).

Полето на графиката се характеризира с размер и пропорции. Размерът на полето зависи от предназначението на диаграмата. Пропорциите и размерът на диаграмата (форматът на диаграмата) също трябва да отговарят на същността на изобразените явления. За статистически изследвания често се използват графики с неравни страни, например с аспектно съотношение на полето 1: или 1:1,33 до 1:1,6 + 5,8. Но понякога квадратната форма на графиките е удобна.

Мащабните ориентири, които осигуряват количествена сигурност на геометрично изображение, са системата от мащаби, използвана в графиката. Мащабът на графиката е условна мярка за преобразуване на статистическа числова стойност в графична. Скалата на скалата е линия, отделни точки от която могат да бъдат разчетени в съответствие с приетата скала като определена стойност на статистически показател. Мащабът е избран по такъв начин, че най-голямата и най-малката от показаните стойности да могат да се поберат на графиката.

Скалите са равномерни и неравномерни, праволинейни (обикновено разположени по координатните оси) и криволинейни (кръгови в кръгови диаграми).

Експликацията на диаграмата е устно обяснение на нейното съдържание (името на диаграмата и съответните обяснения на отделните й части).

Заглавието на диаграмата трябва ясно и кратко да описва нейното съдържание. Обяснителните текстове могат да бъдат разположени в рамките на графичното изображение, до него или извън него, по дължината на мащаба. Те помагат за мислено преминаване от геометрични изображения към явления и процеси, изобразени на графиката.

Особеността на графичните изображения е тяхната изразителност, разбираемост и видимост. Графичните изображения обаче са не само илюстративни, но и аналитични. Така че в момента графиците се използват широко в счетоводната и статистическата практика на предприятия и институции, в изследователската работа, в производствените и икономическите дейности, в образователния процес, пропагандата и други области.

Има много видове графики. Тяхната класификация се основава на редица характеристики:

  • а) метод за изграждане на графично изображение;
  • б) геометрични знаци, изобразяващи статистически показатели и зависимости;
  • в) задачи, решени с помощта на графично изображение.

Статистически графики под формата на графично изображение:

Линейни: статистически криви.

Планарно: лента, лента, квадрат, кръг, сектор, къдрава, точка, фон.

Обемни: разпределителни повърхности.

Статистически графики според метода на конструиране и задачи за изображения:

Диаграми: сравнителни диаграми, динамични диаграми, структурни диаграми.

Статистически карти: картограми, картограми.

Според метода на изграждане статистическите графики се делят на диаграми и статистически карти.

Диаграмите са най-разпространеният начин за графично представяне. Това са графики на количествени отношения. Видовете и методите на тяхното изграждане са разнообразни. Диаграмите се използват за визуално сравнение в различни аспекти (пространствени, времеви и т.н.) на независими една от друга стойности: територии, население и т.н. В този случай сравнението на изследваните популации се извършва според някои значими вариращи атрибут.

Статистически карти - графики на количествено разпределение по повърхността. По своята основна цел те са тясно свързани с диаграми и са специфични само в смисъл, че са условни изображения на статистически данни върху контурна географска карта, т.е. показват пространственото разпределение или пространственото разпределение на статистическите данни. Геометричните знаци, както споменахме по-горе, са или точки, или линии, или равнини, или геометрични тела. В съответствие с това има точкови, линейни, равнинни и пространствени (обемни) графики.

При конструирането на точкови диаграми набори от точки се използват като графични изображения; при конструиране на линейни - линии. Основният принцип за конструиране на всички равнинни диаграми е, че статистическите величини се изобразяват под формата на геометрични фигури и от своя страна се разделят на стълбовидни, лентови, кръгли, квадратни и къдрави.

Статистическите карти според графичното изображение се делят на картограми и картограми.

В зависимост от обхвата на задачите, които трябва да бъдат решени, се разграничават сравнителни диаграми, структурни диаграми и диаграми на динамиката.