Графично представяне на статистически данни. Графично представяне на статистическа информация


Стойността на графичния метод при анализа и обобщаването на данни е голяма. Графичното изображение, на първо място, позволява да се контролира надеждността на статистическите показатели, тъй като, представени на графиката, те по-ясно показват съществуващите неточности, свързани или с наличието на грешки в наблюдението, или със същността на изследваното явление. С помощта на графично изображение е възможно да се изследват моделите на развитие на дадено явление, да се установят съществуващи връзки. Простото сравнение на данни не винаги дава възможност да се улови наличието на причинно-следствени връзки, в същото време тяхното графично представяне помага да се идентифицират причинно-следствените връзки, особено в случай на установяване на първоначални хипотези, които след това подлежат на по-нататъшно развитие.

Статистическа графика- това е чертеж, в който статистическите агрегати, характеризиращи се с определени показатели, са описани с помощта на условни геометрични изображения или знаци. Графично изображениее колекция от точки, линии и форми, които представляват статистически данни. Помощни елементиграфиките са:

    Графичното поле е част от равнината, в която са разположени графичните изображения. Полето на графиката има определени размери, които зависят от предназначението му.

    Пространствените ориентири на графиката са зададени под формата на система от координатни мрежи. Координатната система е необходима за поставяне на геометрични символи в полето на диаграмата. Използват се както правоъгълна, така и полярна координатна система.

    Мащабните ориентири се използват за сравняване на графичното показване на обекта и действителния му размер. Мащабните ориентири се задават чрез система от мащабни везни или мащабни знаци.

    Експликацията на графиката се състои от обяснение на обекта, изобразен от графиката (име), и семантичното значение на всеки знак, използван върху графиката.

Статистическите графики се класифицират според тяхното предназначение (съдържание), метода на изграждане и характера на графичното изображение (фиг. 1).

Фиг. 1. Класификация на статистическите графики

Според метода на конструиране на графични изображения има:

    Диаграми- графично представяне на статистически данни, ясно показващо връзката между сравняваните стойности.

    Статистически карти

Има следните основни типове диаграми: линейни, стълбовидни, лентови, секторни, квадратни, кръгли, къдрави.

Линейни диаграмисе използват за характеризиране на динамиката, т.е. оценка на промените в явленията във времето. Абсцисата показва периоди от време или дати, а ординатата показва нивата на поредица от динамики. Няколко диаграми могат да бъдат поставени на една графика, което ви позволява да сравнявате динамиката на различни индикатори или един индикатор за различни региони или държави.

Фиг.2. Динамика на обема на вноса на леки автомобили в Руската федерация

за 2006-1q. 2010 г

Стълбови диаграмиможе да се използва:

    да анализира динамиката на социално-икономическите явления;

    оценка на изпълнението на плана;

    характеристики на вариацията в серията от разпределения;

    за пространствени сравнения (сравнения между територии, държави, фирми);

    да изучават структурата на явленията.

Колоните са разположени близо или отделно на еднакво разстояние. Височината на колоните трябва да е пропорционална на числените стойности на нивата на характеристиките.

Фиг.3. Динамика на дела на Беларус в търговския оборот на Руската федерация със страните от ОНД

За характеризиране на структурата на социално-икономическите явления се използват широко кръгови диаграми. За изграждането му кръгът трябва да бъде разделен на сектори пропорционално на специфичното тегло на частите в общия обем. Сумата от специфичните тегла е равна на 100%, което съответства на общия обем на изследваното явление.

Фиг.4. Географско разпределение на търговския оборот между Руската федерация и страните от ОНД

Стълбови диаграмисъстоят се от правоъгълници, разположени хоризонтално (ивици).

Понякога за сравнителен анализ по регион, страни използват фигура знак диаграми(схеми на геометрични фигури). Тези диаграми отразяват размера на изследвания обект в съответствие с размера на неговата площ.

Статистически картисе използват за оценка на географското разпределение на явленията и сравнителен анализ по територия.

Статистическите карти включват картограми и картограми. Разликата между тях е в начина, по който статистиката се показва на картите.

Картограмапоказва териториалното разпределение на изследвания признак в отделни райони и се използва за идентифициране на моделите на това разпределение. Картограмите се делят на фонови и точкови. Фоновите картограми с различна плътност на цвета характеризират интензитета на всеки показател в рамките на териториална единица. На точкова картограма нивото на избраното явление се изобразява с точки.

Картограма- това е комбинация от географска карта или нейна схема с диаграма. Тя ви позволява да отразявате спецификата на всеки регион в разпределението на изследваното явление, неговите структурни характеристики.

В момента са разработени различни софтуерни пакети за компютърна графика, например Excel, Statgraf, Statistica.

Статистическите данни трябва да бъдат представени по такъв начин, че да могат да бъдат използвани. Има 3 основни форми за представяне на статистически данни:

1) текст - включването на данни в текста;

2) табличен - представяне на данните в таблици;

3) графичен - изразяване на данни под формата на графики.

Текстовата форма се използва, когато има малко количество цифрови данни.

Табличната форма се използва най-често, тъй като е по-ефективна форма за представяне на статистически данни. За разлика от математическите таблици, които според началните условия позволяват да се получи един или друг резултат, статистическите таблици разказват на езика на числата за изследваните обекти.

Статистическа таблица- това е система от редове и колони, в които се представя в определена последователност и връзка статистическа информация за социално-икономическите явления.

Таблица 2. Външна търговия на Руската федерация за 2000 - 2006 г., млрд. долара

Индекс 2000 2001 2002 2003 2004 2005 2006
Външнотърговски оборот 149,9 155,6 168,3 280,6 368,9 468,4
Експортиране 101,9 107,3 135,9 183,2 243,6 304,5
Импортиране 44,9 53,8 76,1 97,4 125,3 163,9
Търговски баланс 60,1 48,1 46,3 59,9 85,8 118,3 140,7
включително:
с чужди държави
износ 90,8 86,6 90,9 114,6 210,1 261,1
импортиране 31,4 40,7 48,8 77,5 103,5 138,6
търговски баланс 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Например в табл. 2 представя информация за външната търговия на Русия, която би било неефективно да се изразява в текстова форма.

Разграничете предмети предикатстатистическа таблица. Субектът показва характеризирания обект - или единици от съвкупността, или групи от единици, или съвкупността като цяло. В сказуемото се дава характеристиката на субекта, обикновено в числова форма. Задължителен заглавкатаблица, която показва към коя категория и към кое време принадлежат данните в таблицата.

Според характера на предмета статистическите таблици се делят на просто, групаи комбиниран. В предмета на проста таблица обектът на изследване не е разделен на групи, а е даден списък на всички единици от съвкупността или е посочена популацията като цяло (например таблица 11). В предмета на груповата таблица обектът на изследване е разделен на групи по един признак, а предикатът посочва броя на единиците в групите (абсолютен или като процент) и обобщени показатели за групите (например табл. 4). В предмета на комбинираната таблица съвкупността е разделена на групи не по един, а по няколко критерия (например таблица 2).

Когато конструирате таблици, трябва да се ръководите от следното Общи правила.

1. Субектът на таблицата се намира в лявата (по-рядко - горната) част, а сказуемото - в дясната (по-рядко - долната).

2. Заглавията на колоните съдържат имената на индикаторите и техните единици.

3. Последният ред допълва таблицата и се намира в нейния край, но понякога е първият: в този случай вторият ред се изписва „включително“, а следващите редове съдържат компонентите на общия ред.

4. Числовите данни се записват с еднаква степен на точност във всяка колона, като цифрите на числата са разположени под цифрите, а целочислената част е отделена от дробната запетая.

5. В таблицата не трябва да има празни клетки: ако данните са нула, тогава се поставя знакът "–" (тире); ако данните не са известни, тогава се прави запис „няма информация“ или се поставя знакът „…“ (многоточие). Ако стойността на показателя не е нула, но първата значима цифра се появява след приетата степен на точност, тогава се записва 0,0 (ако, да речем, е приета степен на точност 0,1).

Понякога статистическите таблици се допълват с графики, когато целта е да се подчертае някаква характеристика на данните, да се сравнят. Графичната форма е най-ефективната форма за представяне на данни по отношение на тяхното възприемане. С помощта на графики се постига видимост на характеристиките на структурата, динамиката, връзката на явленията и тяхното сравнение.

Статистически графики- това са условни изображения на числени стойности и техните съотношения чрез линии, геометрични фигури, рисунки или географски диаграми. Графичната форма улеснява разглеждането на статистически данни, прави ги визуални, изразителни и видими. Графиките обаче имат определени ограничения: на първо място, една графика не може да включва толкова данни, колкото могат да се поберат в таблица; освен това графиката винаги показва закръглени данни - не точни, а приблизителни. По този начин графиката се използва само за показване на общата ситуация, а не на детайлите. Последният недостатък е сложността на чертежа. Може да се преодолее с помощта на персонален компютър (например "Съветник за диаграми" от пакета Microsoft Office Excel).

Според метода на изграждане на графиките те се разделят на диаграми, картограмии диаграми на диаграми.

Най-често срещаният начин за графично представяне на данни са диаграми, които са от следните видове: линейни, радиални, точкови, равнинни, обемни, къдрави. Видът на диаграмите зависи от вида на представените данни и задачата за конструиране. Във всеки случай графиката трябва да бъде придружена от заглавие - над или под графичното поле. Заглавието показва кой индикатор се показва, за коя територия и за колко време.

Линейните графики се използват за представяне на количествени променливи: характеристики на изменението на техните стойности, динамика, връзки между променливите. Вариацията на данните се анализира с помощта на зона на разпространение, кумулира(по-малко от крива) и огиви(крива "по-голямо от"). Разпределителният полигон е разгледан в Тема 4 (напр. Фиг. 5.). За да се изгради кумулация, стойностите на променливата характеристика се нанасят по абсцисата, а ординатите са натрупаните суми от честоти или честоти (от f1към ∑ f). За да се изгради огив, натрупаните суми от честоти се поставят на оста y в обратен ред (от ∑ fпреди f1). Кумулат и огив съгласно табл. 4. изобразете на фиг. един.

Ориз. 1. Кумулати и огиви на разпределението на стоките според стойността на митническата стойност

Използването на линейни диаграми в анализа на тенденциите е разгледано в Тема 5 (напр. Фигура 13), а използването им за анализ на връзки в Тема 6 (напр. Фигура 21). Тема 6 също обхваща използването на точкови диаграми (напр. Фигура 20).

Линейните диаграми се подразделят на едноизмерен, използвани за представяне на данни за една променлива, и двуизмерен- за две променливи. Пример за едномерна линейна графика е полигон на разпределение, а за двумерна е регресионна линия (напр. фиг. 21).

Понякога при големи промени в индикатора се използва логаритмична скала. Например, ако стойностите на даден индикатор варират от 1 до 1000, това може да доведе до затруднения при чертането. В такива случаи те преминават към логаритмите на стойностите на индикатора, които няма да се различават толкова много: lg 1 = 0, lg 1000 = 3.

Между планаренСпоред честотата на използване се разграничават лентови графики (хистограми), в които индикаторът е представен като лента, чиято височина съответства на стойността на индикатора (например фиг. 4).

Пропорционалността на площта на определена геометрична фигура към стойността на индикатора е в основата на други видове равнинни диаграми: триъгълна, квадрат, правоъгълен. Можете също така да използвате сравнение на площите на кръг - в този случай радиусът на кръга е зададен.

лентова диаграмапредставя индикатори под формата на хоризонтално разтегнати правоъгълници и иначе е същата като стълбовидна диаграма.

От равнинните диаграми често се използва кръгова диаграма, който се използва за онагледяване на структурата на изследваната популация. Целият набор се приема за 100%, съответства на общата площ на кръга, площите на секторите съответстват на части от комплекта. Нека изградим секторна диаграма на структурата на външната търговия на Руската федерация през 2006 г. съгласно таблица. 2 (виж фиг. 2). При използване на компютърни програми секторните диаграми се изграждат в триизмерна форма, т.е. не в две, а в три равнини (виж фиг. 3).

Ориз. 2. Проста кръгова диаграма 3. 3D кръгова диаграма

Къдравите (картинни) диаграми подобряват яснотата на изображението, тъй като включват изображение на показания индикатор, чийто размер съответства на размера на индикатора.

При изчертаването на графика всичко е еднакво важно - правилният избор на графично изображение, пропорции, спазване на правилата за проектиране на графики. Тези въпроси са разгледани по-подробно в и.

Картограмите и картограмите се използват за изобразяване на географските характеристики на изучаваните явления. Те показват местоположението на изследваното явление, неговата интензивност на определена територия - в република, област, стопански или административен район и т. н. Построяването на картограми и картограми се разглежда в специална литература напр.

Край на работата -

Тази тема принадлежи на:

Понятието статистика. Предмет и метод на статистиката

Понятие за статистика.. предмет и метод на статистиката.. статистическо наблюдение..

Ако имате нужда от допълнителен материал по тази тема или не сте намерили това, което търсите, препоръчваме да използвате търсенето в нашата база данни с произведения:

Какво ще правим с получения материал:

Ако този материал се оказа полезен за вас, можете да го запазите на страницата си в социалните мрежи:

Всички теми в този раздел:

Предмет и метод на статистиката
Терминът "статистика" е въведен в научна употреба от немския учен Готфрид Ахенвал през 1746 г., който предлага замяна на заглавието на курса "Изследвания на държавата", преподаван в германските университети, с "Св.

Статистическо наблюдение
Хората имат различно отношение към статистическата информация: едни не я възприемат, други безусловно вярват, а трети са съгласни с мнението на английския политик Дизраели: „Има 3 вида лъжа: лъжа,

Обобщение и групиране на статистики
Резюме - научно организирана обработка на материалите от наблюдения (по предварително разработена програма), която включва освен задължителния контрол на събраните данни, систематизиране, групиране

Абсолютни стойности
За характеризиране на масови явления статистиката използва статистически величини (показатели), които характеризират групи единици или съвкупност (явление) като цяло. Статистически величини

Относителни стойности
Относителната стойност е резултат от разделяне (сравняване) на две абсолютни стойности. Числителят на дробта е стойността, която се сравнява, а знаменателят е стойността, с която се сравнява (ba

Средни стойности
Както неведнъж е споменавано, статистиката изучава масови явления и процеси. Всяко от тези явления има както общи за цялата съвкупност, така и специални, индивидуални свойства.

Изграждане на серия за разпространение
Характеристиките, изследвани от статистиката, варират (различават се една от друга) за различните единици от съвкупността в един и същи период или момент от време. Например стойността на външнотърговския оборот варира

Изчисляване на структурните характеристики на разпределителните серии
При изучаване на вариацията се използват такива характеристики на серия на разпределение, които описват количествено нейната структура, структура. Такава е например медианата - стойността на променливия атрибут

Изчисляване на мерки за размер и интензитет на вариация
Най-простият индикатор е диапазонът на вариация - абсолютната разлика между максималните и минималните стойности на даден признак от стойностите, налични в изследваната популация (24):

Изчисляване на разпределителни моменти и показатели за неговата форма
За по-нататъшно изследване на естеството на вариацията се използват средните стойности на различни степени на отклонение на отделните стойности на даден признак от неговата средна аритметична стойност. Тези показатели се наричат

Проверка дали серията за разпространение е нормална
Теоретичната крива на разпределение се разбира като графично представяне на серия под формата на непрекъсната линия на промяна на честотата в вариационна серия, функционално свързана с промяна в опциите, други

Проверка дали редът на разпределение отговаря на закона на Поасон
Митническата инспекция е извършила проверка след освобождаване на стоките. В резултат на това беше получена следната серия от дискретно разпределение на броя на нарушенията, идентифицирани във всеки тест (Таблица 16). маса 1

Абсолютни и относителни показатели за изменение на структурата
Развитието на статистическата съвкупност се проявява не само в количественото нарастване или намаляване на елементите на системата, но и в промяна на нейната структура. Структурата е структурата на съвкупността

Рангови показатели за изменение на структурата
За измерване на разликите в структурата често се използват по-малко точни, но по-лесни за изчисляване показатели, които се основават на оценка на разликите не в стойностите на самите дялове, а в техните редици, т.е.

Концепцията за селективно наблюдение
Методът на вземане на проби се използва, когато използването на непрекъснато наблюдение е физически невъзможно поради огромно количество данни или не е икономически осъществимо. Има физическа невъзможност

Методи за вземане на проби
1. Действително произволен избор: всички единици на HS са номерирани и числата, изтеглени в резултат на тегленето, съответстват на единиците, които са попаднали в извадката, а броят на числата е равен на планирания брой

Средна извадкова грешка
След приключване на подбора на необходимия брой единици в извадката и регистриране на характеристиките на тези единици, предвидени в програмата за наблюдение, те преминават към изчисляване на обобщаващи показатели. към тях от

Пределна извадкова грешка
Като се има предвид, че на базата на извадково изследване е невъзможно да се оцени точно обобщаващата характеристика на ХС, е необходимо да се намерят границите, в които тя се намира. В конкретна проба разликата

Необходим размер на извадката
При разработването на програма за селективно наблюдение им се дава конкретна стойност на пределната грешка и нивото на вероятност. Минималният размер на извадката, който осигурява дадена

Насоки
Задача. В предприятието са интервюирани 100 работници от 1000 по реда на произволна неповтаряща се извадка и са получени следните данни за доходите им за месеца (таблица 24): Ta

Концепцията за времеви редове
Една от най-важните задачи на статистиката е изучаването на промените в анализираните показатели във времето, тоест тяхната динамика. Този проблем се решава чрез анализ на динамиката (времеви редове).

Индикатори за промени в нивата на серия от динамика
Анализът на динамичните редове започва с определяне как нивата на редовете се променят (увеличават, намаляват или остават непроменени) в абсолютно и относително изражение. Да проследя

Средни показатели на серия от динамика
Всяка серия от динамика може да се разглежда като определен набор от n индикатора, променящи се във времето, които могат да бъдат обобщени като средни стойности. Такива обобщени (средни) показатели са особено

Методи за идентифициране на основната тенденция (тренд) в поредицата от динамика
Една от основните задачи на изучаването на серията от динамика е да се идентифицира основната тенденция (модел) в промяната на нивата на серията, наречена тенденция. Редовност при промяна на нивата на серия в някои случаи

Оценка на адекватността на тенденцията и прогнозиране
За намереното уравнение на тенденцията е необходимо да се оцени неговата надеждност (адекватност), което обикновено се извършва с помощта на критерия на Фишер, сравнявайки изчислената му стойност Fр

Сезонен анализ
В поредицата от динамики, чиито нива са месечни или тримесечни индикатори, наред със случайни колебания често се наблюдават сезонни колебания, които се разбират като периодични

Насоки
Според Федералната служба за държавна статистика балансът на външната търговия (SVT) на Русия за периода 2000-2006 г. характеризиращ се с редица динамики, представени в табл. 36. Таблица 36. Външнотърговски баланс (CBT) на Русия за p

Концепцията за корелационна зависимост
Един от най-общите закони на обективния свят е законът за всеобщата връзка и зависимост между явленията. Естествено, когато се изследват явления в най-различни области, статистиката неизбежно се сблъсква

Методи за идентифициране и оценка на корелации
В статистиката се използват редица методи за идентифициране на наличието и характера на корелация между две характеристики. 1. Разглеждане на паралелни данни (кн

Рангови коефициенти на корелация
Коефициентите на рангова корелация са по-малко точни, но по-лесни за изчисляване непараметрични показатели за измерване на близостта на връзката между две корелирани характеристики. Те включват

Особености на корелацията на динамичните редове
В много изследвания е необходимо да се изследва динамиката на няколко показателя едновременно, т.е. разгледайте паралелно няколко времеви серии. В този случай става необходимо да се измери зависимостта

Индикатори за стегнатостта на връзката между качествените характеристики
Методът на корелационните таблици е приложим не само за количествени, но и за описателни (качествени) характеристики, връзката между които често трябва да се изучава при провеждане на различни социолози.

Множествена корелация
Когато решават практически проблеми, изследователите се сблъскват с факта, че корелациите не се ограничават до връзки между две характеристики: ефективно у и фактор х. В действие

Предназначение и видове индекси
Индексът е относителна величина, показваща колко пъти нивото на изследваното явление при дадени условия се различава от нивото на същото явление при други условия. Разликата в условията може да бъде

Индивидуални индекси
Относителната стойност, получена чрез сравняване на нивата, се нарича индивидуален индекс, ако структурата на изследваното явление няма значение. Индивидуалните индекси се означават с i

Общи индекси
Ако изследваното явление е разнородно и сравнение на нивата може да се направи само след привеждането им към обща мярка, икономическият анализ се извършва с помощта на общи показатели. Индексът става общ

Средни индекси
Когато се изучават качествени показатели, често е необходимо да се вземе предвид промяната във времето (или пространството) на средната стойност на индексиран показател за определена хомогенна популация.

Териториални индекси
Териториалните индекси се използват за пространствени, междурегионални сравнения на различни показатели. Тяхното изчисляване е по-сложно от изчисляването на разглежданите традиционни (динамични) индекси

ГРАФИЧНО ПРЕДСТАВЯНЕ НА СТАТИСТИЧЕСКИ ДАННИ, метод за визуално представяне и обобщаване на данни за социално-икономически явления чрез геометрични изображения, чертежи или схематични географски карти и обяснителни надписи към тях. Графичното представяне на статистическите данни ясно и нагледно показва връзката между явленията и процесите на социалния живот, основните тенденции в тяхното развитие, степента на тяхното разпространение в пространството; ви позволява да видите както съвкупността от явления като цяло, така и отделните му части.

За графично представяне на статистически данни се използват различни видове статистически графики. Всяка графика се състои от графично изображение и помощни елементи. Те включват: обяснение на диаграма, пространствени препратки, препратки към мащаб, поле на диаграма. Помощните елементи позволяват четенето на графиката, разбирането и използването й. Графиките могат да бъдат класифицирани по редица признаци: в зависимост от формата на графичното изображение те биват точкови, линейни, равнинни, пространствени и къдрави. Според метода на изграждане на графиките те се делят на диаграми и статистически карти.

Най-често срещаният начин за графични изображения е диаграма. Това е чертеж, в който статистическите данни са представени като геометрични фигури или знаци, а територията, за която се отнасят тези данни, е посочена само устно. Ако диаграмата е насложена върху географска карта или върху план на територията, за която се отнасят статистическите данни, тогава графиката се нарича диаграма на картата. Ако статистическите данни са показани чрез защриховане или оцветяване на съответната територия на географска карта или план, тогава графиката се нарича картограма.

Могат да се използват различни видове диаграми за сравняване на подобни статистически данни, характеризиращи различни обекти или територии. Най-очевидни са лентовите диаграми, в които статистическите данни се показват като вертикално удължени правоъгълници. Тяхната прегледност се постига чрез съпоставяне на височината на колоните (фиг. 1).

Ако базовата линия е вертикална и лентите са хоризонтални, тогава диаграмата се нарича лентова диаграма. Фигура 2 показва сравнителна лентова диаграма, която характеризира територията на земното кълбо.

Диаграмите, предназначени за популяризиране, понякога се изграждат под формата на стандартни фигури - чертежи, характерни за показваните статистически данни, което прави диаграмата по-изразителна и привлича вниманието към нея. Такива диаграми се наричат ​​къдрави или картинни (фиг. 3).

Голяма група индикативни графики са структурни диаграми. Методът за графично представяне на структурата на статистическите данни се състои в изготвянето на структурни кръгови или кръгови диаграми (фиг. 4).

За изображение и анализ на развитието на явленията във времето се изграждат диаграми на динамиката: лентови, лентови, квадратни, кръгови, линейни, радиални и др. Изборът на вида на диаграмата зависи от характеристиките на изходните данни, цел на изследването. Например, ако има поредица от динамики с донякъде неравномерни нива във времето (1913, 1940, 1950, 1980, 2000, 2005), тогава се използват стълбовидни, квадратни или кръгови диаграми. Те са визуално впечатляващи, добре запомнени, но не са подходящи за изобразяване на голям брой нива. Ако броят на нивата в поредица от динамика е голям, тогава се използват линейни диаграми, които възпроизвеждат процеса на развитие под формата на непрекъсната прекъсната линия (фиг. 5).

Доста често на една линейна диаграма са показани няколко криви, които дават сравнително описание на динамиката на различни показатели или на един и същи показател в различни страни (фиг. 6).

За да се покаже зависимостта на един показател от друг, се изгражда диаграма на връзката. Единият индикатор се приема за X, а другият за Y (т.е. функция на X). Построена е правоъгълна координатна система със скали за показатели, като в нея е начертана графика (фиг. 7).

Развитието на компютърните технологии и приложния софтуер направи възможно създаването на географски информационни системи (ГИС), които представляват качествено нов етап в графичното представяне на информацията. ГИС предоставят събиране, съхранение, обработка, достъп, показване и разпространение на пространствено координирани данни; включват голям брой графични и тематични бази данни във връзка с модели и изчислителни функции, които позволяват представяне на информация в пространствена (картографска) форма, получаване на многослойни електронни карти на региона в различни мащаби. Според териториалния обхват се разграничават глобални, субконтинентални, държавни, регионални и локални видове ГИС. Предметната ориентация на ГИС се определя от задачите, които се решават с негова помощ, сред които могат да бъдат инвентаризация на ресурсите, анализ, оценка, мониторинг, управление и планиране.

Лит .: Герчук Я. П. Графични методи в статистиката. М., 1968; Теория на статистиката / Под редакцията на Р. А. Шмойлова. 4-то изд. М., 2005. С. 150-83.

Статистическата графика е чертеж, в който статистическите съвкупности, характеризиращи се с определени показатели, са описани с помощта на условни геометрични изображения или знаци. В статистическите графики най-често се използва системата от правоъгълни координати, но има и графики, базирани на принципа на полярните координати (кръгови графики).

Класификация на видовете диаграми:

а) метод за изграждане на графично изображение;

б) геометрични знаци, изобразяващи статистически показатели и зависимости;

в) задачи, решени с помощта на графично изображение.

Статистически графики под формата на графично изображение:

1. Линейни: статистически криви.

2. Равнинни: лента, лента, квадрат, кръг, сектор, къдрава, точка, фон.

3. Обемни: разпределителни повърхнини.

Статистически графики според метода на конструиране и задачи за изображения:

1. Диаграми: диаграми за сравнение, диаграми на динамиката, структурни диаграми (най-често срещаният начин за графични изображения. Това са графики на количествени отношения).

2. Статистически карти: картограми, картограми (графики на количествено разпределение по повърхността. По своята основна цел те са тясно съседни на диаграмите и са специфични само в смисъл, че са условни изображения на статистически данни върху контурна географска карта, т.е. , те показват пространствено разпределение или пространствено разпределение на статистика)

10/ Абсолютни цифри

Абсолютни показателиотразяват физическите измерения на процесите и явленията, изучавани от статистиката, а именно тяхната маса, площ, обем, дължина, времеви характеристики. Те винаги са наименувани с числа. Изразено в натурален, стойностен или трудовмерни единици.

Натурални единици - тонове, километри, литри, барели, късове.

Условно натуралните единици се използват, когато даден продукт има няколко разновидности и общият обем може да се определи само въз основа на потребителско свойство, общо за всички разновидности. Преобразуването в условни единици се извършва въз основа на специални коефициенти, изчислени като съотношение на потребителските свойства на отделните разновидности на продукта към референтната стойност.

Разходните мерни единици дават парична оценка на социално-икономическите явления (стойност на БВП). Единиците за измерване на труда позволяват да се вземат предвид общите разходи за труд в предприятието и трудоемкостта на отделните операции на технологичния процес (човекодни, човекочасове).

Индивидуални абсолютни показателиполучени директно в процеса на статистическо наблюдение в резултат на интересуващия ни количествен признак.

Обобщени обемни абсолютни показателисе получават чрез сумиране и групиране на отделни стойности.

11/ Относителни показатели

Относителният показател е резултат от разделянето на един абсолютен показател на друг и изразява съотношението между количествените характеристики на социално-икономическите явления.

Без относителни показатели е невъзможно да се измери интензивността на развитието на изследваното явление във времето, да се оцени нивото на развитие на едно явление на фона на други взаимосвързани с него явления, да се направят пространствени и териториални сравнения.

При изчисляване на относителен показател се нарича абсолютният показател, който е в числителя на полученото съотношение текущи или сравними, а показателят в знаменателя се нарича база за сравнение или база.

Относителните показатели могат да бъдат изразени в коефициенти, проценти, ppm, десетични дроби или могат да бъдат наречени стойности. Процентите се използват в случаите, когато съпоставяният абсолютен показател превишава базовия не повече от 2-3 пъти. Ако превъзходството е по-голямо, тогава се използва коефициентът.

Има следните видове относителни показатели.

    Относителният показател за динамика (RDI) е съотношението на нивото на процеса или явлението, което се изследва за даден период от време, и нивото на същото явление в миналото. OPD се измерва като процент или се изразява като коефициент.

    Тази стойност показва колко пъти текущото ниво е по-голямо от базовата линия или каква част от базовата линия е. Ако GPV се изрази като множествено, тогава това е факторът на растежа. Когато този фактор се умножи по 100, се получава темпът на растеж.

    Относителният показател на плана (RPI) е съотношението на планираното ниво на индикатора към вече постигнатия индикатор в миналото. ROP, подобно на RAP, се изразява като процент или като отношение.

    Относителният показател за изпълнение на плана (PRRP) е отношението на действително постигнатото ниво към планираното ниво на индикатора. PRRP също се изразява като процент или като отношение.

    Индексът на относителната структура (RPS) е съотношението на структурните части на обекта, който се изследва и се определя от съотношението на показателя, който характеризира част от съвкупността, към показателя, който характеризира цялата популация. OPS се изразява в части от единици или като процент.

    Относителен координационен индекс (RIC) - съотношението на различни части, принадлежащи към един обект.

    Индекс на относително сравнение (RPCr) е съотношението на абсолютни показатели със същото име, които характеризират различни обекти.

    Показателят за относителна интензивност (RII) характеризира степента на разпространение на процеса или явлението, което се изследва в присъщата му среда и се определя от съотношението на показателя, характеризиращ явлението, към показателя, характеризиращ средата за разпространение на това явление. OPI се измерват в проценти, ppm, децимили. Този показател се изчислява, когато абсолютната му стойност е недостатъчна, за да се формулират разумни заключения за мащаба на явлението. Различни OPII са индикатори ниво на икономическо развитиехарактеризиращи производството на БВП на човек от населението, търговския оборот на човек от населението и др. Индикаторите за нивото на икономическо развитие се наричат ​​стойности и се измерват в рубли на глава от населението и т.

§ 1. Понятия за статистика, статистическа закономерност и съвкупност ..... 2

§2. Признаци на единици от статистическата съвкупност, тяхната класификация ...... 2

§едно. Концепцията за статистическото наблюдение, неговата подготовка ............... 4

§2. Видове статистическо наблюдение ................................................. ................. .. пет

§3. Грешки при наблюдение ................................................. .................. ................... 6

§4. Обобщение и групиране ............................................. ................. ................. 6

§пет. Видове статистически групи ................................................. ............ 6

§6. Статистически таблици................................................. ......... 7

§7. Статистически графики ................................................. .................. ............ осем

§едно. Действително и теоретично разпределение ............................................. 21

§2. Нормална крива на разпределение ............................................. 21

§3. Тестване на хипотезата за нормалното разпределение............................. 21

§4. Критерии за съответствие: Pearson, Romanovsky, Kolmogorov........... 21

§пет. Практическата стойност на моделирането на сериите на разпределение ..... 22

§едно. Концепцията за селективно наблюдение. Причини за използването му ...... 23

§3. Грешки при вземане на проби ................................................. ............... 24

§4. Примерни задачи за наблюдение............................................. 25

§пет. Разширяване на данните от извадковите наблюдения към общата популация... 26

§6. Малка извадка ................................................ .............. ................ 26

§едно. Концепцията за корелация и CRA ............................................ 27

§2. Условия за използване и ограничения на KPA .............................. 27

§3. Сдвоена регресия, базирана на метода на най-малките квадрати.. 28

§4. Приложение на сдвоено уравнение на линейна регресия .......... 29

§6. Множествена корелация ............................................. 32


Тема 1.: Въведение в статистиката.

  1. понятия за статистика, статистическа закономерност и население.
  2. признаци на единици от статистическата съвкупност, тяхната класификация.
  3. предмет и метод на статистиката.

§ 1. Понятия за статистика, статистическа закономерност и съвкупност.

Думата статистика идва от латинското „ състояние” в превод - състояние, състояние на нещата.

Терминът статистика възниква през втората половина на 18 век. Във връзка с познаването на държавите, изучаването на техните характеристики. От същото време датира и началото на преподаването на статистика в университета. В зависимост от отрасъла на статистическите изследвания се разграничават: статистика на населението, индустрията, селското стопанство и др. - приложна статистика.

Общата теория на статистиката е набор от методи и техники за събиране, обработка, представяне и анализ на числени данни. Терминът статистика днес се използва в 3 значения:

  1. като синоним на думата "данни"
  2. клон от значения, който съчетава принципите и методите на работа с числени данни, характеризиращи масови явления (продължителността на живота на мъжете е по-ниска, отколкото на жените)
  3. клон на практическата дейност, насочен към обработка и анализ на числени данни.

Статистиката позволява да се идентифицират и измерват моделите на развитие на социално-икономическите процеси и явления, както и връзката между тях в конкретни условия на място и време.

Закономерността се отнася до повторението, последователността и реда на промените в явленията.

Статистическа закономерност - закономерност, при която необходимостта е неразривно свързана във всяко отделно явление със случайността и само в множество явления се проявява като закон. Концепцията за статистическа закономерност се противопоставя на концепцията за динамична закономерност, която се проявява във всяко явление. (пример: S кръг = pr 2 от > r теми > S кръг). Обектът на статистическото изследване е статистическа съвкупност - съвкупност от единици, които имат масов характер, хомогенност, определят се от цялостност и наличие на вариация. Всеки отделен елемент се нарича статистическа съвкупност (ESS)

§2. Признаци на единици от статистическата съвкупност, тяхната класификация.

ECC имат определени свойства, които се наричат ​​характеристики. Статистиката изучава явленията чрез техните характеристики, колкото по-хомогенно е множеството, толкова повече общи характеристики имат неговите единици и толкова по-малко варират стойностите на тези характеристики.

Описателен знак е знак, който може да бъде изразен само словесно.

  1. Количествен признак - признак, който може да бъде изразен числено.
  2. Пряк знак е свойство, което е пряко присъщо на характерен обект.
  3. Косвен признак са свойствата не на самия характеризиран обект, а на обекта, свързан с него или включен в него.
  4. първичният атрибут е абсолютна стойност, която може да бъде измерена.
  5. вторичен признак - резултат от сравнение на първични признаци, той се измерва директно.
  6. натурален знак - измерва се в късове, кг, тонове, литри и др.
  7. знак за труд - измерва се в човекодни, човекочасове.
  8. стойностен атрибут - измерен в рубли, $, €, ₤.
  9. безразмерен знак - измерване в дялове,%
  10. алтернативна характеристика е характеристика, която приема само една стойност от няколко възможни.
  11. дискретен знак - приема само цяло число, без междинна.
  12. непрекъсната характеристика е характеристика, която приема произволна стойност в рамките на определен диапазон.
  13. Факторна черта е черта, която променя друга черта.
  14. ефективна черта - черта, която се променя под чертата на друга
  15. моментен знак - знак, измерен в определен момент от времето.
  16. интервален знак - знак за определен период от време.

Една и съща характеристика може да бъде класифицирана едновременно според различни класификации.

§3. Предмет и метод на статистиката.

Обект на статистическото изследване са статистическите агрегати - набор от еднокачествени вариращи обекти.

Спецификата на предмета на статистиката определя и спецификата на метода, те включват:

  1. събиране на данни (статистическо наблюдение, публикуване)
  2. обобщаване на данни (обобщение, групиране)
  3. представяне на данни (таблици и графики)
  4. анализ и интерпретация на числени данни (изчисляване на средни стойности, анализ на вариации, KRA, серии от динамика, индекси)

Тема 2: Организация на статистическото наблюдение.

Обобщение и групиране на данни.

§едно. Концепцията за статистическото наблюдение, неговата подготовка.

§2. Видове статистическо наблюдение.

§3 Грешки в наблюдението.

§4 Обобщение и групиране

§5 Видове статистически групировки.

§6 Статистически таблици.

§7 Статистически графики.

§едно. Концепцията за статистическото наблюдение, неговата подготовка.

Всяко статистическо изследване започва със събиране на данни.

Източници на информация:

  1. различни публикации (вестници, списания и др.)
  2. основният източник на публикувана статистическа информация са публикациите на органите на държавната статистика (RF през 2001 г., издателство GOSKOMSTAT).
  3. извършване на статистическо наблюдение, т.е. научно организирано събиране на данни.

Статистическото наблюдение е масово, планирано, научно организирано наблюдение на явлението от социалния и икономически живот, което се състои в регистриране на признаци за всяка единица от изследваната съвкупност.

Процес на наблюдение:

  1. Подготовка за наблюдение
  2. Провеждане на масово събиране на данни
  3. Подготовка на данни за обработка
  4. Разработване на предложения за подобряване на статистическото наблюдение.

Подготовка за наблюдение:

  1. Определяне на целта и обекта на наблюдение
  2. Определяне на състава на знаците, подлежащи на регистрация
  3. Разработване на документи за събиране на данни
  4. Изборът на отчетната единица и единицата, спрямо която ще се извършва наблюдението.
  5. Необходимо е да се определят методите и средствата за получаване на данни.

Организационни проблеми за решаване:

  1. необходимо е да се определи съставът на службите, провеждащи изследването
  2. информирайте персонала
  3. изготви работен график
  4. копиране на документи за събиране на данни

Обект на наблюдение са социално-икономическите явления и процеси.

Необходимо е ясно да се идентифицират знаците за регистрация.

Програма за наблюдение - списък от признаци на признаци, подлежащи на регистрация в процеса на наблюдение.

Изисквания към програмата за наблюдение:

  1. Програмата трябва да съдържа съществени характеристики, които пряко характеризират изследваното явление; признаци, които имат вторични явления или знаци, чиито стойности ще бъдат очевидно ненадеждни или ще отсъстват напълно, не трябва да се включват в програмата.
  2. Въпросите от програмата за наблюдение трябва да са точни, недвусмислени и лесни за разбиране, за да се избегнат трудности при получаване на отговори.
  3. Трябва да се определи последователността на въпросите.
  4. Програмата за мониторинг трябва да включва въпроси от пряк характер за провеждане и изясняване на събраните данни.
  5. за да се осигури еднаквост на получената информация, програмата се съставя под формата на документ - нарича се статистическа форма.

Статистическият формуляр е документ от единична извадка, съдържащ програма и резултатите от наблюденията.

Прави се разлика между индивидуална форма (отговори на въпроси за една единица наблюдение) и отписана (информация за няколко единици от статистическата съвкупност).

Формулярът и инструкциите за попълването му са инструменти за статистическо наблюдение.

Изборът на време за наблюдение се състои в решаването на 2 въпроса: установяване на критична дата или интервал, определяне на периода на наблюдение.

Критична дата - определен ден от годината, часът от деня, към който признаците трябва да бъдат регистрирани за всяка единица от изследваната съвкупност.

Период на наблюдение - времето, през което се попълват статистическите форми, т.е. време, необходимо за събиране на данни.

Трябва да се има предвид, че разстоянието на периода на наблюдение от критичната дата или интервал може да доведе до намаляване на надеждността на получената информация.

§2. Видове статистическо наблюдение.

Във вътрешната статистика се използват три форми на статистически наблюдения.

  1. статистическа отчетност на предприятия, организации, учреждения.
  2. специално организирано статистическо наблюдение (преброяване и др.)
  3. регистър - форма на непрекъснато статистическо наблюдение на дългосрочни процеси

Статистическото наблюдение се класифицира:

По време на наблюдение:

  • текущо наблюдение - извършва се непрекъсната регистрация на признаци (служба по вписванията, престъпност и др.).
  • периодично наблюдение - извършва се на определени интервали от време (стандарт на живот в град Челябинск, цена на потребителската кошница, преброяване на населението).
  • Еднократно - еднократно наблюдение с определена цел.

По обхват на съвкупност от единици:

  • Непрекъснато наблюдение - трябва да се получи информация за всички ECC
  • Не е пълно наблюдение
    • Методът на основния масив - изследват се най-значимите единици от изследваната съвкупност (за изследване на инженерното предприятие на Челябинска област).
    • Селективното наблюдение е произволен подбор на ECC, които да бъдат наблюдавани.
    • Монографско наблюдение - когато се наблюдава един ECC, те често се използват за съставяне на програма за масово наблюдение.

Чрез събиране на данни:

  • Пряко наблюдение - самите регистратори, чрез пряко измерване, претегляне, установяват факта на обекта, който ще бъде регистриран (дете под 1 година в поликлиника).
  • Документално наблюдение - използват се различни документи (съставяне на декларация)

Анкета - необходимата информация се получава от думите на респондента.

  • Препращащо проучване - извършва се от специално обучени служители, които получават необходимата информация на базата на анкета на съответните лица и сами записват отговорите във формуляра. Експедиционното проучване може да бъде директно (лице в лице) и косвено (анкета по телефона)
  • Кореспондентско проучване - информацията се предоставя от персонала на доброволните кореспонденти, този метод изисква малко финансови разходи, но не дава точната стойност на наблюдението.
  • Самостоятелна регистрация - формулярите се попълват сами от респондентите, а регистраторите само им раздават бланките на въпросниците и им обясняват как да ги попълнят.

§3. Грешки при наблюдение

Основното изискване към статистическото наблюдение е точността.

Точност - степента на съответствие на всеки характерен показател с действителната стойност, определена от материалите на статистическото наблюдение.

Несъответствието между изчислената и действителната стойност се нарича грешка на наблюдението, в зависимост от причините за възникването се разграничават: грешки при регистрацията и грешки на представителността. Грешките при регистрация се делят на случайни и систематични.

Случайни грешки - резултат от действията на случайни фактори (редове, колони са смесени)

Систематични грешки - винаги са склонни или да надценяват, или да подценяват индикатора. (възраст)

Грешките в представителността са характерни за непродължително наблюдение и възникват в резултат на неточно възпроизвеждане на извадката от цялата оригинална популация.

След като получите статистическите формуляри, трябва:

  1. проверка на пълнотата на събраните данни.
  2. извършват аритметичен контрол въз основа на връзката на различни признаци помежду си.
  3. да извършва логически контрол въз основа на познаването на логическите връзки между характеристиките.

§4. Обобщение и групиране

Въз основа на събраните данни е невъзможно да се направи изчисление и да се направят изводи, първо те трябва да бъдат обобщени и обобщени в една таблица. За тези цели се използват обобщение и групиране.

Резюме - набор от последователни операции за обобщаване на конкретни единични факти, които образуват набор и идентифицират типични характеристики и модели, присъщи на изследваното явление като цяло.

Обикновена водка - броене на сумите за населението.

Комплексното резюме е набор от операции за групиране на отделни наблюдения, отчитане на резултатите за всяка група и за целия обект като цяло и представяне на резултатите под формата на статистически таблици.

Според формата на обработка на материала обобщението може да бъде децентрализирано, централизирано - такова обобщение се извършва с еднократно статистическо наблюдение.

Групиране - разделянето на набора от единици от изследваната съвкупност на групи по определени признаци.

§пет. Видове статистически групировки

Групировките могат да бъдат класифицирани по структура и съдържание.

Аналитичното групиране характеризира връзката между признаците, единият от които е фактор, а другият е продуктивен.

образование

Непълно висше

§6. Статистически таблици

Резултатите от обобщаването и групирането трябва да бъдат представени така, че да могат да се използват.

Има 3 начина за представяне на данни:

  1. данни могат да бъдат включени в текста.
  2. представяне в таблици.
  3. графичен начин

Статистическа таблица - система от редове и колони, в които в определена последователност е представена статистическа информация за социално-икономическите явления.

Правете разлика между субект и предикат на таблицата.

Субектът е обект, характеризиращ се с числа, обикновено субектът е даден от лявата страна на таблицата.

Предикатът е система от показатели, чрез които се характеризира обектът.

Статистическата таблица съдържа 3 вида заглавки: общи, странични

Общото заглавие трябва да отразява съдържанието на цялата таблица, разположено над таблицата в центъра.

Правило за маса.

  1. и трите вида заглавия без съкращения на думи са задължителни, в заглавието могат да се поставят общи мерни единици.
  2. таблицата не трябва да има допълнителни линии, може да липсват вертикални маркировки.
  3. Последният ред е задължителен. Може да бъде в началото или в края на документа. Ако в началото на документа, тогава ако в края, тогава ОБЩО:
  1. цифровите данни в една колона се записват с една степен на точност. Цифрите са написани строго под цифрите, цялата част е разделена със запетая.
  2. таблицата не трябва да съдържа празни клетки, ако няма данни, тогава те пишат „Няма информация“ или „...“, ако данните са нула, тогава „-“. Ако стойността не е равна на нула, но първата значима цифра се появява след определената точност 0,01®0,0 - ако приетата точност е до десети.
  3. ако в таблицата има много колони, тогава колоните на субекта се обозначават с главни букви, а колоните на предиката с цифри.
  4. ако таблицата се основава на заимствани данни, тогава източникът на данните е посочен под таблицата; ако е необходимо, таблицата може да бъде придружена от бележки.

§7. Статистически графики

Статистическите таблици могат да бъдат допълнени с графики.

Статистическите графики са условни изображения на числови стойности и техните съотношения чрез линии, геометрични фигури, рисунки.

Предимства на графичното изображение

  1. ясно, очевидно, изразително.
  2. границите на изменение на индикатора, сравнителната скорост на изменение и волатилността се виждат веднага

Минуси на графично изображение

  1. Включете по-малко данни, отколкото в таблицата.
  2. графиката показва закръглени данни, общата ситуация, но не и детайлите.

Статистически графики

Диаграми

къдрава

Тема 3: Статистически показатели.

§едно. Същност и значение на статистическия показател, неговите атрибути.

§2. Класификация на статистическите показатели.

§3. Видове относителни показатели. Принципи на изграждане.

§4. Системи от статистически показатели.

Статистическият признак е свойство, присъщо на ЕСС, съществува обективно от това дали се изучава като наука или не.

Статистическият показател е обобщаваща характеристика на някакво свойство на съвкупността.

Структурата на статистическия показател (неговите атрибути):

  • Средни стойности
  • Вариационни индикатори
  • Индикатори за свързване на функции
  • Показатели за структурата и характера на разпространението
  • Динамични показатели
  • Показатели за променливост
  • Индикатори за точност и надеждност на извадковите оценки
  • Индикатори за точност и надеждност на прогнозата

По вид: общият брой единици или общата собственост на обекта. Това е сумата от първичните характеристики, измерени в бройки, kg, m, $ и др.

Относителен показател- получени чрез сравняване на абсолютни или относителни показатели в пространството, във времето или чрез сравняване на показатели на различни свойства на обекта на изследване.

Относителният показател от 1-ви ред се получава чрез сравняване на 2 x абсолютни показатели. Относителният показател от 2-ри ред се получава чрез сравняване на относителните показатели от 1-ви ред и т.н.

Относителен индекс от 3-ти ред и по-висок е много рядък.

Преки индикатори - такива показатели, чиято стойност се увеличава с нарастването на изследваното явление.

Обратни показатели - показатели, чиято стойност намалява с увеличаване на изследваното явление.

… структури

… високоговорители

...отношения

… интензивност

… отношение към стандарта

... сравнения

Структурни показателисе получават чрез свързване на частта с цялото.

Относителни показатели за динамика

ü Показатели за динамика (темпове на растеж, растеж)

ü Индекси

Индикатори за взаимоотношенияхарактеризира връзката между характеристиките:

ü Коефициент на корелация

ü Аналитични показатели

Индикатори за интензивностхарактеризират връзката на два обекта на различни основания.

ü Интензивност на труда - количеството време, използвано за производството на една единица продукт

ü Производство – количеството произведени продукти за единица време

ИЗХОД \u003d 1 / интензивност на труда

Показатели за отношение към стандарта- съотношението на действителните стойности на знака на индикатора към нормативните, планирани, оптимални.

Сравнителни показатели -сравнение на различни обекти на една и съща основа.

Общи принципи за конструиране на статистически показатели:

  1. статистиките са обективно свързани.
  2. Сравняваните индикатори могат да се различават само по един атрибут; не можете да сравнявате индикатор по два или повече атрибута.
  3. необходимо е да се знаят и вземат предвид границите на индикатора.

За всяка характеристика на даден обект е необходима система от статистически показатели.

  1. когнитивна функция – базирана на анализ на данни
  2. пропаганда
  3. стимулираща функция

Тема 4: Средни стойности

§едно. понятие за средно

§2. видове средни стойности

§3. средно аритметично и неговите свойства

§4. хармонично средно, геометрично средно, квадратично средно.

§пет. многомерна средна

Най-често срещаната форма на статистически показатели е средната стойност.

Най-важното свойство на средната стойност е, че тя отразява общото, което е присъщо на всяка единица от изследваната популация, въпреки че стойността на атрибута на отделните единици от популацията може да варира в една или друга посока.

Типичността на средната е пряко свързана с хомогенността на изследваната популация. В случай на нехомогенна съвкупност е необходимо тя да се раздели на качествено хомогенни групи и да се изчисли средната стойност за всяка от хомогенните групи.

Можете да определите средното чрез първоначалното съотношение на средното (ISS) неговата логическа формула.

Структурни средни

Мода - Mo

Медиана - Аз

В редицата от динамика се изчисляват средната аритметична и средната хронологична стойност.

средноаритметично се нарича такава средна стойност на признака, при изчисляването на която общият обем на признака не се променя.

Пример: тегло.

ср проста аритметика

х аз– индивидуална стойност на признака

n е общият брой на изследваната популация

вж. аритметично претеглени

Свойства вж. аритметика.

Сумата от отклоненията на отделните стойности на даден признак от средната му стойност е нула

ако всяка отделна стойност на характеристика се умножи или раздели на едно и също постоянно число, тогава средната стойност ще се увеличи или намали с една и съща сума.

ако към всяка отделна стойност на атрибута се добави едно и също постоянно число, тогава средната стойност ще се промени съответно със същото число.

Доказателство

ако теглата f на среднопретеглената стойност се умножат или разделят на едно и също число, тогава средната стойност няма да се промени.

сумата от квадратите на отклоненията на атрибута е по-малка от всяко друго число.

Други видове средни стойности

Тип среда

проста средна стойност

Среднопретеглена стойност

хармоничен

геометричен

квадратна

Много е трудно да се характеризира групирането на една основа и малко информация остава в паметта.

Многомерна средна стойност - средната стойност за няколко признака E.S.S.

От съотношенията на стойностите на характеристиките за E.S. към средните стойности на тези признаци.

Многомерна средна стойност за i единици

х ij– стойността на признака j за i единица

Средна стойност на признак j

k е броят на функциите

j е номерът на характеристиката и броят на нейната популация

Тема 5: Анализ на вариациите

§едно. Промяна на знаците и причините за това

§2. Ранове на разпределение

§3. Структурни характеристики на вариационната серия.

§4. Сила на вариационните индикатори.

§пет. Индикатори за интензитет на вариация

§6. видове дисперсия. Правило за добавяне на дисперсии.

Вариация в стойността на характеристика в популация е разликата в нейните стойности между различни единици от дадена популация в същия период или момент от време.

Причината за вариацията: различни условия за съществуване на ЕСС, именно вариацията създава необходимостта от такава наука като статистиката.

Извършването на вариационен анализ започва с изграждането на вариационна серия - подредено разпределение на единиците на съвкупността според нарастващи или намаляващи знаци и преброяване на съответните честоти.

Ранове на разпределение

ü класиран

ü дискретни

ü интервал

Класирани вариационни серии- списък на отделните единици. агрегати във възходящ низходящ ред на класираната характеристика

Серия с дискретни вариации -таблица, състояща се от 2 реда - стойности на полимер на променлива характеристика и брой единици с дадена стойност на характеристика.

Интервална вариационна серия се конструира в следните случаи:

  1. функцията приема дискретни стойности, но техният брой е твърде голям
  2. атрибутът приема произволна стойност в определен диапазон

При конструирането на серия от интервални вариации е необходимо да се избере оптималният брой групи, най-често срещаният метод, използващ формулата на Стърджис

k - брой интервали

n е обемът на населението

При изчисленията почти винаги се получават дробни стойности, закръглящи се до цяло число.

Дължина на интервала - л

Интервални видове

долната граница на следващия интервал повтаря горната граница на следващия интервал

отворен интервал, интервал с една граница

Когато се изчислява за интервална вариационна серия, средата на интервала се приема като x i.

NME =60 медиана = 1

Cumulate - разпространение по-малко от

Ogiva – разпространение по-голямо от

Медианата е стойността на характеристика, която разделя цялата съвкупност на две равни части.

За дискретна вариационна серия, изчисляването на медианата: ако n е четно, тогава No. Средна единица

Интервални вариационни серии:

k - брой интервали

x 0 - долната граница на средния интервал

ле дължината на средния интервал

Сума от честоти

Кумулативната честота на интервала, предхождащ медианата.

Средна интервална честота

Среден интервал– първият интервал, чиято натрупана честота надвишава половината от общата сума на честотите.

Графично медианата е върху кумулата.

  1. Квартили - стойността на атрибута, разделящ съвкупността на 4 равни части.

1-ви квартил

3-ти квартил

2-ри квартил - медиана.

xQ 1 x Q 3 - долната граница на интервала, съдържащ 1-ви и 3-ти квартил.

l - дължина на интервала

и - натрупаните честоти на интервали от предишни интервали, съдържащи 1-ви и 3-ти квартил.

Честоти на квартилните интервали.

За характеризиране на серията вариации се използват следните:

Децили - разделят населението на 10 равни части, Перцитили - разделят населението на 100 равни части.

  1. Режимът е често срещана характеристика. За дискретна вариационна серия - най-високата честота. За серия от интервални вариации режимът се изчислява по следната формула:

Долна граница на модалния интервал

л– дължина на модалния интервал

fMo-модална интервална честота

f Mo +1 е честотата на интервала след модала

Модален интервал - интервалът с най-висока честота.Графично режимът се намира на хистограмата.

  1. Вариация на обхвата
  2. Средно линейно отклонение

претеглени

  1. дисперсия:

претеглени

  1. стандартно отклонение

дисперсионно свойство.

  1. намаляването на всички стойности на характеристика с една и съща сума не променя стойността на дисперсията.
  2. Намаляването на всички стойности на характеристиките с k пъти намалява дисперсията с до 2пъти и RMS в да севеднъж
  3. ако изчислите средния квадрат на отклоненията от всяка стойност А, различна от средната аритметична стойност, тогава тя винаги ще бъде по-голяма от средния квадрат на отклоненията, изчислена от средната аритметична стойност. По този начин средната винаги е по-малка от изчислената от всяка друга стойност, т.е. има минималното свойство. RMS = 1.25 - с разпределения близки до нормалните.

При условия на нормално разпределение има следната връзка между и броя на наблюденията в рамките на 68,3% от наблюденията.

95,4% от наблюденията са в границите

99,7% от наблюденията са в границите

За сравняване на вариацията на признаците в различни популации или за сравняване на вариацията на различни белези в една и съща популация се използват относителни показатели, като базата е средноаритметичното.

  1. Относителен диапазон на вариация.
  2. Относително линейно отклонение
  3. Коефициентът на вариация

тези показатели дават не само сравнителна оценка, но и формират хомогенността на населението. Наборът се счита за хомогенен, ако коефициентът на вариация не надвишава 33%.

Наред с изучаването на вариациите на даден признак в цялата популация като цяло, често се налага да се проследят и количествените изменения на признака, но до групите, на които е разделена популацията и между тях. Това се постига чрез изчисляване на различни изгледи.

Видове дисперсия:

  1. Обща дисперсия
  2. Междугрупова дисперсия
  3. Дисперсия в рамките на групата (остатъчно)

1. измерва вариацията на даден признак в цялата популация под влиянието на всички фактори, които са причинили тази вариация

Пример:консумация на кисело мляко: на базата на извадка от 100 души

Социален статус

x i -индивидуална стойност на признака

Средната стойност на признака за цялата популация

честота на тази функция.

  1. 2. характеризира изменението на признака под влиянието на признака на фактора, лежащ в основата на групирането.

Групово средно

Обща средна стойност за групата

Честота по група

  1. 3. характеризира изменението на признак под влияние на фактори, които не са включени в групирането

х iji стойност на функцията в j група

Средната стойност на характеристиката в йгрупа

f ij - честотаi-та характеристика вj група

Има правило, което свързва 3 типа дисперсия, нарича се правило за добавяне на дисперсия.

Остатъчна дисперсия от йгрупа

Сумата от честотите над йгрупа

не общата сума на честотите

основната задача на анализа на вариационни серии е да се идентифицират модели на разпределение на честотата.

Кривата на разпределение е графично представяне под формата на непрекъсната линия на промяна на честотата в серия от вариации във функционално свързана промяна в стойността на характеристика.

Кривата на разпределение може да се начертае с помощта на многоъгълник и хистограма. Препоръчително е емпиричното разпределение да се сведе до теоретично, до една от добре проучените форми.

Крива на нормалното разпределение.

Има следните видове криви на разпределение:

  1. унимодален
  2. много върхове

Хомогенните популации се характеризират с едновърхови криви, многовърховата крива показва хетерогенността на популацията и необходимостта от пренареждане.

Установяването на общия характер на разпределението включва оценка на неговата хомогенност и изчисляване на асимметрията и ексцеса. За симетрични разпределения

За сравнително изследване на асиметрията на различни разпределения се изчислява коефициентът на асиметрия As.

Централен момент от трети ред; - RMS куб;

Ако, тогава асиметрията е значителна

Ако As<0, то As – левосторонняя, если As>0, тогава As е дясна.

Ако, тогава As е незначително. За симетричен и умерено асиметричен индикаторът на ексцеса се изчислява: ако E k > 0, тогава разпределението е пиково, ако E k<0, то распределение плосковершинное.

Вариантността на алтернативния признак се проявява количествено по следния начин.

0 - единици, които нямат тази функция;

1 - единици с тази функция;

Р- делът на единиците с тази характеристика;

р- делът на единиците, които нямат тази характеристика;

тогава p+q=1.

Алтернативната функция приема 2 стойности 0 и 1 с тегла стри р.

Директни знаци- това са признаци, чиято стойност нараства с нарастването на изследваното явление.

Обратни знаци -признаци, чиято величина намалява с увеличаване на изследваното явление.

Генериране (директно)

Интензивност на труда (обратен)

Максималната вариация на дела е 0,25.

Тема 6: Моделиране на разпределителни серии.

§едно. Действително и теоретично разпределение

§2. Крива на нормалното разпределение.

§3. Проверка на хипотезата за нормално разпределение.

§4. Критерии за съгласие: Пиърсън, Романовски, Колмогоров.

§пет. Практическата стойност на моделирането на разпределителни серии.

§едно. Действително и теоретично разпределение

Една от най-важните цели на изучаването на сериите на разпределение е да се разкрие моделът на разпределение и да се определи неговия характер. Моделите на разпределение се проявяват най-ясно само при голям брой наблюдения.

Действителното разпределение може да бъде изобразено графично с помощта на крива на разпределение - графично изобразена като непрекъсната линия на промяна на честотата в серията от вариации на варианта, функционално свързан с промяната.

Теоретичната крива на разпределение се разбира като крива на този тип разпределение в общи линии, която изключва влиянието на фактори, случайни за закономерността.

Теоретичното разпределение може да бъде изразено чрез аналитична формула, наречена аналитична формула. Най-често срещаното е нормалното разпределение.

§2. Крива на нормалното разпределение.

Закон за нормалното разпределение:

y е ординатата на нормалното разпределение

t е нормализирано отклонение.

; е=2.7218; x i -опции за вариационна серия; - средно аритметично;

Имоти:

Функцията на нормалното разпределение е равномерно, т.е. f(t)=f(-t), . Нормалната функция на разпределение се определя изцяло от стандартното отклонение.

§3. Проверка на хипотезата за нормално разпределение.

Причината за честото позоваване на закона за разпределение е, че зависимостта е резултат от действието на много случайни причини, нито една от които не е преобладаваща. Ако Mo = Me е изчислено във вариационната серия, това може да показва близост до нормалното разпределение. Най-точният тест за съответствие с нормалния закон се прави с помощта на специални критерии.

§4. Критерии за съгласие: Пиърсън, Романовски, Колмогоров.

Критерий на Пиърсън.

Теоретична честота

Емпирична честота

Метод за изчисляване на теоретичните честоти.

  1. Определя се средноаритметичната стойност и в съответствие с интервалните вариационни серии t се изчислява за всеки интервал.
  2. Намираме стойността на плътността на вероятността за нормализирания закон на разпределение. СТРАНИЦА 49
  3. Намираме теоретичната честота.

l - дължина на интервала

- сума от емпиричните честоти

- плътност на вероятността

закръглете стойността до цели числа

  1. Изчисляване на коефициента на Пиърсън
  2. таблична стойност

d.f. – брой интервали – 3 бр

d.f. е броят на степените на свобода.

  1. ако > , тогава разпределението не е нормално, т.е. хипотезата за нормално разпределение се отменя. Ако< , то распределение является нормальным.

Критерий на Романовски.

Изчислява се критерият на Pearson;

Броят на градусите.

Ако с<3, то распределение близко к нормальному.

Критерий на Колмогоров

, Д-максималната стойност между натрупаните емпирични и теоретични честоти. Необходимо условие за използване на Колмогоров: Броят на наблюденията е повече от 100. Според специална вероятностна таблица, с която може да се твърди, че това разпределение е нормално.

§пет. Практическата стойност на моделирането на разпределителни серии.

  1. способността да се прилагат законите на нормалното разпределение към емпиричното разпределение.
  2. способността да се използва правилото 3 х сигма.
  3. Способността да се избегнат допълнителни отнемащи време и скъпи изчисления, като се изследва популацията, знаейки, че разпределението е нормално.

Тема 7: Избирателно наблюдение.

§едно. Концепцията за селективно наблюдение. Причини за използването му.

§2. Видове селективно наблюдение.

§3. Грешки при вземане на проби.

§4. Примерни задачи за наблюдение

§пет. Разпространение на данни от извадково наблюдение към генералната съвкупност.

§6. Малка проба.

§едно. Концепцията за селективно наблюдение. Причини за използването му.

Селективно наблюдение - такова непродължително наблюдение, при което единици от изследваната съвкупност, подбрани по определен начин, се подлагат на статистическо изследване.

Цел (задача) на извадковото наблюдение: за изследваната част да се характеризира цялата съвкупност от единици, при спазване на всички правила и принципи на статистическото наблюдение.

Причини за използване на селективно наблюдение:

  1. спестяване на материали, труд и време;
  2. възможността за по-подробно и подробно изследване на отделните единици на статистическата съвкупност и техните групи.
  3. някои специфични проблеми могат да бъдат решени само с помощта на селективно наблюдение.
  4. компетентното и добре организирано селективно наблюдение дава висока точност на резултатите.

Генералната съвкупност е съвкупността от единици, от които се прави селекцията.

Рамката за извадка е набор от единици, избрани за изследването. В статистиката е обичайно да се прави разлика между параметрите на генералната съвкупност и извадката.

Видове вземане на проби

По метод на избор:

Повтаря се

Единицата, която е включена в извадката, след регистриране на наблюдаваните характеристики се връща в генералната съвкупност за участие в по-нататъшната процедура на подбор.

Обемът на генералната съвкупност остава непроменен, което води до постоянно попадение в извадката на всяка единица.

Неповтаряща се

Извадкова единица не се връща към популацията, от която е направена селекция.

Метод на избор:

Всъщност-случаен е във връзка с единици от генералната съвкупност на случаен принцип или на случаен принцип без елементи на последователност. Въпреки това, преди да се проведе такава извадка, трябва да се уверите, че всички единици от генералната съвкупност имат равен шанс да бъдат включени в извадката, т.е. в пълния списък на единиците от статистическата съвкупност няма пропуски или непознаване на отделни единици. Необходимо е също така ясно да се установят границите на общата популация. Технически установената селекция се извършва чрез теглене на жребий или използване на таблица със случайни числа.

Механично вземане на проби (всеки 5 в списъка) се използва в случаите, когато генералната съвкупност е подредена по някакъв начин, т.е. има определена последователност в разпределението на единиците. При извършване на механично вземане на проби се установява съотношението на подбора, което се установява от съотношението на генералната съвкупност и извадката.

Опасността от грешка при механично вземане на проби може да възникне поради: случайно съвпадение на избрания интервал и цикличност в подреждането на единиците от генералната съвкупност.

Зонално вземане на проби се използва, когато всички единици от генералната съвкупност могат да бъдат разделени на групи (региони, държави) според някакъв признак.

Комбинирана проба.

Изборът на единици може да бъде направен:

  1. или пропорционално на размера на групата
  2. или пропорционално на вътрешногруповата диференциация на признака
  3. , където n е размерът на извадката, N е размерът на генералната съвкупност, n азразмер на извадката аз-групи, Н азсила на звука азпроби.
  4. - този метод е по-точен, но в процеса на вземане на проби е много трудно да се определи предварително за вариацията. (преди наблюдение).

сериен избор.

Използва се, когато ECC се комбинират в малки групи (серии), например опаковки с готови продукти, студентски групи. Същността на серийното вземане на проби е, че сериите се избират чрез произволни или механични средства и след това се извършва непрекъснато изследване в рамките на избраната серия.

Комбинирана селекция.

Това е комбинация от методите за избор, обсъдени по-горе, по-често се използва комбинация от типични и серийни серии, т.е. избор на серии от няколко типични групи.

Подборът може да бъде и многоетапен и едноетапен, многофразов и еднофразов.

Многоетапен избор: от генералната съвкупност първо се извличат по-големи групи, след това по-малки и така нататък, докато се изберат онези единици, които са обект на проучването.

Избор на няколко фрази: включва запазването на една и съща единица на селекция на всички етапи от нейното прилагане. В същото време единиците за подбор, избрани на всеки следващ етап, подлежат на проверка, чиято програма се разширява (Пример: студенти от целия институт, след това студенти от някои факултети).

§3. Грешки при вземане на проби.

Систематичен

Грешки в представителността възникват само при селективно наблюдение. Възникват поради факта, че извадката от съвкупността не може точно да възпроизведе генералната съвкупност. Те не могат да бъдат избегнати, но са лесни за прогнозиране и, ако е необходимо, могат да бъдат минимизирани.

Грешка на извадката е разликата между стойността на даден параметър в генералната съвкупност и неговата стойност, изчислена от резултатите от извадково наблюдение. Dх=-m+ , Dх – пределна грешка в извадката, m – обща средна; - извадкова средна стойност.

Пределната грешка на извадката е случайна стойност.Работите на Чебишев са посветени на изследването на моделите на случайни грешки на извадката. Теоремата на Чебишев доказва, че Dx не превишава: - средна грешка на извадката Коефициентът на t-доверие показва вероятността за тази грешка. стр. 42-43.

В случай, че е необходимо да се определи t от известното F(t), ние вземаме най-близкото голямо F(t) и определяме t от него.

Ограничете фракцията на грешката

P - дял.

Ако изборът е извършен по неповтарящ се начин, тогава се добавят формулите за гранична грешка

Корекция за неповтаряне.

За всеки тип извадково наблюдение представената грешка се изчислява по различен начин:

  1. правилно произволно и механично наблюдение;
  2. Зонирано наблюдение
  3. серийно вземане на проби

r е броят на сериите в извадката;

R е броят на сериите в генералната съвкупност;

Междугрупова дисперсия на пропорцията.

§4. Примерни задачи за наблюдение

Използва се за следните задачи:

  1. н-? за определяне на размера на извадката от известните F(t), Dx.
  2. определяне на проба Dx от известни F(t), n
  3. определяне на F(t) от известни Dx и n

1 задача n - ? Първо, n се определя от формулата за повторен избор за неповтаряща се селекция:

Начини за определяне на дисперсията:

  1. взето е от предишни подобни проучвания.
  2. RMS с нормално разпределение » 1/6 от диапазона на вариация.
  3. ако разпределението е очевидно асиметрично, тогава RMS » 1/5 от диапазона на вариация
  4. За дела се прилага максималната възможна дисперсия p(1-p)=0,25
  5. с n³100, след това s 2 \u003d S 2 - дисперсия на пробата

£30 н£100, след това s 2 \u003d S 2 (n / n-1), s 2 - обща дисперсия

н<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

При изчисляване на n не трябва да се преследва голяма стойност на t и малки пределни грешки, тъй като това води до увеличаване на n и оттам до увеличаване на разходите. Следният закон е подобен.

§пет. Разпространение на данни от извадково наблюдение към генералната съвкупност.

Крайната цел на всеки VN е да характеризира общата съвкупност.

Стойностите, изчислени от резултатите от VN, се разпределят към общата съвкупност, като се вземе предвид границата на тяхната пределна грешка.

Да приемем консумацията на кисело мляко на месец от един човек.

£250-20 млн.£250+20; £230 млн.£270

И то само 1000 души

£230 000 млн.£270 000

48%-5%£p£48%+5%

§6. Малка проба.

В практиката на статистическите изследвания в съвременните условия все повече се налага да се работи с малки извадки.

Малка проба - извадка за наблюдение брой единици, от които не надвишава 30, n £ 30 /

Развитието на теорията за малката извадка е направено от английския статистик Госет, който пише под псевдонима student през 1908 г.

Той доказа, че оценката на несъответствието между средните стойности на малка извадка и общата извадка има специален закон на разпределение. Когато се изчислява за малка извадка, стойността на s 2 не се изчислява. t st за възможни граници на грешки използвайте критерия на Стюдент. Страници 44-45. е вероятността от противоположното събитие.

Брой степени на свобода

ограничаване на грешката на малката извадка

грешка на пределния дял

Тема 8: Корелационно-регресионен анализ и моделиране.

§едно. Концепцията за корелация и CRA.

§2. Условия за ползване и ограничения на КПА.

§3. Двойна регресия, базирана на метода на най-малките квадрати.

§4. Приложение на сдвоено уравнение на линейна регресия.

§пет. Индикатори за плътност на връзката и здравина на връзката.

§6. Множествена корелация.

§едно. Концепцията за корелация и CRA.

Функционална връзка y=5x

корелация

Има 2 вида връзки между различни явления и техния знак, функционални и статистически.

Такава връзка се нарича функционална, когато при промяна на стойността на една от променливите втората се променя по строго определен начин, т.е. стойността на една променлива съответства на една или повече точно определени стойности на друга променлива . Функционална връзка е възможна само когато променливата y зависи от променливата x и не зависи от никакви други фактори, но в реалния живот това е невъзможно.

Статистическа връзка съществува, когато при промяна на стойността на една от променливите втората може да приема всякакви стойности в определени граници, но нейните статистически характеристики се променят според определен закон.

Най-важният частен случай на статистическа връзка е корелационната връзка. С корелация различни стойности на една променлива съответстват на различни средни стойности на друга променлива, т.е. с промяна в стойността на атрибута x, средната стойност на атрибута y се променя по естествен начин.

Думата корелация е въведена от английския биолог и статистик Франсис Гал (корелация)

Корелацията може да възникне по различни начини:

  • причинно-следствена зависимост на вариацията на резултантния белег от вариацията на факторния белег.
  • Може да възникне корелация между 2 ефекта от една и съща причина (пожари, брой пожарникари, размер на пожара)
  • Връзката на знаците, всеки от които е причина и следствие едновременно (производителност на труда и заплата)

В статистиката е обичайно да се разграничават следните видове зависимости:

  1. двойна корелация - връзката между 2 признака на резултант и факториел, или между два факториела.
  2. частична корелация - връзката между ефективния и един факторен атрибут с фиксирана стойност на друг факторен атрибут.
  3. множествена корелация - зависимостта на резултантния признак от два или повече факторни признака, включени в изследването.

Задачата на корелационния анализ е да определи количествено близостта на връзката между признаците. В края на 19 век Галтън и Пиърсън изследват връзката между ръста на бащите и децата.

Регресията изследва формата на връзката. Задачата на регресионния анализ е да определи аналитичния израз на връзката.

Корелационно-регресионният анализ като общо понятие включва промяна в плътността на връзката и установяване на аналитичен израз на връзката.

§2. Условия за ползване и ограничения на КПА.

  1. наличието на масови данни, т.к корелацията е статистическа
  2. необходима е качествена хомогенност на популацията.
  3. подчинение на разпределението на съвкупността по резултатни и факторни характеристики на нормалния закон на разпределение, което е свързано с използването на метода на най-малките квадрати.

§3. Двойна регресия, базирана на метода на най-малките квадрати.

Регресионният анализ се състои в определяне на аналитичния израз на връзката. Формата прави разлика между линейна регресия, която се изразява чрез уравнение на права линия, и нелинейна регресия или.

Според посоката на общуване се разграничават по права линия, т.е. С нарастването на x, y нараства.

обратен

Обратно т.е. когато x нараства, y намалява.

  1. графичен метод - чрез нанасяне на емпирични данни върху корелационното поле, но по-точна оценка се прави чрез метода на най-малките квадрати.

X - действителен знак

U - знак за ефективен

Разликата между действителната стойност и стойността, изчислена чрез квадратното уравнение за свързване, трябва да клони към минимум.

С LSM min е сумата от квадратните отклонения на емпиричните стойности y от теоретичните стойности, получени съгласно избраното регресионно уравнение.

За линейна връзка

Þ а,b

за парабола

За хипербола

параметри a,b,c се записват в уравнението, след което заместваме полученото уравнение с емпиричната стойност x iи намерете теоретичната стойност y i .След това сравняваме y iтеоретични и y iемпиричен. Сборът от квадратите на разликата между тях трябва да бъде минимален. Избираме вида на зависимостта, в която се извършва тази зависимост.

В уравнението на двойната линейна регресия:

b е коефициентът на сдвоена линейна регресия,той измерва силата на връзката, т.е. характеризира средното отклонение на съвкупността от y от неговата средна стойност за приета мерна единица.

b\u003d 20, когато x се промени с 1 знак, y се отклонява от средната си стойност с 20 средно в популацията.

Положителен знак при регресионния коефициент показва пряка връзка между характеристиките, знакът „-“ показва обратна връзка между характеристиките.

§4. Приложение на сдвоено уравнение на линейна регресия.

Основното приложение е прогнозирането по регресионното уравнение. Прогнозирането е ограничено от условията на стабилност на други фактори и условия на процеса. Ако средата на протичащия процес се промени рязко в нея, тогава това регресионно уравнение няма да се осъществи.

Точкова прогноза се получава чрез заместване на очакваната стойност на фактора в регресионното уравнение. Вероятността за точно изпълнение на такава прогноза е изключително малка.

Ако точкова прогноза е придружена от стойност на средната прогнозна грешка, тогава такава прогноза се нарича интервална прогноза.

Средната прогнозна грешка се формира от два вида грешки:

  1. грешки тип 1 - грешка на регресионната линия
  2. грешка от 2-ри вид - грешка, свързана с грешката на вариацията.

Средна грешка в прогнозата.

Грешка в позицията на регресионната линия в генералната съвкупност

n - размер на извадката

x k - грешна стойност на фактора

RMS на резултантната характеристика от регресионната линия в общата популация

Корелационният анализ включва оценка на плътността на връзката. Индикатори:

  1. коефициент на линейна корелация - характеризира плътността и посоката на връзката между два признака в случай на линейна връзка между тях

при =-1 връзката е функционална обратна, =1 връзката е функционално директна, при =0 няма връзка.

Използва се само за линейни зависимости, използва се за оценка на връзките между количествени характеристики. Изчислява се само по индивидуални стойности.

Коефициент на корелация:

Емпирично: и двата вида дисперсия се изчисляват според резултантния атрибут.

Теоретичен:

Дисперсия на стойностите на ефективната характеристика, изчислена чрез регресионното уравнение

Разсейване на емпиричната стойност на резултантната характеристика

  • висока степен на точност
  • подходящ за оценка на близостта на връзката между описателна и количествена характеристика, но количествената трябва да бъде ефективна
  • подходящ за всички видове връзки

Коефициент на корелация на Спирман

рангове - поредни номера на единиците от съвкупността в класираните серии. Необходимо е и двата признака да се класират в еднакъв ред от най-малкия към най-големия или обратно. Ако ранговете на единиците на съвкупността се означат с p x и p y, тогава коефициентът на корелация на ранговете ще приеме следната форма:

Предимства на коефициента на корелационните серии:

  1. Можете също така да класирате по описателни признаци, които не могат да бъдат изразени числено, следователно изчисляването на коефициента на Спирман е възможно за следните двойки признаци: число - число; описателно – количествен; Описателен – описателен. (образованието е описателен атрибут)
  2. показва посоката на връзката

Недостатъци на коефициента на Спирман.

  1. еднаквите разлики в ранга могат да съответстват на напълно различни разлики в стойността на даден признак (в случай на количествени признаци). Пример: Производството на електроенергия в страната за година

САЩ 2400 kWh 1

RF 800 kWh 2

Канада 600 kWh 3

Ако сред стойностите на Spearman се появят няколко идентични стойности, тогава се формират свързани рангове, т.е. същите средни числа

В този случай коефициентът на Спирман се изчислява, както следва:

j-номера на връзките по ред за характеристика x

ай-броя на еднаквите рангове в j връзки по x

к-номерата на лигаментите по реда на функция y

Bk-броят на еднаквите рангове в койтоняколко

  1. 4. Коефициент на рангова корелация на Kendall

Максимална сума за ранг

S е действителната сума на ранговете

Дава по-строга оценка от коефициента на Спирман.

За изчислението всички единици се класират според атрибут x според атрибут приза всеки ранг се изчислява броят на последващите рангове, надвишаващи дадената сума, означен с P и броят на последващите рангове под това обозначение Q.

P+Q= 1/2 n(n-1)

  1. Коефициент на рангова корелация на Фехнер.

Коефициент на Фехнер - мярка за плътността на връзката под формата на съотношението на разликата в броя на двойките съвпадащи и несъвпадащи знаци към сумата от тези числа.

  1. изчисляване на средни стойности за x и y
  2. индивидуалните стойности x i y i се сравняват със средните стойности със задължително посочване на знака „+“ или „-“. Ако знаците съвпадат в x и y, тогава ги отнасяме към числото „C“, ако не, тогава към „H“.
  3. пребройте броя на съвпадащите и несъвпадащите двойки.

Задачата за измерване на връзката става пред статистика по отношение на описателните характеристики, важен специален случай на такава задача, измерваща връзката между 2 алтернативни характеристики, едната от които е причина за другата последица.

Стегнатостта на връзката между 2 алтернативни характеристики може да се измери с помощта на 2 коефициента:

  1. коефициент на асоцииране
  2. коефициент на непредвидени обстоятелства

Коефициентът на случайност има недостатък: когато една от двете разнородни комбинации Av или Ba е равна на нула, коефициентът се превръща в единица. Той много либерално оценява стегнатостта на връзката - надценява я.

Коефициент на Пиърсън

Ако няма две, а повече възможни стойности на всяка от взаимосвързаните характеристики, се изчисляват следните коефициенти:

  1. Коефициент на Пиърсън
  2. Коефициент на Чупров за описателен признак

Коефициентът на Пиърсън се изчислява от квадратни матрици

Под нормата

до 1 и до 2 - номерът на групата съответно по знаци 1 и 2. Недостатъкът на коефициента на Пиърсън е, че той не достига 1 дори при увеличаване на броя на групите.

Коефициент на Чупров (1874–1926)

коефициентът на Чупров по-строго оценява херметичността на връзката.

§6. Множествена корелация.

Изследването на връзката между резултантната и две или повече факторни характеристики се нарича множествена регресия. При изследването на зависимостите чрез методите на множествената регресия се поставят 2 задачи.

  1. определяне на аналитичния израз на връзката между ефективния признак y и действителните признаци x 1 , x 2 , x 3 , ... x k, т.е. намерете функцията y \u003d f (x 1, x 2, ... x k)
  2. Оценка на стегнатостта на връзката между ефективния и всеки от факторните признаци.

Корелационно-регресионният модел (CRM) е регресионно уравнение, което включва основните фактори, които влияят върху вариацията на резултантния атрибут.

Изграждането на модел на множествена регресия включва следните стъпки:

  1. избор на форма на комуникация
  2. избор на факторни характеристики
  3. Гарантиране, че популацията е достатъчно голяма, за да предостави правилни оценки.

I. целият набор от връзки между променливи, които се срещат в практиката, е доста пълно описан от функции от 5 вида:

  1. линеен:
  2. мощност:
  3. показателен:
  4. парабола:
  5. хипербола:

въпреки че всичките 5 функции присъстват в практиката на CRA, най-често се използва линейната зависимост, като най-простото и лесно интерпретируемо уравнение на линейна зависимост: , k - набор от фактори, включени в уравнението, b j

0 - защото >0,7, затова им обръщаме специално внимание

ЕКО. Скала за плътност на комуникацията:

Ако връзката е 0 - 0,3 - слаба връзка

0,3 - 0,5 - забележимо

0,3 - 0,5 - близо

0,7 - 0,9 - високо

повече от 0,9 - много високо

след това сравняваме две характеристики (доход и пол)<0,7, то включаем в уравнение множественной регрессии.

Избор на фактори за включване в уравнението на множествената регресия:

  1. трябва да има причинно-следствена връзка между ефективните и действителните признаци.
  2. ефективните и действителните признаци трябва да са тясно свързани помежду си, в противен случай възниква явлението мултиколинеарност (>06) , т.е. факторните знаци, включени в уравнението, влияят не само на резултата, но и взаимно, което води до неправилна интерпретация на числените данни.

Методи за избор на фактори, които да бъдат включени в уравнението на множествената регресия:

1. експертен метод – базирани на интуитивен логически анализ, извършен от висококвалифицирани експерти.

2. използването на матрици на сдвоени коефициенти на корелация се извършва успоредно с първия метод, матрицата е симетрична по отношение на единичния диагонал.

3. поетапен регресионен анализ - последователното включване на факторни характеристики в регресионното уравнение и тестване на значимостта се извършва въз основа на стойностите на два показателя на всяка стъпка. Корелация, регресионен индикатор.

Резултат на корелация: Изчислете промяната в теоретичната корелация на съотношението или промяната в средната остатъчна дисперсия. Показателят за регресия е изменението на условно чистия коефициент на регресия.

Обща сума

31

32

22

85