सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व. सांख्यिकीय माहितीचे ग्राफिकल सादरीकरण


डेटाचे विश्लेषण आणि सामान्यीकरणामध्ये ग्राफिकल पद्धतीचे मूल्य मोठे आहे. ग्राफिक प्रतिमा, सर्व प्रथम, सांख्यिकीय निर्देशकांची विश्वासार्हता नियंत्रित करण्यास अनुमती देते, कारण, आलेखावर सादर केलेले, ते निरीक्षणातील त्रुटींच्या उपस्थितीशी किंवा अभ्यासाधीन घटनेच्या साराशी संबंधित विद्यमान अयोग्यता अधिक स्पष्टपणे दर्शवतात. ग्राफिक प्रतिमेच्या मदतीने, एखाद्या घटनेच्या विकासाच्या नमुन्यांचा अभ्यास करणे, विद्यमान संबंध स्थापित करणे शक्य आहे. डेटाची साधी तुलना नेहमीच कारणात्मक संबंधांची उपस्थिती पकडणे शक्य करत नाही, त्याच वेळी, त्यांचे ग्राफिकल प्रतिनिधित्व कार्यकारण संबंध ओळखण्यास मदत करते, विशेषत: प्रारंभिक गृहीतके स्थापित करण्याच्या बाबतीत, जे नंतर पुढील विकासाच्या अधीन असतात.

सांख्यिकी आलेख- हे एक रेखाचित्र आहे ज्यामध्ये विशिष्ट निर्देशकांद्वारे वैशिष्ट्यीकृत सांख्यिकीय समुच्चयांचे सशर्त भौमितिक प्रतिमा किंवा चिन्हे वापरून वर्णन केले जाते. ग्राफिक प्रतिमासांख्यिकीय डेटाचे प्रतिनिधित्व करणारे बिंदू, रेषा आणि आकारांचा संग्रह आहे. सहायक घटकग्राफिक्स आहेत:

    आलेख फील्ड हा विमानाचा एक भाग आहे जेथे ग्राफिक प्रतिमा आहेत. आलेख फील्डचे काही परिमाण आहेत, जे त्याच्या उद्देशावर अवलंबून असतात.

    आलेखाच्या स्थानिक खुणा समन्वय ग्रिडच्या प्रणालीच्या स्वरूपात सेट केल्या जातात. चार्ट फील्डमध्ये भूमितीय चिन्हे ठेवण्यासाठी समन्वय प्रणाली आवश्यक आहे. आयताकृती आणि ध्रुवीय समन्वय प्रणाली दोन्ही वापरल्या जातात.

    ऑब्जेक्टचे ग्राफिकल डिस्प्ले आणि त्याच्या वास्तविक आकाराची तुलना करण्यासाठी स्केल लँडमार्क वापरले जातात. स्केल लँडमार्क स्केल स्केल किंवा स्केल चिन्हांच्या प्रणालीद्वारे सेट केले जातात.

    आलेखाच्या स्पष्टीकरणामध्ये आलेख (नाव) द्वारे चित्रित केलेल्या ऑब्जेक्टचे स्पष्टीकरण आणि आलेखावर वापरलेल्या प्रत्येक चिन्हाचा अर्थपूर्ण अर्थ असतो.

सांख्यिकीय आलेख त्यांच्या उद्देशानुसार (सामग्री), बांधकाम पद्धती आणि ग्राफिक प्रतिमेचे स्वरूप (चित्र 1) नुसार वर्गीकृत केले जातात.

आकृती क्रं 1. सांख्यिकीय आलेखांचे वर्गीकरण

ग्राफिक प्रतिमा तयार करण्याच्या पद्धतीनुसार, तेथे आहेतः

    आकृत्या- सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व, तुलना केलेल्या मूल्यांमधील संबंध स्पष्टपणे दर्शविते.

    सांख्यिकी नकाशे

चार्टचे खालील मुख्य प्रकार आहेत: रेखा, बार, पट्टी, सेक्टर, चौरस, गोलाकार, कुरळे.

रेखा चार्टडायनॅमिक्स वैशिष्ट्यीकृत करण्यासाठी वापरले जातात, म्हणजे कालांतराने घटनांमधील बदलांचे मूल्यांकन. abscissa कालखंड किंवा तारखा दर्शविते आणि ऑर्डिनेट डायनॅमिक्सच्या मालिकेचे स्तर दर्शविते. एका आलेखावर अनेक तक्ते लावले जाऊ शकतात, जे तुम्हाला विविध निर्देशकांच्या गतिशीलतेची किंवा वेगवेगळ्या प्रदेशांसाठी किंवा देशांसाठी एका निर्देशकाची तुलना करण्यास अनुमती देतात.

अंजीर.2. रशियन फेडरेशनमधील प्रवासी कारच्या आयातीच्या प्रमाणात गतीशीलता

2006-1 q साठी. 2010

बार चार्टवापरले जाऊ शकते:

    सामाजिक-आर्थिक घटनेच्या गतिशीलतेचे विश्लेषण करण्यासाठी;

    योजनेच्या अंमलबजावणीचे मूल्यांकन;

    वितरणाच्या मालिकेतील भिन्नतेची वैशिष्ट्ये;

    स्थानिक तुलनेसाठी (प्रदेश, देश, कंपन्यांमधील तुलना);

    घटनेच्या संरचनेचा अभ्यास करणे.

स्तंभ समान अंतरावर जवळ किंवा स्वतंत्रपणे स्थित आहेत. स्तंभांची उंची वैशिष्ट्य स्तरांच्या संख्यात्मक मूल्यांच्या प्रमाणात असावी.

अंजीर.3. सीआयएस देशांसह रशियन फेडरेशनच्या व्यापार उलाढालीमध्ये बेलारूसच्या वाटा गतिशीलता

सामाजिक-आर्थिक घटनेची रचना वैशिष्ट्यीकृत करण्यासाठी मोठ्या प्रमाणावर वापरले जातात पाई चार्ट. ते तयार करण्यासाठी, वर्तुळ एकूण खंडातील भागांच्या विशिष्ट गुरुत्वाकर्षणाच्या प्रमाणात विभागांमध्ये विभागले गेले पाहिजे. विशिष्ट वजनांची बेरीज 100% इतकी आहे, जी अभ्यासाधीन घटनेच्या एकूण व्हॉल्यूमशी संबंधित आहे.

अंजीर.4. रशियन फेडरेशन आणि सीआयएस देशांमधील व्यापार उलाढालीचे भौगोलिक वितरण

बार चार्टक्षैतिजरित्या मांडलेले आयत (पट्टे).

कधीकधी प्रदेशानुसार तुलनात्मक विश्लेषणासाठी, देश वापरतात आकृती चिन्ह रेखाचित्रे(भौमितिक आकारांचे आकृत्या). हे आकृती अभ्यास केलेल्या वस्तूचा आकार त्याच्या क्षेत्राच्या आकारानुसार दर्शवतात.

सांख्यिकी नकाशेघटनांच्या भौगोलिक वितरणाचे मूल्यांकन करण्यासाठी आणि प्रदेशानुसार तुलनात्मक विश्लेषण करण्यासाठी वापरले जातात.

सांख्यिकीय नकाशांमध्ये कार्टोग्राम आणि कार्टोग्राम समाविष्ट आहेत. त्यांच्यातील फरक नकाशांवर ज्या प्रकारे आकडेवारी प्रदर्शित केली जाते त्यामध्ये आहे.

कार्टोग्रामस्वतंत्र भागात अभ्यासाधीन असलेल्या वैशिष्ट्याचे प्रादेशिक वितरण दर्शविते आणि या वितरणाचे नमुने ओळखण्यासाठी वापरले जाते. कार्टोग्राम पार्श्वभूमी आणि बिंदूमध्ये विभागलेले आहेत. वेगवेगळ्या रंगांच्या घनतेचे पार्श्वभूमी कार्टोग्राम प्रादेशिक युनिटमधील कोणत्याही निर्देशकाची तीव्रता दर्शवतात. डॉट कार्टोग्रामवर, निवडलेल्या घटनेची पातळी ठिपके वापरून दर्शविली जाते.

कार्टोग्राम- हे भौगोलिक नकाशा किंवा आकृतीसह त्याची योजना यांचे संयोजन आहे. हे आपल्याला अभ्यासाधीन घटनेच्या वितरणामध्ये, त्याची संरचनात्मक वैशिष्ट्ये प्रत्येक प्रदेशाची वैशिष्ट्ये प्रतिबिंबित करण्यास अनुमती देते.

सध्या, संगणक ग्राफिक्ससाठी विविध सॉफ्टवेअर पॅकेजेस विकसित केली गेली आहेत, उदाहरणार्थ, एक्सेल, स्टॅटग्राफ, स्टॅटिस्टिका.

सांख्यिकीय डेटा अशा प्रकारे सादर केला पाहिजे की ते वापरता येतील. सांख्यिकीय डेटा सादर करण्याचे 3 मुख्य प्रकार आहेत:

1) मजकूर - मजकूरात डेटा समाविष्ट करणे;

2) सारणी - सारण्यांमध्ये डेटाचे सादरीकरण;

3) ग्राफिक - आलेखांच्या स्वरूपात डेटाची अभिव्यक्ती.

जेव्हा थोड्या प्रमाणात डिजिटल डेटा असतो तेव्हा मजकूर फॉर्म वापरला जातो.

टॅब्युलर फॉर्म बहुतेक वेळा वापरला जातो, कारण हा सांख्यिकीय डेटा सादर करण्याचा अधिक कार्यक्षम प्रकार आहे. गणितीय सारण्यांच्या विपरीत, जे, प्रारंभिक परिस्थितीनुसार, एक किंवा दुसरा परिणाम प्राप्त करण्यास अनुमती देतात, सांख्यिकीय सारण्या अभ्यासाधीन वस्तूंबद्दल संख्यांची भाषा सांगतात.

सांख्यिकी सारणी- ही पंक्ती आणि स्तंभांची एक प्रणाली आहे, ज्यामध्ये सामाजिक-आर्थिक घटनेबद्दल सांख्यिकीय माहिती एका विशिष्ट क्रमाने आणि कनेक्शनमध्ये सादर केली जाते.

तक्ता 2. 2000 - 2006 साठी रशियन फेडरेशनचा परकीय व्यापार, अब्ज डॉलर्स

निर्देशांक 2000 2001 2002 2003 2004 2005 2006
विदेशी व्यापार उलाढाल 149,9 155,6 168,3 280,6 368,9 468,4
निर्यात करा 101,9 107,3 135,9 183,2 243,6 304,5
आयात करा 44,9 53,8 76,1 97,4 125,3 163,9
व्यापार शिल्लक 60,1 48,1 46,3 59,9 85,8 118,3 140,7
यासह:
परदेशी देशांसह
निर्यात 90,8 86,6 90,9 114,6 210,1 261,1
आयात 31,4 40,7 48,8 77,5 103,5 138,6
व्यापार शिल्लक 59,3 45,9 42,1 53,6 75,5 106,6 122,5

उदाहरणार्थ, टेबलमध्ये. 2 रशियाच्या परकीय व्यापाराची माहिती सादर करते, जी मजकूर स्वरूपात व्यक्त करणे अकार्यक्षम असेल.

भेद करा विषयआणि अंदाजसांख्यिकी सारणी. विषय वैशिष्ट्यीकृत ऑब्जेक्ट दर्शवतो - एकतर लोकसंख्येची एकके, किंवा युनिट्सचे गट, किंवा संपूर्णता. प्रेडिकेटमध्ये, विषयाचे वैशिष्ट्य दिले जाते, सहसा संख्यात्मक स्वरूपात. अनिवार्य शीर्षलेखसारणी, जे सूचित करते की टेबलमधील डेटा कोणत्या श्रेणीचा आणि कोणत्या वेळेचा आहे.

विषयाच्या स्वरूपानुसार, सांख्यिकीय तक्त्यामध्ये विभागले गेले आहेत सोपे, गटआणि संयुक्त. साध्या सारणीच्या विषयामध्ये, अभ्यासाचा विषय गटांमध्ये विभागलेला नाही, परंतु एकतर लोकसंख्येच्या सर्व एककांची यादी दिली आहे किंवा संपूर्ण लोकसंख्या दर्शविली आहे (उदाहरणार्थ, तक्ता 11). गट सारणीच्या विषयामध्ये, अभ्यासाचे ऑब्जेक्ट एका गुणधर्मानुसार गटांमध्ये विभागले गेले आहे आणि प्रेडिकेट गटांमधील एककांची संख्या (निरपेक्ष किंवा टक्केवारी म्हणून) आणि गटांसाठी सारांश निर्देशक (उदाहरणार्थ, सारणी) दर्शवते. 4). संयोजन सारणीच्या विषयामध्ये, लोकसंख्या एकानुसार नाही तर अनेक निकषांनुसार (उदाहरणार्थ, तक्ता 2) गटांमध्ये विभागली गेली आहे.

तक्ते तयार करताना, आपण खालील गोष्टींद्वारे मार्गदर्शन केले पाहिजे सर्वसाधारण नियम.

1. सारणीचा विषय डावीकडे (कमी वेळा - वरच्या) भागात स्थित आहे, आणि प्रेडिकेट - उजवीकडे (कमी वेळा - खालचा) आहे.

2. स्तंभ शीर्षकांमध्ये निर्देशकांची नावे आणि त्यांच्या युनिट्स असतात.

3. अंतिम ओळ सारणी पूर्ण करते आणि त्याच्या शेवटी स्थित असते, परंतु काहीवेळा ती पहिली असते: या प्रकरणात, दुसरी ओळ "सहीत" लिहिली जाते आणि त्यानंतरच्या ओळींमध्ये एकूण ओळीचे घटक असतात.

4. अंकांच्या खाली असलेल्या संख्येच्या अंकांसह, प्रत्येक स्तंभामध्ये समान प्रमाणात अचूकतेसह अंकीय डेटा लिहिला जातो आणि पूर्णांक भाग अपूर्णांक स्वल्पविरामाने विभक्त केला जातो.

5. टेबलमध्ये रिक्त सेल असू नयेत: जर डेटा शून्य असेल, तर “–” चिन्ह (डॅश) ठेवले जाईल; जर डेटा माहित नसेल, तर "माहिती नाही" अशी नोंद केली जाते किंवा "..." (लंबवर्तुळ) चिन्ह लावले जाते. जर घातांक मूल्य शून्य नसेल, परंतु पहिला महत्त्वाचा अंक अचूकतेच्या स्वीकृत डिग्रीनंतर दिसत असेल, तर 0.0 रेकॉर्ड केला जाईल (जर, 0.1 च्या अचूकतेची डिग्री स्वीकारली असेल).

काहीवेळा सांख्यिकी सारण्यांना आलेखांसह पूरक केले जाते जेव्हा लक्ष्य डेटाच्या काही वैशिष्ट्यांवर जोर देणे, त्यांची तुलना करणे हे असते. ग्राफिकल फॉर्म त्यांच्या आकलनाच्या दृष्टीने डेटा सादरीकरणाचा सर्वात प्रभावी प्रकार आहे. आलेखांच्या मदतीने, संरचनेची वैशिष्ट्ये, गतिशीलता, घटनांमधील संबंध आणि त्यांची तुलना यांची दृश्यमानता प्राप्त केली जाते.

सांख्यिकी आलेख- या रेषा, भौमितिक आकार, रेखाचित्रे किंवा भौगोलिक तक्त्यांद्वारे संख्यात्मक मूल्ये आणि त्यांचे गुणोत्तर यांच्या सशर्त प्रतिमा आहेत. ग्राफिकल फॉर्म सांख्यिकीय डेटाचा विचार करणे सुलभ करते, ते दृश्यमान, अर्थपूर्ण आणि दृश्यमान बनवते. तथापि, आलेखांना काही मर्यादा आहेत: सर्व प्रथम, आलेखामध्ये जितका डेटा टेबलमध्ये बसू शकतो तितका समाविष्ट करू शकत नाही; याव्यतिरिक्त, आलेख नेहमी गोलाकार डेटा दर्शवतो - अचूक नाही, परंतु अंदाजे. अशा प्रकारे, आलेख फक्त सामान्य परिस्थिती दर्शविण्यासाठी वापरला जातो, तपशील नाही. शेवटची कमतरता म्हणजे प्लॉटिंगची जटिलता. वैयक्तिक संगणक वापरून त्यावर मात केली जाऊ शकते (उदाहरणार्थ, पॅकेजमधील "डायग्राम विझार्ड". मायक्रोसॉफ्ट ऑफिस एक्सेल).

ग्राफिक्स तयार करण्याच्या पद्धतीनुसार, ते विभागलेले आहेत आकृत्या, कार्टोग्रामआणि चार्ट आकृत्या.

डेटाचे ग्राफिकल प्रतिनिधित्व करण्याचा सर्वात सामान्य मार्ग म्हणजे चार्ट, जे खालील प्रकारचे आहेत: रेखीय, रेडियल, स्कॅटर, प्लानर, व्हॉल्यूमेट्रिक, कर्ली. आकृत्यांचा प्रकार सादर केलेल्या डेटाच्या प्रकारावर आणि बांधकाम कार्यावर अवलंबून असतो. कोणत्याही परिस्थितीत, आलेखासह शीर्षलेख असणे आवश्यक आहे - आलेख फील्डच्या वर किंवा खाली. शीर्षक दर्शवते की कोणता निर्देशक प्रदर्शित केला जातो, कोणत्या प्रदेशासाठी आणि कोणत्या वेळेसाठी.

रेषा आलेख परिमाणवाचक चलांचे प्रतिनिधित्व करण्यासाठी वापरले जातात: त्यांच्या मूल्यांच्या भिन्नतेची वैशिष्ट्ये, गतिशीलता, चलांमधील संबंध. वापरून डेटा भिन्नतेचे विश्लेषण केले जाते वितरण क्षेत्र, जमा करते(वक्र पेक्षा कमी) आणि ogives(वक्र "पेक्षा मोठे"). वितरण बहुभुज विषय 4 मध्ये चर्चा केली आहे (उदा. चित्र 5.). क्युम्युलेट तयार करण्यासाठी, व्हेरिएबल वैशिष्ट्याची मूल्ये abscissa च्या बाजूने प्लॉट केली जातात आणि ordinates म्हणजे फ्रिक्वेन्सी किंवा फ्रिक्वेन्सीजची जमा केलेली बेरीज (पासून f1ते ∑ f). ओगिव्ह तयार करण्यासाठी, फ्रिक्वेन्सीची जमा झालेली बेरीज y-अक्षावर उलट क्रमाने ठेवली जाते (∑ पासून fआधी f1). सारणीनुसार एकत्रित करा आणि ओजीव्ह करा. 4. अंजीर मध्ये चित्रण. एक

तांदूळ. 1. सीमाशुल्क मूल्याच्या मूल्यानुसार वस्तूंच्या वितरणाचे संचित आणि ओजीव्ह

ट्रेंड अ‍ॅनालिसिसमध्‍ये लाइन चार्टचा वापर विषय 5 (उदा. आकृती 13) आणि विषय 6 (उदा. आकृती 21) मध्‍ये लिंक विश्‍लेषणासाठी वापरण्‍यात आलेला आहे. विषय 6 मध्ये स्कॅटर प्लॉटचा वापर देखील समाविष्ट आहे (उदा. आकृती 20).

रेखा चार्ट उपविभाजित आहेत एक-आयामी, एका व्हेरिएबलवरील डेटाचे प्रतिनिधित्व करण्यासाठी वापरले जाते, आणि द्विमितीय- दोन व्हेरिएबल्ससाठी. एक-आयामी रेखा आलेखाचे उदाहरण म्हणजे वितरण बहुभुज, आणि द्विमितीय एक प्रतिगमन रेषा आहे (उदा. चित्र 21).

कधीकधी, निर्देशकामध्ये मोठ्या बदलांसह, लॉगरिदमिक स्केल वापरला जातो. उदाहरणार्थ, जर इंडिकेटरची व्हॅल्यू 1 ते 1000 पर्यंत बदलत असतील तर प्लॉटिंग करताना यामुळे अडचणी येऊ शकतात. अशा परिस्थितीत, ते सूचक मूल्यांच्या लॉगरिदमवर स्विच करतात, जे इतके वेगळे नसतील: lg 1 = 0, lg 1000 = 3.

मध्ये प्लॅनरबार आलेख (हिस्टोग्राम) वापराच्या वारंवारतेनुसार वेगळे केले जातात, ज्यामध्ये निर्देशक बार म्हणून सादर केला जातो, ज्याची उंची निर्देशकाच्या मूल्याशी संबंधित असते (उदाहरणार्थ, अंजीर 4).

एका विशिष्ट भौमितीय आकृतीच्या क्षेत्रफळाच्या निर्देशकाच्या मूल्याच्या प्रमाणानुसार इतर प्रकारच्या प्लॅनर आकृत्यांचा समावेश होतो: त्रिकोणी, चौरस, आयताकृती. आपण वर्तुळाच्या क्षेत्रांची तुलना देखील वापरू शकता - या प्रकरणात, वर्तुळाची त्रिज्या सेट केली आहे.

पट्टी चार्टक्षैतिज ताणलेल्या आयताच्या स्वरूपात निर्देशक सादर करते आणि अन्यथा बार चार्ट सारखेच असते.

प्लॅनर आकृत्यांपैकी, ते बर्याचदा वापरले जाते पाई चार्ट, ज्याचा उपयोग अभ्यासलेल्या लोकसंख्येची रचना स्पष्ट करण्यासाठी केला जातो. संपूर्ण संच 100% म्हणून घेतला जातो, तो वर्तुळाच्या एकूण क्षेत्राशी संबंधित असतो, सेक्टरचे क्षेत्र सेटच्या भागांशी संबंधित असतात. टेबलनुसार 2006 मध्ये रशियन फेडरेशनच्या परदेशी व्यापाराच्या संरचनेचा सेक्टर आकृती तयार करूया. 2 (अंजीर 2 पहा). संगणक प्रोग्राम वापरताना, सेक्टर डायग्राम त्रि-आयामी स्वरूपात तयार केले जातात, म्हणजे, दोन नव्हे तर तीन विमानांमध्ये (चित्र 3 पहा).

तांदूळ. 2. साधा पाई चार्ट 3. 3D पाई चार्ट

कुरळे (चित्र) आकृती प्रतिमेची स्पष्टता वाढवतात, कारण त्यात प्रदर्शित निर्देशकाचे चित्र समाविष्ट असते, ज्याचा आकार निर्देशकाच्या आकाराशी संबंधित असतो.

आलेख प्लॉट करताना, सर्वकाही तितकेच महत्वाचे आहे - ग्राफिक प्रतिमेची योग्य निवड, प्रमाण, आलेख डिझाइन करण्याच्या नियमांचे पालन. हे मुद्दे अधिक तपशीलवार आणि मध्ये समाविष्ट आहेत.

कार्टोग्राम आणि कार्टोग्राम्सचा उपयोग अभ्यासल्या जाणार्‍या घटनेची भौगोलिक वैशिष्ट्ये दर्शवण्यासाठी केला जातो. ते अभ्यासात असलेल्या घटनेचे स्थान, विशिष्ट प्रदेशात त्याची तीव्रता दर्शवतात - प्रजासत्ताक, प्रदेश, आर्थिक किंवा प्रशासकीय जिल्हा इ. उदाहरणार्थ, कार्टोग्राम आणि कार्टोग्रामचे बांधकाम विशेष साहित्यात मानले जाते.

कामाचा शेवट -

हा विषय संबंधित आहे:

आकडेवारीची संकल्पना. आकडेवारीचा विषय आणि पद्धत

सांख्यिकी संकल्पना.. विषय आणि आकडेवारीची पद्धत.. सांख्यिकी निरीक्षण..

आपल्याला या विषयावर अतिरिक्त सामग्रीची आवश्यकता असल्यास, किंवा आपण जे शोधत आहात ते आपल्याला सापडले नाही, तर आम्ही आमच्या कार्यांच्या डेटाबेसमधील शोध वापरण्याची शिफारस करतो:

प्राप्त सामग्रीचे आम्ही काय करू:

जर ही सामग्री तुमच्यासाठी उपयुक्त ठरली, तर तुम्ही ती सोशल नेटवर्क्सवरील तुमच्या पेजवर सेव्ह करू शकता:

या विभागातील सर्व विषय:

आकडेवारीचा विषय आणि पद्धत
1746 मध्ये जर्मन शास्त्रज्ञ गॉटफ्रीड अचेनवाल यांनी "सांख्यिकी" हा शब्द वैज्ञानिक वापरात आणला, ज्यांनी जर्मन विद्यापीठांमध्ये शिकवल्या जाणार्‍या "स्टेट स्टडीज" या अभ्यासक्रमाच्या शीर्षकाच्या जागी "सेंट" ने प्रस्तावित केले.

सांख्यिकीय निरीक्षण
सांख्यिकीय माहितीबद्दल लोकांचा दृष्टीकोन भिन्न आहे: काहींना ते समजत नाही, इतर बिनशर्त विश्वास ठेवतात आणि तरीही काहीजण इंग्लिश राजकारणी डिझरेलीच्या मताशी सहमत आहेत: “तीथे 3 प्रकारचे खोटे आहेत: खोटे,

आकडेवारीचा सारांश आणि समूहीकरण
सारांश - निरीक्षण सामग्रीची शास्त्रोक्त पद्धतीने आयोजित प्रक्रिया (पूर्वी विकसित केलेल्या प्रोग्रामनुसार), ज्यामध्ये एकत्रित डेटाचे अनिवार्य नियंत्रण, पद्धतशीरीकरण, गटबद्धता समाविष्ट आहे.

निरपेक्ष मूल्ये
वस्तुमान घटना दर्शवण्यासाठी, सांख्यिकी सांख्यिकीय प्रमाण (निर्देशक) वापरते जे एककांचे गट किंवा संपूर्णपणे (घटना) दर्शवते. सांख्यिकीय प्रमाण

सापेक्ष मूल्ये
सापेक्ष मूल्य हे दोन निरपेक्ष मूल्यांचे विभाजन (तुलना) करण्याचा परिणाम आहे. अपूर्णांकाचा अंश म्हणजे ज्या मूल्याची तुलना केली जात आहे, आणि भाजक हे मूल्य (ba

सरासरी मूल्ये
यापूर्वी अनेकदा म्हटल्याप्रमाणे, आकडेवारी वस्तुमान घटना आणि प्रक्रियांचा अभ्यास करते. या प्रत्येक घटनेत संपूर्ण संचासाठी सामान्य आणि विशेष, वैयक्तिक गुणधर्म दोन्ही आहेत.

वितरण मालिका तयार करणे
लोकसंख्येच्या वेगवेगळ्या एककांसाठी एकाच कालावधीत किंवा वेळेत आकडेवारीद्वारे अभ्यास केलेली वैशिष्ट्ये भिन्न (एकमेकांपासून भिन्न) असतात. उदाहरणार्थ, परदेशी व्यापार उलाढालीचे मूल्य बदलते

वितरण मालिकेच्या संरचनात्मक वैशिष्ट्यांची गणना
भिन्नतेचा अभ्यास करताना, वितरण मालिकेची अशी वैशिष्ट्ये वापरली जातात जी त्याची रचना, संरचनेचे परिमाणात्मक वर्णन करतात. असे, उदाहरणार्थ, मध्यक आहे - व्हेरिएबल विशेषताचे मूल्य

आकार आणि भिन्नतेच्या तीव्रतेच्या मोजमापांची गणना
सर्वात सोपा निर्देशक भिन्नतेची श्रेणी आहे - अभ्यासलेल्या लोकसंख्येमध्ये उपलब्ध असलेल्या मूल्यांमधील गुणविशेषाच्या कमाल आणि किमान मूल्यांमधील परिपूर्ण फरक (24):

वितरण क्षणांची गणना आणि त्याच्या आकाराचे निर्देशक
भिन्नतेच्या स्वरूपाच्या पुढील अभ्यासासाठी, त्याच्या अंकगणित सरासरी मूल्यापासून गुणविशेषाच्या वैयक्तिक मूल्यांच्या भिन्न अंशांच्या विचलनाची सरासरी मूल्ये वापरली जातात. या निर्देशकांना म्हणतात

वितरण मालिका सामान्य आहे की नाही हे तपासत आहे
सैद्धांतिक वितरण वक्र हे व्हेरिएशनल शृंखलेतील वारंवारतेच्या बदलाच्या सतत रेषेच्या स्वरूपात मालिकेचे ग्राफिक प्रतिनिधित्व म्हणून समजले जाते, पर्यायांमधील बदलाशी कार्यशीलपणे संबंधित, इतर

वितरण शृंखला पॉसॉनच्या कायद्याचे पालन करते की नाही ते तपासत आहे
सीमाशुल्क विभागाने माल सोडल्यानंतर तपासणी केली. परिणामी, प्रत्येक चाचणीमध्ये ओळखल्या गेलेल्या उल्लंघनांच्या संख्येची खालील स्वतंत्र वितरण मालिका प्राप्त झाली (तक्ता 16). तक्ता 1

रचना बदलाचे परिपूर्ण आणि सापेक्ष निर्देशक
सांख्यिकीय लोकसंख्येचा विकास केवळ प्रणालीच्या घटकांमधील परिमाणवाचक वाढ किंवा घट मध्येच नव्हे तर त्याच्या संरचनेतील बदलामध्ये देखील प्रकट होतो. रचना म्हणजे एकूणाची रचना

रचना बदलाचे रँक निर्देशक
संरचनेतील फरक मोजण्यासाठी, कमी अचूक, परंतु गणना करणे सोपे आहे, निर्देशक बहुतेकदा वापरले जातात, जे स्वतःच्या शेअर्सच्या मूल्यांमध्ये नसून त्यांच्या श्रेणीतील फरकांचे मूल्यांकन करण्यावर आधारित असतात, म्हणजेच क्रमानुसार.

निवडक निरीक्षणाची संकल्पना
सॅम्पलिंग पद्धत वापरली जाते जेव्हा सतत निरीक्षणाचा वापर मोठ्या प्रमाणात डेटामुळे शारीरिकदृष्ट्या अशक्य असते किंवा आर्थिकदृष्ट्या व्यवहार्य नसते. एक भौतिक अशक्यता आहे

सॅम्पलिंग पद्धती
1. वास्तविक यादृच्छिक निवड: HS च्या सर्व युनिट्स क्रमांकित आहेत आणि ड्रॉच्या परिणामी काढलेल्या संख्या नमुन्यात आलेल्या युनिट्सशी संबंधित आहेत आणि संख्यांची संख्या नियोजित संख्येच्या समान आहे.

सरासरी नमुना त्रुटी
नमुन्यातील आवश्यक संख्येच्या युनिट्सची निवड पूर्ण केल्यानंतर आणि निरीक्षण कार्यक्रमाद्वारे प्रदान केलेल्या या युनिट्सच्या वैशिष्ट्यांची नोंदणी केल्यानंतर, ते सामान्यीकरण निर्देशकांच्या गणनेकडे पुढे जातात. पासून त्यांना

किरकोळ नमुना त्रुटी
नमुना सर्वेक्षणाच्या आधारे एचएसच्या सामान्यीकरण वैशिष्ट्याचे अचूकपणे मूल्यांकन करणे अशक्य आहे हे लक्षात घेऊन, ते कोणत्या मर्यादांमध्ये आहे ते शोधणे आवश्यक आहे. एका विशिष्ट नमुन्यात, फरक

आवश्यक नमुना आकार
निवडक निरीक्षणाचा कार्यक्रम विकसित करताना, त्यांना सीमांत त्रुटी आणि संभाव्यतेच्या पातळीचे विशिष्ट मूल्य दिले जाते. दिलेला किमान नमुना आकार

मार्गदर्शक तत्त्वे
एक कार्य. एंटरप्राइझमध्ये, 1000 पैकी 100 कामगारांची यादृच्छिक न-पुनरावृत्ती नमुन्याच्या क्रमाने मुलाखत घेण्यात आली आणि त्यांच्या महिन्याच्या उत्पन्नावर खालील डेटा प्राप्त झाला (तक्ता 24): Ta

वेळ मालिकेची संकल्पना
सांख्यिकीतील सर्वात महत्वाचे कार्य म्हणजे कालांतराने विश्लेषित निर्देशकांमधील बदलांचा अभ्यास करणे, म्हणजेच त्यांची गतिशीलता. डायनॅमिक्सच्या मालिकेचे (वेळ मालिका) विश्लेषण करून ही समस्या सोडवली जाते.

डायनॅमिक्सच्या मालिकेच्या पातळीतील बदलांचे सूचक
वेळ मालिकेचे विश्लेषण निरपेक्ष आणि सापेक्ष दृष्टीने मालिकेचे स्तर कसे बदलतात (वाढतात, कमी होतात किंवा अपरिवर्तित राहतात) हे ठरवण्यापासून सुरू होते. माग लावण्याकारिता

डायनॅमिक्सच्या मालिकेचे सरासरी निर्देशक
डायनॅमिक्सची प्रत्येक मालिका वेळोवेळी बदलणाऱ्या n निर्देशकांचा एक निश्चित संच मानली जाऊ शकते, ज्याचा सारांश सरासरी मूल्ये म्हणून केला जाऊ शकतो. अशा सामान्यीकृत (सरासरी) निर्देशक विशेषतः आहेत

डायनॅमिक्सच्या मालिकेतील मुख्य कल (ट्रेंड) ओळखण्यासाठी पद्धती
डायनॅमिक्सच्या मालिकेचा अभ्यास करण्याच्या मुख्य कार्यांपैकी एक म्हणजे मालिकेतील स्तर बदलण्यातील मुख्य कल (पॅटर्न) ओळखणे, ज्याला ट्रेंड म्हणतात. काही प्रकरणांमध्ये मालिकेचे स्तर बदलण्याची नियमितता

ट्रेंड पर्याप्तता मूल्यांकन आणि अंदाज
सापडलेल्या ट्रेंड समीकरणासाठी, त्याच्या विश्वासार्हतेचे (पर्याप्तता) मूल्यांकन करणे आवश्यक आहे, जे सहसा फिशर निकष वापरून केले जाते, त्याच्या गणना केलेल्या मूल्याची तुलना करून Fр

हंगामी विश्लेषण
डायनॅमिक्सच्या मालिकेत, ज्याचे स्तर मासिक किंवा त्रैमासिक निर्देशक आहेत, यादृच्छिक चढउतारांसह, हंगामी चढउतार अनेकदा पाळले जातात, जे वेळोवेळी समजले जातात.

मार्गदर्शक तत्त्वे
फेडरल स्टेट स्टॅटिस्टिक्स सर्व्हिसच्या मते, 2000-2006 या कालावधीसाठी रशियाचा परकीय व्यापार (SVT) शिल्लक. टेबलमध्ये सादर केलेल्या अनेक डायनॅमिक्सद्वारे वैशिष्ट्यीकृत. 36. तक्ता 36. रशियाचा परदेशी व्यापार शिल्लक (CBT) p साठी

सहसंबंध अवलंबित्व संकल्पना
वस्तुनिष्ठ जगाच्या सर्वात सामान्य नियमांपैकी एक म्हणजे सार्वत्रिक कनेक्शन आणि घटनांमधील अवलंबित्वाचा नियम. साहजिकच, सर्वात वैविध्यपूर्ण क्षेत्रातील घटनांचा तपास करताना, आकडेवारी अपरिहार्यपणे आदळते.

सहसंबंध ओळखण्यासाठी आणि मूल्यमापन करण्याच्या पद्धती
दोन वैशिष्ट्यांमधील सहसंबंधाची उपस्थिती आणि स्वरूप ओळखण्यासाठी आकडेवारीमध्ये अनेक पद्धती वापरल्या जातात. 1. समांतर डेटाचा विचार (kn

रँक सहसंबंध गुणांक
रँक सहसंबंध गुणांक कमी अचूक आहेत, परंतु गणना करणे सोपे आहे, दोन सहसंबंधित वैशिष्ट्यांमधील संबंधांची जवळीक मोजण्यासाठी नॉन-पॅरामेट्रिक निर्देशक. यात समाविष्ट

वेळ मालिकेच्या सहसंबंधाची वैशिष्ट्ये
बर्याच अभ्यासांमध्ये, एकाच वेळी अनेक निर्देशकांच्या गतिशीलतेचा अभ्यास करणे आवश्यक आहे, म्हणजे. समांतर अनेक वेळा मालिका विचारात घ्या. या प्रकरणात, अवलंबित्व मोजणे आवश्यक होते

गुणात्मक वैशिष्ट्यांमधील संबंधांच्या घट्टपणाचे सूचक
सहसंबंध सारण्यांची पद्धत केवळ परिमाणवाचक नाही तर वर्णनात्मक (गुणात्मक) वैशिष्ट्यांसाठी देखील लागू आहे, विविध समाजशास्त्रज्ञांचे आयोजन करताना त्यांच्यातील संबंधांचा अनेकदा अभ्यास करावा लागतो.

एकाधिक सहसंबंध
व्यावहारिक समस्या सोडवताना, संशोधकांना या वस्तुस्थितीचा सामना करावा लागतो की परस्परसंबंध दोन वैशिष्ट्यांमधील संबंधांपुरते मर्यादित नाहीत: प्रभावी y आणि घटक x. कृतीत

उद्देश आणि निर्देशांकांचे प्रकार
निर्देशांक हे एक सापेक्ष मूल्य आहे जे दर्शविते की दिलेल्या परिस्थितीत अभ्यास केलेल्या घटनेची पातळी इतर परिस्थितींमध्ये समान घटनेच्या पातळीपेक्षा किती वेळा भिन्न आहे. परिस्थितीतील फरक असू शकतो

वैयक्तिक निर्देशांक
जर अभ्यासाधीन घटनेच्या संरचनेत फरक पडत नसेल तर पातळींची तुलना करून प्राप्त केलेल्या सापेक्ष मूल्याला वैयक्तिक निर्देशांक म्हणतात. वैयक्तिक निर्देशांक i द्वारे दर्शविले जातात

सामान्य निर्देशांक
जर अभ्यासाधीन घटना विषम असेल आणि पातळींची तुलना त्यांना एका सामान्य मापनावर आणल्यानंतरच केली जाऊ शकते, तर आर्थिक विश्लेषण सामान्य निर्देशांकांद्वारे केले जाते. निर्देशांक सामान्य होतो

सरासरी निर्देशांक
गुणात्मक निर्देशकांचा अभ्यास करताना, विशिष्ट एकसंध लोकसंख्येसाठी अनुक्रमित निर्देशकाच्या सरासरी मूल्याच्या वेळेत (किंवा जागा) बदल लक्षात घेणे आवश्यक असते.

प्रादेशिक निर्देशांक
प्रादेशिक निर्देशांकांचा वापर विविध निर्देशकांच्या स्थानिक, आंतरप्रादेशिक तुलनासाठी केला जातो. त्यांची गणना पारंपारिक (गतिशील) निर्देशांकांच्या गणनेपेक्षा अधिक क्लिष्ट आहे.

सांख्यिकी डेटाचे ग्राफिक प्रतिनिधित्व, भौमितिक प्रतिमा, रेखाचित्रे किंवा योजनाबद्ध भौगोलिक नकाशे आणि त्यांच्या स्पष्टीकरणात्मक शिलालेखांद्वारे सामाजिक-आर्थिक घटनांवरील डेटाचे दृश्य प्रतिनिधित्व आणि सामान्यीकरण करण्याची पद्धत. सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व स्पष्टपणे आणि दृश्यमानपणे सामाजिक जीवनातील घटना आणि प्रक्रिया, त्यांच्या विकासातील मुख्य ट्रेंड, अंतराळातील त्यांच्या वितरणाची डिग्री यांच्यातील संबंध दर्शवते; आपल्याला संपूर्ण घटनांची संपूर्णता आणि त्याचे वैयक्तिक भाग दोन्ही पाहण्याची परवानगी देते.

सांख्यिकीय डेटाच्या ग्राफिकल सादरीकरणासाठी, विविध प्रकारचे सांख्यिकीय आलेख वापरले जातात. प्रत्येक आलेखामध्ये ग्राफिक प्रतिमा आणि सहायक घटक असतात. यामध्ये समाविष्ट आहे: चार्ट स्पष्टीकरण, अवकाशीय संदर्भ, स्केल संदर्भ, चार्ट फील्ड. सहाय्यक घटक आलेख वाचणे, समजून घेणे आणि वापरणे शक्य करतात. अनेक वैशिष्ट्यांनुसार आलेखांचे वर्गीकरण केले जाऊ शकते: ग्राफिक प्रतिमेच्या आकारानुसार, ते बिंदू, रेषा, प्लॅनर, अवकाशीय आणि कुरळे असू शकतात. ग्राफिक्स तयार करण्याच्या पद्धतीनुसार, ते आकृत्या आणि सांख्यिकीय नकाशेमध्ये विभागलेले आहेत.

ग्राफिक प्रतिमांचा सर्वात सामान्य मार्ग म्हणजे आकृती. हे एक रेखाचित्र आहे ज्यामध्ये सांख्यिकीय डेटा भौमितिक आकार किंवा चिन्हे म्हणून सादर केला जातो आणि हा डेटा ज्या प्रदेशाशी संबंधित आहे तो केवळ तोंडी दर्शविला जातो. जर आकृती भौगोलिक नकाशावर किंवा सांख्यिकीय डेटाशी संबंधित असलेल्या प्रदेशाच्या योजनेवर सुपरइम्पोज केली असेल, तर आलेखाला नकाशा आकृती म्हणतात. भौगोलिक नकाशा किंवा योजनेवर संबंधित प्रदेशाची छटा दाखवून किंवा रंग देऊन सांख्यिकीय डेटा दर्शविला गेल्यास, आलेखाला कार्टोग्राम म्हणतात.

भिन्न वस्तू किंवा प्रदेशांचे वैशिष्ट्य असलेल्या समान सांख्यिकीय डेटाची तुलना करण्यासाठी विविध प्रकारचे तक्ते वापरले जाऊ शकतात. सर्वात स्पष्ट म्हणजे बार चार्ट, ज्यामध्ये सांख्यिकीय डेटा अनुलंब वाढवलेला आयत म्हणून प्रदर्शित केला जातो. स्तंभांच्या उंचीची तुलना करून त्यांची स्पष्टता प्राप्त होते (चित्र 1).

जर आधाररेखा उभी असेल आणि पट्ट्या आडव्या असतील तर चार्टला स्ट्रिप चार्ट म्हणतात. आकृती 2 एक तुलना बार चार्ट दर्शविते जी जगाच्या प्रदेशाचे वैशिष्ट्य दर्शवते.

लोकप्रियतेसाठी हेतू असलेले तक्ते कधीकधी मानक आकृत्यांच्या स्वरूपात तयार केले जातात - प्रदर्शित केलेल्या सांख्यिकीय डेटाचे वैशिष्ट्य रेखाचित्रे, जे चार्टला अधिक अर्थपूर्ण बनवते आणि त्याकडे लक्ष वेधून घेते. अशा आकृत्यांना कुरळे किंवा सचित्र (चित्र 3) म्हणतात.

सूचक आलेखांचा एक मोठा गट म्हणजे स्ट्रक्चरल डायग्राम. सांख्यिकीय डेटाच्या संरचनेचे ग्राफिकल प्रतिनिधित्व करण्याच्या पद्धतीमध्ये स्ट्रक्चरल पाई किंवा पाई चार्ट (चित्र 4) काढणे समाविष्ट आहे.

वेळेत घटनेच्या विकासाची प्रतिमा आणि विश्लेषण करण्यासाठी, डायनॅमिक्सचे आकृत्या तयार केल्या जातात: बार, पट्टी, चौरस, वर्तुळाकार, रेखीय, रेडियल इ. आकृतीच्या प्रकाराची निवड प्रारंभिक डेटाच्या वैशिष्ट्यांवर अवलंबून असते, अभ्यासाचा उद्देश. उदाहरणार्थ, जर काही प्रमाणात असमान पातळी असलेल्या डायनॅमिक्सची मालिका असेल (1913, 1940, 1950, 1980, 2000, 2005), तर बार, चौरस किंवा पाई चार्ट वापरले जातात. ते दृष्यदृष्ट्या प्रभावी आहेत, चांगले लक्षात ठेवतात, परंतु मोठ्या संख्येने स्तरांचे चित्रण करण्यासाठी योग्य नाहीत. जर डायनॅमिक्सच्या मालिकेतील स्तरांची संख्या मोठी असेल, तर रेखीय आकृत्या वापरल्या जातात जे सतत तुटलेल्या रेषेच्या स्वरूपात विकास प्रक्रियेचे पुनरुत्पादन करतात (चित्र 5).

बर्‍याचदा, एका ओळीच्या चार्टवर अनेक वक्र दर्शविले जातात, जे विविध देशांमधील विविध निर्देशकांच्या गतिशीलतेचे किंवा समान निर्देशकाचे तुलनात्मक वर्णन देतात (चित्र 6).

एका निर्देशकाचे दुसर्‍यावर अवलंबित्व प्रदर्शित करण्यासाठी, संबंध आकृती तयार केली आहे. एक सूचक X म्हणून घेतला जातो आणि दुसरा Y साठी घेतला जातो (म्हणजे X चे कार्य). निर्देशकांसाठी स्केल असलेली आयताकृती समन्वय प्रणाली तयार केली आहे आणि त्यात एक आलेख काढला आहे (चित्र 7).

संगणक तंत्रज्ञान आणि उपयोजित सॉफ्टवेअरच्या विकासामुळे भौगोलिक माहिती प्रणाली (GIS) तयार करणे शक्य झाले आहे, जे माहितीच्या ग्राफिकल प्रतिनिधित्वामध्ये गुणात्मकदृष्ट्या नवीन टप्प्याचे प्रतिनिधित्व करतात. GIS स्थानिक पातळीवर समन्वित डेटाचे संकलन, संचयन, प्रक्रिया, प्रवेश, प्रदर्शन आणि वितरण प्रदान करते; मॉडेल आणि गणना फंक्शन्सच्या संयोगाने मोठ्या संख्येने ग्राफिक आणि थीमॅटिक डेटाबेस समाविष्ट करतात जे स्थानिक (कार्टोग्राफिक) स्वरूपात माहिती सादर करण्यास, विविध स्केलवर प्रदेशाचे बहु-स्तरीय इलेक्ट्रॉनिक नकाशे प्राप्त करण्यास अनुमती देतात. प्रादेशिक व्याप्तीनुसार, जागतिक, उपखंडीय, राज्य, प्रादेशिक आणि स्थानिक प्रकारचे GIS वेगळे केले जातात. GIS चे विषयाभिमुखता त्याच्या मदतीने सोडवलेल्या कार्यांद्वारे निर्धारित केले जाते, ज्यामध्ये संसाधने, विश्लेषण, मूल्यमापन, देखरेख, व्यवस्थापन आणि नियोजन यांची यादी असू शकते.

लिट.: गेर्चुक या. पी. आकडेवारीमध्ये ग्राफिक पद्धती. एम., 1968; सांख्यिकी सिद्धांत / आर. ए. श्मोयलोवा द्वारा संपादित. चौथी आवृत्ती. एम., 2005. एस. 150-83.

सांख्यिकीय आलेख एक रेखाचित्र आहे ज्यामध्ये विशिष्ट निर्देशकांद्वारे वैशिष्ट्यीकृत सांख्यिकीय लोकसंख्या सशर्त भूमितीय प्रतिमा किंवा चिन्हे वापरून वर्णन केली जाते. सांख्यिकीय आलेखांमध्ये, आयताकृती निर्देशांकांची प्रणाली बहुतेकदा वापरली जाते, परंतु ध्रुवीय निर्देशांक (परिपत्रक आलेख) च्या तत्त्वावर आधारित आलेख देखील आहेत.

चार्ट प्रकारांचे वर्गीकरण:

अ) ग्राफिक प्रतिमा तयार करण्याची पद्धत;

b) सांख्यिकीय निर्देशक आणि संबंध दर्शविणारी भौमितिक चिन्हे;

c) ग्राफिक प्रतिमेच्या मदतीने सोडवलेली कार्ये.

ग्राफिक प्रतिमेच्या स्वरूपात सांख्यिकीय आलेख:

1. रेखीय: सांख्यिकीय वक्र.

2. प्लॅनर: बार, पट्टी, चौरस, वर्तुळाकार, सेक्टर, कुरळे, बिंदू, पार्श्वभूमी.

3. व्हॉल्यूमेट्रिक: वितरण पृष्ठभाग.

बांधकाम आणि प्रतिमा कार्यांच्या पद्धतीनुसार सांख्यिकीय आलेख:

1. आकृत्या: तुलना आकृत्या, गतिशील आकृत्या, स्ट्रक्चरल आकृत्या (ग्राफिक प्रतिमांचा सर्वात सामान्य मार्ग. हे परिमाणवाचक संबंधांचे आलेख आहेत).

2. सांख्यिकीय नकाशे: कार्टोग्राम, कार्टोग्राम (पृष्ठभागावरील परिमाणवाचक वितरणाचे आलेख. त्यांच्या मुख्य उद्देशाने, ते आकृत्यांजवळ आहेत आणि केवळ या अर्थाने विशिष्ट आहेत की ते समोच्च भौगोलिक नकाशावरील सांख्यिकीय डेटाच्या सशर्त प्रतिमा आहेत, उदा. , ते स्थानिक वितरण किंवा आकडेवारीचे अवकाशीय वितरण दर्शवतात)

10/ परिपूर्ण आकडे

परिपूर्ण निर्देशकआकडेवारीद्वारे अभ्यासलेल्या प्रक्रिया आणि घटनांचे भौतिक परिमाण प्रतिबिंबित करतात, म्हणजे त्यांचे वस्तुमान, क्षेत्रफळ, खंड, लांबी, ऐहिक वैशिष्ट्ये. ते नेहमी नामांकित संख्या असतात. मध्ये व्यक्त केले नैसर्गिक, मूल्य किंवा श्रममोजमापाची एकके.

नैसर्गिक एकके - टन, किलोमीटर, लिटर, बॅरल्स, तुकडे.

सशर्त नैसर्गिक युनिट्स वापरल्या जातात जेव्हा उत्पादनामध्ये अनेक प्रकार असतात आणि एकूण व्हॉल्यूम केवळ सर्व जातींमध्ये सामान्य असलेल्या ग्राहक मालमत्तेच्या आधारावर निर्धारित केले जाऊ शकते. पारंपारिक युनिट्समध्ये रूपांतरण उत्पादनाच्या वैयक्तिक जातींच्या ग्राहक गुणधर्मांचे संदर्भ मूल्य आणि गुणोत्तर म्हणून गणना केलेल्या विशेष गुणांकांच्या आधारे केले जाते.

मोजमापाची किंमत एकके सामाजिक-आर्थिक घटनांचे (जीडीपी मूल्य) आर्थिक मूल्यांकन देतात. मोजमापाच्या कामगार युनिट्समुळे एंटरप्राइझमधील एकूण श्रम खर्च आणि तांत्रिक प्रक्रियेच्या वैयक्तिक ऑपरेशन्सची श्रम तीव्रता (मनुष्य-दिवस, मनुष्य-तास) विचारात घेणे शक्य होते.

वैयक्तिक परिपूर्ण निर्देशकस्वारस्याच्या परिमाणवाचक वैशिष्ट्याचा परिणाम म्हणून सांख्यिकीय निरीक्षणाच्या प्रक्रियेत थेट प्राप्त.

सारांश व्हॉल्यूम परिपूर्ण निर्देशकवैयक्तिक मूल्यांचा सारांश आणि गटबद्ध करून प्राप्त केले जातात.

11/ सापेक्ष निर्देशक

सापेक्ष सूचक हा एका निरपेक्ष निर्देशकाला दुसर्‍याने विभाजित करण्याचा परिणाम आहे आणि सामाजिक-आर्थिक घटनेच्या परिमाणवाचक वैशिष्ट्यांमधील गुणोत्तर व्यक्त करतो.

सापेक्ष निर्देशकांशिवाय, वेळेत अभ्यासाधीन घटनेच्या विकासाची तीव्रता मोजणे, त्याच्याशी संबंधित इतर घटनांच्या पार्श्वभूमीवर एका घटनेच्या विकासाच्या पातळीचे मूल्यांकन करणे, स्थानिक आणि प्रादेशिक तुलना करणे अशक्य आहे.

सापेक्ष निर्देशकाची गणना करताना, परिणामी गुणोत्तराच्या अंशामध्ये असलेल्या परिपूर्ण निर्देशकास म्हणतात. वर्तमान किंवा तुलनात्मक, आणि भाजकातील घातांक म्हणतात तुलनेचा आधार किंवा आधार.

सापेक्ष निर्देशक गुणांक, टक्केवारी, पीपीएम, दशांश मध्ये व्यक्त केले जाऊ शकतात किंवा त्यांना मूल्ये म्हणून नाव दिले जाऊ शकते. टक्केवारी अशा प्रकरणांमध्ये वापरली जाते जेथे तुलनात्मक परिपूर्ण निर्देशक बेस एक पेक्षा 2-3 वेळा जास्त नाही. जर श्रेष्ठता जास्त असेल तर गुणांक वापरला जातो.

खालील आहेत सापेक्ष निर्देशकांचे प्रकार.

    डायनॅमिक्सचे सापेक्ष सूचक (RDI) हे दिलेल्या कालावधीसाठी अभ्यासाधीन प्रक्रियेच्या किंवा घटनेच्या पातळीचे आणि भूतकाळातील समान घटनेच्या पातळीचे गुणोत्तर आहे. ओपीडी टक्केवारी म्हणून मोजली जाते किंवा गुणांक म्हणून व्यक्त केली जाते.

    हे मूल्य वर्तमान पातळी बेसलाइनपेक्षा किती पटीने मोठे आहे किंवा बेसलाइनचे किती प्रमाणात आहे हे दर्शवते. जर GPV एकाधिक म्हणून व्यक्त केला असेल, तर तो वाढीचा घटक आहे. जेव्हा हा घटक 100 ने गुणाकार केला जातो तेव्हा वाढीचा दर प्राप्त होतो.

    योजनेचा सापेक्ष सूचक (RPI) म्हणजे भूतकाळात आधीच साध्य केलेल्या निर्देशकाच्या नियोजित पातळीचे गुणोत्तर. ROP, RAP प्रमाणे, टक्केवारी किंवा गुणोत्तर म्हणून व्यक्त केले जाते.

    रिलेटिव्ह प्लॅन इम्प्लिमेंटेशन इंडिकेटर (पीआरआरपी) हे इंडिकेटरच्या नियोजित स्तरावर प्रत्यक्षात साध्य केलेल्या पातळीचे गुणोत्तर आहे. PRRP टक्केवारी किंवा गुणोत्तर म्हणून देखील व्यक्त केला जातो.

    रिलेटिव्ह स्ट्रक्चर इंडेक्स (RPS) हे अभ्यासाधीन ऑब्जेक्टच्या स्ट्रक्चरल भागांचे गुणोत्तर आहे आणि लोकसंख्येचा एक भाग आणि संपूर्ण लोकसंख्येचे वैशिष्ट्य दर्शविणाऱ्या निर्देशकाच्या गुणोत्तराद्वारे निर्धारित केले जाते. OPS युनिट्सच्या अपूर्णांकांमध्ये किंवा टक्केवारी म्हणून व्यक्त केले जाते.

    रिलेटिव्ह कोऑर्डिनेशन इंडेक्स (RIC) - एका ऑब्जेक्टशी संबंधित वेगवेगळ्या भागांचे गुणोत्तर.

    सापेक्ष तुलना निर्देशांक (RPCr) हे एकाच नावाच्या निरपेक्ष निर्देशकांचे गुणोत्तर आहे जे भिन्न वस्तूंचे वैशिष्ट्य दर्शवतात.

    सापेक्ष तीव्रता निर्देशक (RII) त्याच्या अंतर्निहित वातावरणात अभ्यासाच्या अंतर्गत प्रक्रियेच्या किंवा घटनेच्या प्रसाराची डिग्री दर्शवितो आणि या घटनेच्या वितरणासाठी वातावरणाचे वैशिष्ट्य दर्शविणार्‍या निर्देशकाच्या इंद्रियगोचरच्या गुणोत्तराद्वारे निर्धारित केले जाते. ओपीआय टक्के, पीपीएम, डेसिमिलमध्ये मोजले जाते. जेव्हा घटनेच्या प्रमाणाबद्दल वाजवी निष्कर्ष काढण्यासाठी परिपूर्ण मूल्य अपुरे असते तेव्हा या निर्देशकाची गणना केली जाते. विविध प्रकारचे OPII निर्देशक आहेत आर्थिक विकासाची पातळीदरडोई जीडीपीचे उत्पादन, दरडोई व्यापार उलाढाल इ. आर्थिक विकासाच्या पातळीच्या निर्देशकांना मूल्ये नावाची नावे दिली जातात आणि दरडोई रूबल इ. मध्ये मोजली जातात.

§1. सांख्यिकी संकल्पना, सांख्यिकीय नियमितता आणि संपूर्णता ..... 2

§2. सांख्यिकीय लोकसंख्येच्या एककांची चिन्हे, त्यांचे वर्गीकरण ...... 2

एक सांख्यिकीय निरीक्षणाची संकल्पना, त्याची तयारी ............... 4

§2. सांख्यिकीय निरीक्षणाचे प्रकार ................................................. .................. 5

§3. निरीक्षण त्रुटी ................................................ ..................................... 6

§ चार. सारांश आणि गटीकरण ................................................ ............................... 6

§5. सांख्यिकीय गटांचे प्रकार .................................. ............ 6

§6. सांख्यिकीय तक्ते................................................ ............... 7

§7. सांख्यिकीय आलेख ................................................ ..................... आठ

एक वास्तविक आणि सैद्धांतिक वितरण ................................................ 21

§2. सामान्य वितरण वक्र ................................................... २१

§3. सामान्य वितरणाच्या गृहीतकाची चाचणी करणे................................. 21

§ चार. कॉन्कॉर्डन्स निकष: पिअर्सन, रोमानोव्स्की, कोल्मोगोरोव........... २१

§5. मॉडेलिंग वितरण मालिकेचे व्यावहारिक मूल्य ..... 22

एक निवडक निरीक्षणाची संकल्पना. त्याच्या वापराची कारणे ...... 23

§3. नमुना त्रुटी ................................................ ............... २४

§ चार. नमुना निरीक्षण कार्ये................................................ २५

§5. सामान्य लोकसंख्येपर्यंत नमुना निरीक्षण डेटा विस्तारित करणे... 26

§6. छोटा नमुना ................................................ .............................. २६

§एक. सहसंबंध आणि CRA ची संकल्पना ..................................... 27

§2. KPA च्या वापरासाठी अटी आणि मर्यादा .................................. 27

§3. किमान वर्गांच्या पद्धतीवर आधारित पेअर रिग्रेशन.. 28

§ चार. जोडलेल्या रेखीय प्रतिगमन समीकरणाचा वापर.......... 29

§6. अनेक सहसंबंध ................................................ 32


विषय 1.: आकडेवारीचा परिचय.

  1. सांख्यिकी संकल्पना, सांख्यिकीय नियमितता आणि लोकसंख्या.
  2. सांख्यिकीय लोकसंख्येच्या एककांची चिन्हे, त्यांचे वर्गीकरण.
  3. आकडेवारीचा विषय आणि पद्धत.

§1. सांख्यिकी संकल्पना, सांख्यिकीय नियमितता आणि संपूर्णता.

सांख्यिकी हा शब्द लॅटिनमधून आला आहे. स्थिती" भाषांतरात - एक राज्य, एक स्थिती.

सांख्यिकी हा शब्द 18 व्या शतकाच्या उत्तरार्धात उद्भवला. राज्यांच्या ज्ञानाच्या संबंधात, त्यांच्या वैशिष्ट्यांचा अभ्यास. विद्यापीठात सांख्यिकी शिकवण्याची सुरुवात त्याच काळात झाली. सांख्यिकी संशोधनाच्या शाखेवर अवलंबून आहे: लोकसंख्या, उद्योग, शेती इत्यादींची आकडेवारी. - लागू आकडेवारी.

सांख्यिकीचा सामान्य सिद्धांत हा संख्यात्मक डेटा गोळा करणे, प्रक्रिया करणे, सादर करणे आणि विश्लेषण करणे यासाठी पद्धती आणि तंत्रांचा एक संच आहे. सांख्यिकी हा शब्द आज 3 अर्थांमध्ये वापरला जातो:

  1. "डेटा" शब्दाचा समानार्थी शब्द म्हणून
  2. अर्थांची एक शाखा जी वस्तुमान घटना दर्शविणार्‍या संख्यात्मक डेटासह कार्य करण्याच्या तत्त्वे आणि पद्धती एकत्र करते (पुरुषांचे आयुर्मान स्त्रियांपेक्षा कमी आहे)
  3. संख्यात्मक डेटावर प्रक्रिया आणि विश्लेषण करण्याच्या उद्देशाने व्यावहारिक क्रियाकलापांची एक शाखा.

सांख्यिकी सामाजिक-आर्थिक प्रक्रिया आणि घटनांच्या विकासाचा नमुना तसेच स्थान आणि वेळेच्या विशिष्ट परिस्थितीत त्यांच्यातील संबंध ओळखणे आणि मोजणे शक्य करते.

नियमितता म्हणजे घटनांमधील बदलांची पुनरावृत्ती, क्रम आणि क्रम.

सांख्यिकीय नियमितता - एक नियमितता ज्यामध्ये प्रत्येक वैयक्तिक इंद्रियगोचरमध्ये आवश्यकतेचा अविभाज्यपणे संबंध जोडलेला असतो आणि केवळ अनेक घटनांमध्ये एक कायदा म्हणून प्रकट होतो. सांख्यिकीय नियमिततेच्या संकल्पनेला गतिमान नियमिततेच्या संकल्पनेने विरोध केला आहे जो प्रत्येक घटनेत स्वतःला प्रकट करतो. (उदाहरण: S वर्तुळ =pr 2 पेक्षा > r विषय > S वर्तुळ). सांख्यिकीय संशोधनाचा उद्देश सांख्यिकीय संच आहे - एककांचा संच ज्यामध्ये वस्तुमान वर्ण, एकसंधता, अखंडता आणि भिन्नतेच्या उपस्थितीद्वारे निर्धारित केली जाते. प्रत्येक वैयक्तिक घटकाला सांख्यिकीय लोकसंख्या युनिट (ESS) म्हणतात.

§2. सांख्यिकीय लोकसंख्येच्या एककांची चिन्हे, त्यांचे वर्गीकरण.

ECC मध्ये काही गुणधर्म असतात ज्यांना वैशिष्ट्ये म्हणतात. सांख्यिकी त्यांच्या वैशिष्ट्यांद्वारे घटनांचा अभ्यास करते, संच जितका अधिक एकसंध, त्याच्या युनिट्सची अधिक सामान्य वैशिष्ट्ये आणि या वैशिष्ट्यांची मूल्ये कमी असतात.

वर्णनात्मक चिन्ह हे एक चिन्ह आहे जे केवळ तोंडी व्यक्त केले जाऊ शकते.

  1. परिमाणवाचक चिन्ह - एक चिन्ह जे संख्यात्मकरित्या व्यक्त केले जाऊ शकते.
  2. थेट चिन्ह ही एक गुणधर्म आहे जी एखाद्या वैशिष्ट्यपूर्ण वस्तूमध्ये थेट अंतर्भूत असते.
  3. अप्रत्यक्ष चिन्ह म्हणजे वैशिष्ट्यीकृत वस्तूचे गुणधर्म नसून त्याच्याशी संबंधित किंवा त्यात समाविष्ट असलेल्या वस्तूचे गुणधर्म.
  4. प्राथमिक गुणधर्म हे एक परिपूर्ण मूल्य आहे जे मोजले जाऊ शकते.
  5. दुय्यम वैशिष्ट्य - प्राथमिक वैशिष्ट्यांच्या तुलनाचा परिणाम, तो थेट मोजला जातो.
  6. नैसर्गिक चिन्ह - तुकडे, किलो, टन, लिटर इ. मध्ये मोजले जाते.
  7. श्रम चिन्ह - मनुष्य-दिवस, मनुष्य-तासांमध्ये मोजले जाते.
  8. मूल्य गुणधर्म - रूबल, $, €, ₤ मध्ये मोजले.
  9. आकारहीन चिन्ह - समभागांमध्ये मोजमाप,%
  10. पर्यायी वैशिष्‍ट्य हे असे वैशिष्‍ट्य आहे जे अनेक संभाव्यांपैकी केवळ एकच मूल्य घेते.
  11. स्वतंत्र चिन्ह - मध्यवर्ती चिन्हाशिवाय केवळ पूर्णांक मूल्य घेते.
  12. एक सतत वैशिष्ट्य हे एक वैशिष्ट्य आहे जे विशिष्ट श्रेणीमध्ये कोणतेही मूल्य घेते.
  13. घटक गुणधर्म हे एक वैशिष्ट्य आहे जे दुसरे वैशिष्ट्य बदलते.
  14. प्रभावी गुणधर्म - एक वैशिष्ट्य जे दुसर्याच्या वैशिष्ट्याखाली बदलते
  15. क्षणिक चिन्ह - ठराविक वेळी मोजले जाणारे चिन्ह.
  16. मध्यांतर चिन्ह - विशिष्ट कालावधीसाठी चिन्ह.

वेगवेगळ्या वर्गीकरणांनुसार समान वैशिष्ट्याचे एकाच वेळी वर्गीकरण केले जाऊ शकते.

§3. आकडेवारीचा विषय आणि पद्धत.

सांख्यिकीय संशोधनाचा विषय सांख्यिकीय समुच्चय आहे - एक-गुणवत्तेच्या भिन्न वस्तूंचा संच.

आकडेवारीच्या विषयाची वैशिष्ट्ये पद्धतीची वैशिष्ट्ये निर्धारित करतात, त्यामध्ये हे समाविष्ट आहे:

  1. डेटा संकलन (सांख्यिकीय निरीक्षण, प्रकाशन)
  2. डेटाचे सामान्यीकरण (सारांश, गटीकरण)
  3. डेटा सादरीकरण (टेबल आणि आलेख)
  4. संख्यात्मक डेटाचे विश्लेषण आणि व्याख्या (सरासरीची गणना, फरकांचे विश्लेषण, केआरए, डायनॅमिक्सची मालिका, निर्देशांक)

विषय 2: सांख्यिकीय निरीक्षणाचे आयोजन.

डेटाचा सारांश आणि समूहीकरण.

एक सांख्यिकीय निरीक्षणाची संकल्पना, त्याची तयारी.

§2. सांख्यिकीय निरीक्षणाचे प्रकार.

§3 निरीक्षणातील त्रुटी.

§4 सारांश आणि समूहीकरण

§5 सांख्यिकीय गटांचे प्रकार.

§6 सांख्यिकी सारण्या.

§7 सांख्यिकीय आलेख.

एक सांख्यिकीय निरीक्षणाची संकल्पना, त्याची तयारी.

कोणतेही सांख्यिकीय संशोधन डेटाच्या संकलनापासून सुरू होते.

माहितीचे स्रोत:

  1. विविध प्रकाशने (वृत्तपत्रे, मासिके इ.)
  2. प्रकाशित सांख्यिकीय माहितीचा मुख्य स्त्रोत म्हणजे राज्य सांख्यिकी संस्थांचे प्रकाशन (2001 मध्ये आरएफ, GOSKOMSTAT प्रकाशन गृह).
  3. सांख्यिकीय निरीक्षण पार पाडणे, म्हणजे वैज्ञानिकदृष्ट्या आयोजित डेटा संग्रह.

सांख्यिकीय निरीक्षण हे सामाजिक आणि आर्थिक जीवनाच्या घटनेचे वस्तुमान, नियोजित, वैज्ञानिकदृष्ट्या आयोजित केलेले निरीक्षण आहे, ज्यामध्ये अभ्यास केलेल्या लोकसंख्येच्या प्रत्येक युनिटसाठी चिन्हे नोंदविली जातात.

निरीक्षण प्रक्रिया:

  1. निरीक्षणाची तयारी करत आहे
  2. वस्तुमान डेटा संकलन आयोजित करणे
  3. प्रक्रियेसाठी डेटा तयार करत आहे
  4. सांख्यिकीय निरीक्षणाच्या सुधारणेसाठी प्रस्तावांचा विकास.

निरीक्षण तयारी:

  1. निरीक्षणाचा उद्देश आणि ऑब्जेक्ट निश्चित करणे
  2. नोंदणीच्या अधीन असलेल्या चिन्हांच्या रचनेचे निर्धारण
  3. डेटा संकलनासाठी दस्तऐवजांचा विकास
  4. रिपोर्टिंग युनिटची निवड आणि ज्या युनिटविरुद्ध निरीक्षण केले जाईल.
  5. डेटा मिळविण्याच्या पद्धती आणि माध्यमांची व्याख्या करणे आवश्यक आहे.

संघटनात्मक समस्या सोडवल्या पाहिजेत:

  1. अभ्यास करणार्‍या सेवांची रचना निश्चित करणे आवश्यक आहे
  2. कर्मचारी थोडक्यात
  3. कामाचे वेळापत्रक तयार करा
  4. डेटा संकलनासाठी दस्तऐवजांची प्रतिकृती

निरीक्षणाचा उद्देश सामाजिक-आर्थिक घटना आणि प्रक्रिया आहे.

नोंदणीसाठी चिन्हे स्पष्टपणे ओळखणे आवश्यक आहे.

निरीक्षण कार्यक्रम - निरीक्षणाच्या प्रक्रियेत नोंदणीच्या अधीन असलेल्या चिन्हांच्या चिन्हांची यादी.

निरीक्षण कार्यक्रम आवश्यकता:

  1. प्रोग्राममध्ये अत्यावश्यक वैशिष्ट्ये असावीत जी अभ्यासाधीन घटना थेट दर्शवितात; दुय्यम घटना किंवा चिन्हे असलेली चिन्हे, ज्याची मूल्ये स्पष्टपणे अविश्वसनीय असतील किंवा पूर्णपणे अनुपस्थित असतील, प्रोग्राममध्ये समाविष्ट करू नयेत.
  2. निरीक्षण कार्यक्रमाचे प्रश्न अचूक आणि अस्पष्ट नसावेत आणि उत्तरे मिळवण्यात अडचणी येऊ नयेत म्हणून ते समजण्यास सोपे असावेत.
  3. प्रश्नांचा क्रम ठरवावा.
  4. संकलित केलेल्या डेटाचे संचालन आणि स्पष्टीकरण करण्यासाठी मॉनिटरिंग प्रोग्राममध्ये थेट स्वरूपाचे प्रश्न समाविष्ट केले पाहिजेत.
  5. मिळालेल्या माहितीची एकसमानता सुनिश्चित करण्यासाठी, प्रोग्राम दस्तऐवजाच्या स्वरूपात तयार केला जातो - ज्याला सांख्यिकीय फॉर्म म्हणतात.

सांख्यिकीय फॉर्म हा प्रोग्राम आणि निरीक्षणांचे परिणाम असलेल्या एका नमुन्याचे दस्तऐवज आहे.

वैयक्तिक स्वरूप (निरीक्षणाच्या एका युनिटवरील प्रश्नांची उत्तरे) आणि राइट ऑफ (सांख्यिकीय लोकसंख्येच्या अनेक युनिट्सवरील माहिती) यांच्यात फरक केला जातो.

फॉर्म आणि तो भरण्यासाठीच्या सूचना ही सांख्यिकीय निरीक्षणाची साधने आहेत.

निरीक्षण वेळेच्या निवडीमध्ये 2 प्रश्न सोडवणे समाविष्ट आहे: एक महत्त्वपूर्ण तारीख किंवा मध्यांतर स्थापित करणे, निरीक्षण कालावधी निश्चित करणे.

गंभीर तारीख - वर्षाचा एक विशिष्ट दिवस, दिवसाचा तास ज्याची चिन्हे अभ्यासलेल्या लोकसंख्येच्या प्रत्येक युनिटसाठी नोंदणीकृत असणे आवश्यक आहे.

निरीक्षण कालावधी - ज्या कालावधीत सांख्यिकीय फॉर्म भरले जातात, उदा. डेटा गोळा करण्यासाठी लागणारा वेळ.

हे लक्षात घेतले पाहिजे की गंभीर तारीख किंवा मध्यांतरापासून निरीक्षण कालावधीचे अंतर प्राप्त झालेल्या माहितीची विश्वासार्हता कमी करू शकते.

§2. सांख्यिकीय निरीक्षणाचे प्रकार.

देशांतर्गत आकडेवारीमध्ये, सांख्यिकीय निरीक्षणाचे तीन प्रकार वापरले जातात.

  1. उपक्रम, संस्था, संस्थांचे सांख्यिकीय अहवाल.
  2. विशेषतः आयोजित सांख्यिकीय निरीक्षण (जनगणना, इ.)
  3. नोंदणी - दीर्घकालीन प्रक्रियांच्या सतत सांख्यिकीय निरीक्षणाचा एक प्रकार

सांख्यिकीय निरीक्षणाचे वर्गीकरण केले जाते:

निरीक्षण वेळेनुसार:

  • वर्तमान निरीक्षण - चिन्हांची सतत नोंदणी केली जाते (नोंदणी कार्यालय, गुन्हा इ.).
  • नियतकालिक निरीक्षण - ठराविक कालांतराने केले जाते (चेल्याबिन्स्क शहरातील राहणीमान, ग्राहक टोपलीची किंमत, लोकसंख्या जनगणना).
  • एक-वेळ - विशिष्ट हेतूसाठी एकदा केलेले निरीक्षण.

लोकसंख्या युनिट्सच्या कव्हरेजनुसार:

  • सतत निरीक्षण - सर्व ECC ची माहिती मिळवणे आवश्यक आहे
  • पूर्ण निरीक्षण नाही
    • मुख्य अॅरेची पद्धत - अभ्यासलेल्या लोकसंख्येच्या सर्वात महत्त्वपूर्ण युनिट्सची तपासणी केली जाते (चेल्याबिन्स्क प्रदेशाच्या अभियांत्रिकी उपक्रमाचा अभ्यास करण्यासाठी).
    • निवडक निरीक्षण हे निरीक्षण करण्यासाठी ECC ची यादृच्छिक निवड आहे.
    • मोनोग्राफिक निरीक्षण - जेव्हा एक ECC निरीक्षण केले जाते, तेव्हा ते बहुधा वस्तुमान निरीक्षण कार्यक्रम तयार करण्यासाठी वापरले जातात.

डेटा संकलनाच्या मार्गाने:

  • थेट निरीक्षण - रजिस्ट्रार स्वत:, थेट मोजमाप करून, वजन करून, नोंदणीकृत विषयाची वस्तुस्थिती स्थापित करतात (पॉलीक्लिनिकमध्ये 1 वर्षापेक्षा कमी वयाचे मूल).
  • डॉक्युमेंटरी निरीक्षण - विविध दस्तऐवज वापरले जातात (घोषणा काढणे)

मतदान - आवश्यक माहिती प्रतिसादकर्त्याच्या शब्दांमधून मिळविली जाते.

  • फॉरवर्डिंग सर्वेक्षण - विशेष प्रशिक्षित कर्मचार्‍यांद्वारे केले जाते जे संबंधित व्यक्तींच्या सर्वेक्षणाच्या आधारे आवश्यक माहिती प्राप्त करतात आणि स्वतः उत्तरे फॉर्ममध्ये रेकॉर्ड करतात. मोहीम सर्वेक्षण प्रत्यक्ष (समोरासमोर) आणि अप्रत्यक्ष (फोनद्वारे सर्वेक्षण) असू शकते.
  • संवाददाता सर्वेक्षण - स्वयंसेवी वार्ताहरांच्या कर्मचार्‍यांकडून माहिती प्रदान केली जाते, या पद्धतीसाठी थोडासा आर्थिक खर्च आवश्यक आहे, परंतु निरीक्षणाचे अचूक मूल्य देत नाही.
  • स्व-नोंदणी - फॉर्म प्रतिसादकर्त्यांनी स्वतः भरले आहेत आणि रजिस्ट्रार फक्त त्यांना प्रश्नावलीचे फॉर्म वितरित करतात आणि ते कसे भरायचे ते स्पष्ट करतात.

§3. निरीक्षण त्रुटी

सांख्यिकीय निरीक्षणासाठी लागू केलेली मुख्य आवश्यकता म्हणजे अचूकता.

अचूकता - सांख्यिकीय निरीक्षणाच्या सामग्रीवरून निर्धारित केलेल्या वास्तविक मूल्यासह कोणत्याही वैशिष्ट्यपूर्ण निर्देशकाच्या अनुपालनाची डिग्री.

गणना केलेल्या आणि वास्तविक मूल्यांमधील विसंगतीला निरीक्षण त्रुटी म्हणतात, घटनेच्या कारणांवर अवलंबून, ते वेगळे करतात: नोंदणी त्रुटी आणि प्रतिनिधीत्व त्रुटी. नोंदणी त्रुटी यादृच्छिक आणि पद्धतशीर विभागल्या आहेत.

यादृच्छिक त्रुटी - यादृच्छिक घटकांच्या क्रियांचा परिणाम (पंक्ती, स्तंभ मिसळले आहेत)

पद्धतशीर त्रुटी - नेहमी एकतर एकतर जास्त मोजणे किंवा निर्देशक कमी लेखणे. (वय)

प्रातिनिधिकता त्रुटी हे सतत निरीक्षण न ठेवण्याचे स्वरूप आहे आणि संपूर्ण मूळ लोकसंख्येच्या नमुन्याच्या चुकीच्या पुनरुत्पादनामुळे उद्भवतात.

सांख्यिकीय फॉर्म प्राप्त केल्यानंतर, आपण हे करणे आवश्यक आहे:

  1. गोळा केलेल्या डेटाची पूर्णता तपासा.
  2. एकमेकांशी विविध वैशिष्ट्यांच्या संबंधांवर आधारित अंकगणित नियंत्रण करा.
  3. वैशिष्ट्यांमधील तार्किक संबंधांच्या ज्ञानावर आधारित तार्किक नियंत्रण अमलात आणणे.

§ चार. सारांश आणि समूहीकरण

संकलित केलेल्या डेटाच्या आधारे, गणना करणे आणि निष्कर्ष काढणे अशक्य आहे; प्रथम, त्यांना एका सारणीमध्ये सारांशित करणे आणि सारांशित करणे आवश्यक आहे. या हेतूंसाठी, सारांश आणि गटीकरण वापरले जातात.

सारांश - विशिष्ट एकल तथ्यांचे सामान्यीकरण करण्यासाठी अनुक्रमिक ऑपरेशन्सचा एक संच जो एक संच तयार करतो आणि संपूर्णपणे अभ्यासाच्या अंतर्गत घटनेत अंतर्भूत वैशिष्ट्यपूर्ण वैशिष्ट्ये आणि नमुने ओळखतो.

साधे वोडका - लोकसंख्येसाठी बेरीज मोजणे.

एक जटिल सारांश म्हणजे वैयक्तिक निरीक्षणांचे गट करणे, प्रत्येक गटासाठी आणि संपूर्ण ऑब्जेक्टसाठी परिणाम मोजणे आणि सांख्यिकीय सारण्यांच्या स्वरूपात निकाल सादर करणे हे ऑपरेशन्सचा एक संच आहे.

सामग्री प्रक्रियेच्या स्वरूपानुसार, सारांश विकेंद्रित, केंद्रीकृत केला जाऊ शकतो - असा सारांश एक-वेळच्या सांख्यिकीय निरीक्षणासह केला जातो.

गटबद्ध करणे - अभ्यास केलेल्या लोकसंख्येच्या एककांच्या संचाचे विशिष्ट वैशिष्ट्यांनुसार गटांमध्ये विभागणे.

§5. सांख्यिकीय गटांचे प्रकार

रचना आणि सामग्रीनुसार गटांचे वर्गीकरण केले जाऊ शकते.

विश्लेषणात्मक गटबाजी वैशिष्ट्यांमधील संबंध दर्शवते, ज्यापैकी एक घटक असतो आणि दुसरा उत्पादक असतो.

शिक्षण

अपूर्ण उच्च

§6. सांख्यिकी सारण्या

सारांश आणि ग्रुपिंगचे परिणाम अशा प्रकारे सादर केले पाहिजेत की ते वापरता येतील.

डेटा सादर करण्याचे 3 मार्ग आहेत:

  1. डेटा मजकूरात समाविष्ट केला जाऊ शकतो.
  2. सारण्यांमध्ये सादरीकरण.
  3. ग्राफिक मार्ग

सांख्यिकी सारणी - पंक्ती आणि स्तंभांची एक प्रणाली ज्यामध्ये सामाजिक-आर्थिक घटनांवरील सांख्यिकीय माहिती एका विशिष्ट क्रमाने सादर केली जाते.

सारणीचा विषय आणि प्रेडिकेटमध्ये फरक करा.

विषय हा अंकांद्वारे वैशिष्ट्यीकृत ऑब्जेक्ट आहे, सहसा विषय टेबलच्या डाव्या बाजूला दिलेला असतो.

प्रेडिकेट ही निर्देशकांची एक प्रणाली आहे ज्याद्वारे ऑब्जेक्टची वैशिष्ट्ये दर्शविली जातात.

सांख्यिकीय सारणीमध्ये 3 प्रकारचे शीर्षलेख आहेत: सामान्य, बाजू

सामान्य शीर्षकाने संपूर्ण सारणीची सामग्री प्रतिबिंबित केली पाहिजे, मध्यभागी टेबलच्या वर स्थित आहे.

टेबल नियम.

  1. शब्द संक्षेपाशिवाय सर्व तीन प्रकारची शीर्षके आवश्यक आहेत, मापनाची सामान्य एकके शीर्षकामध्ये ठेवली जाऊ शकतात.
  2. टेबलमध्ये अतिरिक्त रेषा नसाव्यात, उभ्या खुणा गहाळ असू शकतात.
  3. अंतिम ओळ आवश्यक आहे. हे एकतर दस्तऐवजाच्या सुरूवातीस किंवा शेवटी असू शकते. जर दस्तऐवजाच्या सुरुवातीला असेल तर शेवटी असेल तर TOTAL:
  1. एका स्तंभातील डिजिटल डेटा एका अंश अचूकतेसह रेकॉर्ड केला जातो. अंक अंकांच्या खाली काटेकोरपणे लिहिलेले आहेत, संपूर्ण भाग स्वल्पविरामाने विभक्त केला आहे.
  2. टेबलमध्ये रिक्त सेल नसावेत, जर डेटा नसेल तर ते "माहिती नाही" किंवा "..." लिहितात, जर डेटा शून्य असेल तर "-". जर मूल्य शून्याच्या बरोबरीचे नसेल परंतु निर्दिष्ट अचूकता 0.01®0.0 नंतर पहिला महत्त्वाचा अंक दिसतो - जर स्वीकृत अचूकता दहाव्या भागापर्यंत असेल.
  3. जर टेबलमध्ये अनेक स्तंभ असतील, तर विषयाचे स्तंभ कॅपिटल अक्षरांनी आणि प्रेडिकेटचे स्तंभ संख्यांद्वारे सूचित केले जातात.
  4. जर टेबल उधार घेतलेल्या डेटावर आधारित असेल, तर डेटाचा स्रोत टेबलच्या खाली दर्शविला जातो; आवश्यक असल्यास, टेबल नोट्ससह असू शकते.

§7. सांख्यिकी आलेख

सांख्यिकी सारण्यांना आलेखांसह पूरक केले जाऊ शकते.

सांख्यिकीय आलेख म्हणजे संख्यात्मक मूल्यांच्या सशर्त प्रतिमा आणि रेषा, भूमितीय आकार, रेखाचित्रे यांच्याद्वारे त्यांचे गुणोत्तर.

ग्राफिक प्रतिमेचे फायदे

  1. स्पष्टपणे, स्पष्टपणे, स्पष्टपणे.
  2. निर्देशक बदलण्याची मर्यादा, बदलाचा तुलनात्मक दर आणि अस्थिरता त्वरित दृश्यमान आहे

ग्राफिक प्रतिमेचे तोटे

  1. सारणीपेक्षा कमी डेटा समाविष्ट करा.
  2. आलेख गोलाकार डेटा, सामान्य परिस्थिती दाखवतो, परंतु तपशील नाही.

सांख्यिकी आलेख

आकृत्या

कुरळे

विषय 3: सांख्यिकीय निर्देशक.

एक सांख्यिकीय निर्देशकाचे सार आणि अर्थ, त्याचे गुणधर्म.

§2. सांख्यिकीय निर्देशकांचे वर्गीकरण.

§3. सापेक्ष निर्देशकांचे प्रकार. बांधकाम तत्त्वे.

§ चार. सांख्यिकीय निर्देशक प्रणाली.

सांख्यिकीय चिन्ह ही ESS मध्ये अंतर्भूत असलेली एक मालमत्ता आहे, ती वस्तुनिष्ठपणे अस्तित्वात आहे की त्याचा विज्ञान म्हणून अभ्यास केला जातो किंवा नाही.

सांख्यिकीय निर्देशक हे लोकसंख्येच्या काही मालमत्तेचे सामान्यीकरण वैशिष्ट्य आहे.

सांख्यिकीय निर्देशकाची रचना (त्याचे गुणधर्म):

  • सरासरी मूल्ये
  • भिन्नता निर्देशक
  • वैशिष्ट्य कनेक्शन निर्देशक
  • वितरणाची रचना आणि स्वरूपाचे निर्देशक
  • डायनॅमिक निर्देशक
  • परिवर्तनशीलता निर्देशक
  • नमुना अंदाजांची अचूकता आणि विश्वासार्हतेचे निर्देशक
  • अंदाज अचूकता आणि विश्वसनीयता निर्देशक

प्रकारानुसार: युनिट्सची एकूण संख्या किंवा ऑब्जेक्टची एकूण मालमत्ता. ही प्राथमिक वैशिष्ट्यांची बेरीज आहे, तुकडे, kg, m, $, इ.

सापेक्ष सूचक- अवकाशातील निरपेक्ष किंवा सापेक्ष निर्देशकांची तुलना करून, वेळेत किंवा अभ्यासाधीन ऑब्जेक्टच्या विविध गुणधर्मांच्या निर्देशकांची तुलना करून मिळवले.

2 x निरपेक्ष निर्देशकांची तुलना करून 1ल्या क्रमाचा सापेक्ष निर्देशक प्राप्त केला जातो. 2रा ऑर्डर रिलेटिव्ह इंडिकेटर 1ली ऑर्डर रिलेटिव्ह इंडिकेटर इ.ची तुलना करून मिळवला जातो.

3रा क्रम आणि उच्च सापेक्ष निर्देशांक फार दुर्मिळ आहे.

डायरेक्ट इंडिकेटर - असे निर्देशक, ज्याचे मूल्य अभ्यासाधीन घटनेच्या वाढीसह वाढते.

व्यस्त सूचक - निर्देशक ज्यांचे मूल्य अभ्यासाधीन घटनेच्या वाढीसह कमी होते.

… संरचना

…वक्ते

…नाते

… तीव्रता

…मानकांशी संबंध

... तुलना

रचना निर्देशकसंपूर्ण भागाशी संबंधित करून मिळवले जातात.

गतिशीलतेचे सापेक्ष संकेतक

ü गतिशीलतेचे निर्देशक (वाढीचा दर, वाढ)

ü निर्देशांक

नातेसंबंध निर्देशकवैशिष्ट्यांमधील संबंध दर्शवा:

ü सहसंबंध गुणांक

ü विश्लेषणात्मक निर्देशांक

तीव्रता निर्देशकवेगवेगळ्या आधारांवर दोन वस्तूंचे संबंध वैशिष्ट्यीकृत करा.

ü श्रम तीव्रता - उत्पादनाचे एक युनिट तयार करण्यासाठी लागणारा वेळ

ü उत्पादन - वेळेच्या प्रति युनिट उत्पादित उत्पादनांचे प्रमाण

आउटपुट \u003d 1 / श्रम तीव्रता

मानकांकडे वृत्तीचे सूचक- निर्देशकाच्या चिन्हाच्या वास्तविक मूल्यांचे प्रमाण मानक, नियोजित, इष्टतम.

तुलना निर्देशक -एकाच आधारावर वेगवेगळ्या वस्तूंची तुलना.

सांख्यिकीय निर्देशक तयार करण्यासाठी सामान्य तत्त्वे:

  1. आकडेवारी वस्तुनिष्ठपणे संबंधित आहेत.
  2. तुलना केलेले सूचक फक्त एका विशेषतामध्ये भिन्न असू शकतात; तुम्ही दोन किंवा अधिक गुणधर्मांद्वारे निर्देशकाची तुलना करू शकत नाही.
  3. निर्देशकाच्या मर्यादा जाणून घेणे आणि विचारात घेणे आवश्यक आहे.

ऑब्जेक्टच्या प्रत्येक वैशिष्ट्यासाठी, सांख्यिकीय निर्देशकांची एक प्रणाली आवश्यक आहे.

  1. संज्ञानात्मक कार्य - डेटा विश्लेषणावर आधारित
  2. प्रचार
  3. उत्तेजक कार्य

विषय 4: सरासरी

एक सरासरी संकल्पना

§2. सरासरीचे प्रकार

§3. अंकगणित सरासरी आणि त्याचे गुणधर्म

§ चार. हार्मोनिक मीन, भौमितिक माध्य, चतुर्भुज माध्य.

§5. बहुविविध सरासरी

सांख्यिकीय निर्देशकांचा सर्वात सामान्य प्रकार म्हणजे सरासरी.

सरासरीचा सर्वात महत्त्वाचा गुणधर्म असा आहे की ते अभ्यासाधीन लोकसंख्येच्या प्रत्येक युनिटमध्ये अंतर्भूत असलेले सामान्य प्रतिबिंबित करते, जरी लोकसंख्येच्या वैयक्तिक युनिट्सच्या गुणधर्माचे मूल्य एका दिशेने किंवा दुसर्या दिशेने चढ-उतार होऊ शकते.

सरासरीची वैशिष्ट्यपूर्णता थेट अभ्यास केलेल्या लोकसंख्येच्या एकसमानतेशी संबंधित आहे. एकसमान नसलेल्या लोकसंख्येच्या बाबतीत, ते गुणात्मक एकसंध गटांमध्ये विभागणे आणि प्रत्येक एकसंध गटासाठी प्रत्येकासाठी सरासरी मोजणे आवश्यक आहे.

तुम्ही सरासरी (ISS) त्याच्या तार्किक सूत्राच्या प्रारंभिक गुणोत्तराद्वारे सरासरी निर्धारित करू शकता.

स्ट्रक्चरल सरासरी

फॅशन - मो

मध्यक - मी

डायनॅमिक्सच्या मालिकेत, अंकगणित सरासरी आणि कालक्रमानुसार गणना केली जाते.

अंकगणित सरासरी वैशिष्ट्याचे असे सरासरी मूल्य असे म्हणतात ज्याच्या गणनेमध्ये वैशिष्ट्याचा एकूण खंड बदलत नाही.

उदाहरण: वजन.

बुध साधे अंकगणित

x i- वैशिष्ट्याचे वैयक्तिक मूल्य

n ही अभ्यास केलेल्या लोकसंख्येची एकूण संख्या आहे

cf अंकगणित भारित

गुणधर्म cf. अंकगणित

एखाद्या वैशिष्ट्याच्या वैयक्तिक मूल्यांच्या त्याच्या सरासरी मूल्यापासून विचलनाची बेरीज शून्य आहे

वैशिष्ट्याचे प्रत्येक वैयक्तिक मूल्य समान स्थिर संख्येने गुणाकार किंवा भागल्यास, सरासरी समान प्रमाणात वाढेल किंवा कमी होईल.

गुणधर्माच्या प्रत्येक वैयक्तिक मूल्यामध्ये एक आणि समान स्थिर संख्या जोडल्यास, त्याच संख्येनुसार सरासरी मूल्य बदलेल.

पुरावा

भारित सरासरीचे वजन f समान संख्येने गुणाकार किंवा भागल्यास, सरासरी बदलणार नाही.

विशेषताच्या वर्ग विचलनाची बेरीज इतर कोणत्याही संख्येपेक्षा कमी आहे.

इतर प्रकारचे सरासरी

मधला प्रकार

साधी सरासरी

सरासरी

हार्मोनिक

भौमितिक

चतुर्भुज

एका आधारावर गटबद्ध करणे खूप कठीण आहे आणि थोडी माहिती स्मृतीमध्ये राहते.

मल्टीव्हेरिएट मीन - अनेक वैशिष्ट्यांसाठी सरासरी मूल्य E.S.S.

E.S साठी वैशिष्ट्य मूल्यांच्या गुणोत्तरांमधून या वैशिष्ट्यांच्या सरासरी मूल्यांपर्यंत.

साठी मल्टीव्हेरिएट सरासरी मी युनिट्स

x ij- i युनिटसाठी j वैशिष्ट्याचे मूल्य

वैशिष्ट्याचे सरासरी मूल्य j

k ही वैशिष्ट्यांची संख्या आहे

j ही वैशिष्ट्याची संख्या आणि त्याच्या लोकसंख्येची संख्या आहे

विषय 5: फरकांचे विश्लेषण

एक चिन्हे आणि त्याची कारणे भिन्नता

§2. वितरण रँक

§3. भिन्नता मालिकेची संरचनात्मक वैशिष्ट्ये.

§ चार. भिन्नता निर्देशकांची शक्ती.

§5. भिन्नता तीव्रता निर्देशक

§6. पसरण्याचे प्रकार. भिन्नता जोडण्याचे नियम.

लोकसंख्येतील वैशिष्ट्याच्या मूल्यातील फरक म्हणजे त्याच कालावधीत किंवा वेळेत दिलेल्या लोकसंख्येच्या विविध युनिट्समधील मूल्यांमधील फरक.

भिन्नतेचे कारण: ESS च्या अस्तित्वासाठी भिन्न परिस्थिती, ही भिन्नता आहे जी सांख्यिकीसारख्या विज्ञानाची आवश्यकता निर्माण करते.

व्हेरिएशनल विश्लेषणाची सुरुवात व्हेरिएशनल सिरीजच्या निर्मितीपासून होते - वाढत्या किंवा कमी होत असलेल्या चिन्हांनुसार लोकसंख्या युनिट्सचे क्रमबद्ध वितरण आणि संबंधित फ्रिक्वेन्सी मोजणे.

वितरण रँक

ü रँक

ü स्वतंत्र

ü मध्यांतर

श्रेणीबद्ध भिन्नता मालिका- वैयक्तिक युनिट्सची यादी. रँक केलेल्या वैशिष्ट्याच्या चढत्या उतरत्या क्रमाने एकत्रित

भिन्न भिन्नता मालिका - 2 पंक्तींचा समावेश असलेली सारणी - व्हेरिएबल वैशिष्ट्याची पॉलिमर मूल्ये आणि दिलेल्या वैशिष्ट्य मूल्यासह युनिट्सची संख्या.

खालील प्रकरणांमध्ये मध्यांतर भिन्नता मालिका तयार केली जाते:

  1. वैशिष्ट्य स्वतंत्र मूल्ये घेते, परंतु त्यांची संख्या खूप मोठी आहे
  2. विशेषता विशिष्ट श्रेणीमध्ये कोणतेही मूल्य घेते

इंटरव्हल व्हेरिएशन सिरीज तयार करताना, स्टर्जेस फॉर्म्युला वापरून इष्टतम गटांची संख्या, सर्वात सामान्य पद्धत निवडणे आवश्यक आहे.

k - मध्यांतरांची संख्या

n हे लोकसंख्येचे प्रमाण आहे

गणनेमध्ये, अपूर्णांक मूल्ये जवळजवळ नेहमीच प्राप्त केली जातात, पूर्णांकापर्यंत पूर्ण केली जातात.

अंतराल लांबी - l

मध्यांतर प्रकार

त्यानंतरच्या मध्यांतराची खालची मर्यादा त्यानंतरच्या मध्यांतराच्या वरच्या मर्यादेची पुनरावृत्ती करते

खुले मध्यांतर, एका चौकारासह मध्यांतर

इंटरव्हल व्हेरिएशन सिरीजची गणना करताना, इंटरव्हलचा मधला भाग x i म्हणून घेतला जातो.

NME =60 मध्यक = 1

Cumulate - पेक्षा कमी वितरण

Ogiva - पेक्षा जास्त वितरण

मध्यक हे वैशिष्ट्याचे मूल्य आहे जे संपूर्ण लोकसंख्येला दोन समान भागांमध्ये विभाजित करते.

एका भिन्न भिन्नता मालिकेसाठी, मध्यकाची गणना: जर n सम असेल, तर क्र. मध्य एकक

अंतराल भिन्नता मालिका:

k - मध्यांतरांची संख्या

x 0 - मध्यांतराची खालची मर्यादा

lमध्यांतराची लांबी आहे

फ्रिक्वेन्सीची बेरीज

मध्यकाच्या आधीच्या मध्यांतराची संचयी वारंवारता.

मध्यांतर वारंवारता

मध्यांतर– प्रथम अंतराल ज्याची संचित वारंवारता फ्रिक्वेन्सीच्या एकूण योगाच्या निम्म्यापेक्षा जास्त आहे.

ग्राफिकदृष्ट्या, मध्यक कम्युलेटवर आहे.

  1. चतुर्थांश - लोकसंख्येला 4 समान भागांमध्ये विभाजित करणाऱ्या गुणधर्माचे मूल्य.

1ला चतुर्थांश

3रा चतुर्थांश

2रा चतुर्थक - मध्यक.

x प्र 1 x Q 3 - 1ला आणि 3रा चतुर्थांश असलेल्या मध्यांतराची खालची मर्यादा.

l - मध्यांतर लांबी

आणि - 1ले आणि 3रे चतुर्थांश असलेल्या मागील मध्यांतरांच्या मध्यांतरांची संचित फ्रिक्वेन्सी.

चतुर्थक मध्यांतरांची वारंवारता.

भिन्नता मालिका वैशिष्ट्यीकृत करण्यासाठी, खालील वापरले जातात:

Deciles - लोकसंख्येला 10 समान भागांमध्ये विभाजित करा, Percitiles - लोकसंख्येला 100 समान भागांमध्ये विभाजित करा.

  1. मोड हे वारंवार येणारे वैशिष्ट्य वैशिष्ट्य आहे. वेगळ्या भिन्नता मालिकेसाठी - सर्वोच्च वारंवारता. मध्यांतर भिन्नता मालिकेसाठी, मोड खालील सूत्र वापरून मोजला जातो:

मोडल मध्यांतराची खालची सीमा

l- मोडल अंतराल लांबी

fMo-मोडल अंतराल वारंवारता

f Mo +1 ही मोडल नंतरच्या मध्यांतराची वारंवारता आहे

मोडल मध्यांतर - सर्वोच्च वारंवारतेसह मध्यांतर.ग्राफिकदृष्ट्या, मोड हिस्टोग्रामवर आढळतो.

  1. स्पॅन भिन्नता
  2. सरासरी रेखीय विचलन

भारित

  1. फैलाव:

भारित

  1. प्रमाणित विचलन

फैलाव मालमत्ता.

  1. वैशिष्ट्याच्या सर्व मूल्यांमध्ये समान रक्कम कमी केल्याने भिन्नतेचे मूल्य बदलत नाही.
  2. सर्व वैशिष्ट्य मूल्ये k वेळा कमी केल्याने भिन्नता कमी होते ते 2वेळा, आणि RMS मध्ये करण्यासाठीएकदा
  3. जर तुम्ही अंकगणित सरासरीपेक्षा भिन्न असलेल्या कोणत्याही मूल्यातील विचलनांचा सरासरी वर्ग काढला, तर तो नेहमी अंकगणितीय सरासरीवरून काढलेल्या विचलनाच्या सरासरी वर्गापेक्षा मोठा असेल. अशाप्रकारे, सरासरी पासून नेहमी इतर कोणत्याही मूल्याच्या गणनापेक्षा कमी असते, म्हणजे. त्यात किमान मालमत्ता आहे. RMS = 1.25 - सामान्यच्या जवळ वितरणासह.

सामान्य वितरणाच्या परिस्थितीत, 68.3% निरीक्षणांमधील निरीक्षणे आणि संख्या यांच्यात खालील संबंध आहेत.

95.4% निरीक्षणे मर्यादेत आहेत

९९.७% निरीक्षणे मर्यादेत आहेत

वेगवेगळ्या लोकसंख्येतील वैशिष्ट्यांच्या भिन्नतेची तुलना करण्यासाठी किंवा समान लोकसंख्येतील भिन्न वैशिष्ट्यांच्या भिन्नतेची तुलना करण्यासाठी, सापेक्ष निर्देशक वापरले जातात, आधार म्हणजे अंकगणितीय सरासरी.

  1. भिन्नतेची सापेक्ष श्रेणी.
  2. सापेक्ष रेखीय विचलन
  3. भिन्नतेचे गुणांक

हे संकेतक केवळ तुलनात्मक मूल्यांकनच देत नाहीत तर लोकसंख्येची एकसंधता देखील देतात. जर भिन्नतेचे गुणांक 33% पेक्षा जास्त नसेल तर संच एकसंध मानला जातो.

संपूर्ण लोकसंख्येतील वैशिष्ट्याच्या भिन्नतेच्या अभ्यासाबरोबरच, गुणवत्तेतील परिमाणवाचक बदलांचा मागोवा घेणे अनेकदा आवश्यक असते, परंतु लोकसंख्या ज्या गटांमध्ये विभागली गेली आहे आणि त्यांच्या दरम्यान. वेगवेगळ्या दृश्यांची गणना करून हे साध्य केले जाते.

पसरण्याचे प्रकार:

  1. एकूण भिन्नता
  2. आंतरसमूह भिन्नता
  3. गटातील भिन्नता (अवशिष्ट)

1. या फरकाला कारणीभूत असलेल्या सर्व घटकांच्या प्रभावाखाली संपूर्ण लोकसंख्येतील वैशिष्ट्यातील फरक मोजतो

उदाहरण:दही वापर: 100 लोकांच्या नमुन्यावर आधारित

सामाजिक दर्जा

x i -विशेषतेचे वैयक्तिक मूल्य

संपूर्ण लोकसंख्येवरील वैशिष्ट्याचे सरासरी मूल्य

या वैशिष्ट्याची वारंवारता.

  1. 2. समूहाच्या अंतर्निहित घटकाच्या वैशिष्ट्याच्या प्रभावाखाली वैशिष्ट्यातील भिन्नता दर्शवते.

गट सरासरी

एकूण गट सरासरी

गटानुसार वारंवारता

  1. 3. गटात समाविष्ट नसलेल्या घटकांच्या प्रभावाखाली असलेल्या वैशिष्ट्यातील भिन्नता दर्शवते

x iji j गटातील मूल्य वैशिष्ट्य

मधील वैशिष्ट्याचे सरासरी मूल्य jगट

f ij - वारंवारतामध्ये i-th वैशिष्ट्यj गट

एक नियम आहे जो 3 प्रकारच्या भिन्नतेला जोडतो, त्याला विचरण जोड नियम म्हणतात.

द्वारे अवशिष्ट फैलाव jगट

ओव्हर फ्रिक्वेन्सीची बेरीज jगट

nफ्रिक्वेन्सीची एकूण बेरीज आहे

व्हेरिएशनल सिरीजच्या विश्लेषणाचे मुख्य कार्य म्हणजे वारंवारता वितरणाचे नमुने ओळखणे.

वितरण वक्र हे वैशिष्ट्याच्या मूल्यामध्ये कार्यात्मकपणे संबंधित बदलामध्ये भिन्नता मालिकेतील वारंवारता बदलाच्या सतत रेषेच्या स्वरूपात एक ग्राफिक प्रतिनिधित्व आहे.

बहुभुज आणि हिस्टोग्राम वापरून वितरण वक्र प्लॉट केले जाऊ शकते. प्रायोगिक वितरणास सैद्धांतिक, चांगल्या-अभ्यास केलेल्या स्वरूपांपैकी एकापर्यंत कमी करण्याचा सल्ला दिला जातो.

सामान्य वितरणाचा वक्र.

खालील प्रकारचे वितरण वक्र आहेत:

  1. एकरूप
  2. अनेक शिरोबिंदू

एकसंध लोकसंख्या सिंगल-व्हर्टेक्स वक्र द्वारे दर्शविले जाते, एक बहु-शिरोबिंदू वक्र लोकसंख्येची विषमता आणि पुनर्रचनाची आवश्यकता दर्शवते.

वितरणाचे सामान्य स्वरूप शोधण्यात त्याच्या एकजिनसीपणाचे मूल्यांकन आणि स्क्युनेस आणि कर्टोसिसची गणना समाविष्ट आहे. सममितीय वितरणासाठी

विविध वितरणांच्या विषमतेच्या तुलनात्मक अभ्यासासाठी, असममितीचा गुणांक As ची गणना केली जाते.

तिसऱ्या ऑर्डरचा मध्यवर्ती क्षण; - आरएमएस घन;

जर, असममितता लक्षणीय आहे

जर म्हणून<0, то As – левосторонняя, если As>0, नंतर जसे उजव्या हाताने आहे.

जर, तर As नगण्य आहे. सममितीय आणि मध्यम असममित साठी, कर्टोसिस निर्देशकाची गणना केली जाते: जर E k > 0 असेल, तर वितरण शिखरावर असेल, जर E k असेल तर<0, то распределение плосковершинное.

पर्यायी वैशिष्ट्याची भिन्नता परिमाणात्मकपणे खालीलप्रमाणे प्रकट केली आहे.

0 - ज्या युनिट्समध्ये हे वैशिष्ट्य नाही;

1 - या वैशिष्ट्यासह युनिट्स;

आर- या वैशिष्ट्यासह युनिट्सचे प्रमाण;

q- हे वैशिष्ट्य नसलेल्या युनिट्सचे प्रमाण;

नंतर p+q=1.

वैकल्पिक वैशिष्ट्य 2 मूल्ये 0 आणि 1 वजनांसह घेते pआणि q

थेट चिन्हे- ही चिन्हे आहेत, ज्याचे मूल्य अभ्यासाधीन घटनेच्या वाढीसह वाढते.

उलट चिन्हे -चिन्हे, ज्याची परिमाण अभ्यासाधीन घटनेच्या वाढीसह कमी होते.

पिढी (थेट)

श्रम तीव्रता (उलट)

शेअरची कमाल भिन्नता 0.25 आहे.

विषय 6: मॉडेलिंग वितरण मालिका.

एक वास्तविक आणि सैद्धांतिक वितरण

§2. सामान्य वितरणाचा वक्र.

§3. सामान्य वितरणाच्या गृहीतकाची चाचणी करणे.

§ चार. संमती निकष: पीअरसन, रोमानोव्स्की, कोल्मोगोरोव.

§5. मॉडेलिंग वितरण मालिकेचे व्यावहारिक मूल्य.

एक वास्तविक आणि सैद्धांतिक वितरण

वितरण मालिकेचा अभ्यास करण्याचे सर्वात महत्त्वाचे उद्दिष्ट म्हणजे वितरणाचा नमुना उघड करणे आणि त्याचे स्वरूप निश्चित करणे. वितरण नमुने केवळ मोठ्या संख्येने निरीक्षणांसह स्पष्टपणे प्रकट होतात.

वितरण वक्र वापरून वास्तविक वितरण ग्राफिक पद्धतीने चित्रित केले जाऊ शकते - बदलाशी संबंधित कार्यात्मक रीतीने व्हेरिएंटच्या भिन्नता मालिकेतील वारंवारता बदलाची सतत रेषा म्हणून ग्राफिकरित्या चित्रित केले जाते.

सैद्धांतिक वितरण वक्र हा या प्रकारच्या वितरणाचा वक्र म्हणून सामान्य शब्दात समजला जातो जो नियमिततेसाठी यादृच्छिक घटकांचा प्रभाव वगळतो.

सैद्धांतिक वितरण विश्लेषणात्मक सूत्राद्वारे व्यक्त केले जाऊ शकते ज्याला विश्लेषणात्मक सूत्र म्हणतात. सर्वात सामान्य म्हणजे सामान्य वितरण.

§2. सामान्य वितरणाचा वक्र.

सामान्य वितरण कायदा:

y हा सामान्य वितरणाचा क्रम आहे

t हे सामान्यीकृत विचलन आहे.

; e=2.7218; x i -भिन्नता मालिका पर्याय; - सरासरी;

गुणधर्म:

सामान्य वितरण कार्य सम आहे, म्हणजे. f(t)=f(-t), . सामान्य वितरण कार्य पूर्णपणे मानक विचलनाद्वारे निर्धारित केले जाते.

§3. सामान्य वितरणाच्या गृहीतकाची चाचणी करणे.

वितरणाच्या कायद्याचा वारंवार संदर्भ देण्याचे कारण असे आहे की अनेक यादृच्छिक कारणांच्या क्रियेमुळे निर्माण होणारे अवलंबित्व, त्यापैकी कोणतेही प्रमुख नाही. जर Mo = Me ची गणना व्हेरिएशनल मालिकेत केली असेल, तर हे सामान्य वितरणाशी जवळीक दर्शवू शकते. सामान्य कायद्याचे पालन करण्याची सर्वात अचूक चाचणी विशेष निकष वापरून केली जाते.

§ चार. संमती निकष: पीअरसन, रोमानोव्स्की, कोल्मोगोरोव.

पिअर्सनचा निकष.

सैद्धांतिक वारंवारता

अनुभवजन्य वारंवारता

सैद्धांतिक फ्रिक्वेन्सीची गणना करण्याची पद्धत.

  1. अंकगणित सरासरी निर्धारित केली जाते आणि मध्यांतर भिन्नता मालिकेनुसार, प्रत्येक मध्यांतरासाठी t ची गणना केली जाते.
  2. आम्हाला सामान्यीकृत वितरण कायद्यासाठी संभाव्यतेच्या घनतेचे मूल्य आढळते. पृष्ठ ४९
  3. आम्ही सैद्धांतिक वारंवारता शोधू.

l - मध्यांतर लांबी

- अनुभवजन्य फ्रिक्वेन्सीची बेरीज

- संभाव्यता घनता

पूर्णांकापर्यंत मूल्य पूर्ण करा

  1. पिअर्सनचे गुणोत्तर गणना
  2. टेबल मूल्य

d.f - मध्यांतरांची संख्या - 3

d.f स्वातंत्र्याच्या अंशांची संख्या आहे.

  1. जर > , तर वितरण सामान्य नाही, म्हणजे सामान्य वितरणाची परिकल्पना रद्द केली आहे. जर ए< , то распределение является нормальным.

रोमानोव्स्की निकष.

पिअर्सनचा निकष मोजला जातो;

अंशांची संख्या.

सह तर<3, то распределение близко к нормальному.

कोल्मोगोरोव्हचा निकष

, डी-संचित अनुभवजन्य आणि सैद्धांतिक फ्रिक्वेन्सींमधील कमाल मूल्य. कोल्मोगोरोव्ह वापरण्यासाठी एक आवश्यक अट: निरीक्षणांची संख्या 100 पेक्षा जास्त आहे. एका विशेष संभाव्यता सारणीनुसार, ज्याद्वारे असे तर्क केले जाऊ शकतात की हे वितरण सामान्य आहे.

§5. मॉडेलिंग वितरण मालिकेचे व्यावहारिक मूल्य.

  1. अनुभवजन्य वितरणासाठी सामान्य वितरणाचे नियम लागू करण्याची क्षमता.
  2. 3 x सिग्मा नियम वापरण्याची क्षमता.
  3. लोकसंख्येचे परीक्षण करून, वितरण सामान्य आहे हे जाणून अतिरिक्त वेळ घेणारी आणि खर्चिक गणना टाळण्याची क्षमता.

विषय 7: निवडक निरीक्षण.

एक निवडक निरीक्षणाची संकल्पना. त्याच्या वापरासाठी कारणे.

§2. निवडक निरीक्षणाचे प्रकार.

§3. नमुना त्रुटी.

§ चार. नमुना निरीक्षण कार्ये

§5. सामान्य लोकसंख्येसाठी नमुना निरीक्षण डेटाचे वितरण.

§6. लहान नमुना.

एक निवडक निरीक्षणाची संकल्पना. त्याच्या वापरासाठी कारणे.

निवडक निरीक्षण - असे निरंतर निरीक्षण, ज्यामध्ये अभ्यास केलेल्या लोकसंख्येची एकके, विशिष्ट प्रकारे निवडलेली, सांख्यिकीय तपासणी केली जाते.

नमुना निरीक्षणाचा उद्देश (कार्य): तपासलेल्या भागासाठी, संख्याशास्त्रीय निरीक्षणाच्या सर्व नियम आणि तत्त्वांच्या अधीन असलेल्या युनिट्सच्या संपूर्ण लोकसंख्येचे वैशिष्ट्यीकृत करणे.

निवडक निरीक्षण वापरण्याची कारणे:

  1. साहित्य, श्रम खर्च आणि वेळेची बचत;
  2. सांख्यिकीय लोकसंख्येच्या वैयक्तिक युनिट्स आणि त्यांच्या गटांचा अधिक तपशीलवार आणि तपशीलवार अभ्यास करण्याची संधी.
  3. काही विशिष्ट समस्या केवळ निवडक निरीक्षणाच्या वापराने सोडवल्या जाऊ शकतात.
  4. सक्षम आणि सुव्यवस्थित निवडक निरीक्षण परिणामांची उच्च अचूकता देते.

सामान्य लोकसंख्या म्हणजे एककांचा संच ज्यामधून निवड केली जाते.

सॅम्पलिंग फ्रेम म्हणजे सर्वेक्षणासाठी निवडलेल्या युनिट्सचा संच. आकडेवारीमध्ये, सामान्य लोकसंख्या आणि नमुना लोकसंख्येच्या पॅरामीटर्समध्ये फरक करण्याची प्रथा आहे.

सॅम्पलिंगचे प्रकार

निवड पद्धतीनुसार:

वारंवार

नमुन्यात समाविष्ट केलेले युनिट, निरीक्षण केलेल्या वैशिष्ट्यांच्या नोंदणीनंतर, पुढील निवड प्रक्रियेत सहभागी होण्यासाठी सामान्य लोकांकडे परत केले जाते.

सामान्य लोकसंख्येचे प्रमाण अपरिवर्तित राहते, ज्यामुळे कोणत्याही युनिटच्या नमुन्यात सतत फटका बसतो.

पुनरावृत्ती न होणारी

ज्या लोकसंख्येमधून निवड केली जाते त्या लोकसंख्येला नमुना युनिट परत केले जात नाही.

निवड पद्धत:

वास्तविक - यादृच्छिक कोणत्याही सुसंगततेच्या घटकांशिवाय यादृच्छिकपणे किंवा यादृच्छिकपणे सामान्य लोकसंख्येच्या युनिट्सच्या संबंधात आहे. तथापि, असा नमुना घेण्यापूर्वी, एखाद्याने हे सुनिश्चित केले पाहिजे की सामान्य लोकसंख्येच्या सर्व घटकांना नमुन्यात समाविष्ट होण्याची समान संधी आहे, म्हणजे. सांख्यिकीय लोकसंख्येच्या एककांच्या संपूर्ण यादीमध्ये वैयक्तिक एककांची कोणतीही चूक किंवा अज्ञान नाही. सामान्य लोकसंख्येच्या सीमा स्पष्टपणे स्थापित करणे देखील आवश्यक आहे. तांत्रिकदृष्ट्या स्थापित केलेली निवड चिठ्ठ्या काढून किंवा यादृच्छिक संख्यांच्या सारणीचा वापर करून केली जाते.

यांत्रिक नमुने (यादीतील प्रत्येक 5) अशा प्रकरणांमध्ये वापरले जाते जेथे सामान्य लोकसंख्येला कसा तरी आदेश दिला जातो, उदा. युनिट्सच्या वितरणामध्ये एक विशिष्ट क्रम असतो. यांत्रिक सॅम्पलिंग आयोजित करताना, निवडीचे प्रमाण स्थापित केले जाते, जे सामान्य लोकसंख्या आणि नमुना लोकसंख्येच्या गुणोत्तराने स्थापित केले जाते.

यांत्रिक सॅम्पलिंगमध्ये त्रुटीचा धोका या कारणांमुळे दिसू शकतो: निवडलेल्या मध्यांतराचा यादृच्छिक योगायोग आणि सामान्य लोकसंख्येच्या युनिट्सच्या व्यवस्थेमध्ये चक्रीय नमुने.

झोन केलेले सॅम्पलिंग जेव्हा सामान्य लोकसंख्येच्या सर्व एककांना काही गुणधर्मांनुसार गटांमध्ये (प्रदेश, देश) विभागले जाऊ शकते तेव्हा वापरले जाते.

एकत्रित नमुना.

युनिट्सची निवड केली जाऊ शकते:

  1. किंवा गटाच्या आकाराच्या प्रमाणात
  2. किंवा वैशिष्ट्याच्या आंतरगट भिन्नतेच्या प्रमाणात
  3. , जेथे n नमुन्याचा आकार आहे, N हा सामान्य लोकसंख्येचा आकार आहे, n iनमुन्याचा आकार i-गट, एन iखंड iनमुने
  4. - ही पद्धत अधिक अचूक आहे, परंतु सॅम्पलिंग दरम्यान, भिन्नतेबद्दल आगाऊ ठरवणे फार कठीण आहे. (निरीक्षण करण्यापूर्वी).

मालिका निवड.

जेव्हा ECCs लहान गटांमध्ये (मालिका) एकत्र केले जातात, उदाहरणार्थ, तयार उत्पादनांसह पॅकेजिंग, विद्यार्थी गट. सीरियल सॅम्पलिंगचा सार असा आहे की मालिका एकतर यादृच्छिक किंवा यांत्रिक पद्धतीने निवडल्या जातात आणि नंतर निवडलेल्या मालिकेमध्ये सतत सर्वेक्षण केले जाते.

एकत्रित निवड.

हे वर चर्चा केलेल्या निवड पद्धतींचे संयोजन आहे, अधिक वेळा ठराविक आणि क्रमिक मालिकेचे संयोजन वापरले जाते, म्हणजे. अनेक विशिष्ट गटांमधून मालिकांची निवड.

निवड मल्टी-स्टेज आणि सिंगल-स्टेज, पॉली-फ्रेज आणि सिंगल-फ्रेज देखील असू शकते.

मल्टी-स्टेज निवड: सामान्य लोकसंख्येमधून, प्रथम, मोठे गट काढले जातात, नंतर लहान गट आणि असेच सर्वेक्षणाच्या अधीन असलेल्या युनिट्सची निवड होईपर्यंत.

बहु-वाक्यांश निवड: त्याच्या अंमलबजावणीच्या सर्व टप्प्यांवर निवडीच्या समान युनिटचे जतन करणे समाविष्ट आहे. त्याच वेळी, प्रत्येक त्यानंतरच्या टप्प्यावर निवडलेल्या निवड युनिट्स परीक्षेच्या अधीन आहेत, ज्याचा कार्यक्रम विस्तारत आहे (उदाहरण: संपूर्ण संस्थेचे विद्यार्थी, नंतर काही विद्याशाखांचे विद्यार्थी).

§3. नमुना त्रुटी.

पद्धतशीर

प्रातिनिधिकता त्रुटी केवळ निवडक निरीक्षणामध्ये आढळतात. नमुना लोकसंख्या सामान्य लोकसंख्येचे अचूक पुनरुत्पादन करू शकत नाही या वस्तुस्थितीमुळे उद्भवू शकते. ते टाळले जाऊ शकत नाहीत, परंतु ते अंदाज लावणे सोपे आहे आणि आवश्यक असल्यास, ते कमी केले जाऊ शकतात.

सॅम्पलिंग एरर म्हणजे सामान्य लोकसंख्येमधील पॅरामीटरचे मूल्य आणि नमुना निरीक्षणाच्या परिणामांवरून मोजलेले मूल्य यांच्यातील फरक. Dх=-m+ , Dх – नमुन्यातील किरकोळ त्रुटी, m – सामान्य सरासरी; - नमुना सरासरी.

मार्जिनल सॅम्पलिंग एरर हे यादृच्छिक मूल्य आहे. चेबीशेव्हची कामे यादृच्छिक सॅम्पलिंग त्रुटींच्या नमुन्यांच्या अभ्यासासाठी समर्पित आहेत. चेबीशेव्हचे प्रमेय हे सिद्ध करते की Dx पेक्षा जास्त नाही: - सरासरी नमुना त्रुटी. t-विश्वास गुणांक या त्रुटीची संभाव्यता दर्शवितो. pp 42-43.

ज्ञात F(t) वरून t निर्धारित करणे आवश्यक असताना, आम्ही सर्वात जवळचा मोठा F(t) घेतो आणि त्यावरून t निर्धारित करतो.

त्रुटी अपूर्णांक मर्यादित करा

पी - शेअर.

जर निवड न-पुनरावृत्ती पद्धतीने केली गेली असेल, तर मर्यादा त्रुटी सूत्रे जोडली जातात

न-पुनरावृत्तीसाठी सुधारणा.

प्रत्येक प्रकारच्या नमुना निरीक्षणासाठी, सादर केलेली त्रुटी वेगळ्या पद्धतीने मोजली जाते:

  1. योग्य यादृच्छिक आणि यांत्रिक निरीक्षण;
  2. झोन केलेले पाळत ठेवणे
  3. अनुक्रमांक नमुना

r ही नमुन्यातील मालिकेची संख्या आहे;

आर ही सामान्य लोकसंख्येतील मालिकांची संख्या आहे;

आंतरसमूह प्रमाणातील भिन्नता.

§ चार. नमुना निरीक्षण कार्ये

खालील कार्यांसाठी वापरले जाते:

  1. n-? ज्ञात F(t), Dx वरून नमुना आकार निश्चित करण्यासाठी.
  2. ज्ञात F(t), n वरून Dx नमुन्याचे निर्धारण
  3. ज्ञात Dx आणि n वरून F(t) चे निर्धारण

1 कार्य n - ? प्रथम, पुनरावृत्ती न होणाऱ्या निवडीसाठी, n हे पुनर्निवड सूत्राद्वारे निर्धारित केले जाते:

भिन्नता निश्चित करण्याचे मार्गः

  1. हे मागील समान अभ्यासातून घेतले आहे.
  2. सामान्य वितरणासह RMS » भिन्नतेच्या श्रेणीच्या 1/6.
  3. जर वितरण स्पष्टपणे असममित असेल, तर RMS » 1/5 भिन्नतेच्या श्रेणीचे
  4. शेअरसाठी, जास्तीत जास्त संभाव्य फरक p(1-p)=0.25 लागू केला जातो
  5. n³100 सह, नंतर s 2 \u003d S 2 - नमुना भिन्नता

£३० n£100, नंतर s 2 \u003d S 2 (n / n-1), s 2 - सामान्य भिन्नता

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

n ची गणना करताना, एखाद्याने t चे मोठे मूल्य आणि लहान किरकोळ त्रुटींचा पाठपुरावा करू नये, कारण यामुळे n मध्ये वाढ होते आणि त्यामुळे खर्चात वाढ होते. खालील कायदा समान आहे.

§5. सामान्य लोकसंख्येसाठी नमुना निरीक्षण डेटाचे वितरण.

कोणत्याही व्हीएनचे अंतिम ध्येय सामान्य लोकसंख्येचे वैशिष्ट्य आहे.

व्हीएनच्या निकालांमधून गणना केलेली मूल्ये त्यांच्या किरकोळ त्रुटीची मर्यादा लक्षात घेऊन सामान्य लोकांमध्ये वितरीत केली जातात.

एका व्यक्तीने दर महिन्याला दह्याचे सेवन गृहीत धरा.

£250-20m£250+20; £230m£270

आणि फक्त 1000 लोक

£230,000m£270,000

48%-5%£p£48%+5%

§6. लहान नमुना.

आधुनिक परिस्थितीत सांख्यिकीय संशोधनाच्या सरावात, लहान नमुने हाताळणे वाढत्या प्रमाणात आवश्यक आहे.

छोटा नमुना - एककांची निरीक्षण नमुना संख्या 30, n £ 30 / पेक्षा जास्त नाही

लहान सॅम्पलिंगच्या सिद्धांताचा विकास इंग्रजी सांख्यिकीशास्त्रज्ञ गोसेट यांनी केला होता, ज्याने 1908 मध्ये विद्यार्थी या टोपणनावाने लिहिले होते.

त्याने हे सिद्ध केले की लहान नमुना आणि सामान्य नमुन्यातील विसंगतीचा अंदाज विशेष वितरण कायदा आहे. लहान नमुन्यासाठी गणना करताना, s 2 चे मूल्य मोजले जात नाही. संभाव्य त्रुटी मर्यादेसाठी विद्यार्थी निकष वापरा. पृष्ठे 44-45. विरुद्ध घटनेची संभाव्यता आहे.

स्वातंत्र्याच्या अंशांची संख्या

लहान नमुना त्रुटी मर्यादित करणे

किरकोळ शेअर त्रुटी

विषय 8: सहसंबंध-रिग्रेशन विश्लेषण आणि मॉडेलिंग.

एक सहसंबंध आणि CRA संकल्पना.

§2. KPA च्या वापरासाठी अटी आणि निर्बंध.

§3. किमान चौरस पद्धतीवर आधारित प्रतिगमन जोडणे.

§ चार. जोडलेल्या रेखीय प्रतिगमन समीकरणाचा वापर.

§5. कनेक्शनच्या घट्टपणाचे निर्देशक आणि कनेक्शनची ताकद.

§6. एकाधिक सहसंबंध.

एक सहसंबंध आणि CRA संकल्पना.

कार्यात्मक कनेक्शन y=5x

सहसंबंध

विविध घटना आणि त्यांचे चिन्ह, कार्यात्मक आणि सांख्यिकीय यांच्यात 2 प्रकारचे कनेक्शन आहेत.

अशा कनेक्शनला फंक्शनल असे म्हणतात जेव्हा, एका व्हेरिएबलच्या मूल्यातील बदलासह, दुसरे एक काटेकोरपणे परिभाषित मार्गाने बदलते, म्हणजे, एका व्हेरिएबलचे मूल्य दुसर्या व्हेरिएबलच्या एक किंवा अधिक अचूकपणे निर्दिष्ट केलेल्या मूल्यांशी संबंधित असते. . फंक्शनल कनेक्शन तेव्हाच शक्य आहे जेव्हा व्हेरिएबल y व्हेरिएबल x वर अवलंबून असेल आणि इतर कोणत्याही घटकांवर अवलंबून नाही, परंतु वास्तविक जीवनात हे अशक्य आहे.

एक सांख्यिकीय संबंध अस्तित्त्वात असतो जेव्हा, व्हेरिएबल्सपैकी एकाच्या मूल्यातील बदलासह, दुसरे कोणतेही मूल्य विशिष्ट मर्यादेत घेऊ शकते, परंतु त्याची सांख्यिकीय वैशिष्ट्ये विशिष्ट कायद्यानुसार बदलतात.

सांख्यिकीय संबंधाचे सर्वात महत्वाचे विशिष्ट प्रकरण म्हणजे परस्पर संबंध. परस्परसंबंधासह, एका व्हेरिएबलची भिन्न मूल्ये दुसर्‍या व्हेरिएबलच्या भिन्न सरासरी मूल्यांशी संबंधित असतात, उदा. गुण x च्या मूल्यात बदल करून, गुणधर्म y चे सरासरी मूल्य नैसर्गिक पद्धतीने बदलते.

सहसंबंध हा शब्द इंग्रजी जीवशास्त्रज्ञ आणि सांख्यिकीशास्त्रज्ञ फ्रान्सिस गॅल (सहसंबंध) यांनी सादर केला.

परस्परसंबंध वेगवेगळ्या प्रकारे उद्भवू शकतात:

  • कारक वैशिष्ट्याच्या भिन्नतेवर परिणामी वैशिष्ट्याच्या भिन्नतेचे कार्यकारण अवलंबन.
  • एकाच कारणाच्या 2 परिणामांमध्ये एक संबंध असू शकतो (आग, अग्निशामकांची संख्या, आगीचा आकार)
  • चिन्हांचा संबंध, ज्यापैकी प्रत्येक एकाच वेळी कारण आणि परिणाम दोन्ही आहे (कामगार उत्पादकता आणि पगार)

आकडेवारीमध्ये, खालील प्रकारच्या अवलंबनामध्ये फरक करण्याची प्रथा आहे:

  1. जोडीचा सहसंबंध - परिणामकारक आणि फलकांच्या 2 चिन्हांमधला संबंध, किंवा दोन गुणात्मक चिन्हांमधील संबंध.
  2. आंशिक सहसंबंध - प्रभावी आणि एक घटक गुणधर्म यांच्यातील संबंध दुसर्या घटक गुणधर्माच्या निश्चित मूल्यासह.
  3. एकाधिक सहसंबंध - अभ्यासात समाविष्ट केलेल्या दोन किंवा अधिक घटक वैशिष्ट्यांवर परिणामी वैशिष्ट्यांचे अवलंबन.

सहसंबंध विश्लेषणाचे कार्य वैशिष्ट्यांमधील नातेसंबंधाची जवळीक मोजणे आहे. 19व्या शतकाच्या उत्तरार्धात, गॅल्टन आणि पिअर्सन यांनी वडील आणि मुलांची उंची यांच्यातील संबंधांची तपासणी केली.

प्रतिगमन संबंधाच्या स्वरूपाचे परीक्षण करते. प्रतिगमन विश्लेषणाचे कार्य नातेसंबंधाची विश्लेषणात्मक अभिव्यक्ती निश्चित करणे आहे.

सामान्य संकल्पना म्हणून सहसंबंध-रिग्रेशन विश्लेषणामध्ये कनेक्शनच्या घट्टपणामध्ये बदल आणि कनेक्शनच्या विश्लेषणात्मक अभिव्यक्तीची स्थापना समाविष्ट असते.

§2. KPA च्या वापरासाठी अटी आणि निर्बंध.

  1. वस्तुमान डेटाची उपस्थिती, कारण सहसंबंध सांख्यिकीय आहे
  2. लोकसंख्येची गुणात्मक एकसंधता आवश्यक आहे.
  3. परिणामी आणि घटक वैशिष्ट्यांनुसार लोकसंख्येचे वितरण, सामान्य वितरण कायद्यानुसार, जे कमीत कमी वर्ग पद्धतीच्या वापराशी संबंधित आहे.

§3. किमान चौरस पद्धतीवर आधारित प्रतिगमन जोडणे.

रीग्रेशन विश्लेषणामध्ये संबंधांची विश्लेषणात्मक अभिव्यक्ती निश्चित करणे समाविष्ट आहे. फॉर्म रेखीय प्रतिगमन दरम्यान फरक करतो, जो सरळ रेषेच्या समीकरणाद्वारे व्यक्त केला जातो आणि नॉन-रेखीय प्रतिगमन किंवा.

संप्रेषणाच्या दिशेनुसार, ते सरळ रेषेत वेगळे केले जातात, म्हणजे. जसा x वाढतो, y वाढतो.

उलट

उलट म्हणजे. जसा x वाढतो, y कमी होतो.

  1. ग्राफिकल पद्धत - सहसंबंध फील्डवर प्रायोगिक डेटाचे प्लॉटिंग करून, परंतु कमीत कमी स्क्वेअर पद्धती वापरून अधिक अचूक अंदाज लावला जातो.

एक्स - वास्तविक चिन्ह

यू - प्रभावी चिन्ह

वास्तविक मूल्य आणि स्क्वेअर कपलिंग समीकरणाद्वारे मोजले जाणारे मूल्य यांच्यातील फरक कमीत कमी असणे आवश्यक आहे.

LSM min सह निवडलेल्या प्रतिगमन समीकरणानुसार प्राप्त केलेल्या सैद्धांतिक मूल्यांमधून प्रायोगिक मूल्यांच्या y च्या वर्ग विचलनाची बेरीज आहे.

रेखीय नातेसंबंधासाठी

Þ अ,b

पॅराबोला साठी

हायपरबोल साठी

पॅरामीटर्स a,b,c समीकरणामध्ये लिहिल्या जातात, नंतर आम्ही परिणामी समीकरणाला अनुभवजन्य मूल्यासह बदलतो x iआणि सैद्धांतिक मूल्य शोधा y मी .मग आम्ही तुलना करतो y iसैद्धांतिक आणि y iअनुभवजन्य त्यांच्यातील फरकाच्या वर्गांची बेरीज किमान असावी. आम्ही अवलंबनाचा प्रकार निवडतो ज्यामध्ये हे अवलंबन केले जाते.

जोडीनुसार रेखीय प्रतिगमन समीकरणात:

b हा जोडलेल्या रेखीय प्रतिगमनाचा गुणांक आहे,ते बाँडची ताकद मोजते, उदा. मापनाच्या प्रति स्वीकृत युनिटच्या सरासरी मूल्यापासून y च्या लोकसंख्येचे सरासरी विचलन दर्शवते.

b\u003d 20 जेव्हा x 1 चिन्ह y ने बदलते तेव्हा लोकसंख्येतील सरासरी मूल्य 20 ने विचलित होते.

प्रतिगमन गुणांकावरील सकारात्मक चिन्ह वैशिष्ट्यांमधील थेट संबंध दर्शवते, "-" चिन्ह वैशिष्ट्यांमधील अभिप्राय दर्शवते.

§ चार. जोडलेल्या रेखीय प्रतिगमन समीकरणाचा वापर.

मुख्य अनुप्रयोग प्रतिगमन समीकरणानुसार अंदाज आहे. इतर घटकांच्या स्थिरतेच्या अटींद्वारे आणि प्रक्रियेच्या परिस्थितीनुसार अंदाज मर्यादित आहे. जर चालू असलेल्या प्रक्रियेचे वातावरण त्यात झपाट्याने बदलले तर हे प्रतिगमन समीकरण घडणार नाही.

प्रतिगमन समीकरणामध्ये घटकाचे अपेक्षित मूल्य बदलून बिंदूचा अंदाज प्राप्त केला जातो. अशा अंदाजाच्या अचूक अंमलबजावणीची संभाव्यता अत्यंत लहान आहे.

जर एखाद्या बिंदूचा अंदाज सरासरी अंदाज त्रुटीच्या मूल्यासह असेल, तर अशा अंदाजाला अंतराल अंदाज म्हणतात.

सरासरी अंदाज त्रुटी दोन प्रकारच्या त्रुटींमधून तयार केली जाते:

  1. टाइप 1 एरर - रिग्रेशन लाइन एरर
  2. दुसऱ्या प्रकारची त्रुटी - भिन्नतेच्या त्रुटीशी संबंधित त्रुटी.

सरासरी अंदाज त्रुटी.

सामान्य लोकसंख्येमध्ये रीग्रेशन लाइनच्या स्थितीत त्रुटी

n - नमुना आकार

x k - घटकाचे चुकीचे मूल्य

सामान्य लोकसंख्येतील प्रतिगमन रेषेतून परिणामी वैशिष्ट्याचे RMS

सहसंबंध विश्लेषणामध्ये कनेक्शनच्या घट्टपणाचे मूल्यांकन समाविष्ट आहे. निर्देशक:

  1. रेखीय सहसंबंध गुणांक - दोन वैशिष्ट्यांमधील संबंधांची घट्टपणा आणि दिशा दर्शविते त्यांच्यामधील रेखीय संबंधाच्या बाबतीत

=-1 वर कनेक्शन फंक्शनल व्युत्क्रम आहे, =1 कनेक्शन फंक्शनल डायरेक्ट आहे, =0 वर कोणतेही कनेक्शन नाही.

हे फक्त रेखीय संबंधांसाठी वापरले जाते, ते परिमाणवाचक वैशिष्ट्यांमधील संबंधांचे मूल्यांकन करण्यासाठी वापरले जाते. केवळ वैयक्तिक मूल्यांवर गणना केली जाते.

सहसंबंध गुणोत्तर:

प्रायोगिक: दोन्ही प्रकारचे भिन्नता परिणामी गुणधर्मानुसार मोजली जाते.

सैद्धांतिक:

प्रतिगमन समीकरणाद्वारे गणना केलेल्या प्रभावी वैशिष्ट्याच्या मूल्यांचे फैलाव

परिणामी वैशिष्ट्याच्या अनुभवजन्य मूल्याचा फैलाव

  • अचूकता उच्च पदवी
  • वर्णनात्मक आणि परिमाणवाचक वैशिष्ट्यांमधील नातेसंबंधाच्या जवळचे मूल्यांकन करण्यासाठी योग्य, परंतु परिमाणवाचक प्रभावी असावे
  • सर्व प्रकारच्या कनेक्शनसाठी योग्य

स्पियरमॅनचा सहसंबंध गुणांक

रँक - रँक केलेल्या मालिकेतील लोकसंख्येच्या एककांची अनुक्रमांक. दोन्ही वैशिष्ट्यांना समान क्रमाने सर्वात लहान ते सर्वात मोठे किंवा त्याउलट रँक करणे आवश्यक आहे. जर लोकसंख्येच्या एककांची श्रेणी p x आणि p y ने दर्शविली असेल, तर रँकचा सहसंबंध गुणांक खालील फॉर्म घेईल:

सहसंबंध मालिका गुणांकाचे फायदे:

  1. आपण वर्णनात्मक वैशिष्ट्यांनुसार देखील रँक करू शकता जे संख्यात्मकरित्या व्यक्त केले जाऊ शकत नाहीत, म्हणून, स्पियरमॅन ​​गुणांकाची गणना खालील वैशिष्ट्यांच्या जोडीसाठी शक्य आहे: संख्या - संख्या; वर्णनात्मक - परिमाणवाचक; वर्णनात्मक - वर्णनात्मक. (शिक्षण हे वर्णनात्मक गुणधर्म आहे)
  2. कनेक्शनची दिशा दाखवते

स्पिअरमॅन गुणांकाचे तोटे.

  1. समान-रँकमधील फरक गुणांच्या मूल्यातील पूर्णपणे भिन्न फरकांशी संबंधित असू शकतात (परिमाणवाचक वैशिष्ट्यांच्या बाबतीत). उदाहरण: देशाची प्रति वर्ष वीज निर्मिती

यूएसए 2400 kWh 1

RF 800 kWh 2

कॅनडा 600 kWh 3

स्पिअरमॅन मूल्यांमध्ये अनेक समान मूल्ये आढळल्यास, संबंधित श्रेणी तयार केली जातात, म्हणजे. समान मधली संख्या

या प्रकरणात, स्पिअरमॅन गुणांक खालीलप्रमाणे मोजला जातो:

j-वैशिष्ट्य x साठी क्रमाने लिंक्सची संख्या

अज- x द्वारे j लिंकमधील समान रँकची संख्या

k-वैशिष्ट्य y च्या क्रमाने अस्थिबंधन संख्या

Bk-मध्ये समान रँकची संख्या जेचा गठ्ठा, चा गुच्छ, चा घड

  1. 4. केंडल रँक सहसंबंध गुणांक

कमाल रँक रक्कम

S ही रँकची खरी बेरीज आहे

स्पिअरमॅन गुणांकापेक्षा कठोर अंदाज देतो.

गणनेसाठी, सर्व एकके विशेषता x नुसार गुणविशेषानुसार रँक केली जातात येथेप्रत्येक रँकसाठी, दिलेल्या बेरजेपेक्षा नंतरच्या रँकची संख्या मोजली जाते, P द्वारे दर्शविले जाते आणि या पदनाम Q च्या खालील रँकची संख्या.

P+Q= 1 / 2 n(n-1)

  1. फेकनर रँक सहसंबंध गुणांक.

फेकनर गुणांक - या संख्यांच्या बेरजेशी जुळणार्‍या आणि गैर-संयोगी चिन्हांच्या जोड्यांच्या संख्येतील फरकाच्या गुणोत्तराच्या रूपात कनेक्शनच्या घट्टपणाचे मोजमाप.

  1. x आणि y साठी सरासरीची गणना
  2. वैयक्तिक मूल्ये x i y i ची तुलना "+" किंवा "-" चिन्हाच्या अनिवार्य संकेतासह सरासरी मूल्यांशी केली जाते. जर चिन्हे x आणि y मध्ये जुळत असतील, तर आम्ही त्यांना "C" क्रमांकाकडे संदर्भित करू, नसल्यास, "H" कडे.
  3. जुळणार्‍या आणि न जुळणार्‍या जोड्यांची संख्या मोजा.

संबंध मोजण्याचे कार्य वर्णनात्मक वैशिष्ट्यांच्या संबंधात सांख्यिकीशास्त्रज्ञासमोर होते, अशा कार्याचे एक महत्त्वाचे विशेष प्रकरण, 2 पर्यायी वैशिष्ट्यांमधील संबंध मोजणे, त्यापैकी एक इतर परिणामाचे कारण आहे.

2 पर्यायी वैशिष्ट्यांमधील संबंधांची घट्टता 2 गुणांक वापरून मोजली जाऊ शकते:

  1. असोसिएशन गुणांक
  2. आकस्मिक घटक

आकस्मिक गुणांकात एक कमतरता आहे: जेव्हा Av किंवा Ba या दोन विषम संयोगांपैकी एक शून्य असेल तेव्हा गुणांक एकात बदलतो. तो कनेक्शनच्या घट्टपणाचे अगदी उदारमताने मूल्यांकन करतो - तो त्याचा अतिरेक करतो.

पिअर्सनचे प्रमाण

जर दोन नसतील, परंतु परस्पर संबंधित वैशिष्ट्यांपैकी अधिक संभाव्य मूल्ये असतील तर, खालील गुणांक मोजले जातात:

  1. पिअर्सनचे प्रमाण
  2. वर्णनात्मक वैशिष्ट्यासाठी चुप्रोव्ह गुणांक

पिअर्सन गुणांक स्क्वेअर मॅट्रिक्सवरून मोजला जातो

सामान्यपेक्षा कमी

1 आणि 2 पर्यंत - अनुक्रमे 1 आणि 2 चिन्हांनुसार गटाची संख्या. पिअर्सन गुणांकाचा तोटा असा आहे की तो गटांच्या संख्येत वाढ करूनही 1 पर्यंत पोहोचत नाही.

चुप्रोव्ह गुणांक (1874-1926)

चुप्रोव्ह गुणांक कनेक्शनच्या घट्टपणाचा अधिक कठोरपणे अंदाज लावतो.

§6. एकाधिक सहसंबंध.

परिणामी आणि दोन किंवा अधिक घटक वैशिष्ट्यांमधील संबंधांचा अभ्यास म्हणतात एकाधिक प्रतिगमन. एकाधिक रीग्रेशनच्या पद्धतींद्वारे अवलंबनांच्या अभ्यासामध्ये, 2 कार्ये सेट केली जातात.

  1. प्रभावी वैशिष्ट्य y आणि वास्तविक वैशिष्ट्ये x 1 , x 2 , x 3 , ... x k , i.e. मधील संबंधांच्या विश्लेषणात्मक अभिव्यक्तीचे निर्धारण फंक्शन y \u003d f (x 1, x 2, ... x k) शोधा
  2. प्रभावी आणि प्रत्येक घटक चिन्हे यांच्यातील संबंधांच्या घट्टपणाचे मूल्यांकन.

सहसंबंध-रिग्रेशन मॉडेल (CRM) हे एक प्रतिगमन समीकरण आहे ज्यामध्ये मुख्य घटक समाविष्ट आहेत जे परिणामी गुणधर्माच्या भिन्नतेवर परिणाम करतात.

एकाधिक रीग्रेशन मॉडेल तयार करण्यासाठी खालील चरणांचा समावेश आहे:

  1. संवादाच्या स्वरूपाची निवड
  2. घटक वैशिष्ट्यांची निवड
  3. योग्य अंदाज देण्यासाठी लोकसंख्या मोठी आहे याची खात्री करणे.

I. प्रॅक्टिसमध्ये आलेल्या व्हेरिएबल्समधील संबंधांचा संपूर्ण संच 5 प्रकारच्या फंक्शन्सद्वारे पूर्णपणे वर्णन केला जातो:

  1. रेखीय:
  2. शक्ती:
  3. सूचक:
  4. पॅराबोला:
  5. हायपरबोला:

जरी सीआरएच्या सरावामध्ये सर्व 5 फंक्शन्स उपस्थित आहेत, रेखीय अवलंबन बहुतेकदा वापरले जाते, सर्वात सोपा आणि सर्वात सहज अर्थ लावता येण्याजोगा रेखीय अवलंबन समीकरण म्हणून: , k - समीकरणामध्ये समाविष्ट घटकांचा संच, ब ज

0 - कारण >0.7 म्हणून आम्ही त्यांच्याकडे विशेष लक्ष देतो

ECO. संप्रेषण घट्टपणा स्केल:

कनेक्शन 0 - 0.3 असल्यास - एक कमकुवत कनेक्शन

0.3 - 0.5 - लक्षात येण्याजोगे

0.3 - 0.5 - बंद

0.7 - 0.9 - उच्च

0.9 पेक्षा जास्त - खूप उच्च

मग आम्ही दोन वैशिष्ट्यांची तुलना करतो (उत्पन्न आणि लिंग)<0,7, то включаем в уравнение множественной регрессии.

एकाधिक प्रतिगमन समीकरणामध्ये समाविष्ट करण्यासाठी घटकांची निवड:

  1. प्रभावी आणि वास्तविक चिन्हे यांच्यात कार्यकारण संबंध असणे आवश्यक आहे.
  2. प्रभावी आणि वास्तविक चिन्हे एकमेकांशी जवळून संबंधित असणे आवश्यक आहे, अन्यथा घटना उद्भवू शकते बहुसंग्रहता (>06) , म्हणजे समीकरणात समाविष्ट केलेली घटक चिन्हे केवळ परिणामावरच नव्हे तर एकमेकांवर परिणाम करतात, ज्यामुळे संख्यात्मक डेटाचा चुकीचा अर्थ लावला जातो.

एकाधिक प्रतिगमन समीकरणामध्ये समाविष्ट करण्यासाठी घटक निवडण्याच्या पद्धती:

1. तज्ञ पद्धत - उच्च पात्र तज्ञांनी केलेल्या अंतर्ज्ञानी तार्किक विश्लेषणावर आधारित.

2. जोडलेल्या सहसंबंध गुणांकांच्या मॅट्रिक्सचा वापर पहिल्या पद्धतीच्या समांतरपणे केला जातो, मॅट्रिक्स एकक कर्णाच्या संदर्भात सममितीय आहे.

3. चरणानुसार प्रतिगमन विश्लेषण - प्रतिगमन समीकरण आणि महत्त्व चाचणीमधील घटक वैशिष्ट्यांचा अनुक्रमिक समावेश प्रत्येक चरणावर दोन निर्देशकांच्या मूल्यांवर आधारित केला जातो. सहसंबंध, प्रतिगमन सूचक.

सहसंबंध स्कोअर: गुणोत्तराच्या सैद्धांतिक सहसंबंधातील बदल किंवा सरासरी अवशिष्ट भिन्नतामधील बदलाची गणना करा. प्रतिगमन सूचक हा सशर्त शुद्ध प्रतिगमन गुणांकातील बदल आहे.

एकूण

31

32

22

85