सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व. सांख्यिकीय माहितीचे ग्राफिकल सादरीकरण
डेटाचे विश्लेषण आणि सामान्यीकरणामध्ये ग्राफिकल पद्धतीचे मूल्य मोठे आहे. ग्राफिक प्रतिमा, सर्व प्रथम, सांख्यिकीय निर्देशकांची विश्वासार्हता नियंत्रित करण्यास अनुमती देते, कारण, आलेखावर सादर केलेले, ते निरीक्षणातील त्रुटींच्या उपस्थितीशी किंवा अभ्यासाधीन घटनेच्या साराशी संबंधित विद्यमान अयोग्यता अधिक स्पष्टपणे दर्शवतात. ग्राफिक प्रतिमेच्या मदतीने, एखाद्या घटनेच्या विकासाच्या नमुन्यांचा अभ्यास करणे, विद्यमान संबंध स्थापित करणे शक्य आहे. डेटाची साधी तुलना नेहमीच कारणात्मक संबंधांची उपस्थिती पकडणे शक्य करत नाही, त्याच वेळी, त्यांचे ग्राफिकल प्रतिनिधित्व कार्यकारण संबंध ओळखण्यास मदत करते, विशेषत: प्रारंभिक गृहीतके स्थापित करण्याच्या बाबतीत, जे नंतर पुढील विकासाच्या अधीन असतात.
सांख्यिकी आलेख- हे एक रेखाचित्र आहे ज्यामध्ये विशिष्ट निर्देशकांद्वारे वैशिष्ट्यीकृत सांख्यिकीय समुच्चयांचे सशर्त भौमितिक प्रतिमा किंवा चिन्हे वापरून वर्णन केले जाते. ग्राफिक प्रतिमासांख्यिकीय डेटाचे प्रतिनिधित्व करणारे बिंदू, रेषा आणि आकारांचा संग्रह आहे. सहायक घटकग्राफिक्स आहेत:
आलेख फील्ड हा विमानाचा एक भाग आहे जेथे ग्राफिक प्रतिमा आहेत. आलेख फील्डचे काही परिमाण आहेत, जे त्याच्या उद्देशावर अवलंबून असतात.
आलेखाच्या स्थानिक खुणा समन्वय ग्रिडच्या प्रणालीच्या स्वरूपात सेट केल्या जातात. चार्ट फील्डमध्ये भूमितीय चिन्हे ठेवण्यासाठी समन्वय प्रणाली आवश्यक आहे. आयताकृती आणि ध्रुवीय समन्वय प्रणाली दोन्ही वापरल्या जातात.
ऑब्जेक्टचे ग्राफिकल डिस्प्ले आणि त्याच्या वास्तविक आकाराची तुलना करण्यासाठी स्केल लँडमार्क वापरले जातात. स्केल लँडमार्क स्केल स्केल किंवा स्केल चिन्हांच्या प्रणालीद्वारे सेट केले जातात.
आलेखाच्या स्पष्टीकरणामध्ये आलेख (नाव) द्वारे चित्रित केलेल्या ऑब्जेक्टचे स्पष्टीकरण आणि आलेखावर वापरलेल्या प्रत्येक चिन्हाचा अर्थपूर्ण अर्थ असतो.
सांख्यिकीय आलेख त्यांच्या उद्देशानुसार (सामग्री), बांधकाम पद्धती आणि ग्राफिक प्रतिमेचे स्वरूप (चित्र 1) नुसार वर्गीकृत केले जातात.
आकृती क्रं 1. सांख्यिकीय आलेखांचे वर्गीकरण
ग्राफिक प्रतिमा तयार करण्याच्या पद्धतीनुसार, तेथे आहेतः
आकृत्या- सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व, तुलना केलेल्या मूल्यांमधील संबंध स्पष्टपणे दर्शविते.
सांख्यिकी नकाशे
चार्टचे खालील मुख्य प्रकार आहेत: रेखा, बार, पट्टी, सेक्टर, चौरस, गोलाकार, कुरळे.
रेखा चार्टडायनॅमिक्स वैशिष्ट्यीकृत करण्यासाठी वापरले जातात, म्हणजे कालांतराने घटनांमधील बदलांचे मूल्यांकन. abscissa कालखंड किंवा तारखा दर्शविते आणि ऑर्डिनेट डायनॅमिक्सच्या मालिकेचे स्तर दर्शविते. एका आलेखावर अनेक तक्ते लावले जाऊ शकतात, जे तुम्हाला विविध निर्देशकांच्या गतिशीलतेची किंवा वेगवेगळ्या प्रदेशांसाठी किंवा देशांसाठी एका निर्देशकाची तुलना करण्यास अनुमती देतात.
अंजीर.2. रशियन फेडरेशनमधील प्रवासी कारच्या आयातीच्या प्रमाणात गतीशीलता
2006-1 q साठी. 2010
बार चार्टवापरले जाऊ शकते:
सामाजिक-आर्थिक घटनेच्या गतिशीलतेचे विश्लेषण करण्यासाठी;
योजनेच्या अंमलबजावणीचे मूल्यांकन;
वितरणाच्या मालिकेतील भिन्नतेची वैशिष्ट्ये;
स्थानिक तुलनेसाठी (प्रदेश, देश, कंपन्यांमधील तुलना);
घटनेच्या संरचनेचा अभ्यास करणे.
स्तंभ समान अंतरावर जवळ किंवा स्वतंत्रपणे स्थित आहेत. स्तंभांची उंची वैशिष्ट्य स्तरांच्या संख्यात्मक मूल्यांच्या प्रमाणात असावी.
अंजीर.3. सीआयएस देशांसह रशियन फेडरेशनच्या व्यापार उलाढालीमध्ये बेलारूसच्या वाटा गतिशीलता
सामाजिक-आर्थिक घटनेची रचना वैशिष्ट्यीकृत करण्यासाठी मोठ्या प्रमाणावर वापरले जातात पाई चार्ट. ते तयार करण्यासाठी, वर्तुळ एकूण खंडातील भागांच्या विशिष्ट गुरुत्वाकर्षणाच्या प्रमाणात विभागांमध्ये विभागले गेले पाहिजे. विशिष्ट वजनांची बेरीज 100% इतकी आहे, जी अभ्यासाधीन घटनेच्या एकूण व्हॉल्यूमशी संबंधित आहे.
अंजीर.4. रशियन फेडरेशन आणि सीआयएस देशांमधील व्यापार उलाढालीचे भौगोलिक वितरण
बार चार्टक्षैतिजरित्या मांडलेले आयत (पट्टे).
कधीकधी प्रदेशानुसार तुलनात्मक विश्लेषणासाठी, देश वापरतात आकृती चिन्ह रेखाचित्रे(भौमितिक आकारांचे आकृत्या). हे आकृती अभ्यास केलेल्या वस्तूचा आकार त्याच्या क्षेत्राच्या आकारानुसार दर्शवतात.
सांख्यिकी नकाशेघटनांच्या भौगोलिक वितरणाचे मूल्यांकन करण्यासाठी आणि प्रदेशानुसार तुलनात्मक विश्लेषण करण्यासाठी वापरले जातात.
सांख्यिकीय नकाशांमध्ये कार्टोग्राम आणि कार्टोग्राम समाविष्ट आहेत. त्यांच्यातील फरक नकाशांवर ज्या प्रकारे आकडेवारी प्रदर्शित केली जाते त्यामध्ये आहे.
कार्टोग्रामस्वतंत्र भागात अभ्यासाधीन असलेल्या वैशिष्ट्याचे प्रादेशिक वितरण दर्शविते आणि या वितरणाचे नमुने ओळखण्यासाठी वापरले जाते. कार्टोग्राम पार्श्वभूमी आणि बिंदूमध्ये विभागलेले आहेत. वेगवेगळ्या रंगांच्या घनतेचे पार्श्वभूमी कार्टोग्राम प्रादेशिक युनिटमधील कोणत्याही निर्देशकाची तीव्रता दर्शवतात. डॉट कार्टोग्रामवर, निवडलेल्या घटनेची पातळी ठिपके वापरून दर्शविली जाते.
कार्टोग्राम- हे भौगोलिक नकाशा किंवा आकृतीसह त्याची योजना यांचे संयोजन आहे. हे आपल्याला अभ्यासाधीन घटनेच्या वितरणामध्ये, त्याची संरचनात्मक वैशिष्ट्ये प्रत्येक प्रदेशाची वैशिष्ट्ये प्रतिबिंबित करण्यास अनुमती देते.
सध्या, संगणक ग्राफिक्ससाठी विविध सॉफ्टवेअर पॅकेजेस विकसित केली गेली आहेत, उदाहरणार्थ, एक्सेल, स्टॅटग्राफ, स्टॅटिस्टिका.
सांख्यिकीय डेटा अशा प्रकारे सादर केला पाहिजे की ते वापरता येतील. सांख्यिकीय डेटा सादर करण्याचे 3 मुख्य प्रकार आहेत:
1) मजकूर - मजकूरात डेटा समाविष्ट करणे;
2) सारणी - सारण्यांमध्ये डेटाचे सादरीकरण;
3) ग्राफिक - आलेखांच्या स्वरूपात डेटाची अभिव्यक्ती.
जेव्हा थोड्या प्रमाणात डिजिटल डेटा असतो तेव्हा मजकूर फॉर्म वापरला जातो.
टॅब्युलर फॉर्म बहुतेक वेळा वापरला जातो, कारण हा सांख्यिकीय डेटा सादर करण्याचा अधिक कार्यक्षम प्रकार आहे. गणितीय सारण्यांच्या विपरीत, जे, प्रारंभिक परिस्थितीनुसार, एक किंवा दुसरा परिणाम प्राप्त करण्यास अनुमती देतात, सांख्यिकीय सारण्या अभ्यासाधीन वस्तूंबद्दल संख्यांची भाषा सांगतात.
सांख्यिकी सारणी- ही पंक्ती आणि स्तंभांची एक प्रणाली आहे, ज्यामध्ये सामाजिक-आर्थिक घटनेबद्दल सांख्यिकीय माहिती एका विशिष्ट क्रमाने आणि कनेक्शनमध्ये सादर केली जाते.
तक्ता 2. 2000 - 2006 साठी रशियन फेडरेशनचा परकीय व्यापार, अब्ज डॉलर्स
निर्देशांक | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 |
विदेशी व्यापार उलाढाल | 149,9 | 155,6 | 168,3 | 280,6 | 368,9 | 468,4 | |
निर्यात करा | 101,9 | 107,3 | 135,9 | 183,2 | 243,6 | 304,5 | |
आयात करा | 44,9 | 53,8 | 76,1 | 97,4 | 125,3 | 163,9 | |
व्यापार शिल्लक | 60,1 | 48,1 | 46,3 | 59,9 | 85,8 | 118,3 | 140,7 |
यासह: | |||||||
परदेशी देशांसह | |||||||
निर्यात | 90,8 | 86,6 | 90,9 | 114,6 | 210,1 | 261,1 | |
आयात | 31,4 | 40,7 | 48,8 | 77,5 | 103,5 | 138,6 | |
व्यापार शिल्लक | 59,3 | 45,9 | 42,1 | 53,6 | 75,5 | 106,6 | 122,5 |
उदाहरणार्थ, टेबलमध्ये. 2 रशियाच्या परकीय व्यापाराची माहिती सादर करते, जी मजकूर स्वरूपात व्यक्त करणे अकार्यक्षम असेल.
भेद करा विषयआणि अंदाजसांख्यिकी सारणी. विषय वैशिष्ट्यीकृत ऑब्जेक्ट दर्शवतो - एकतर लोकसंख्येची एकके, किंवा युनिट्सचे गट, किंवा संपूर्णता. प्रेडिकेटमध्ये, विषयाचे वैशिष्ट्य दिले जाते, सहसा संख्यात्मक स्वरूपात. अनिवार्य शीर्षलेखसारणी, जे सूचित करते की टेबलमधील डेटा कोणत्या श्रेणीचा आणि कोणत्या वेळेचा आहे.
विषयाच्या स्वरूपानुसार, सांख्यिकीय तक्त्यामध्ये विभागले गेले आहेत सोपे, गटआणि संयुक्त. साध्या सारणीच्या विषयामध्ये, अभ्यासाचा विषय गटांमध्ये विभागलेला नाही, परंतु एकतर लोकसंख्येच्या सर्व एककांची यादी दिली आहे किंवा संपूर्ण लोकसंख्या दर्शविली आहे (उदाहरणार्थ, तक्ता 11). गट सारणीच्या विषयामध्ये, अभ्यासाचे ऑब्जेक्ट एका गुणधर्मानुसार गटांमध्ये विभागले गेले आहे आणि प्रेडिकेट गटांमधील एककांची संख्या (निरपेक्ष किंवा टक्केवारी म्हणून) आणि गटांसाठी सारांश निर्देशक (उदाहरणार्थ, सारणी) दर्शवते. 4). संयोजन सारणीच्या विषयामध्ये, लोकसंख्या एकानुसार नाही तर अनेक निकषांनुसार (उदाहरणार्थ, तक्ता 2) गटांमध्ये विभागली गेली आहे.
तक्ते तयार करताना, आपण खालील गोष्टींद्वारे मार्गदर्शन केले पाहिजे सर्वसाधारण नियम.
1. सारणीचा विषय डावीकडे (कमी वेळा - वरच्या) भागात स्थित आहे, आणि प्रेडिकेट - उजवीकडे (कमी वेळा - खालचा) आहे.
2. स्तंभ शीर्षकांमध्ये निर्देशकांची नावे आणि त्यांच्या युनिट्स असतात.
3. अंतिम ओळ सारणी पूर्ण करते आणि त्याच्या शेवटी स्थित असते, परंतु काहीवेळा ती पहिली असते: या प्रकरणात, दुसरी ओळ "सहीत" लिहिली जाते आणि त्यानंतरच्या ओळींमध्ये एकूण ओळीचे घटक असतात.
4. अंकांच्या खाली असलेल्या संख्येच्या अंकांसह, प्रत्येक स्तंभामध्ये समान प्रमाणात अचूकतेसह अंकीय डेटा लिहिला जातो आणि पूर्णांक भाग अपूर्णांक स्वल्पविरामाने विभक्त केला जातो.
5. टेबलमध्ये रिक्त सेल असू नयेत: जर डेटा शून्य असेल, तर “–” चिन्ह (डॅश) ठेवले जाईल; जर डेटा माहित नसेल, तर "माहिती नाही" अशी नोंद केली जाते किंवा "..." (लंबवर्तुळ) चिन्ह लावले जाते. जर घातांक मूल्य शून्य नसेल, परंतु पहिला महत्त्वाचा अंक अचूकतेच्या स्वीकृत डिग्रीनंतर दिसत असेल, तर 0.0 रेकॉर्ड केला जाईल (जर, 0.1 च्या अचूकतेची डिग्री स्वीकारली असेल).
काहीवेळा सांख्यिकी सारण्यांना आलेखांसह पूरक केले जाते जेव्हा लक्ष्य डेटाच्या काही वैशिष्ट्यांवर जोर देणे, त्यांची तुलना करणे हे असते. ग्राफिकल फॉर्म त्यांच्या आकलनाच्या दृष्टीने डेटा सादरीकरणाचा सर्वात प्रभावी प्रकार आहे. आलेखांच्या मदतीने, संरचनेची वैशिष्ट्ये, गतिशीलता, घटनांमधील संबंध आणि त्यांची तुलना यांची दृश्यमानता प्राप्त केली जाते.
सांख्यिकी आलेख- या रेषा, भौमितिक आकार, रेखाचित्रे किंवा भौगोलिक तक्त्यांद्वारे संख्यात्मक मूल्ये आणि त्यांचे गुणोत्तर यांच्या सशर्त प्रतिमा आहेत. ग्राफिकल फॉर्म सांख्यिकीय डेटाचा विचार करणे सुलभ करते, ते दृश्यमान, अर्थपूर्ण आणि दृश्यमान बनवते. तथापि, आलेखांना काही मर्यादा आहेत: सर्व प्रथम, आलेखामध्ये जितका डेटा टेबलमध्ये बसू शकतो तितका समाविष्ट करू शकत नाही; याव्यतिरिक्त, आलेख नेहमी गोलाकार डेटा दर्शवतो - अचूक नाही, परंतु अंदाजे. अशा प्रकारे, आलेख फक्त सामान्य परिस्थिती दर्शविण्यासाठी वापरला जातो, तपशील नाही. शेवटची कमतरता म्हणजे प्लॉटिंगची जटिलता. वैयक्तिक संगणक वापरून त्यावर मात केली जाऊ शकते (उदाहरणार्थ, पॅकेजमधील "डायग्राम विझार्ड". मायक्रोसॉफ्ट ऑफिस एक्सेल).
ग्राफिक्स तयार करण्याच्या पद्धतीनुसार, ते विभागलेले आहेत आकृत्या, कार्टोग्रामआणि चार्ट आकृत्या.
डेटाचे ग्राफिकल प्रतिनिधित्व करण्याचा सर्वात सामान्य मार्ग म्हणजे चार्ट, जे खालील प्रकारचे आहेत: रेखीय, रेडियल, स्कॅटर, प्लानर, व्हॉल्यूमेट्रिक, कर्ली. आकृत्यांचा प्रकार सादर केलेल्या डेटाच्या प्रकारावर आणि बांधकाम कार्यावर अवलंबून असतो. कोणत्याही परिस्थितीत, आलेखासह शीर्षलेख असणे आवश्यक आहे - आलेख फील्डच्या वर किंवा खाली. शीर्षक दर्शवते की कोणता निर्देशक प्रदर्शित केला जातो, कोणत्या प्रदेशासाठी आणि कोणत्या वेळेसाठी.
रेषा आलेख परिमाणवाचक चलांचे प्रतिनिधित्व करण्यासाठी वापरले जातात: त्यांच्या मूल्यांच्या भिन्नतेची वैशिष्ट्ये, गतिशीलता, चलांमधील संबंध. वापरून डेटा भिन्नतेचे विश्लेषण केले जाते वितरण क्षेत्र, जमा करते(वक्र पेक्षा कमी) आणि ogives(वक्र "पेक्षा मोठे"). वितरण बहुभुज विषय 4 मध्ये चर्चा केली आहे (उदा. चित्र 5.). क्युम्युलेट तयार करण्यासाठी, व्हेरिएबल वैशिष्ट्याची मूल्ये abscissa च्या बाजूने प्लॉट केली जातात आणि ordinates म्हणजे फ्रिक्वेन्सी किंवा फ्रिक्वेन्सीजची जमा केलेली बेरीज (पासून f1ते ∑ f). ओगिव्ह तयार करण्यासाठी, फ्रिक्वेन्सीची जमा झालेली बेरीज y-अक्षावर उलट क्रमाने ठेवली जाते (∑ पासून fआधी f1). सारणीनुसार एकत्रित करा आणि ओजीव्ह करा. 4. अंजीर मध्ये चित्रण. एक
तांदूळ. 1. सीमाशुल्क मूल्याच्या मूल्यानुसार वस्तूंच्या वितरणाचे संचित आणि ओजीव्ह
ट्रेंड अॅनालिसिसमध्ये लाइन चार्टचा वापर विषय 5 (उदा. आकृती 13) आणि विषय 6 (उदा. आकृती 21) मध्ये लिंक विश्लेषणासाठी वापरण्यात आलेला आहे. विषय 6 मध्ये स्कॅटर प्लॉटचा वापर देखील समाविष्ट आहे (उदा. आकृती 20).
रेखा चार्ट उपविभाजित आहेत एक-आयामी, एका व्हेरिएबलवरील डेटाचे प्रतिनिधित्व करण्यासाठी वापरले जाते, आणि द्विमितीय- दोन व्हेरिएबल्ससाठी. एक-आयामी रेखा आलेखाचे उदाहरण म्हणजे वितरण बहुभुज, आणि द्विमितीय एक प्रतिगमन रेषा आहे (उदा. चित्र 21).
कधीकधी, निर्देशकामध्ये मोठ्या बदलांसह, लॉगरिदमिक स्केल वापरला जातो. उदाहरणार्थ, जर इंडिकेटरची व्हॅल्यू 1 ते 1000 पर्यंत बदलत असतील तर प्लॉटिंग करताना यामुळे अडचणी येऊ शकतात. अशा परिस्थितीत, ते सूचक मूल्यांच्या लॉगरिदमवर स्विच करतात, जे इतके वेगळे नसतील: lg 1 = 0, lg 1000 = 3.
मध्ये प्लॅनरबार आलेख (हिस्टोग्राम) वापराच्या वारंवारतेनुसार वेगळे केले जातात, ज्यामध्ये निर्देशक बार म्हणून सादर केला जातो, ज्याची उंची निर्देशकाच्या मूल्याशी संबंधित असते (उदाहरणार्थ, अंजीर 4).
एका विशिष्ट भौमितीय आकृतीच्या क्षेत्रफळाच्या निर्देशकाच्या मूल्याच्या प्रमाणानुसार इतर प्रकारच्या प्लॅनर आकृत्यांचा समावेश होतो: त्रिकोणी, चौरस, आयताकृती. आपण वर्तुळाच्या क्षेत्रांची तुलना देखील वापरू शकता - या प्रकरणात, वर्तुळाची त्रिज्या सेट केली आहे.
पट्टी चार्टक्षैतिज ताणलेल्या आयताच्या स्वरूपात निर्देशक सादर करते आणि अन्यथा बार चार्ट सारखेच असते.
प्लॅनर आकृत्यांपैकी, ते बर्याचदा वापरले जाते पाई चार्ट, ज्याचा उपयोग अभ्यासलेल्या लोकसंख्येची रचना स्पष्ट करण्यासाठी केला जातो. संपूर्ण संच 100% म्हणून घेतला जातो, तो वर्तुळाच्या एकूण क्षेत्राशी संबंधित असतो, सेक्टरचे क्षेत्र सेटच्या भागांशी संबंधित असतात. टेबलनुसार 2006 मध्ये रशियन फेडरेशनच्या परदेशी व्यापाराच्या संरचनेचा सेक्टर आकृती तयार करूया. 2 (अंजीर 2 पहा). संगणक प्रोग्राम वापरताना, सेक्टर डायग्राम त्रि-आयामी स्वरूपात तयार केले जातात, म्हणजे, दोन नव्हे तर तीन विमानांमध्ये (चित्र 3 पहा).
तांदूळ. 2. साधा पाई चार्ट 3. 3D पाई चार्ट
कुरळे (चित्र) आकृती प्रतिमेची स्पष्टता वाढवतात, कारण त्यात प्रदर्शित निर्देशकाचे चित्र समाविष्ट असते, ज्याचा आकार निर्देशकाच्या आकाराशी संबंधित असतो.
आलेख प्लॉट करताना, सर्वकाही तितकेच महत्वाचे आहे - ग्राफिक प्रतिमेची योग्य निवड, प्रमाण, आलेख डिझाइन करण्याच्या नियमांचे पालन. हे मुद्दे अधिक तपशीलवार आणि मध्ये समाविष्ट आहेत.
कार्टोग्राम आणि कार्टोग्राम्सचा उपयोग अभ्यासल्या जाणार्या घटनेची भौगोलिक वैशिष्ट्ये दर्शवण्यासाठी केला जातो. ते अभ्यासात असलेल्या घटनेचे स्थान, विशिष्ट प्रदेशात त्याची तीव्रता दर्शवतात - प्रजासत्ताक, प्रदेश, आर्थिक किंवा प्रशासकीय जिल्हा इ. उदाहरणार्थ, कार्टोग्राम आणि कार्टोग्रामचे बांधकाम विशेष साहित्यात मानले जाते.
कामाचा शेवट -
हा विषय संबंधित आहे:
आकडेवारीची संकल्पना. आकडेवारीचा विषय आणि पद्धत
सांख्यिकी संकल्पना.. विषय आणि आकडेवारीची पद्धत.. सांख्यिकी निरीक्षण..
आपल्याला या विषयावर अतिरिक्त सामग्रीची आवश्यकता असल्यास, किंवा आपण जे शोधत आहात ते आपल्याला सापडले नाही, तर आम्ही आमच्या कार्यांच्या डेटाबेसमधील शोध वापरण्याची शिफारस करतो:
प्राप्त सामग्रीचे आम्ही काय करू:
जर ही सामग्री तुमच्यासाठी उपयुक्त ठरली, तर तुम्ही ती सोशल नेटवर्क्सवरील तुमच्या पेजवर सेव्ह करू शकता:
ट्विट |
या विभागातील सर्व विषय:
आकडेवारीचा विषय आणि पद्धत
1746 मध्ये जर्मन शास्त्रज्ञ गॉटफ्रीड अचेनवाल यांनी "सांख्यिकी" हा शब्द वैज्ञानिक वापरात आणला, ज्यांनी जर्मन विद्यापीठांमध्ये शिकवल्या जाणार्या "स्टेट स्टडीज" या अभ्यासक्रमाच्या शीर्षकाच्या जागी "सेंट" ने प्रस्तावित केले.
सांख्यिकीय निरीक्षण
सांख्यिकीय माहितीबद्दल लोकांचा दृष्टीकोन भिन्न आहे: काहींना ते समजत नाही, इतर बिनशर्त विश्वास ठेवतात आणि तरीही काहीजण इंग्लिश राजकारणी डिझरेलीच्या मताशी सहमत आहेत: “तीथे 3 प्रकारचे खोटे आहेत: खोटे,
आकडेवारीचा सारांश आणि समूहीकरण
सारांश - निरीक्षण सामग्रीची शास्त्रोक्त पद्धतीने आयोजित प्रक्रिया (पूर्वी विकसित केलेल्या प्रोग्रामनुसार), ज्यामध्ये एकत्रित डेटाचे अनिवार्य नियंत्रण, पद्धतशीरीकरण, गटबद्धता समाविष्ट आहे.
निरपेक्ष मूल्ये
वस्तुमान घटना दर्शवण्यासाठी, सांख्यिकी सांख्यिकीय प्रमाण (निर्देशक) वापरते जे एककांचे गट किंवा संपूर्णपणे (घटना) दर्शवते. सांख्यिकीय प्रमाण
सापेक्ष मूल्ये
सापेक्ष मूल्य हे दोन निरपेक्ष मूल्यांचे विभाजन (तुलना) करण्याचा परिणाम आहे. अपूर्णांकाचा अंश म्हणजे ज्या मूल्याची तुलना केली जात आहे, आणि भाजक हे मूल्य (ba
सरासरी मूल्ये
यापूर्वी अनेकदा म्हटल्याप्रमाणे, आकडेवारी वस्तुमान घटना आणि प्रक्रियांचा अभ्यास करते. या प्रत्येक घटनेत संपूर्ण संचासाठी सामान्य आणि विशेष, वैयक्तिक गुणधर्म दोन्ही आहेत.
वितरण मालिका तयार करणे
लोकसंख्येच्या वेगवेगळ्या एककांसाठी एकाच कालावधीत किंवा वेळेत आकडेवारीद्वारे अभ्यास केलेली वैशिष्ट्ये भिन्न (एकमेकांपासून भिन्न) असतात. उदाहरणार्थ, परदेशी व्यापार उलाढालीचे मूल्य बदलते
वितरण मालिकेच्या संरचनात्मक वैशिष्ट्यांची गणना
भिन्नतेचा अभ्यास करताना, वितरण मालिकेची अशी वैशिष्ट्ये वापरली जातात जी त्याची रचना, संरचनेचे परिमाणात्मक वर्णन करतात. असे, उदाहरणार्थ, मध्यक आहे - व्हेरिएबल विशेषताचे मूल्य
आकार आणि भिन्नतेच्या तीव्रतेच्या मोजमापांची गणना
सर्वात सोपा निर्देशक भिन्नतेची श्रेणी आहे - अभ्यासलेल्या लोकसंख्येमध्ये उपलब्ध असलेल्या मूल्यांमधील गुणविशेषाच्या कमाल आणि किमान मूल्यांमधील परिपूर्ण फरक (24):
वितरण क्षणांची गणना आणि त्याच्या आकाराचे निर्देशक
भिन्नतेच्या स्वरूपाच्या पुढील अभ्यासासाठी, त्याच्या अंकगणित सरासरी मूल्यापासून गुणविशेषाच्या वैयक्तिक मूल्यांच्या भिन्न अंशांच्या विचलनाची सरासरी मूल्ये वापरली जातात. या निर्देशकांना म्हणतात
वितरण मालिका सामान्य आहे की नाही हे तपासत आहे
सैद्धांतिक वितरण वक्र हे व्हेरिएशनल शृंखलेतील वारंवारतेच्या बदलाच्या सतत रेषेच्या स्वरूपात मालिकेचे ग्राफिक प्रतिनिधित्व म्हणून समजले जाते, पर्यायांमधील बदलाशी कार्यशीलपणे संबंधित, इतर
वितरण शृंखला पॉसॉनच्या कायद्याचे पालन करते की नाही ते तपासत आहे
सीमाशुल्क विभागाने माल सोडल्यानंतर तपासणी केली. परिणामी, प्रत्येक चाचणीमध्ये ओळखल्या गेलेल्या उल्लंघनांच्या संख्येची खालील स्वतंत्र वितरण मालिका प्राप्त झाली (तक्ता 16). तक्ता 1
रचना बदलाचे परिपूर्ण आणि सापेक्ष निर्देशक
सांख्यिकीय लोकसंख्येचा विकास केवळ प्रणालीच्या घटकांमधील परिमाणवाचक वाढ किंवा घट मध्येच नव्हे तर त्याच्या संरचनेतील बदलामध्ये देखील प्रकट होतो. रचना म्हणजे एकूणाची रचना
रचना बदलाचे रँक निर्देशक
संरचनेतील फरक मोजण्यासाठी, कमी अचूक, परंतु गणना करणे सोपे आहे, निर्देशक बहुतेकदा वापरले जातात, जे स्वतःच्या शेअर्सच्या मूल्यांमध्ये नसून त्यांच्या श्रेणीतील फरकांचे मूल्यांकन करण्यावर आधारित असतात, म्हणजेच क्रमानुसार.
निवडक निरीक्षणाची संकल्पना
सॅम्पलिंग पद्धत वापरली जाते जेव्हा सतत निरीक्षणाचा वापर मोठ्या प्रमाणात डेटामुळे शारीरिकदृष्ट्या अशक्य असते किंवा आर्थिकदृष्ट्या व्यवहार्य नसते. एक भौतिक अशक्यता आहे
सॅम्पलिंग पद्धती
1. वास्तविक यादृच्छिक निवड: HS च्या सर्व युनिट्स क्रमांकित आहेत आणि ड्रॉच्या परिणामी काढलेल्या संख्या नमुन्यात आलेल्या युनिट्सशी संबंधित आहेत आणि संख्यांची संख्या नियोजित संख्येच्या समान आहे.
सरासरी नमुना त्रुटी
नमुन्यातील आवश्यक संख्येच्या युनिट्सची निवड पूर्ण केल्यानंतर आणि निरीक्षण कार्यक्रमाद्वारे प्रदान केलेल्या या युनिट्सच्या वैशिष्ट्यांची नोंदणी केल्यानंतर, ते सामान्यीकरण निर्देशकांच्या गणनेकडे पुढे जातात. पासून त्यांना
किरकोळ नमुना त्रुटी
नमुना सर्वेक्षणाच्या आधारे एचएसच्या सामान्यीकरण वैशिष्ट्याचे अचूकपणे मूल्यांकन करणे अशक्य आहे हे लक्षात घेऊन, ते कोणत्या मर्यादांमध्ये आहे ते शोधणे आवश्यक आहे. एका विशिष्ट नमुन्यात, फरक
आवश्यक नमुना आकार
निवडक निरीक्षणाचा कार्यक्रम विकसित करताना, त्यांना सीमांत त्रुटी आणि संभाव्यतेच्या पातळीचे विशिष्ट मूल्य दिले जाते. दिलेला किमान नमुना आकार
मार्गदर्शक तत्त्वे
एक कार्य. एंटरप्राइझमध्ये, 1000 पैकी 100 कामगारांची यादृच्छिक न-पुनरावृत्ती नमुन्याच्या क्रमाने मुलाखत घेण्यात आली आणि त्यांच्या महिन्याच्या उत्पन्नावर खालील डेटा प्राप्त झाला (तक्ता 24): Ta
वेळ मालिकेची संकल्पना
सांख्यिकीतील सर्वात महत्वाचे कार्य म्हणजे कालांतराने विश्लेषित निर्देशकांमधील बदलांचा अभ्यास करणे, म्हणजेच त्यांची गतिशीलता. डायनॅमिक्सच्या मालिकेचे (वेळ मालिका) विश्लेषण करून ही समस्या सोडवली जाते.
डायनॅमिक्सच्या मालिकेच्या पातळीतील बदलांचे सूचक
वेळ मालिकेचे विश्लेषण निरपेक्ष आणि सापेक्ष दृष्टीने मालिकेचे स्तर कसे बदलतात (वाढतात, कमी होतात किंवा अपरिवर्तित राहतात) हे ठरवण्यापासून सुरू होते. माग लावण्याकारिता
डायनॅमिक्सच्या मालिकेचे सरासरी निर्देशक
डायनॅमिक्सची प्रत्येक मालिका वेळोवेळी बदलणाऱ्या n निर्देशकांचा एक निश्चित संच मानली जाऊ शकते, ज्याचा सारांश सरासरी मूल्ये म्हणून केला जाऊ शकतो. अशा सामान्यीकृत (सरासरी) निर्देशक विशेषतः आहेत
डायनॅमिक्सच्या मालिकेतील मुख्य कल (ट्रेंड) ओळखण्यासाठी पद्धती
डायनॅमिक्सच्या मालिकेचा अभ्यास करण्याच्या मुख्य कार्यांपैकी एक म्हणजे मालिकेतील स्तर बदलण्यातील मुख्य कल (पॅटर्न) ओळखणे, ज्याला ट्रेंड म्हणतात. काही प्रकरणांमध्ये मालिकेचे स्तर बदलण्याची नियमितता
ट्रेंड पर्याप्तता मूल्यांकन आणि अंदाज
सापडलेल्या ट्रेंड समीकरणासाठी, त्याच्या विश्वासार्हतेचे (पर्याप्तता) मूल्यांकन करणे आवश्यक आहे, जे सहसा फिशर निकष वापरून केले जाते, त्याच्या गणना केलेल्या मूल्याची तुलना करून Fр
हंगामी विश्लेषण
डायनॅमिक्सच्या मालिकेत, ज्याचे स्तर मासिक किंवा त्रैमासिक निर्देशक आहेत, यादृच्छिक चढउतारांसह, हंगामी चढउतार अनेकदा पाळले जातात, जे वेळोवेळी समजले जातात.
मार्गदर्शक तत्त्वे
फेडरल स्टेट स्टॅटिस्टिक्स सर्व्हिसच्या मते, 2000-2006 या कालावधीसाठी रशियाचा परकीय व्यापार (SVT) शिल्लक. टेबलमध्ये सादर केलेल्या अनेक डायनॅमिक्सद्वारे वैशिष्ट्यीकृत. 36. तक्ता 36. रशियाचा परदेशी व्यापार शिल्लक (CBT) p साठी
सहसंबंध अवलंबित्व संकल्पना
वस्तुनिष्ठ जगाच्या सर्वात सामान्य नियमांपैकी एक म्हणजे सार्वत्रिक कनेक्शन आणि घटनांमधील अवलंबित्वाचा नियम. साहजिकच, सर्वात वैविध्यपूर्ण क्षेत्रातील घटनांचा तपास करताना, आकडेवारी अपरिहार्यपणे आदळते.
सहसंबंध ओळखण्यासाठी आणि मूल्यमापन करण्याच्या पद्धती
दोन वैशिष्ट्यांमधील सहसंबंधाची उपस्थिती आणि स्वरूप ओळखण्यासाठी आकडेवारीमध्ये अनेक पद्धती वापरल्या जातात. 1. समांतर डेटाचा विचार (kn
रँक सहसंबंध गुणांक
रँक सहसंबंध गुणांक कमी अचूक आहेत, परंतु गणना करणे सोपे आहे, दोन सहसंबंधित वैशिष्ट्यांमधील संबंधांची जवळीक मोजण्यासाठी नॉन-पॅरामेट्रिक निर्देशक. यात समाविष्ट
वेळ मालिकेच्या सहसंबंधाची वैशिष्ट्ये
बर्याच अभ्यासांमध्ये, एकाच वेळी अनेक निर्देशकांच्या गतिशीलतेचा अभ्यास करणे आवश्यक आहे, म्हणजे. समांतर अनेक वेळा मालिका विचारात घ्या. या प्रकरणात, अवलंबित्व मोजणे आवश्यक होते
गुणात्मक वैशिष्ट्यांमधील संबंधांच्या घट्टपणाचे सूचक
सहसंबंध सारण्यांची पद्धत केवळ परिमाणवाचक नाही तर वर्णनात्मक (गुणात्मक) वैशिष्ट्यांसाठी देखील लागू आहे, विविध समाजशास्त्रज्ञांचे आयोजन करताना त्यांच्यातील संबंधांचा अनेकदा अभ्यास करावा लागतो.
एकाधिक सहसंबंध
व्यावहारिक समस्या सोडवताना, संशोधकांना या वस्तुस्थितीचा सामना करावा लागतो की परस्परसंबंध दोन वैशिष्ट्यांमधील संबंधांपुरते मर्यादित नाहीत: प्रभावी y आणि घटक x. कृतीत
उद्देश आणि निर्देशांकांचे प्रकार
निर्देशांक हे एक सापेक्ष मूल्य आहे जे दर्शविते की दिलेल्या परिस्थितीत अभ्यास केलेल्या घटनेची पातळी इतर परिस्थितींमध्ये समान घटनेच्या पातळीपेक्षा किती वेळा भिन्न आहे. परिस्थितीतील फरक असू शकतो
वैयक्तिक निर्देशांक
जर अभ्यासाधीन घटनेच्या संरचनेत फरक पडत नसेल तर पातळींची तुलना करून प्राप्त केलेल्या सापेक्ष मूल्याला वैयक्तिक निर्देशांक म्हणतात. वैयक्तिक निर्देशांक i द्वारे दर्शविले जातात
सामान्य निर्देशांक
जर अभ्यासाधीन घटना विषम असेल आणि पातळींची तुलना त्यांना एका सामान्य मापनावर आणल्यानंतरच केली जाऊ शकते, तर आर्थिक विश्लेषण सामान्य निर्देशांकांद्वारे केले जाते. निर्देशांक सामान्य होतो
सरासरी निर्देशांक
गुणात्मक निर्देशकांचा अभ्यास करताना, विशिष्ट एकसंध लोकसंख्येसाठी अनुक्रमित निर्देशकाच्या सरासरी मूल्याच्या वेळेत (किंवा जागा) बदल लक्षात घेणे आवश्यक असते.
प्रादेशिक निर्देशांक
प्रादेशिक निर्देशांकांचा वापर विविध निर्देशकांच्या स्थानिक, आंतरप्रादेशिक तुलनासाठी केला जातो. त्यांची गणना पारंपारिक (गतिशील) निर्देशांकांच्या गणनेपेक्षा अधिक क्लिष्ट आहे.
सांख्यिकी डेटाचे ग्राफिक प्रतिनिधित्व, भौमितिक प्रतिमा, रेखाचित्रे किंवा योजनाबद्ध भौगोलिक नकाशे आणि त्यांच्या स्पष्टीकरणात्मक शिलालेखांद्वारे सामाजिक-आर्थिक घटनांवरील डेटाचे दृश्य प्रतिनिधित्व आणि सामान्यीकरण करण्याची पद्धत. सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व स्पष्टपणे आणि दृश्यमानपणे सामाजिक जीवनातील घटना आणि प्रक्रिया, त्यांच्या विकासातील मुख्य ट्रेंड, अंतराळातील त्यांच्या वितरणाची डिग्री यांच्यातील संबंध दर्शवते; आपल्याला संपूर्ण घटनांची संपूर्णता आणि त्याचे वैयक्तिक भाग दोन्ही पाहण्याची परवानगी देते.
सांख्यिकीय डेटाच्या ग्राफिकल सादरीकरणासाठी, विविध प्रकारचे सांख्यिकीय आलेख वापरले जातात. प्रत्येक आलेखामध्ये ग्राफिक प्रतिमा आणि सहायक घटक असतात. यामध्ये समाविष्ट आहे: चार्ट स्पष्टीकरण, अवकाशीय संदर्भ, स्केल संदर्भ, चार्ट फील्ड. सहाय्यक घटक आलेख वाचणे, समजून घेणे आणि वापरणे शक्य करतात. अनेक वैशिष्ट्यांनुसार आलेखांचे वर्गीकरण केले जाऊ शकते: ग्राफिक प्रतिमेच्या आकारानुसार, ते बिंदू, रेषा, प्लॅनर, अवकाशीय आणि कुरळे असू शकतात. ग्राफिक्स तयार करण्याच्या पद्धतीनुसार, ते आकृत्या आणि सांख्यिकीय नकाशेमध्ये विभागलेले आहेत.
ग्राफिक प्रतिमांचा सर्वात सामान्य मार्ग म्हणजे आकृती. हे एक रेखाचित्र आहे ज्यामध्ये सांख्यिकीय डेटा भौमितिक आकार किंवा चिन्हे म्हणून सादर केला जातो आणि हा डेटा ज्या प्रदेशाशी संबंधित आहे तो केवळ तोंडी दर्शविला जातो. जर आकृती भौगोलिक नकाशावर किंवा सांख्यिकीय डेटाशी संबंधित असलेल्या प्रदेशाच्या योजनेवर सुपरइम्पोज केली असेल, तर आलेखाला नकाशा आकृती म्हणतात. भौगोलिक नकाशा किंवा योजनेवर संबंधित प्रदेशाची छटा दाखवून किंवा रंग देऊन सांख्यिकीय डेटा दर्शविला गेल्यास, आलेखाला कार्टोग्राम म्हणतात.
भिन्न वस्तू किंवा प्रदेशांचे वैशिष्ट्य असलेल्या समान सांख्यिकीय डेटाची तुलना करण्यासाठी विविध प्रकारचे तक्ते वापरले जाऊ शकतात. सर्वात स्पष्ट म्हणजे बार चार्ट, ज्यामध्ये सांख्यिकीय डेटा अनुलंब वाढवलेला आयत म्हणून प्रदर्शित केला जातो. स्तंभांच्या उंचीची तुलना करून त्यांची स्पष्टता प्राप्त होते (चित्र 1).
जर आधाररेखा उभी असेल आणि पट्ट्या आडव्या असतील तर चार्टला स्ट्रिप चार्ट म्हणतात. आकृती 2 एक तुलना बार चार्ट दर्शविते जी जगाच्या प्रदेशाचे वैशिष्ट्य दर्शवते.
लोकप्रियतेसाठी हेतू असलेले तक्ते कधीकधी मानक आकृत्यांच्या स्वरूपात तयार केले जातात - प्रदर्शित केलेल्या सांख्यिकीय डेटाचे वैशिष्ट्य रेखाचित्रे, जे चार्टला अधिक अर्थपूर्ण बनवते आणि त्याकडे लक्ष वेधून घेते. अशा आकृत्यांना कुरळे किंवा सचित्र (चित्र 3) म्हणतात.
सूचक आलेखांचा एक मोठा गट म्हणजे स्ट्रक्चरल डायग्राम. सांख्यिकीय डेटाच्या संरचनेचे ग्राफिकल प्रतिनिधित्व करण्याच्या पद्धतीमध्ये स्ट्रक्चरल पाई किंवा पाई चार्ट (चित्र 4) काढणे समाविष्ट आहे.
वेळेत घटनेच्या विकासाची प्रतिमा आणि विश्लेषण करण्यासाठी, डायनॅमिक्सचे आकृत्या तयार केल्या जातात: बार, पट्टी, चौरस, वर्तुळाकार, रेखीय, रेडियल इ. आकृतीच्या प्रकाराची निवड प्रारंभिक डेटाच्या वैशिष्ट्यांवर अवलंबून असते, अभ्यासाचा उद्देश. उदाहरणार्थ, जर काही प्रमाणात असमान पातळी असलेल्या डायनॅमिक्सची मालिका असेल (1913, 1940, 1950, 1980, 2000, 2005), तर बार, चौरस किंवा पाई चार्ट वापरले जातात. ते दृष्यदृष्ट्या प्रभावी आहेत, चांगले लक्षात ठेवतात, परंतु मोठ्या संख्येने स्तरांचे चित्रण करण्यासाठी योग्य नाहीत. जर डायनॅमिक्सच्या मालिकेतील स्तरांची संख्या मोठी असेल, तर रेखीय आकृत्या वापरल्या जातात जे सतत तुटलेल्या रेषेच्या स्वरूपात विकास प्रक्रियेचे पुनरुत्पादन करतात (चित्र 5).
बर्याचदा, एका ओळीच्या चार्टवर अनेक वक्र दर्शविले जातात, जे विविध देशांमधील विविध निर्देशकांच्या गतिशीलतेचे किंवा समान निर्देशकाचे तुलनात्मक वर्णन देतात (चित्र 6).
एका निर्देशकाचे दुसर्यावर अवलंबित्व प्रदर्शित करण्यासाठी, संबंध आकृती तयार केली आहे. एक सूचक X म्हणून घेतला जातो आणि दुसरा Y साठी घेतला जातो (म्हणजे X चे कार्य). निर्देशकांसाठी स्केल असलेली आयताकृती समन्वय प्रणाली तयार केली आहे आणि त्यात एक आलेख काढला आहे (चित्र 7).
संगणक तंत्रज्ञान आणि उपयोजित सॉफ्टवेअरच्या विकासामुळे भौगोलिक माहिती प्रणाली (GIS) तयार करणे शक्य झाले आहे, जे माहितीच्या ग्राफिकल प्रतिनिधित्वामध्ये गुणात्मकदृष्ट्या नवीन टप्प्याचे प्रतिनिधित्व करतात. GIS स्थानिक पातळीवर समन्वित डेटाचे संकलन, संचयन, प्रक्रिया, प्रवेश, प्रदर्शन आणि वितरण प्रदान करते; मॉडेल आणि गणना फंक्शन्सच्या संयोगाने मोठ्या संख्येने ग्राफिक आणि थीमॅटिक डेटाबेस समाविष्ट करतात जे स्थानिक (कार्टोग्राफिक) स्वरूपात माहिती सादर करण्यास, विविध स्केलवर प्रदेशाचे बहु-स्तरीय इलेक्ट्रॉनिक नकाशे प्राप्त करण्यास अनुमती देतात. प्रादेशिक व्याप्तीनुसार, जागतिक, उपखंडीय, राज्य, प्रादेशिक आणि स्थानिक प्रकारचे GIS वेगळे केले जातात. GIS चे विषयाभिमुखता त्याच्या मदतीने सोडवलेल्या कार्यांद्वारे निर्धारित केले जाते, ज्यामध्ये संसाधने, विश्लेषण, मूल्यमापन, देखरेख, व्यवस्थापन आणि नियोजन यांची यादी असू शकते.
लिट.: गेर्चुक या. पी. आकडेवारीमध्ये ग्राफिक पद्धती. एम., 1968; सांख्यिकी सिद्धांत / आर. ए. श्मोयलोवा द्वारा संपादित. चौथी आवृत्ती. एम., 2005. एस. 150-83.
सांख्यिकीय आलेख एक रेखाचित्र आहे ज्यामध्ये विशिष्ट निर्देशकांद्वारे वैशिष्ट्यीकृत सांख्यिकीय लोकसंख्या सशर्त भूमितीय प्रतिमा किंवा चिन्हे वापरून वर्णन केली जाते. सांख्यिकीय आलेखांमध्ये, आयताकृती निर्देशांकांची प्रणाली बहुतेकदा वापरली जाते, परंतु ध्रुवीय निर्देशांक (परिपत्रक आलेख) च्या तत्त्वावर आधारित आलेख देखील आहेत.
चार्ट प्रकारांचे वर्गीकरण:
अ) ग्राफिक प्रतिमा तयार करण्याची पद्धत;
b) सांख्यिकीय निर्देशक आणि संबंध दर्शविणारी भौमितिक चिन्हे;
c) ग्राफिक प्रतिमेच्या मदतीने सोडवलेली कार्ये.
ग्राफिक प्रतिमेच्या स्वरूपात सांख्यिकीय आलेख:
1. रेखीय: सांख्यिकीय वक्र.
2. प्लॅनर: बार, पट्टी, चौरस, वर्तुळाकार, सेक्टर, कुरळे, बिंदू, पार्श्वभूमी.
3. व्हॉल्यूमेट्रिक: वितरण पृष्ठभाग.
बांधकाम आणि प्रतिमा कार्यांच्या पद्धतीनुसार सांख्यिकीय आलेख:
1. आकृत्या: तुलना आकृत्या, गतिशील आकृत्या, स्ट्रक्चरल आकृत्या (ग्राफिक प्रतिमांचा सर्वात सामान्य मार्ग. हे परिमाणवाचक संबंधांचे आलेख आहेत).
2. सांख्यिकीय नकाशे: कार्टोग्राम, कार्टोग्राम (पृष्ठभागावरील परिमाणवाचक वितरणाचे आलेख. त्यांच्या मुख्य उद्देशाने, ते आकृत्यांजवळ आहेत आणि केवळ या अर्थाने विशिष्ट आहेत की ते समोच्च भौगोलिक नकाशावरील सांख्यिकीय डेटाच्या सशर्त प्रतिमा आहेत, उदा. , ते स्थानिक वितरण किंवा आकडेवारीचे अवकाशीय वितरण दर्शवतात)
10/ परिपूर्ण आकडे
परिपूर्ण निर्देशकआकडेवारीद्वारे अभ्यासलेल्या प्रक्रिया आणि घटनांचे भौतिक परिमाण प्रतिबिंबित करतात, म्हणजे त्यांचे वस्तुमान, क्षेत्रफळ, खंड, लांबी, ऐहिक वैशिष्ट्ये. ते नेहमी नामांकित संख्या असतात. मध्ये व्यक्त केले नैसर्गिक, मूल्य किंवा श्रममोजमापाची एकके.
नैसर्गिक एकके - टन, किलोमीटर, लिटर, बॅरल्स, तुकडे.
सशर्त नैसर्गिक युनिट्स वापरल्या जातात जेव्हा उत्पादनामध्ये अनेक प्रकार असतात आणि एकूण व्हॉल्यूम केवळ सर्व जातींमध्ये सामान्य असलेल्या ग्राहक मालमत्तेच्या आधारावर निर्धारित केले जाऊ शकते. पारंपारिक युनिट्समध्ये रूपांतरण उत्पादनाच्या वैयक्तिक जातींच्या ग्राहक गुणधर्मांचे संदर्भ मूल्य आणि गुणोत्तर म्हणून गणना केलेल्या विशेष गुणांकांच्या आधारे केले जाते.
मोजमापाची किंमत एकके सामाजिक-आर्थिक घटनांचे (जीडीपी मूल्य) आर्थिक मूल्यांकन देतात. मोजमापाच्या कामगार युनिट्समुळे एंटरप्राइझमधील एकूण श्रम खर्च आणि तांत्रिक प्रक्रियेच्या वैयक्तिक ऑपरेशन्सची श्रम तीव्रता (मनुष्य-दिवस, मनुष्य-तास) विचारात घेणे शक्य होते.
वैयक्तिक परिपूर्ण निर्देशकस्वारस्याच्या परिमाणवाचक वैशिष्ट्याचा परिणाम म्हणून सांख्यिकीय निरीक्षणाच्या प्रक्रियेत थेट प्राप्त.
सारांश व्हॉल्यूम परिपूर्ण निर्देशकवैयक्तिक मूल्यांचा सारांश आणि गटबद्ध करून प्राप्त केले जातात.
11/ सापेक्ष निर्देशक
सापेक्ष सूचक हा एका निरपेक्ष निर्देशकाला दुसर्याने विभाजित करण्याचा परिणाम आहे आणि सामाजिक-आर्थिक घटनेच्या परिमाणवाचक वैशिष्ट्यांमधील गुणोत्तर व्यक्त करतो.
सापेक्ष निर्देशकांशिवाय, वेळेत अभ्यासाधीन घटनेच्या विकासाची तीव्रता मोजणे, त्याच्याशी संबंधित इतर घटनांच्या पार्श्वभूमीवर एका घटनेच्या विकासाच्या पातळीचे मूल्यांकन करणे, स्थानिक आणि प्रादेशिक तुलना करणे अशक्य आहे.
सापेक्ष निर्देशकाची गणना करताना, परिणामी गुणोत्तराच्या अंशामध्ये असलेल्या परिपूर्ण निर्देशकास म्हणतात. वर्तमान किंवा तुलनात्मक, आणि भाजकातील घातांक म्हणतात तुलनेचा आधार किंवा आधार.
सापेक्ष निर्देशक गुणांक, टक्केवारी, पीपीएम, दशांश मध्ये व्यक्त केले जाऊ शकतात किंवा त्यांना मूल्ये म्हणून नाव दिले जाऊ शकते. टक्केवारी अशा प्रकरणांमध्ये वापरली जाते जेथे तुलनात्मक परिपूर्ण निर्देशक बेस एक पेक्षा 2-3 वेळा जास्त नाही. जर श्रेष्ठता जास्त असेल तर गुणांक वापरला जातो.
खालील आहेत सापेक्ष निर्देशकांचे प्रकार.
डायनॅमिक्सचे सापेक्ष सूचक (RDI) हे दिलेल्या कालावधीसाठी अभ्यासाधीन प्रक्रियेच्या किंवा घटनेच्या पातळीचे आणि भूतकाळातील समान घटनेच्या पातळीचे गुणोत्तर आहे. ओपीडी टक्केवारी म्हणून मोजली जाते किंवा गुणांक म्हणून व्यक्त केली जाते.
हे मूल्य वर्तमान पातळी बेसलाइनपेक्षा किती पटीने मोठे आहे किंवा बेसलाइनचे किती प्रमाणात आहे हे दर्शवते. जर GPV एकाधिक म्हणून व्यक्त केला असेल, तर तो वाढीचा घटक आहे. जेव्हा हा घटक 100 ने गुणाकार केला जातो तेव्हा वाढीचा दर प्राप्त होतो.
योजनेचा सापेक्ष सूचक (RPI) म्हणजे भूतकाळात आधीच साध्य केलेल्या निर्देशकाच्या नियोजित पातळीचे गुणोत्तर. ROP, RAP प्रमाणे, टक्केवारी किंवा गुणोत्तर म्हणून व्यक्त केले जाते.
रिलेटिव्ह प्लॅन इम्प्लिमेंटेशन इंडिकेटर (पीआरआरपी) हे इंडिकेटरच्या नियोजित स्तरावर प्रत्यक्षात साध्य केलेल्या पातळीचे गुणोत्तर आहे. PRRP टक्केवारी किंवा गुणोत्तर म्हणून देखील व्यक्त केला जातो.
रिलेटिव्ह स्ट्रक्चर इंडेक्स (RPS) हे अभ्यासाधीन ऑब्जेक्टच्या स्ट्रक्चरल भागांचे गुणोत्तर आहे आणि लोकसंख्येचा एक भाग आणि संपूर्ण लोकसंख्येचे वैशिष्ट्य दर्शविणाऱ्या निर्देशकाच्या गुणोत्तराद्वारे निर्धारित केले जाते. OPS युनिट्सच्या अपूर्णांकांमध्ये किंवा टक्केवारी म्हणून व्यक्त केले जाते.
रिलेटिव्ह कोऑर्डिनेशन इंडेक्स (RIC) - एका ऑब्जेक्टशी संबंधित वेगवेगळ्या भागांचे गुणोत्तर.
सापेक्ष तुलना निर्देशांक (RPCr) हे एकाच नावाच्या निरपेक्ष निर्देशकांचे गुणोत्तर आहे जे भिन्न वस्तूंचे वैशिष्ट्य दर्शवतात.
सापेक्ष तीव्रता निर्देशक (RII) त्याच्या अंतर्निहित वातावरणात अभ्यासाच्या अंतर्गत प्रक्रियेच्या किंवा घटनेच्या प्रसाराची डिग्री दर्शवितो आणि या घटनेच्या वितरणासाठी वातावरणाचे वैशिष्ट्य दर्शविणार्या निर्देशकाच्या इंद्रियगोचरच्या गुणोत्तराद्वारे निर्धारित केले जाते. ओपीआय टक्के, पीपीएम, डेसिमिलमध्ये मोजले जाते. जेव्हा घटनेच्या प्रमाणाबद्दल वाजवी निष्कर्ष काढण्यासाठी परिपूर्ण मूल्य अपुरे असते तेव्हा या निर्देशकाची गणना केली जाते. विविध प्रकारचे OPII निर्देशक आहेत आर्थिक विकासाची पातळीदरडोई जीडीपीचे उत्पादन, दरडोई व्यापार उलाढाल इ. आर्थिक विकासाच्या पातळीच्या निर्देशकांना मूल्ये नावाची नावे दिली जातात आणि दरडोई रूबल इ. मध्ये मोजली जातात.
§1. सांख्यिकी संकल्पना, सांख्यिकीय नियमितता आणि संपूर्णता ..... 2
§2. सांख्यिकीय लोकसंख्येच्या एककांची चिन्हे, त्यांचे वर्गीकरण ...... 2
एक सांख्यिकीय निरीक्षणाची संकल्पना, त्याची तयारी ............... 4
§2. सांख्यिकीय निरीक्षणाचे प्रकार ................................................. .................. 5
§3. निरीक्षण त्रुटी ................................................ ..................................... 6
§ चार. सारांश आणि गटीकरण ................................................ ............................... 6
§5. सांख्यिकीय गटांचे प्रकार .................................. ............ 6
§6. सांख्यिकीय तक्ते................................................ ............... 7
§7. सांख्यिकीय आलेख ................................................ ..................... आठ
एक वास्तविक आणि सैद्धांतिक वितरण ................................................ 21
§2. सामान्य वितरण वक्र ................................................... २१
§3. सामान्य वितरणाच्या गृहीतकाची चाचणी करणे................................. 21
§ चार. कॉन्कॉर्डन्स निकष: पिअर्सन, रोमानोव्स्की, कोल्मोगोरोव........... २१
§5. मॉडेलिंग वितरण मालिकेचे व्यावहारिक मूल्य ..... 22
एक निवडक निरीक्षणाची संकल्पना. त्याच्या वापराची कारणे ...... 23
§3. नमुना त्रुटी ................................................ ............... २४
§ चार. नमुना निरीक्षण कार्ये................................................ २५
§5. सामान्य लोकसंख्येपर्यंत नमुना निरीक्षण डेटा विस्तारित करणे... 26
§6. छोटा नमुना ................................................ .............................. २६
§एक. सहसंबंध आणि CRA ची संकल्पना ..................................... 27
§2. KPA च्या वापरासाठी अटी आणि मर्यादा .................................. 27
§3. किमान वर्गांच्या पद्धतीवर आधारित पेअर रिग्रेशन.. 28
§ चार. जोडलेल्या रेखीय प्रतिगमन समीकरणाचा वापर.......... 29
§6. अनेक सहसंबंध ................................................ 32
विषय 1.: आकडेवारीचा परिचय.
- सांख्यिकी संकल्पना, सांख्यिकीय नियमितता आणि लोकसंख्या.
- सांख्यिकीय लोकसंख्येच्या एककांची चिन्हे, त्यांचे वर्गीकरण.
- आकडेवारीचा विषय आणि पद्धत.
§1. सांख्यिकी संकल्पना, सांख्यिकीय नियमितता आणि संपूर्णता.
सांख्यिकी हा शब्द लॅटिनमधून आला आहे. स्थिती" भाषांतरात - एक राज्य, एक स्थिती.
सांख्यिकी हा शब्द 18 व्या शतकाच्या उत्तरार्धात उद्भवला. राज्यांच्या ज्ञानाच्या संबंधात, त्यांच्या वैशिष्ट्यांचा अभ्यास. विद्यापीठात सांख्यिकी शिकवण्याची सुरुवात त्याच काळात झाली. सांख्यिकी संशोधनाच्या शाखेवर अवलंबून आहे: लोकसंख्या, उद्योग, शेती इत्यादींची आकडेवारी. - लागू आकडेवारी.
सांख्यिकीचा सामान्य सिद्धांत हा संख्यात्मक डेटा गोळा करणे, प्रक्रिया करणे, सादर करणे आणि विश्लेषण करणे यासाठी पद्धती आणि तंत्रांचा एक संच आहे. सांख्यिकी हा शब्द आज 3 अर्थांमध्ये वापरला जातो:
- "डेटा" शब्दाचा समानार्थी शब्द म्हणून
- अर्थांची एक शाखा जी वस्तुमान घटना दर्शविणार्या संख्यात्मक डेटासह कार्य करण्याच्या तत्त्वे आणि पद्धती एकत्र करते (पुरुषांचे आयुर्मान स्त्रियांपेक्षा कमी आहे)
- संख्यात्मक डेटावर प्रक्रिया आणि विश्लेषण करण्याच्या उद्देशाने व्यावहारिक क्रियाकलापांची एक शाखा.
सांख्यिकी सामाजिक-आर्थिक प्रक्रिया आणि घटनांच्या विकासाचा नमुना तसेच स्थान आणि वेळेच्या विशिष्ट परिस्थितीत त्यांच्यातील संबंध ओळखणे आणि मोजणे शक्य करते.
नियमितता म्हणजे घटनांमधील बदलांची पुनरावृत्ती, क्रम आणि क्रम.
सांख्यिकीय नियमितता - एक नियमितता ज्यामध्ये प्रत्येक वैयक्तिक इंद्रियगोचरमध्ये आवश्यकतेचा अविभाज्यपणे संबंध जोडलेला असतो आणि केवळ अनेक घटनांमध्ये एक कायदा म्हणून प्रकट होतो. सांख्यिकीय नियमिततेच्या संकल्पनेला गतिमान नियमिततेच्या संकल्पनेने विरोध केला आहे जो प्रत्येक घटनेत स्वतःला प्रकट करतो. (उदाहरण: S वर्तुळ =pr 2 पेक्षा > r विषय > S वर्तुळ). सांख्यिकीय संशोधनाचा उद्देश सांख्यिकीय संच आहे - एककांचा संच ज्यामध्ये वस्तुमान वर्ण, एकसंधता, अखंडता आणि भिन्नतेच्या उपस्थितीद्वारे निर्धारित केली जाते. प्रत्येक वैयक्तिक घटकाला सांख्यिकीय लोकसंख्या युनिट (ESS) म्हणतात.
§2. सांख्यिकीय लोकसंख्येच्या एककांची चिन्हे, त्यांचे वर्गीकरण.
ECC मध्ये काही गुणधर्म असतात ज्यांना वैशिष्ट्ये म्हणतात. सांख्यिकी त्यांच्या वैशिष्ट्यांद्वारे घटनांचा अभ्यास करते, संच जितका अधिक एकसंध, त्याच्या युनिट्सची अधिक सामान्य वैशिष्ट्ये आणि या वैशिष्ट्यांची मूल्ये कमी असतात.
वर्णनात्मक चिन्ह हे एक चिन्ह आहे जे केवळ तोंडी व्यक्त केले जाऊ शकते.
- परिमाणवाचक चिन्ह - एक चिन्ह जे संख्यात्मकरित्या व्यक्त केले जाऊ शकते.
- थेट चिन्ह ही एक गुणधर्म आहे जी एखाद्या वैशिष्ट्यपूर्ण वस्तूमध्ये थेट अंतर्भूत असते.
- अप्रत्यक्ष चिन्ह म्हणजे वैशिष्ट्यीकृत वस्तूचे गुणधर्म नसून त्याच्याशी संबंधित किंवा त्यात समाविष्ट असलेल्या वस्तूचे गुणधर्म.
- प्राथमिक गुणधर्म हे एक परिपूर्ण मूल्य आहे जे मोजले जाऊ शकते.
- दुय्यम वैशिष्ट्य - प्राथमिक वैशिष्ट्यांच्या तुलनाचा परिणाम, तो थेट मोजला जातो.
- नैसर्गिक चिन्ह - तुकडे, किलो, टन, लिटर इ. मध्ये मोजले जाते.
- श्रम चिन्ह - मनुष्य-दिवस, मनुष्य-तासांमध्ये मोजले जाते.
- मूल्य गुणधर्म - रूबल, $, €, ₤ मध्ये मोजले.
- आकारहीन चिन्ह - समभागांमध्ये मोजमाप,%
- पर्यायी वैशिष्ट्य हे असे वैशिष्ट्य आहे जे अनेक संभाव्यांपैकी केवळ एकच मूल्य घेते.
- स्वतंत्र चिन्ह - मध्यवर्ती चिन्हाशिवाय केवळ पूर्णांक मूल्य घेते.
- एक सतत वैशिष्ट्य हे एक वैशिष्ट्य आहे जे विशिष्ट श्रेणीमध्ये कोणतेही मूल्य घेते.
- घटक गुणधर्म हे एक वैशिष्ट्य आहे जे दुसरे वैशिष्ट्य बदलते.
- प्रभावी गुणधर्म - एक वैशिष्ट्य जे दुसर्याच्या वैशिष्ट्याखाली बदलते
- क्षणिक चिन्ह - ठराविक वेळी मोजले जाणारे चिन्ह.
- मध्यांतर चिन्ह - विशिष्ट कालावधीसाठी चिन्ह.
वेगवेगळ्या वर्गीकरणांनुसार समान वैशिष्ट्याचे एकाच वेळी वर्गीकरण केले जाऊ शकते.
§3. आकडेवारीचा विषय आणि पद्धत.
सांख्यिकीय संशोधनाचा विषय सांख्यिकीय समुच्चय आहे - एक-गुणवत्तेच्या भिन्न वस्तूंचा संच.
आकडेवारीच्या विषयाची वैशिष्ट्ये पद्धतीची वैशिष्ट्ये निर्धारित करतात, त्यामध्ये हे समाविष्ट आहे:
- डेटा संकलन (सांख्यिकीय निरीक्षण, प्रकाशन)
- डेटाचे सामान्यीकरण (सारांश, गटीकरण)
- डेटा सादरीकरण (टेबल आणि आलेख)
- संख्यात्मक डेटाचे विश्लेषण आणि व्याख्या (सरासरीची गणना, फरकांचे विश्लेषण, केआरए, डायनॅमिक्सची मालिका, निर्देशांक)
विषय 2: सांख्यिकीय निरीक्षणाचे आयोजन.
डेटाचा सारांश आणि समूहीकरण.
एक सांख्यिकीय निरीक्षणाची संकल्पना, त्याची तयारी.
§2. सांख्यिकीय निरीक्षणाचे प्रकार.
§3 निरीक्षणातील त्रुटी.
§4 सारांश आणि समूहीकरण
§5 सांख्यिकीय गटांचे प्रकार.
§6 सांख्यिकी सारण्या.
§7 सांख्यिकीय आलेख.
एक सांख्यिकीय निरीक्षणाची संकल्पना, त्याची तयारी.
कोणतेही सांख्यिकीय संशोधन डेटाच्या संकलनापासून सुरू होते.
माहितीचे स्रोत:
- विविध प्रकाशने (वृत्तपत्रे, मासिके इ.)
- प्रकाशित सांख्यिकीय माहितीचा मुख्य स्त्रोत म्हणजे राज्य सांख्यिकी संस्थांचे प्रकाशन (2001 मध्ये आरएफ, GOSKOMSTAT प्रकाशन गृह).
- सांख्यिकीय निरीक्षण पार पाडणे, म्हणजे वैज्ञानिकदृष्ट्या आयोजित डेटा संग्रह.
सांख्यिकीय निरीक्षण हे सामाजिक आणि आर्थिक जीवनाच्या घटनेचे वस्तुमान, नियोजित, वैज्ञानिकदृष्ट्या आयोजित केलेले निरीक्षण आहे, ज्यामध्ये अभ्यास केलेल्या लोकसंख्येच्या प्रत्येक युनिटसाठी चिन्हे नोंदविली जातात.
निरीक्षण प्रक्रिया:
- निरीक्षणाची तयारी करत आहे
- वस्तुमान डेटा संकलन आयोजित करणे
- प्रक्रियेसाठी डेटा तयार करत आहे
- सांख्यिकीय निरीक्षणाच्या सुधारणेसाठी प्रस्तावांचा विकास.
निरीक्षण तयारी:
- निरीक्षणाचा उद्देश आणि ऑब्जेक्ट निश्चित करणे
- नोंदणीच्या अधीन असलेल्या चिन्हांच्या रचनेचे निर्धारण
- डेटा संकलनासाठी दस्तऐवजांचा विकास
- रिपोर्टिंग युनिटची निवड आणि ज्या युनिटविरुद्ध निरीक्षण केले जाईल.
- डेटा मिळविण्याच्या पद्धती आणि माध्यमांची व्याख्या करणे आवश्यक आहे.
संघटनात्मक समस्या सोडवल्या पाहिजेत:
- अभ्यास करणार्या सेवांची रचना निश्चित करणे आवश्यक आहे
- कर्मचारी थोडक्यात
- कामाचे वेळापत्रक तयार करा
- डेटा संकलनासाठी दस्तऐवजांची प्रतिकृती
निरीक्षणाचा उद्देश सामाजिक-आर्थिक घटना आणि प्रक्रिया आहे.
नोंदणीसाठी चिन्हे स्पष्टपणे ओळखणे आवश्यक आहे.
निरीक्षण कार्यक्रम - निरीक्षणाच्या प्रक्रियेत नोंदणीच्या अधीन असलेल्या चिन्हांच्या चिन्हांची यादी.
निरीक्षण कार्यक्रम आवश्यकता:
- प्रोग्राममध्ये अत्यावश्यक वैशिष्ट्ये असावीत जी अभ्यासाधीन घटना थेट दर्शवितात; दुय्यम घटना किंवा चिन्हे असलेली चिन्हे, ज्याची मूल्ये स्पष्टपणे अविश्वसनीय असतील किंवा पूर्णपणे अनुपस्थित असतील, प्रोग्राममध्ये समाविष्ट करू नयेत.
- निरीक्षण कार्यक्रमाचे प्रश्न अचूक आणि अस्पष्ट नसावेत आणि उत्तरे मिळवण्यात अडचणी येऊ नयेत म्हणून ते समजण्यास सोपे असावेत.
- प्रश्नांचा क्रम ठरवावा.
- संकलित केलेल्या डेटाचे संचालन आणि स्पष्टीकरण करण्यासाठी मॉनिटरिंग प्रोग्राममध्ये थेट स्वरूपाचे प्रश्न समाविष्ट केले पाहिजेत.
- मिळालेल्या माहितीची एकसमानता सुनिश्चित करण्यासाठी, प्रोग्राम दस्तऐवजाच्या स्वरूपात तयार केला जातो - ज्याला सांख्यिकीय फॉर्म म्हणतात.
सांख्यिकीय फॉर्म हा प्रोग्राम आणि निरीक्षणांचे परिणाम असलेल्या एका नमुन्याचे दस्तऐवज आहे.
वैयक्तिक स्वरूप (निरीक्षणाच्या एका युनिटवरील प्रश्नांची उत्तरे) आणि राइट ऑफ (सांख्यिकीय लोकसंख्येच्या अनेक युनिट्सवरील माहिती) यांच्यात फरक केला जातो.
फॉर्म आणि तो भरण्यासाठीच्या सूचना ही सांख्यिकीय निरीक्षणाची साधने आहेत.
निरीक्षण वेळेच्या निवडीमध्ये 2 प्रश्न सोडवणे समाविष्ट आहे: एक महत्त्वपूर्ण तारीख किंवा मध्यांतर स्थापित करणे, निरीक्षण कालावधी निश्चित करणे.
गंभीर तारीख - वर्षाचा एक विशिष्ट दिवस, दिवसाचा तास ज्याची चिन्हे अभ्यासलेल्या लोकसंख्येच्या प्रत्येक युनिटसाठी नोंदणीकृत असणे आवश्यक आहे.
निरीक्षण कालावधी - ज्या कालावधीत सांख्यिकीय फॉर्म भरले जातात, उदा. डेटा गोळा करण्यासाठी लागणारा वेळ.
हे लक्षात घेतले पाहिजे की गंभीर तारीख किंवा मध्यांतरापासून निरीक्षण कालावधीचे अंतर प्राप्त झालेल्या माहितीची विश्वासार्हता कमी करू शकते.
§2. सांख्यिकीय निरीक्षणाचे प्रकार.
देशांतर्गत आकडेवारीमध्ये, सांख्यिकीय निरीक्षणाचे तीन प्रकार वापरले जातात.
- उपक्रम, संस्था, संस्थांचे सांख्यिकीय अहवाल.
- विशेषतः आयोजित सांख्यिकीय निरीक्षण (जनगणना, इ.)
- नोंदणी - दीर्घकालीन प्रक्रियांच्या सतत सांख्यिकीय निरीक्षणाचा एक प्रकार
सांख्यिकीय निरीक्षणाचे वर्गीकरण केले जाते:
निरीक्षण वेळेनुसार:
- वर्तमान निरीक्षण - चिन्हांची सतत नोंदणी केली जाते (नोंदणी कार्यालय, गुन्हा इ.).
- नियतकालिक निरीक्षण - ठराविक कालांतराने केले जाते (चेल्याबिन्स्क शहरातील राहणीमान, ग्राहक टोपलीची किंमत, लोकसंख्या जनगणना).
- एक-वेळ - विशिष्ट हेतूसाठी एकदा केलेले निरीक्षण.
लोकसंख्या युनिट्सच्या कव्हरेजनुसार:
- सतत निरीक्षण - सर्व ECC ची माहिती मिळवणे आवश्यक आहे
- पूर्ण निरीक्षण नाही
- मुख्य अॅरेची पद्धत - अभ्यासलेल्या लोकसंख्येच्या सर्वात महत्त्वपूर्ण युनिट्सची तपासणी केली जाते (चेल्याबिन्स्क प्रदेशाच्या अभियांत्रिकी उपक्रमाचा अभ्यास करण्यासाठी).
- निवडक निरीक्षण हे निरीक्षण करण्यासाठी ECC ची यादृच्छिक निवड आहे.
- मोनोग्राफिक निरीक्षण - जेव्हा एक ECC निरीक्षण केले जाते, तेव्हा ते बहुधा वस्तुमान निरीक्षण कार्यक्रम तयार करण्यासाठी वापरले जातात.
डेटा संकलनाच्या मार्गाने:
- थेट निरीक्षण - रजिस्ट्रार स्वत:, थेट मोजमाप करून, वजन करून, नोंदणीकृत विषयाची वस्तुस्थिती स्थापित करतात (पॉलीक्लिनिकमध्ये 1 वर्षापेक्षा कमी वयाचे मूल).
- डॉक्युमेंटरी निरीक्षण - विविध दस्तऐवज वापरले जातात (घोषणा काढणे)
मतदान - आवश्यक माहिती प्रतिसादकर्त्याच्या शब्दांमधून मिळविली जाते.
- फॉरवर्डिंग सर्वेक्षण - विशेष प्रशिक्षित कर्मचार्यांद्वारे केले जाते जे संबंधित व्यक्तींच्या सर्वेक्षणाच्या आधारे आवश्यक माहिती प्राप्त करतात आणि स्वतः उत्तरे फॉर्ममध्ये रेकॉर्ड करतात. मोहीम सर्वेक्षण प्रत्यक्ष (समोरासमोर) आणि अप्रत्यक्ष (फोनद्वारे सर्वेक्षण) असू शकते.
- संवाददाता सर्वेक्षण - स्वयंसेवी वार्ताहरांच्या कर्मचार्यांकडून माहिती प्रदान केली जाते, या पद्धतीसाठी थोडासा आर्थिक खर्च आवश्यक आहे, परंतु निरीक्षणाचे अचूक मूल्य देत नाही.
- स्व-नोंदणी - फॉर्म प्रतिसादकर्त्यांनी स्वतः भरले आहेत आणि रजिस्ट्रार फक्त त्यांना प्रश्नावलीचे फॉर्म वितरित करतात आणि ते कसे भरायचे ते स्पष्ट करतात.
§3. निरीक्षण त्रुटी
सांख्यिकीय निरीक्षणासाठी लागू केलेली मुख्य आवश्यकता म्हणजे अचूकता.
अचूकता - सांख्यिकीय निरीक्षणाच्या सामग्रीवरून निर्धारित केलेल्या वास्तविक मूल्यासह कोणत्याही वैशिष्ट्यपूर्ण निर्देशकाच्या अनुपालनाची डिग्री.
गणना केलेल्या आणि वास्तविक मूल्यांमधील विसंगतीला निरीक्षण त्रुटी म्हणतात, घटनेच्या कारणांवर अवलंबून, ते वेगळे करतात: नोंदणी त्रुटी आणि प्रतिनिधीत्व त्रुटी. नोंदणी त्रुटी यादृच्छिक आणि पद्धतशीर विभागल्या आहेत.
यादृच्छिक त्रुटी - यादृच्छिक घटकांच्या क्रियांचा परिणाम (पंक्ती, स्तंभ मिसळले आहेत)
पद्धतशीर त्रुटी - नेहमी एकतर एकतर जास्त मोजणे किंवा निर्देशक कमी लेखणे. (वय)
प्रातिनिधिकता त्रुटी हे सतत निरीक्षण न ठेवण्याचे स्वरूप आहे आणि संपूर्ण मूळ लोकसंख्येच्या नमुन्याच्या चुकीच्या पुनरुत्पादनामुळे उद्भवतात.
सांख्यिकीय फॉर्म प्राप्त केल्यानंतर, आपण हे करणे आवश्यक आहे:
- गोळा केलेल्या डेटाची पूर्णता तपासा.
- एकमेकांशी विविध वैशिष्ट्यांच्या संबंधांवर आधारित अंकगणित नियंत्रण करा.
- वैशिष्ट्यांमधील तार्किक संबंधांच्या ज्ञानावर आधारित तार्किक नियंत्रण अमलात आणणे.
§ चार. सारांश आणि समूहीकरण
संकलित केलेल्या डेटाच्या आधारे, गणना करणे आणि निष्कर्ष काढणे अशक्य आहे; प्रथम, त्यांना एका सारणीमध्ये सारांशित करणे आणि सारांशित करणे आवश्यक आहे. या हेतूंसाठी, सारांश आणि गटीकरण वापरले जातात.
सारांश - विशिष्ट एकल तथ्यांचे सामान्यीकरण करण्यासाठी अनुक्रमिक ऑपरेशन्सचा एक संच जो एक संच तयार करतो आणि संपूर्णपणे अभ्यासाच्या अंतर्गत घटनेत अंतर्भूत वैशिष्ट्यपूर्ण वैशिष्ट्ये आणि नमुने ओळखतो.
साधे वोडका - लोकसंख्येसाठी बेरीज मोजणे.
एक जटिल सारांश म्हणजे वैयक्तिक निरीक्षणांचे गट करणे, प्रत्येक गटासाठी आणि संपूर्ण ऑब्जेक्टसाठी परिणाम मोजणे आणि सांख्यिकीय सारण्यांच्या स्वरूपात निकाल सादर करणे हे ऑपरेशन्सचा एक संच आहे.
सामग्री प्रक्रियेच्या स्वरूपानुसार, सारांश विकेंद्रित, केंद्रीकृत केला जाऊ शकतो - असा सारांश एक-वेळच्या सांख्यिकीय निरीक्षणासह केला जातो.
गटबद्ध करणे - अभ्यास केलेल्या लोकसंख्येच्या एककांच्या संचाचे विशिष्ट वैशिष्ट्यांनुसार गटांमध्ये विभागणे.
§5. सांख्यिकीय गटांचे प्रकार
रचना आणि सामग्रीनुसार गटांचे वर्गीकरण केले जाऊ शकते.
विश्लेषणात्मक गटबाजी वैशिष्ट्यांमधील संबंध दर्शवते, ज्यापैकी एक घटक असतो आणि दुसरा उत्पादक असतो.
शिक्षण |
|||
अपूर्ण उच्च |
|||
§6. सांख्यिकी सारण्या
सारांश आणि ग्रुपिंगचे परिणाम अशा प्रकारे सादर केले पाहिजेत की ते वापरता येतील.
डेटा सादर करण्याचे 3 मार्ग आहेत:
- डेटा मजकूरात समाविष्ट केला जाऊ शकतो.
- सारण्यांमध्ये सादरीकरण.
- ग्राफिक मार्ग
सांख्यिकी सारणी - पंक्ती आणि स्तंभांची एक प्रणाली ज्यामध्ये सामाजिक-आर्थिक घटनांवरील सांख्यिकीय माहिती एका विशिष्ट क्रमाने सादर केली जाते.
सारणीचा विषय आणि प्रेडिकेटमध्ये फरक करा.
विषय हा अंकांद्वारे वैशिष्ट्यीकृत ऑब्जेक्ट आहे, सहसा विषय टेबलच्या डाव्या बाजूला दिलेला असतो.
प्रेडिकेट ही निर्देशकांची एक प्रणाली आहे ज्याद्वारे ऑब्जेक्टची वैशिष्ट्ये दर्शविली जातात.
सांख्यिकीय सारणीमध्ये 3 प्रकारचे शीर्षलेख आहेत: सामान्य, बाजू
सामान्य शीर्षकाने संपूर्ण सारणीची सामग्री प्रतिबिंबित केली पाहिजे, मध्यभागी टेबलच्या वर स्थित आहे.
टेबल नियम.
- शब्द संक्षेपाशिवाय सर्व तीन प्रकारची शीर्षके आवश्यक आहेत, मापनाची सामान्य एकके शीर्षकामध्ये ठेवली जाऊ शकतात.
- टेबलमध्ये अतिरिक्त रेषा नसाव्यात, उभ्या खुणा गहाळ असू शकतात.
- अंतिम ओळ आवश्यक आहे. हे एकतर दस्तऐवजाच्या सुरूवातीस किंवा शेवटी असू शकते. जर दस्तऐवजाच्या सुरुवातीला असेल तर शेवटी असेल तर TOTAL:
- एका स्तंभातील डिजिटल डेटा एका अंश अचूकतेसह रेकॉर्ड केला जातो. अंक अंकांच्या खाली काटेकोरपणे लिहिलेले आहेत, संपूर्ण भाग स्वल्पविरामाने विभक्त केला आहे.
- टेबलमध्ये रिक्त सेल नसावेत, जर डेटा नसेल तर ते "माहिती नाही" किंवा "..." लिहितात, जर डेटा शून्य असेल तर "-". जर मूल्य शून्याच्या बरोबरीचे नसेल परंतु निर्दिष्ट अचूकता 0.01®0.0 नंतर पहिला महत्त्वाचा अंक दिसतो - जर स्वीकृत अचूकता दहाव्या भागापर्यंत असेल.
- जर टेबलमध्ये अनेक स्तंभ असतील, तर विषयाचे स्तंभ कॅपिटल अक्षरांनी आणि प्रेडिकेटचे स्तंभ संख्यांद्वारे सूचित केले जातात.
- जर टेबल उधार घेतलेल्या डेटावर आधारित असेल, तर डेटाचा स्रोत टेबलच्या खाली दर्शविला जातो; आवश्यक असल्यास, टेबल नोट्ससह असू शकते.
§7. सांख्यिकी आलेख
सांख्यिकी सारण्यांना आलेखांसह पूरक केले जाऊ शकते.
सांख्यिकीय आलेख म्हणजे संख्यात्मक मूल्यांच्या सशर्त प्रतिमा आणि रेषा, भूमितीय आकार, रेखाचित्रे यांच्याद्वारे त्यांचे गुणोत्तर.
ग्राफिक प्रतिमेचे फायदे
- स्पष्टपणे, स्पष्टपणे, स्पष्टपणे.
- निर्देशक बदलण्याची मर्यादा, बदलाचा तुलनात्मक दर आणि अस्थिरता त्वरित दृश्यमान आहे
ग्राफिक प्रतिमेचे तोटे
- सारणीपेक्षा कमी डेटा समाविष्ट करा.
- आलेख गोलाकार डेटा, सामान्य परिस्थिती दाखवतो, परंतु तपशील नाही.
सांख्यिकी आलेख |
आकृत्या |
कुरळे |
विषय 3: सांख्यिकीय निर्देशक.
एक सांख्यिकीय निर्देशकाचे सार आणि अर्थ, त्याचे गुणधर्म.
§2. सांख्यिकीय निर्देशकांचे वर्गीकरण.
§3. सापेक्ष निर्देशकांचे प्रकार. बांधकाम तत्त्वे.
§ चार. सांख्यिकीय निर्देशक प्रणाली.
सांख्यिकीय चिन्ह ही ESS मध्ये अंतर्भूत असलेली एक मालमत्ता आहे, ती वस्तुनिष्ठपणे अस्तित्वात आहे की त्याचा विज्ञान म्हणून अभ्यास केला जातो किंवा नाही.
सांख्यिकीय निर्देशक हे लोकसंख्येच्या काही मालमत्तेचे सामान्यीकरण वैशिष्ट्य आहे.
सांख्यिकीय निर्देशकाची रचना (त्याचे गुणधर्म):
- सरासरी मूल्ये
- भिन्नता निर्देशक
- वैशिष्ट्य कनेक्शन निर्देशक
- वितरणाची रचना आणि स्वरूपाचे निर्देशक
- डायनॅमिक निर्देशक
- परिवर्तनशीलता निर्देशक
- नमुना अंदाजांची अचूकता आणि विश्वासार्हतेचे निर्देशक
- अंदाज अचूकता आणि विश्वसनीयता निर्देशक
प्रकारानुसार: युनिट्सची एकूण संख्या किंवा ऑब्जेक्टची एकूण मालमत्ता. ही प्राथमिक वैशिष्ट्यांची बेरीज आहे, तुकडे, kg, m, $, इ.
सापेक्ष सूचक- अवकाशातील निरपेक्ष किंवा सापेक्ष निर्देशकांची तुलना करून, वेळेत किंवा अभ्यासाधीन ऑब्जेक्टच्या विविध गुणधर्मांच्या निर्देशकांची तुलना करून मिळवले.
2 x निरपेक्ष निर्देशकांची तुलना करून 1ल्या क्रमाचा सापेक्ष निर्देशक प्राप्त केला जातो. 2रा ऑर्डर रिलेटिव्ह इंडिकेटर 1ली ऑर्डर रिलेटिव्ह इंडिकेटर इ.ची तुलना करून मिळवला जातो.
3रा क्रम आणि उच्च सापेक्ष निर्देशांक फार दुर्मिळ आहे.
डायरेक्ट इंडिकेटर - असे निर्देशक, ज्याचे मूल्य अभ्यासाधीन घटनेच्या वाढीसह वाढते.
व्यस्त सूचक - निर्देशक ज्यांचे मूल्य अभ्यासाधीन घटनेच्या वाढीसह कमी होते.
… संरचना |
…वक्ते |
…नाते |
… तीव्रता |
…मानकांशी संबंध |
... तुलना |
रचना निर्देशकसंपूर्ण भागाशी संबंधित करून मिळवले जातात.
गतिशीलतेचे सापेक्ष संकेतक
ü गतिशीलतेचे निर्देशक (वाढीचा दर, वाढ)
ü निर्देशांक
नातेसंबंध निर्देशकवैशिष्ट्यांमधील संबंध दर्शवा:
ü सहसंबंध गुणांक
ü विश्लेषणात्मक निर्देशांक
तीव्रता निर्देशकवेगवेगळ्या आधारांवर दोन वस्तूंचे संबंध वैशिष्ट्यीकृत करा.
ü श्रम तीव्रता - उत्पादनाचे एक युनिट तयार करण्यासाठी लागणारा वेळ
ü उत्पादन - वेळेच्या प्रति युनिट उत्पादित उत्पादनांचे प्रमाण
आउटपुट \u003d 1 / श्रम तीव्रता
मानकांकडे वृत्तीचे सूचक- निर्देशकाच्या चिन्हाच्या वास्तविक मूल्यांचे प्रमाण मानक, नियोजित, इष्टतम.
तुलना निर्देशक -एकाच आधारावर वेगवेगळ्या वस्तूंची तुलना.
सांख्यिकीय निर्देशक तयार करण्यासाठी सामान्य तत्त्वे:
- आकडेवारी वस्तुनिष्ठपणे संबंधित आहेत.
- तुलना केलेले सूचक फक्त एका विशेषतामध्ये भिन्न असू शकतात; तुम्ही दोन किंवा अधिक गुणधर्मांद्वारे निर्देशकाची तुलना करू शकत नाही.
- निर्देशकाच्या मर्यादा जाणून घेणे आणि विचारात घेणे आवश्यक आहे.
ऑब्जेक्टच्या प्रत्येक वैशिष्ट्यासाठी, सांख्यिकीय निर्देशकांची एक प्रणाली आवश्यक आहे.
- संज्ञानात्मक कार्य - डेटा विश्लेषणावर आधारित
- प्रचार
- उत्तेजक कार्य
विषय 4: सरासरी
एक सरासरी संकल्पना
§2. सरासरीचे प्रकार
§3. अंकगणित सरासरी आणि त्याचे गुणधर्म
§ चार. हार्मोनिक मीन, भौमितिक माध्य, चतुर्भुज माध्य.
§5. बहुविविध सरासरी
सांख्यिकीय निर्देशकांचा सर्वात सामान्य प्रकार म्हणजे सरासरी.
सरासरीचा सर्वात महत्त्वाचा गुणधर्म असा आहे की ते अभ्यासाधीन लोकसंख्येच्या प्रत्येक युनिटमध्ये अंतर्भूत असलेले सामान्य प्रतिबिंबित करते, जरी लोकसंख्येच्या वैयक्तिक युनिट्सच्या गुणधर्माचे मूल्य एका दिशेने किंवा दुसर्या दिशेने चढ-उतार होऊ शकते.
सरासरीची वैशिष्ट्यपूर्णता थेट अभ्यास केलेल्या लोकसंख्येच्या एकसमानतेशी संबंधित आहे. एकसमान नसलेल्या लोकसंख्येच्या बाबतीत, ते गुणात्मक एकसंध गटांमध्ये विभागणे आणि प्रत्येक एकसंध गटासाठी प्रत्येकासाठी सरासरी मोजणे आवश्यक आहे.
तुम्ही सरासरी (ISS) त्याच्या तार्किक सूत्राच्या प्रारंभिक गुणोत्तराद्वारे सरासरी निर्धारित करू शकता.
स्ट्रक्चरल सरासरी
फॅशन - मो
मध्यक - मी
डायनॅमिक्सच्या मालिकेत, अंकगणित सरासरी आणि कालक्रमानुसार गणना केली जाते.
अंकगणित सरासरी वैशिष्ट्याचे असे सरासरी मूल्य असे म्हणतात ज्याच्या गणनेमध्ये वैशिष्ट्याचा एकूण खंड बदलत नाही.
उदाहरण: वजन.
बुध साधे अंकगणित
x i- वैशिष्ट्याचे वैयक्तिक मूल्य
n ही अभ्यास केलेल्या लोकसंख्येची एकूण संख्या आहे
cf अंकगणित भारित
गुणधर्म cf. अंकगणित
एखाद्या वैशिष्ट्याच्या वैयक्तिक मूल्यांच्या त्याच्या सरासरी मूल्यापासून विचलनाची बेरीज शून्य आहे
वैशिष्ट्याचे प्रत्येक वैयक्तिक मूल्य समान स्थिर संख्येने गुणाकार किंवा भागल्यास, सरासरी समान प्रमाणात वाढेल किंवा कमी होईल.
गुणधर्माच्या प्रत्येक वैयक्तिक मूल्यामध्ये एक आणि समान स्थिर संख्या जोडल्यास, त्याच संख्येनुसार सरासरी मूल्य बदलेल.
पुरावा
भारित सरासरीचे वजन f समान संख्येने गुणाकार किंवा भागल्यास, सरासरी बदलणार नाही.
विशेषताच्या वर्ग विचलनाची बेरीज इतर कोणत्याही संख्येपेक्षा कमी आहे.
इतर प्रकारचे सरासरी
मधला प्रकार |
साधी सरासरी |
सरासरी |
हार्मोनिक |
||
भौमितिक |
||
चतुर्भुज |
एका आधारावर गटबद्ध करणे खूप कठीण आहे आणि थोडी माहिती स्मृतीमध्ये राहते.
मल्टीव्हेरिएट मीन - अनेक वैशिष्ट्यांसाठी सरासरी मूल्य E.S.S.
E.S साठी वैशिष्ट्य मूल्यांच्या गुणोत्तरांमधून या वैशिष्ट्यांच्या सरासरी मूल्यांपर्यंत.
साठी मल्टीव्हेरिएट सरासरी मी युनिट्स
x ij- i युनिटसाठी j वैशिष्ट्याचे मूल्य
वैशिष्ट्याचे सरासरी मूल्य j
k ही वैशिष्ट्यांची संख्या आहे
j ही वैशिष्ट्याची संख्या आणि त्याच्या लोकसंख्येची संख्या आहे
विषय 5: फरकांचे विश्लेषण
एक चिन्हे आणि त्याची कारणे भिन्नता
§2. वितरण रँक
§3. भिन्नता मालिकेची संरचनात्मक वैशिष्ट्ये.
§ चार. भिन्नता निर्देशकांची शक्ती.
§5. भिन्नता तीव्रता निर्देशक
§6. पसरण्याचे प्रकार. भिन्नता जोडण्याचे नियम.
लोकसंख्येतील वैशिष्ट्याच्या मूल्यातील फरक म्हणजे त्याच कालावधीत किंवा वेळेत दिलेल्या लोकसंख्येच्या विविध युनिट्समधील मूल्यांमधील फरक.
भिन्नतेचे कारण: ESS च्या अस्तित्वासाठी भिन्न परिस्थिती, ही भिन्नता आहे जी सांख्यिकीसारख्या विज्ञानाची आवश्यकता निर्माण करते.
व्हेरिएशनल विश्लेषणाची सुरुवात व्हेरिएशनल सिरीजच्या निर्मितीपासून होते - वाढत्या किंवा कमी होत असलेल्या चिन्हांनुसार लोकसंख्या युनिट्सचे क्रमबद्ध वितरण आणि संबंधित फ्रिक्वेन्सी मोजणे.
वितरण रँक
ü रँक
ü स्वतंत्र
ü मध्यांतर
श्रेणीबद्ध भिन्नता मालिका- वैयक्तिक युनिट्सची यादी. रँक केलेल्या वैशिष्ट्याच्या चढत्या उतरत्या क्रमाने एकत्रित
भिन्न भिन्नता मालिका - 2 पंक्तींचा समावेश असलेली सारणी - व्हेरिएबल वैशिष्ट्याची पॉलिमर मूल्ये आणि दिलेल्या वैशिष्ट्य मूल्यासह युनिट्सची संख्या.
खालील प्रकरणांमध्ये मध्यांतर भिन्नता मालिका तयार केली जाते:
- वैशिष्ट्य स्वतंत्र मूल्ये घेते, परंतु त्यांची संख्या खूप मोठी आहे
- विशेषता विशिष्ट श्रेणीमध्ये कोणतेही मूल्य घेते
इंटरव्हल व्हेरिएशन सिरीज तयार करताना, स्टर्जेस फॉर्म्युला वापरून इष्टतम गटांची संख्या, सर्वात सामान्य पद्धत निवडणे आवश्यक आहे.
k - मध्यांतरांची संख्या
n हे लोकसंख्येचे प्रमाण आहे
गणनेमध्ये, अपूर्णांक मूल्ये जवळजवळ नेहमीच प्राप्त केली जातात, पूर्णांकापर्यंत पूर्ण केली जातात.
अंतराल लांबी - l
मध्यांतर प्रकार
त्यानंतरच्या मध्यांतराची खालची मर्यादा त्यानंतरच्या मध्यांतराच्या वरच्या मर्यादेची पुनरावृत्ती करते
खुले मध्यांतर, एका चौकारासह मध्यांतर
इंटरव्हल व्हेरिएशन सिरीजची गणना करताना, इंटरव्हलचा मधला भाग x i म्हणून घेतला जातो.
NME =60 मध्यक = 1
Cumulate - पेक्षा कमी वितरण
Ogiva - पेक्षा जास्त वितरण
मध्यक हे वैशिष्ट्याचे मूल्य आहे जे संपूर्ण लोकसंख्येला दोन समान भागांमध्ये विभाजित करते.
एका भिन्न भिन्नता मालिकेसाठी, मध्यकाची गणना: जर n सम असेल, तर क्र. मध्य एकक
अंतराल भिन्नता मालिका:
k - मध्यांतरांची संख्या
x 0 - मध्यांतराची खालची मर्यादा
lमध्यांतराची लांबी आहे
फ्रिक्वेन्सीची बेरीज
मध्यकाच्या आधीच्या मध्यांतराची संचयी वारंवारता.
मध्यांतर वारंवारता
मध्यांतर– प्रथम अंतराल ज्याची संचित वारंवारता फ्रिक्वेन्सीच्या एकूण योगाच्या निम्म्यापेक्षा जास्त आहे.
ग्राफिकदृष्ट्या, मध्यक कम्युलेटवर आहे.
- चतुर्थांश - लोकसंख्येला 4 समान भागांमध्ये विभाजित करणाऱ्या गुणधर्माचे मूल्य.
1ला चतुर्थांश
3रा चतुर्थांश
2रा चतुर्थक - मध्यक.
x प्र 1 x Q 3 - 1ला आणि 3रा चतुर्थांश असलेल्या मध्यांतराची खालची मर्यादा.
l - मध्यांतर लांबी
आणि - 1ले आणि 3रे चतुर्थांश असलेल्या मागील मध्यांतरांच्या मध्यांतरांची संचित फ्रिक्वेन्सी.
चतुर्थक मध्यांतरांची वारंवारता.
भिन्नता मालिका वैशिष्ट्यीकृत करण्यासाठी, खालील वापरले जातात:
Deciles - लोकसंख्येला 10 समान भागांमध्ये विभाजित करा, Percitiles - लोकसंख्येला 100 समान भागांमध्ये विभाजित करा.
- मोड हे वारंवार येणारे वैशिष्ट्य वैशिष्ट्य आहे. वेगळ्या भिन्नता मालिकेसाठी - सर्वोच्च वारंवारता. मध्यांतर भिन्नता मालिकेसाठी, मोड खालील सूत्र वापरून मोजला जातो:
मोडल मध्यांतराची खालची सीमा
l- मोडल अंतराल लांबी
fMo-मोडल अंतराल वारंवारता
f Mo +1 ही मोडल नंतरच्या मध्यांतराची वारंवारता आहे
मोडल मध्यांतर - सर्वोच्च वारंवारतेसह मध्यांतर.ग्राफिकदृष्ट्या, मोड हिस्टोग्रामवर आढळतो.
- स्पॅन भिन्नता
- सरासरी रेखीय विचलन
भारित
- फैलाव:
भारित
- प्रमाणित विचलन
फैलाव मालमत्ता.
- वैशिष्ट्याच्या सर्व मूल्यांमध्ये समान रक्कम कमी केल्याने भिन्नतेचे मूल्य बदलत नाही.
- सर्व वैशिष्ट्य मूल्ये k वेळा कमी केल्याने भिन्नता कमी होते ते 2वेळा, आणि RMS मध्ये करण्यासाठीएकदा
- जर तुम्ही अंकगणित सरासरीपेक्षा भिन्न असलेल्या कोणत्याही मूल्यातील विचलनांचा सरासरी वर्ग काढला, तर तो नेहमी अंकगणितीय सरासरीवरून काढलेल्या विचलनाच्या सरासरी वर्गापेक्षा मोठा असेल. अशाप्रकारे, सरासरी पासून नेहमी इतर कोणत्याही मूल्याच्या गणनापेक्षा कमी असते, म्हणजे. त्यात किमान मालमत्ता आहे. RMS = 1.25 - सामान्यच्या जवळ वितरणासह.
सामान्य वितरणाच्या परिस्थितीत, 68.3% निरीक्षणांमधील निरीक्षणे आणि संख्या यांच्यात खालील संबंध आहेत.
95.4% निरीक्षणे मर्यादेत आहेत
९९.७% निरीक्षणे मर्यादेत आहेत
वेगवेगळ्या लोकसंख्येतील वैशिष्ट्यांच्या भिन्नतेची तुलना करण्यासाठी किंवा समान लोकसंख्येतील भिन्न वैशिष्ट्यांच्या भिन्नतेची तुलना करण्यासाठी, सापेक्ष निर्देशक वापरले जातात, आधार म्हणजे अंकगणितीय सरासरी.
- भिन्नतेची सापेक्ष श्रेणी.
- सापेक्ष रेखीय विचलन
- भिन्नतेचे गुणांक
हे संकेतक केवळ तुलनात्मक मूल्यांकनच देत नाहीत तर लोकसंख्येची एकसंधता देखील देतात. जर भिन्नतेचे गुणांक 33% पेक्षा जास्त नसेल तर संच एकसंध मानला जातो.
संपूर्ण लोकसंख्येतील वैशिष्ट्याच्या भिन्नतेच्या अभ्यासाबरोबरच, गुणवत्तेतील परिमाणवाचक बदलांचा मागोवा घेणे अनेकदा आवश्यक असते, परंतु लोकसंख्या ज्या गटांमध्ये विभागली गेली आहे आणि त्यांच्या दरम्यान. वेगवेगळ्या दृश्यांची गणना करून हे साध्य केले जाते.
पसरण्याचे प्रकार:
- एकूण भिन्नता
- आंतरसमूह भिन्नता
- गटातील भिन्नता (अवशिष्ट)
1. या फरकाला कारणीभूत असलेल्या सर्व घटकांच्या प्रभावाखाली संपूर्ण लोकसंख्येतील वैशिष्ट्यातील फरक मोजतो
उदाहरण:दही वापर: 100 लोकांच्या नमुन्यावर आधारित
सामाजिक दर्जा
x i -विशेषतेचे वैयक्तिक मूल्य
संपूर्ण लोकसंख्येवरील वैशिष्ट्याचे सरासरी मूल्य
या वैशिष्ट्याची वारंवारता.
- 2. समूहाच्या अंतर्निहित घटकाच्या वैशिष्ट्याच्या प्रभावाखाली वैशिष्ट्यातील भिन्नता दर्शवते.
गट सरासरी
एकूण गट सरासरी
गटानुसार वारंवारता
- 3. गटात समाविष्ट नसलेल्या घटकांच्या प्रभावाखाली असलेल्या वैशिष्ट्यातील भिन्नता दर्शवते
x ij – i j गटातील मूल्य वैशिष्ट्य
मधील वैशिष्ट्याचे सरासरी मूल्य jगट
f ij - वारंवारतामध्ये i-th वैशिष्ट्यj गट
एक नियम आहे जो 3 प्रकारच्या भिन्नतेला जोडतो, त्याला विचरण जोड नियम म्हणतात.
द्वारे अवशिष्ट फैलाव jगट
ओव्हर फ्रिक्वेन्सीची बेरीज jगट
nफ्रिक्वेन्सीची एकूण बेरीज आहे
व्हेरिएशनल सिरीजच्या विश्लेषणाचे मुख्य कार्य म्हणजे वारंवारता वितरणाचे नमुने ओळखणे.
वितरण वक्र हे वैशिष्ट्याच्या मूल्यामध्ये कार्यात्मकपणे संबंधित बदलामध्ये भिन्नता मालिकेतील वारंवारता बदलाच्या सतत रेषेच्या स्वरूपात एक ग्राफिक प्रतिनिधित्व आहे.
बहुभुज आणि हिस्टोग्राम वापरून वितरण वक्र प्लॉट केले जाऊ शकते. प्रायोगिक वितरणास सैद्धांतिक, चांगल्या-अभ्यास केलेल्या स्वरूपांपैकी एकापर्यंत कमी करण्याचा सल्ला दिला जातो.
सामान्य वितरणाचा वक्र.
खालील प्रकारचे वितरण वक्र आहेत:
- एकरूप
- अनेक शिरोबिंदू
एकसंध लोकसंख्या सिंगल-व्हर्टेक्स वक्र द्वारे दर्शविले जाते, एक बहु-शिरोबिंदू वक्र लोकसंख्येची विषमता आणि पुनर्रचनाची आवश्यकता दर्शवते.
वितरणाचे सामान्य स्वरूप शोधण्यात त्याच्या एकजिनसीपणाचे मूल्यांकन आणि स्क्युनेस आणि कर्टोसिसची गणना समाविष्ट आहे. सममितीय वितरणासाठी
विविध वितरणांच्या विषमतेच्या तुलनात्मक अभ्यासासाठी, असममितीचा गुणांक As ची गणना केली जाते.
तिसऱ्या ऑर्डरचा मध्यवर्ती क्षण; - आरएमएस घन;
जर, असममितता लक्षणीय आहे
जर म्हणून<0, то As – левосторонняя, если As>0, नंतर जसे उजव्या हाताने आहे.
जर, तर As नगण्य आहे. सममितीय आणि मध्यम असममित साठी, कर्टोसिस निर्देशकाची गणना केली जाते: जर E k > 0 असेल, तर वितरण शिखरावर असेल, जर E k असेल तर<0, то распределение плосковершинное.
पर्यायी वैशिष्ट्याची भिन्नता परिमाणात्मकपणे खालीलप्रमाणे प्रकट केली आहे.
0 - ज्या युनिट्समध्ये हे वैशिष्ट्य नाही;
1 - या वैशिष्ट्यासह युनिट्स;
आर- या वैशिष्ट्यासह युनिट्सचे प्रमाण;
q- हे वैशिष्ट्य नसलेल्या युनिट्सचे प्रमाण;
नंतर p+q=1.
वैकल्पिक वैशिष्ट्य 2 मूल्ये 0 आणि 1 वजनांसह घेते pआणि q
थेट चिन्हे- ही चिन्हे आहेत, ज्याचे मूल्य अभ्यासाधीन घटनेच्या वाढीसह वाढते.
उलट चिन्हे -चिन्हे, ज्याची परिमाण अभ्यासाधीन घटनेच्या वाढीसह कमी होते.
पिढी (थेट) |
श्रम तीव्रता (उलट) |
शेअरची कमाल भिन्नता 0.25 आहे.
विषय 6: मॉडेलिंग वितरण मालिका.
एक वास्तविक आणि सैद्धांतिक वितरण
§2. सामान्य वितरणाचा वक्र.
§3. सामान्य वितरणाच्या गृहीतकाची चाचणी करणे.
§ चार. संमती निकष: पीअरसन, रोमानोव्स्की, कोल्मोगोरोव.
§5. मॉडेलिंग वितरण मालिकेचे व्यावहारिक मूल्य.
एक वास्तविक आणि सैद्धांतिक वितरण
वितरण मालिकेचा अभ्यास करण्याचे सर्वात महत्त्वाचे उद्दिष्ट म्हणजे वितरणाचा नमुना उघड करणे आणि त्याचे स्वरूप निश्चित करणे. वितरण नमुने केवळ मोठ्या संख्येने निरीक्षणांसह स्पष्टपणे प्रकट होतात.
वितरण वक्र वापरून वास्तविक वितरण ग्राफिक पद्धतीने चित्रित केले जाऊ शकते - बदलाशी संबंधित कार्यात्मक रीतीने व्हेरिएंटच्या भिन्नता मालिकेतील वारंवारता बदलाची सतत रेषा म्हणून ग्राफिकरित्या चित्रित केले जाते.
सैद्धांतिक वितरण वक्र हा या प्रकारच्या वितरणाचा वक्र म्हणून सामान्य शब्दात समजला जातो जो नियमिततेसाठी यादृच्छिक घटकांचा प्रभाव वगळतो.
सैद्धांतिक वितरण विश्लेषणात्मक सूत्राद्वारे व्यक्त केले जाऊ शकते ज्याला विश्लेषणात्मक सूत्र म्हणतात. सर्वात सामान्य म्हणजे सामान्य वितरण.
§2. सामान्य वितरणाचा वक्र.
सामान्य वितरण कायदा:
y हा सामान्य वितरणाचा क्रम आहे
t हे सामान्यीकृत विचलन आहे.
; e=2.7218; x i -भिन्नता मालिका पर्याय; - सरासरी;
गुणधर्म:
सामान्य वितरण कार्य सम आहे, म्हणजे. f(t)=f(-t), . सामान्य वितरण कार्य पूर्णपणे मानक विचलनाद्वारे निर्धारित केले जाते.
§3. सामान्य वितरणाच्या गृहीतकाची चाचणी करणे.
वितरणाच्या कायद्याचा वारंवार संदर्भ देण्याचे कारण असे आहे की अनेक यादृच्छिक कारणांच्या क्रियेमुळे निर्माण होणारे अवलंबित्व, त्यापैकी कोणतेही प्रमुख नाही. जर Mo = Me ची गणना व्हेरिएशनल मालिकेत केली असेल, तर हे सामान्य वितरणाशी जवळीक दर्शवू शकते. सामान्य कायद्याचे पालन करण्याची सर्वात अचूक चाचणी विशेष निकष वापरून केली जाते.
§ चार. संमती निकष: पीअरसन, रोमानोव्स्की, कोल्मोगोरोव.
पिअर्सनचा निकष.
सैद्धांतिक वारंवारता
अनुभवजन्य वारंवारता
सैद्धांतिक फ्रिक्वेन्सीची गणना करण्याची पद्धत.
- अंकगणित सरासरी निर्धारित केली जाते आणि मध्यांतर भिन्नता मालिकेनुसार, प्रत्येक मध्यांतरासाठी t ची गणना केली जाते.
- आम्हाला सामान्यीकृत वितरण कायद्यासाठी संभाव्यतेच्या घनतेचे मूल्य आढळते. पृष्ठ ४९
- आम्ही सैद्धांतिक वारंवारता शोधू.
l - मध्यांतर लांबी
- अनुभवजन्य फ्रिक्वेन्सीची बेरीज
- संभाव्यता घनता
पूर्णांकापर्यंत मूल्य पूर्ण करा
- पिअर्सनचे गुणोत्तर गणना
- टेबल मूल्य
d.f - मध्यांतरांची संख्या - 3
d.f स्वातंत्र्याच्या अंशांची संख्या आहे.
- जर > , तर वितरण सामान्य नाही, म्हणजे सामान्य वितरणाची परिकल्पना रद्द केली आहे. जर ए< , то распределение является нормальным.
रोमानोव्स्की निकष.
पिअर्सनचा निकष मोजला जातो;
अंशांची संख्या.
सह तर<3, то распределение близко к нормальному.
कोल्मोगोरोव्हचा निकष
, डी-संचित अनुभवजन्य आणि सैद्धांतिक फ्रिक्वेन्सींमधील कमाल मूल्य. कोल्मोगोरोव्ह वापरण्यासाठी एक आवश्यक अट: निरीक्षणांची संख्या 100 पेक्षा जास्त आहे. एका विशेष संभाव्यता सारणीनुसार, ज्याद्वारे असे तर्क केले जाऊ शकतात की हे वितरण सामान्य आहे.
§5. मॉडेलिंग वितरण मालिकेचे व्यावहारिक मूल्य.
- अनुभवजन्य वितरणासाठी सामान्य वितरणाचे नियम लागू करण्याची क्षमता.
- 3 x सिग्मा नियम वापरण्याची क्षमता.
- लोकसंख्येचे परीक्षण करून, वितरण सामान्य आहे हे जाणून अतिरिक्त वेळ घेणारी आणि खर्चिक गणना टाळण्याची क्षमता.
विषय 7: निवडक निरीक्षण.
एक निवडक निरीक्षणाची संकल्पना. त्याच्या वापरासाठी कारणे.
§2. निवडक निरीक्षणाचे प्रकार.
§3. नमुना त्रुटी.
§ चार. नमुना निरीक्षण कार्ये
§5. सामान्य लोकसंख्येसाठी नमुना निरीक्षण डेटाचे वितरण.
§6. लहान नमुना.
एक निवडक निरीक्षणाची संकल्पना. त्याच्या वापरासाठी कारणे.
निवडक निरीक्षण - असे निरंतर निरीक्षण, ज्यामध्ये अभ्यास केलेल्या लोकसंख्येची एकके, विशिष्ट प्रकारे निवडलेली, सांख्यिकीय तपासणी केली जाते.
नमुना निरीक्षणाचा उद्देश (कार्य): तपासलेल्या भागासाठी, संख्याशास्त्रीय निरीक्षणाच्या सर्व नियम आणि तत्त्वांच्या अधीन असलेल्या युनिट्सच्या संपूर्ण लोकसंख्येचे वैशिष्ट्यीकृत करणे.
निवडक निरीक्षण वापरण्याची कारणे:
- साहित्य, श्रम खर्च आणि वेळेची बचत;
- सांख्यिकीय लोकसंख्येच्या वैयक्तिक युनिट्स आणि त्यांच्या गटांचा अधिक तपशीलवार आणि तपशीलवार अभ्यास करण्याची संधी.
- काही विशिष्ट समस्या केवळ निवडक निरीक्षणाच्या वापराने सोडवल्या जाऊ शकतात.
- सक्षम आणि सुव्यवस्थित निवडक निरीक्षण परिणामांची उच्च अचूकता देते.
सामान्य लोकसंख्या म्हणजे एककांचा संच ज्यामधून निवड केली जाते.
सॅम्पलिंग फ्रेम म्हणजे सर्वेक्षणासाठी निवडलेल्या युनिट्सचा संच. आकडेवारीमध्ये, सामान्य लोकसंख्या आणि नमुना लोकसंख्येच्या पॅरामीटर्समध्ये फरक करण्याची प्रथा आहे.
सॅम्पलिंगचे प्रकार
निवड पद्धतीनुसार:
वारंवार
नमुन्यात समाविष्ट केलेले युनिट, निरीक्षण केलेल्या वैशिष्ट्यांच्या नोंदणीनंतर, पुढील निवड प्रक्रियेत सहभागी होण्यासाठी सामान्य लोकांकडे परत केले जाते.
सामान्य लोकसंख्येचे प्रमाण अपरिवर्तित राहते, ज्यामुळे कोणत्याही युनिटच्या नमुन्यात सतत फटका बसतो.
पुनरावृत्ती न होणारी
ज्या लोकसंख्येमधून निवड केली जाते त्या लोकसंख्येला नमुना युनिट परत केले जात नाही.
निवड पद्धत:
वास्तविक - यादृच्छिक कोणत्याही सुसंगततेच्या घटकांशिवाय यादृच्छिकपणे किंवा यादृच्छिकपणे सामान्य लोकसंख्येच्या युनिट्सच्या संबंधात आहे. तथापि, असा नमुना घेण्यापूर्वी, एखाद्याने हे सुनिश्चित केले पाहिजे की सामान्य लोकसंख्येच्या सर्व घटकांना नमुन्यात समाविष्ट होण्याची समान संधी आहे, म्हणजे. सांख्यिकीय लोकसंख्येच्या एककांच्या संपूर्ण यादीमध्ये वैयक्तिक एककांची कोणतीही चूक किंवा अज्ञान नाही. सामान्य लोकसंख्येच्या सीमा स्पष्टपणे स्थापित करणे देखील आवश्यक आहे. तांत्रिकदृष्ट्या स्थापित केलेली निवड चिठ्ठ्या काढून किंवा यादृच्छिक संख्यांच्या सारणीचा वापर करून केली जाते.
यांत्रिक नमुने (यादीतील प्रत्येक 5) अशा प्रकरणांमध्ये वापरले जाते जेथे सामान्य लोकसंख्येला कसा तरी आदेश दिला जातो, उदा. युनिट्सच्या वितरणामध्ये एक विशिष्ट क्रम असतो. यांत्रिक सॅम्पलिंग आयोजित करताना, निवडीचे प्रमाण स्थापित केले जाते, जे सामान्य लोकसंख्या आणि नमुना लोकसंख्येच्या गुणोत्तराने स्थापित केले जाते.
यांत्रिक सॅम्पलिंगमध्ये त्रुटीचा धोका या कारणांमुळे दिसू शकतो: निवडलेल्या मध्यांतराचा यादृच्छिक योगायोग आणि सामान्य लोकसंख्येच्या युनिट्सच्या व्यवस्थेमध्ये चक्रीय नमुने.
झोन केलेले सॅम्पलिंग जेव्हा सामान्य लोकसंख्येच्या सर्व एककांना काही गुणधर्मांनुसार गटांमध्ये (प्रदेश, देश) विभागले जाऊ शकते तेव्हा वापरले जाते.
एकत्रित नमुना.
युनिट्सची निवड केली जाऊ शकते:
- किंवा गटाच्या आकाराच्या प्रमाणात
- किंवा वैशिष्ट्याच्या आंतरगट भिन्नतेच्या प्रमाणात
- , जेथे n नमुन्याचा आकार आहे, N हा सामान्य लोकसंख्येचा आकार आहे, n i – नमुन्याचा आकार i-गट, एन i – खंड iनमुने
- - ही पद्धत अधिक अचूक आहे, परंतु सॅम्पलिंग दरम्यान, भिन्नतेबद्दल आगाऊ ठरवणे फार कठीण आहे. (निरीक्षण करण्यापूर्वी).
मालिका निवड.
जेव्हा ECCs लहान गटांमध्ये (मालिका) एकत्र केले जातात, उदाहरणार्थ, तयार उत्पादनांसह पॅकेजिंग, विद्यार्थी गट. सीरियल सॅम्पलिंगचा सार असा आहे की मालिका एकतर यादृच्छिक किंवा यांत्रिक पद्धतीने निवडल्या जातात आणि नंतर निवडलेल्या मालिकेमध्ये सतत सर्वेक्षण केले जाते.
एकत्रित निवड.
हे वर चर्चा केलेल्या निवड पद्धतींचे संयोजन आहे, अधिक वेळा ठराविक आणि क्रमिक मालिकेचे संयोजन वापरले जाते, म्हणजे. अनेक विशिष्ट गटांमधून मालिकांची निवड.
निवड मल्टी-स्टेज आणि सिंगल-स्टेज, पॉली-फ्रेज आणि सिंगल-फ्रेज देखील असू शकते.
मल्टी-स्टेज निवड: सामान्य लोकसंख्येमधून, प्रथम, मोठे गट काढले जातात, नंतर लहान गट आणि असेच सर्वेक्षणाच्या अधीन असलेल्या युनिट्सची निवड होईपर्यंत.
बहु-वाक्यांश निवड: त्याच्या अंमलबजावणीच्या सर्व टप्प्यांवर निवडीच्या समान युनिटचे जतन करणे समाविष्ट आहे. त्याच वेळी, प्रत्येक त्यानंतरच्या टप्प्यावर निवडलेल्या निवड युनिट्स परीक्षेच्या अधीन आहेत, ज्याचा कार्यक्रम विस्तारत आहे (उदाहरण: संपूर्ण संस्थेचे विद्यार्थी, नंतर काही विद्याशाखांचे विद्यार्थी).
§3. नमुना त्रुटी.
पद्धतशीर |
प्रातिनिधिकता त्रुटी केवळ निवडक निरीक्षणामध्ये आढळतात. नमुना लोकसंख्या सामान्य लोकसंख्येचे अचूक पुनरुत्पादन करू शकत नाही या वस्तुस्थितीमुळे उद्भवू शकते. ते टाळले जाऊ शकत नाहीत, परंतु ते अंदाज लावणे सोपे आहे आणि आवश्यक असल्यास, ते कमी केले जाऊ शकतात.
सॅम्पलिंग एरर म्हणजे सामान्य लोकसंख्येमधील पॅरामीटरचे मूल्य आणि नमुना निरीक्षणाच्या परिणामांवरून मोजलेले मूल्य यांच्यातील फरक. Dх=-m+ , Dх – नमुन्यातील किरकोळ त्रुटी, m – सामान्य सरासरी; - नमुना सरासरी.
मार्जिनल सॅम्पलिंग एरर हे यादृच्छिक मूल्य आहे. चेबीशेव्हची कामे यादृच्छिक सॅम्पलिंग त्रुटींच्या नमुन्यांच्या अभ्यासासाठी समर्पित आहेत. चेबीशेव्हचे प्रमेय हे सिद्ध करते की Dx पेक्षा जास्त नाही: - सरासरी नमुना त्रुटी. t-विश्वास गुणांक या त्रुटीची संभाव्यता दर्शवितो. pp 42-43.
ज्ञात F(t) वरून t निर्धारित करणे आवश्यक असताना, आम्ही सर्वात जवळचा मोठा F(t) घेतो आणि त्यावरून t निर्धारित करतो.
त्रुटी अपूर्णांक मर्यादित करा
पी - शेअर.
जर निवड न-पुनरावृत्ती पद्धतीने केली गेली असेल, तर मर्यादा त्रुटी सूत्रे जोडली जातात
न-पुनरावृत्तीसाठी सुधारणा.
प्रत्येक प्रकारच्या नमुना निरीक्षणासाठी, सादर केलेली त्रुटी वेगळ्या पद्धतीने मोजली जाते:
- योग्य यादृच्छिक आणि यांत्रिक निरीक्षण;
- झोन केलेले पाळत ठेवणे
- अनुक्रमांक नमुना
r ही नमुन्यातील मालिकेची संख्या आहे;
आर ही सामान्य लोकसंख्येतील मालिकांची संख्या आहे;
आंतरसमूह प्रमाणातील भिन्नता.
§ चार. नमुना निरीक्षण कार्ये
खालील कार्यांसाठी वापरले जाते:
- n-? ज्ञात F(t), Dx वरून नमुना आकार निश्चित करण्यासाठी.
- ज्ञात F(t), n वरून Dx नमुन्याचे निर्धारण
- ज्ञात Dx आणि n वरून F(t) चे निर्धारण
1 कार्य n - ? प्रथम, पुनरावृत्ती न होणाऱ्या निवडीसाठी, n हे पुनर्निवड सूत्राद्वारे निर्धारित केले जाते:
भिन्नता निश्चित करण्याचे मार्गः
- हे मागील समान अभ्यासातून घेतले आहे.
- सामान्य वितरणासह RMS » भिन्नतेच्या श्रेणीच्या 1/6.
- जर वितरण स्पष्टपणे असममित असेल, तर RMS » 1/5 भिन्नतेच्या श्रेणीचे
- शेअरसाठी, जास्तीत जास्त संभाव्य फरक p(1-p)=0.25 लागू केला जातो
- n³100 सह, नंतर s 2 \u003d S 2 - नमुना भिन्नता
£३० n£100, नंतर s 2 \u003d S 2 (n / n-1), s 2 - सामान्य भिन्नता
n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2
n ची गणना करताना, एखाद्याने t चे मोठे मूल्य आणि लहान किरकोळ त्रुटींचा पाठपुरावा करू नये, कारण यामुळे n मध्ये वाढ होते आणि त्यामुळे खर्चात वाढ होते. खालील कायदा समान आहे.
§5. सामान्य लोकसंख्येसाठी नमुना निरीक्षण डेटाचे वितरण.
कोणत्याही व्हीएनचे अंतिम ध्येय सामान्य लोकसंख्येचे वैशिष्ट्य आहे.
व्हीएनच्या निकालांमधून गणना केलेली मूल्ये त्यांच्या किरकोळ त्रुटीची मर्यादा लक्षात घेऊन सामान्य लोकांमध्ये वितरीत केली जातात.
एका व्यक्तीने दर महिन्याला दह्याचे सेवन गृहीत धरा.
£250-20m£250+20; £230m£270
आणि फक्त 1000 लोक
£230,000m£270,000
48%-5%£p£48%+5%
§6. लहान नमुना.
आधुनिक परिस्थितीत सांख्यिकीय संशोधनाच्या सरावात, लहान नमुने हाताळणे वाढत्या प्रमाणात आवश्यक आहे.
छोटा नमुना - एककांची निरीक्षण नमुना संख्या 30, n £ 30 / पेक्षा जास्त नाही
लहान सॅम्पलिंगच्या सिद्धांताचा विकास इंग्रजी सांख्यिकीशास्त्रज्ञ गोसेट यांनी केला होता, ज्याने 1908 मध्ये विद्यार्थी या टोपणनावाने लिहिले होते.
त्याने हे सिद्ध केले की लहान नमुना आणि सामान्य नमुन्यातील विसंगतीचा अंदाज विशेष वितरण कायदा आहे. लहान नमुन्यासाठी गणना करताना, s 2 चे मूल्य मोजले जात नाही. संभाव्य त्रुटी मर्यादेसाठी विद्यार्थी निकष वापरा. पृष्ठे 44-45. विरुद्ध घटनेची संभाव्यता आहे.
स्वातंत्र्याच्या अंशांची संख्या
लहान नमुना त्रुटी मर्यादित करणे
किरकोळ शेअर त्रुटी
विषय 8: सहसंबंध-रिग्रेशन विश्लेषण आणि मॉडेलिंग.
एक सहसंबंध आणि CRA संकल्पना.
§2. KPA च्या वापरासाठी अटी आणि निर्बंध.
§3. किमान चौरस पद्धतीवर आधारित प्रतिगमन जोडणे.
§ चार. जोडलेल्या रेखीय प्रतिगमन समीकरणाचा वापर.
§5. कनेक्शनच्या घट्टपणाचे निर्देशक आणि कनेक्शनची ताकद.
§6. एकाधिक सहसंबंध.
एक सहसंबंध आणि CRA संकल्पना.
कार्यात्मक कनेक्शन y=5x
सहसंबंध
विविध घटना आणि त्यांचे चिन्ह, कार्यात्मक आणि सांख्यिकीय यांच्यात 2 प्रकारचे कनेक्शन आहेत.
अशा कनेक्शनला फंक्शनल असे म्हणतात जेव्हा, एका व्हेरिएबलच्या मूल्यातील बदलासह, दुसरे एक काटेकोरपणे परिभाषित मार्गाने बदलते, म्हणजे, एका व्हेरिएबलचे मूल्य दुसर्या व्हेरिएबलच्या एक किंवा अधिक अचूकपणे निर्दिष्ट केलेल्या मूल्यांशी संबंधित असते. . फंक्शनल कनेक्शन तेव्हाच शक्य आहे जेव्हा व्हेरिएबल y व्हेरिएबल x वर अवलंबून असेल आणि इतर कोणत्याही घटकांवर अवलंबून नाही, परंतु वास्तविक जीवनात हे अशक्य आहे.
एक सांख्यिकीय संबंध अस्तित्त्वात असतो जेव्हा, व्हेरिएबल्सपैकी एकाच्या मूल्यातील बदलासह, दुसरे कोणतेही मूल्य विशिष्ट मर्यादेत घेऊ शकते, परंतु त्याची सांख्यिकीय वैशिष्ट्ये विशिष्ट कायद्यानुसार बदलतात.
सांख्यिकीय संबंधाचे सर्वात महत्वाचे विशिष्ट प्रकरण म्हणजे परस्पर संबंध. परस्परसंबंधासह, एका व्हेरिएबलची भिन्न मूल्ये दुसर्या व्हेरिएबलच्या भिन्न सरासरी मूल्यांशी संबंधित असतात, उदा. गुण x च्या मूल्यात बदल करून, गुणधर्म y चे सरासरी मूल्य नैसर्गिक पद्धतीने बदलते.
सहसंबंध हा शब्द इंग्रजी जीवशास्त्रज्ञ आणि सांख्यिकीशास्त्रज्ञ फ्रान्सिस गॅल (सहसंबंध) यांनी सादर केला.
परस्परसंबंध वेगवेगळ्या प्रकारे उद्भवू शकतात:
- कारक वैशिष्ट्याच्या भिन्नतेवर परिणामी वैशिष्ट्याच्या भिन्नतेचे कार्यकारण अवलंबन.
- एकाच कारणाच्या 2 परिणामांमध्ये एक संबंध असू शकतो (आग, अग्निशामकांची संख्या, आगीचा आकार)
- चिन्हांचा संबंध, ज्यापैकी प्रत्येक एकाच वेळी कारण आणि परिणाम दोन्ही आहे (कामगार उत्पादकता आणि पगार)
आकडेवारीमध्ये, खालील प्रकारच्या अवलंबनामध्ये फरक करण्याची प्रथा आहे:
- जोडीचा सहसंबंध - परिणामकारक आणि फलकांच्या 2 चिन्हांमधला संबंध, किंवा दोन गुणात्मक चिन्हांमधील संबंध.
- आंशिक सहसंबंध - प्रभावी आणि एक घटक गुणधर्म यांच्यातील संबंध दुसर्या घटक गुणधर्माच्या निश्चित मूल्यासह.
- एकाधिक सहसंबंध - अभ्यासात समाविष्ट केलेल्या दोन किंवा अधिक घटक वैशिष्ट्यांवर परिणामी वैशिष्ट्यांचे अवलंबन.
सहसंबंध विश्लेषणाचे कार्य वैशिष्ट्यांमधील नातेसंबंधाची जवळीक मोजणे आहे. 19व्या शतकाच्या उत्तरार्धात, गॅल्टन आणि पिअर्सन यांनी वडील आणि मुलांची उंची यांच्यातील संबंधांची तपासणी केली.
प्रतिगमन संबंधाच्या स्वरूपाचे परीक्षण करते. प्रतिगमन विश्लेषणाचे कार्य नातेसंबंधाची विश्लेषणात्मक अभिव्यक्ती निश्चित करणे आहे.
सामान्य संकल्पना म्हणून सहसंबंध-रिग्रेशन विश्लेषणामध्ये कनेक्शनच्या घट्टपणामध्ये बदल आणि कनेक्शनच्या विश्लेषणात्मक अभिव्यक्तीची स्थापना समाविष्ट असते.
§2. KPA च्या वापरासाठी अटी आणि निर्बंध.
- वस्तुमान डेटाची उपस्थिती, कारण सहसंबंध सांख्यिकीय आहे
- लोकसंख्येची गुणात्मक एकसंधता आवश्यक आहे.
- परिणामी आणि घटक वैशिष्ट्यांनुसार लोकसंख्येचे वितरण, सामान्य वितरण कायद्यानुसार, जे कमीत कमी वर्ग पद्धतीच्या वापराशी संबंधित आहे.
§3. किमान चौरस पद्धतीवर आधारित प्रतिगमन जोडणे.
रीग्रेशन विश्लेषणामध्ये संबंधांची विश्लेषणात्मक अभिव्यक्ती निश्चित करणे समाविष्ट आहे. फॉर्म रेखीय प्रतिगमन दरम्यान फरक करतो, जो सरळ रेषेच्या समीकरणाद्वारे व्यक्त केला जातो आणि नॉन-रेखीय प्रतिगमन किंवा.
संप्रेषणाच्या दिशेनुसार, ते सरळ रेषेत वेगळे केले जातात, म्हणजे. जसा x वाढतो, y वाढतो.
उलट |
उलट म्हणजे. जसा x वाढतो, y कमी होतो.
- ग्राफिकल पद्धत - सहसंबंध फील्डवर प्रायोगिक डेटाचे प्लॉटिंग करून, परंतु कमीत कमी स्क्वेअर पद्धती वापरून अधिक अचूक अंदाज लावला जातो.
एक्स - वास्तविक चिन्ह
यू - प्रभावी चिन्ह
वास्तविक मूल्य आणि स्क्वेअर कपलिंग समीकरणाद्वारे मोजले जाणारे मूल्य यांच्यातील फरक कमीत कमी असणे आवश्यक आहे.
LSM min सह निवडलेल्या प्रतिगमन समीकरणानुसार प्राप्त केलेल्या सैद्धांतिक मूल्यांमधून प्रायोगिक मूल्यांच्या y च्या वर्ग विचलनाची बेरीज आहे.
रेखीय नातेसंबंधासाठी
Þ अ,b |
पॅराबोला साठी
हायपरबोल साठी
पॅरामीटर्स a,b,c समीकरणामध्ये लिहिल्या जातात, नंतर आम्ही परिणामी समीकरणाला अनुभवजन्य मूल्यासह बदलतो x iआणि सैद्धांतिक मूल्य शोधा y मी .मग आम्ही तुलना करतो y iसैद्धांतिक आणि y iअनुभवजन्य त्यांच्यातील फरकाच्या वर्गांची बेरीज किमान असावी. आम्ही अवलंबनाचा प्रकार निवडतो ज्यामध्ये हे अवलंबन केले जाते.
जोडीनुसार रेखीय प्रतिगमन समीकरणात:
b हा जोडलेल्या रेखीय प्रतिगमनाचा गुणांक आहे,ते बाँडची ताकद मोजते, उदा. मापनाच्या प्रति स्वीकृत युनिटच्या सरासरी मूल्यापासून y च्या लोकसंख्येचे सरासरी विचलन दर्शवते.
b\u003d 20 जेव्हा x 1 चिन्ह y ने बदलते तेव्हा लोकसंख्येतील सरासरी मूल्य 20 ने विचलित होते.
प्रतिगमन गुणांकावरील सकारात्मक चिन्ह वैशिष्ट्यांमधील थेट संबंध दर्शवते, "-" चिन्ह वैशिष्ट्यांमधील अभिप्राय दर्शवते.
§ चार. जोडलेल्या रेखीय प्रतिगमन समीकरणाचा वापर.
मुख्य अनुप्रयोग प्रतिगमन समीकरणानुसार अंदाज आहे. इतर घटकांच्या स्थिरतेच्या अटींद्वारे आणि प्रक्रियेच्या परिस्थितीनुसार अंदाज मर्यादित आहे. जर चालू असलेल्या प्रक्रियेचे वातावरण त्यात झपाट्याने बदलले तर हे प्रतिगमन समीकरण घडणार नाही.
प्रतिगमन समीकरणामध्ये घटकाचे अपेक्षित मूल्य बदलून बिंदूचा अंदाज प्राप्त केला जातो. अशा अंदाजाच्या अचूक अंमलबजावणीची संभाव्यता अत्यंत लहान आहे.
जर एखाद्या बिंदूचा अंदाज सरासरी अंदाज त्रुटीच्या मूल्यासह असेल, तर अशा अंदाजाला अंतराल अंदाज म्हणतात.
सरासरी अंदाज त्रुटी दोन प्रकारच्या त्रुटींमधून तयार केली जाते:
- टाइप 1 एरर - रिग्रेशन लाइन एरर
- दुसऱ्या प्रकारची त्रुटी - भिन्नतेच्या त्रुटीशी संबंधित त्रुटी.
सरासरी अंदाज त्रुटी.
सामान्य लोकसंख्येमध्ये रीग्रेशन लाइनच्या स्थितीत त्रुटी
n - नमुना आकार
x k - घटकाचे चुकीचे मूल्य
सामान्य लोकसंख्येतील प्रतिगमन रेषेतून परिणामी वैशिष्ट्याचे RMS
सहसंबंध विश्लेषणामध्ये कनेक्शनच्या घट्टपणाचे मूल्यांकन समाविष्ट आहे. निर्देशक:
- रेखीय सहसंबंध गुणांक - दोन वैशिष्ट्यांमधील संबंधांची घट्टपणा आणि दिशा दर्शविते त्यांच्यामधील रेखीय संबंधाच्या बाबतीत
=-1 वर कनेक्शन फंक्शनल व्युत्क्रम आहे, =1 कनेक्शन फंक्शनल डायरेक्ट आहे, =0 वर कोणतेही कनेक्शन नाही.
हे फक्त रेखीय संबंधांसाठी वापरले जाते, ते परिमाणवाचक वैशिष्ट्यांमधील संबंधांचे मूल्यांकन करण्यासाठी वापरले जाते. केवळ वैयक्तिक मूल्यांवर गणना केली जाते.
सहसंबंध गुणोत्तर:
प्रायोगिक: दोन्ही प्रकारचे भिन्नता परिणामी गुणधर्मानुसार मोजली जाते.
सैद्धांतिक:
प्रतिगमन समीकरणाद्वारे गणना केलेल्या प्रभावी वैशिष्ट्याच्या मूल्यांचे फैलाव
परिणामी वैशिष्ट्याच्या अनुभवजन्य मूल्याचा फैलाव
- अचूकता उच्च पदवी
- वर्णनात्मक आणि परिमाणवाचक वैशिष्ट्यांमधील नातेसंबंधाच्या जवळचे मूल्यांकन करण्यासाठी योग्य, परंतु परिमाणवाचक प्रभावी असावे
- सर्व प्रकारच्या कनेक्शनसाठी योग्य
स्पियरमॅनचा सहसंबंध गुणांक
रँक - रँक केलेल्या मालिकेतील लोकसंख्येच्या एककांची अनुक्रमांक. दोन्ही वैशिष्ट्यांना समान क्रमाने सर्वात लहान ते सर्वात मोठे किंवा त्याउलट रँक करणे आवश्यक आहे. जर लोकसंख्येच्या एककांची श्रेणी p x आणि p y ने दर्शविली असेल, तर रँकचा सहसंबंध गुणांक खालील फॉर्म घेईल:
सहसंबंध मालिका गुणांकाचे फायदे:
- आपण वर्णनात्मक वैशिष्ट्यांनुसार देखील रँक करू शकता जे संख्यात्मकरित्या व्यक्त केले जाऊ शकत नाहीत, म्हणून, स्पियरमॅन गुणांकाची गणना खालील वैशिष्ट्यांच्या जोडीसाठी शक्य आहे: संख्या - संख्या; वर्णनात्मक - परिमाणवाचक; वर्णनात्मक - वर्णनात्मक. (शिक्षण हे वर्णनात्मक गुणधर्म आहे)
- कनेक्शनची दिशा दाखवते
स्पिअरमॅन गुणांकाचे तोटे.
- समान-रँकमधील फरक गुणांच्या मूल्यातील पूर्णपणे भिन्न फरकांशी संबंधित असू शकतात (परिमाणवाचक वैशिष्ट्यांच्या बाबतीत). उदाहरण: देशाची प्रति वर्ष वीज निर्मिती
यूएसए 2400 kWh 1
RF 800 kWh 2
कॅनडा 600 kWh 3
स्पिअरमॅन मूल्यांमध्ये अनेक समान मूल्ये आढळल्यास, संबंधित श्रेणी तयार केली जातात, म्हणजे. समान मधली संख्या
या प्रकरणात, स्पिअरमॅन गुणांक खालीलप्रमाणे मोजला जातो:
j-वैशिष्ट्य x साठी क्रमाने लिंक्सची संख्या
अज- x द्वारे j लिंकमधील समान रँकची संख्या
k-वैशिष्ट्य y च्या क्रमाने अस्थिबंधन संख्या
Bk-मध्ये समान रँकची संख्या जेचा गठ्ठा, चा गुच्छ, चा घड
- 4. केंडल रँक सहसंबंध गुणांक
कमाल रँक रक्कम
S ही रँकची खरी बेरीज आहे
स्पिअरमॅन गुणांकापेक्षा कठोर अंदाज देतो.
गणनेसाठी, सर्व एकके विशेषता x नुसार गुणविशेषानुसार रँक केली जातात येथेप्रत्येक रँकसाठी, दिलेल्या बेरजेपेक्षा नंतरच्या रँकची संख्या मोजली जाते, P द्वारे दर्शविले जाते आणि या पदनाम Q च्या खालील रँकची संख्या.
P+Q= 1 / 2 n(n-1)
- फेकनर रँक सहसंबंध गुणांक.
फेकनर गुणांक - या संख्यांच्या बेरजेशी जुळणार्या आणि गैर-संयोगी चिन्हांच्या जोड्यांच्या संख्येतील फरकाच्या गुणोत्तराच्या रूपात कनेक्शनच्या घट्टपणाचे मोजमाप.
- x आणि y साठी सरासरीची गणना
- वैयक्तिक मूल्ये x i y i ची तुलना "+" किंवा "-" चिन्हाच्या अनिवार्य संकेतासह सरासरी मूल्यांशी केली जाते. जर चिन्हे x आणि y मध्ये जुळत असतील, तर आम्ही त्यांना "C" क्रमांकाकडे संदर्भित करू, नसल्यास, "H" कडे.
- जुळणार्या आणि न जुळणार्या जोड्यांची संख्या मोजा.
संबंध मोजण्याचे कार्य वर्णनात्मक वैशिष्ट्यांच्या संबंधात सांख्यिकीशास्त्रज्ञासमोर होते, अशा कार्याचे एक महत्त्वाचे विशेष प्रकरण, 2 पर्यायी वैशिष्ट्यांमधील संबंध मोजणे, त्यापैकी एक इतर परिणामाचे कारण आहे.
2 पर्यायी वैशिष्ट्यांमधील संबंधांची घट्टता 2 गुणांक वापरून मोजली जाऊ शकते:
- असोसिएशन गुणांक
- आकस्मिक घटक
आकस्मिक गुणांकात एक कमतरता आहे: जेव्हा Av किंवा Ba या दोन विषम संयोगांपैकी एक शून्य असेल तेव्हा गुणांक एकात बदलतो. तो कनेक्शनच्या घट्टपणाचे अगदी उदारमताने मूल्यांकन करतो - तो त्याचा अतिरेक करतो.
पिअर्सनचे प्रमाण
जर दोन नसतील, परंतु परस्पर संबंधित वैशिष्ट्यांपैकी अधिक संभाव्य मूल्ये असतील तर, खालील गुणांक मोजले जातात:
- पिअर्सनचे प्रमाण
- वर्णनात्मक वैशिष्ट्यासाठी चुप्रोव्ह गुणांक
पिअर्सन गुणांक स्क्वेअर मॅट्रिक्सवरून मोजला जातो
सामान्यपेक्षा कमी |
||||
1 आणि 2 पर्यंत - अनुक्रमे 1 आणि 2 चिन्हांनुसार गटाची संख्या. पिअर्सन गुणांकाचा तोटा असा आहे की तो गटांच्या संख्येत वाढ करूनही 1 पर्यंत पोहोचत नाही.
चुप्रोव्ह गुणांक (1874-1926)
चुप्रोव्ह गुणांक कनेक्शनच्या घट्टपणाचा अधिक कठोरपणे अंदाज लावतो.
§6. एकाधिक सहसंबंध.
परिणामी आणि दोन किंवा अधिक घटक वैशिष्ट्यांमधील संबंधांचा अभ्यास म्हणतात एकाधिक प्रतिगमन. एकाधिक रीग्रेशनच्या पद्धतींद्वारे अवलंबनांच्या अभ्यासामध्ये, 2 कार्ये सेट केली जातात.
- प्रभावी वैशिष्ट्य y आणि वास्तविक वैशिष्ट्ये x 1 , x 2 , x 3 , ... x k , i.e. मधील संबंधांच्या विश्लेषणात्मक अभिव्यक्तीचे निर्धारण फंक्शन y \u003d f (x 1, x 2, ... x k) शोधा
- प्रभावी आणि प्रत्येक घटक चिन्हे यांच्यातील संबंधांच्या घट्टपणाचे मूल्यांकन.
सहसंबंध-रिग्रेशन मॉडेल (CRM) हे एक प्रतिगमन समीकरण आहे ज्यामध्ये मुख्य घटक समाविष्ट आहेत जे परिणामी गुणधर्माच्या भिन्नतेवर परिणाम करतात.
एकाधिक रीग्रेशन मॉडेल तयार करण्यासाठी खालील चरणांचा समावेश आहे:
- संवादाच्या स्वरूपाची निवड
- घटक वैशिष्ट्यांची निवड
- योग्य अंदाज देण्यासाठी लोकसंख्या मोठी आहे याची खात्री करणे.
I. प्रॅक्टिसमध्ये आलेल्या व्हेरिएबल्समधील संबंधांचा संपूर्ण संच 5 प्रकारच्या फंक्शन्सद्वारे पूर्णपणे वर्णन केला जातो:
- रेखीय:
- शक्ती:
- सूचक:
- पॅराबोला:
- हायपरबोला:
जरी सीआरएच्या सरावामध्ये सर्व 5 फंक्शन्स उपस्थित आहेत, रेखीय अवलंबन बहुतेकदा वापरले जाते, सर्वात सोपा आणि सर्वात सहज अर्थ लावता येण्याजोगा रेखीय अवलंबन समीकरण म्हणून: , k - समीकरणामध्ये समाविष्ट घटकांचा संच, ब ज
0 - कारण >0.7 म्हणून आम्ही त्यांच्याकडे विशेष लक्ष देतो
ECO. संप्रेषण घट्टपणा स्केल:
कनेक्शन 0 - 0.3 असल्यास - एक कमकुवत कनेक्शन
0.3 - 0.5 - लक्षात येण्याजोगे
0.3 - 0.5 - बंद
0.7 - 0.9 - उच्च
0.9 पेक्षा जास्त - खूप उच्च
मग आम्ही दोन वैशिष्ट्यांची तुलना करतो (उत्पन्न आणि लिंग)<0,7, то включаем в уравнение множественной регрессии.
एकाधिक प्रतिगमन समीकरणामध्ये समाविष्ट करण्यासाठी घटकांची निवड:
- प्रभावी आणि वास्तविक चिन्हे यांच्यात कार्यकारण संबंध असणे आवश्यक आहे.
- प्रभावी आणि वास्तविक चिन्हे एकमेकांशी जवळून संबंधित असणे आवश्यक आहे, अन्यथा घटना उद्भवू शकते बहुसंग्रहता (>06) , म्हणजे समीकरणात समाविष्ट केलेली घटक चिन्हे केवळ परिणामावरच नव्हे तर एकमेकांवर परिणाम करतात, ज्यामुळे संख्यात्मक डेटाचा चुकीचा अर्थ लावला जातो.
एकाधिक प्रतिगमन समीकरणामध्ये समाविष्ट करण्यासाठी घटक निवडण्याच्या पद्धती:
1. तज्ञ पद्धत - उच्च पात्र तज्ञांनी केलेल्या अंतर्ज्ञानी तार्किक विश्लेषणावर आधारित.
2. जोडलेल्या सहसंबंध गुणांकांच्या मॅट्रिक्सचा वापर पहिल्या पद्धतीच्या समांतरपणे केला जातो, मॅट्रिक्स एकक कर्णाच्या संदर्भात सममितीय आहे.
3. चरणानुसार प्रतिगमन विश्लेषण - प्रतिगमन समीकरण आणि महत्त्व चाचणीमधील घटक वैशिष्ट्यांचा अनुक्रमिक समावेश प्रत्येक चरणावर दोन निर्देशकांच्या मूल्यांवर आधारित केला जातो. सहसंबंध, प्रतिगमन सूचक.
सहसंबंध स्कोअर: गुणोत्तराच्या सैद्धांतिक सहसंबंधातील बदल किंवा सरासरी अवशिष्ट भिन्नतामधील बदलाची गणना करा. प्रतिगमन सूचक हा सशर्त शुद्ध प्रतिगमन गुणांकातील बदल आहे.
एकूण
31
32
22
85