सांख्यिकीय डेटा सादर करण्याच्या पद्धती. सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व
डेटाचे विश्लेषण आणि सामान्यीकरणामध्ये ग्राफिकल पद्धतीचे मूल्य मोठे आहे. ग्राफिक प्रतिमा, सर्व प्रथम, सांख्यिकीय निर्देशकांच्या विश्वासार्हतेवर नियंत्रण ठेवण्यास अनुमती देते, कारण, आलेखावर सादर केलेले, ते निरीक्षणातील त्रुटींच्या उपस्थितीशी किंवा अभ्यासाधीन घटनेच्या साराशी संबंधित विद्यमान अयोग्यता अधिक स्पष्टपणे दर्शवतात. ग्राफिक प्रतिमेच्या मदतीने, एखाद्या घटनेच्या विकासाच्या नमुन्यांचा अभ्यास करणे, विद्यमान संबंध स्थापित करणे शक्य आहे. डेटाची साधी तुलना नेहमीच कारणात्मक संबंधांची उपस्थिती पकडणे शक्य करत नाही, त्याच वेळी, त्यांचे ग्राफिकल प्रतिनिधित्व कार्यकारण संबंध ओळखण्यास मदत करते, विशेषत: प्रारंभिक गृहीतके स्थापित करण्याच्या बाबतीत, जे नंतर पुढील विकासाच्या अधीन असतात.
सांख्यिकी आलेख- हे एक रेखाचित्र आहे ज्यामध्ये विशिष्ट निर्देशकांद्वारे वैशिष्ट्यीकृत सांख्यिकीय समुच्चयांचे सशर्त भौमितिक प्रतिमा किंवा चिन्हे वापरून वर्णन केले जाते. ग्राफिक प्रतिमासांख्यिकीय डेटाचे प्रतिनिधित्व करणारे बिंदू, रेषा आणि आकारांचा संग्रह आहे. सहायक घटकग्राफिक्स आहेत:
आलेख फील्ड हा विमानाचा एक भाग आहे जेथे ग्राफिक प्रतिमा आहेत. आलेख फील्डचे काही परिमाण आहेत, जे त्याच्या उद्देशावर अवलंबून असतात.
आलेखाच्या स्थानिक खुणा समन्वय ग्रिडच्या प्रणालीच्या स्वरूपात सेट केल्या जातात. आलेख फील्डमध्ये भौमितिक चिन्हे ठेवण्यासाठी समन्वय प्रणाली आवश्यक आहे. आयताकृती आणि ध्रुवीय समन्वय प्रणाली दोन्ही वापरल्या जातात.
ऑब्जेक्टचे ग्राफिकल डिस्प्ले आणि त्याच्या वास्तविक आकाराची तुलना करण्यासाठी स्केल लँडमार्क वापरले जातात. स्केल लँडमार्क स्केल स्केल किंवा स्केल चिन्हांच्या प्रणालीद्वारे सेट केले जातात.
आलेखाच्या स्पष्टीकरणामध्ये आलेख (नाव) द्वारे चित्रित केलेल्या ऑब्जेक्टचे स्पष्टीकरण आणि आलेखावर वापरलेल्या प्रत्येक चिन्हाचा अर्थपूर्ण अर्थ असतो.
सांख्यिकीय आलेख त्यांच्या उद्देशानुसार (सामग्री), बांधकाम पद्धती आणि ग्राफिक प्रतिमेचे स्वरूप (चित्र 1) नुसार वर्गीकृत केले जातात.
आकृती क्रं 1. सांख्यिकीय आलेखांचे वर्गीकरण
ग्राफिक प्रतिमा तयार करण्याच्या पद्धतीनुसार, तेथे आहेतः
आकृत्या- सांख्यिकीय डेटाचे ग्राफिकल प्रतिनिधित्व, तुलना केलेल्या मूल्यांमधील संबंध स्पष्टपणे दर्शविते.
सांख्यिकी नकाशे
चार्टचे खालील मुख्य प्रकार आहेत: रेखा, बार, पट्टी, सेक्टर, चौरस, गोलाकार, कुरळे.
रेखा चार्टडायनॅमिक्स वैशिष्ट्यीकृत करण्यासाठी वापरले जातात, म्हणजे कालांतराने घटनांमधील बदलांचे मूल्यांकन. abscissa कालखंड किंवा तारखा दर्शविते आणि ऑर्डिनेट डायनॅमिक्सच्या मालिकेचे स्तर दर्शविते. एका आलेखावर अनेक तक्ते ठेवता येतात, जे तुम्हाला विविध निर्देशकांच्या गतीशीलतेची किंवा वेगवेगळ्या प्रदेशांसाठी किंवा देशांसाठी एका निर्देशकाची तुलना करण्यास अनुमती देतात.
अंजीर.2. रशियन फेडरेशनमधील प्रवासी कारच्या आयातीच्या प्रमाणात गतीशीलता
2006-1 q साठी. 2010
बार चार्टवापरले जाऊ शकते:
सामाजिक-आर्थिक घटनेच्या गतिशीलतेचे विश्लेषण करण्यासाठी;
योजनेच्या अंमलबजावणीचे मूल्यांकन;
वितरणाच्या मालिकेतील भिन्नतेची वैशिष्ट्ये;
स्थानिक तुलनेसाठी (प्रदेश, देश, कंपन्यांमधील तुलना);
घटनेच्या संरचनेचा अभ्यास करणे.
स्तंभ समान अंतरावर जवळ किंवा स्वतंत्रपणे स्थित आहेत. स्तंभांची उंची वैशिष्ट्य स्तरांच्या संख्यात्मक मूल्यांच्या प्रमाणात असावी.
अंजीर.3. सीआयएस देशांसह रशियन फेडरेशनच्या व्यापार उलाढालीमध्ये बेलारूसच्या वाटा गतिशीलता
सामाजिक-आर्थिक घटनेची रचना वैशिष्ट्यीकृत करण्यासाठी मोठ्या प्रमाणावर वापरले जातात पाई चार्ट. ते तयार करण्यासाठी, वर्तुळ एकूण खंडातील भागांच्या विशिष्ट गुरुत्वाकर्षणाच्या प्रमाणात विभागांमध्ये विभागले गेले पाहिजे. विशिष्ट वजनांची बेरीज 100% इतकी आहे, जी अभ्यासाधीन घटनेच्या एकूण व्हॉल्यूमशी संबंधित आहे.
अंजीर.4. रशियन फेडरेशन आणि सीआयएस देशांमधील व्यापार उलाढालीचे भौगोलिक वितरण
बार चार्टक्षैतिजरित्या मांडलेले आयत (पट्टे).
कधीकधी प्रदेशानुसार तुलनात्मक विश्लेषणासाठी, देश वापरतात आकृती चिन्ह रेखाचित्रे(भौमितिक आकारांचे आकृत्या). हे आकृती अभ्यास केलेल्या वस्तूचा आकार त्याच्या क्षेत्राच्या आकारानुसार दर्शवतात.
सांख्यिकी नकाशेघटनांच्या भौगोलिक वितरणाचे मूल्यांकन करण्यासाठी आणि प्रदेशानुसार तुलनात्मक विश्लेषण करण्यासाठी वापरले जातात.
सांख्यिकीय नकाशांमध्ये कार्टोग्राम आणि कार्टोग्राम समाविष्ट आहेत. त्यांच्यातील फरक नकाशांवर ज्या प्रकारे आकडेवारी प्रदर्शित केली जाते त्यामध्ये आहे.
कार्टोग्रामस्वतंत्र भागात अभ्यासाधीन असलेल्या वैशिष्ट्याचे प्रादेशिक वितरण दर्शविते आणि या वितरणाचे नमुने ओळखण्यासाठी वापरले जाते. कार्टोग्राम पार्श्वभूमी आणि बिंदूमध्ये विभागलेले आहेत. वेगवेगळ्या रंगांच्या घनतेचे पार्श्वभूमी कार्टोग्राम प्रादेशिक युनिटमधील कोणत्याही निर्देशकाची तीव्रता दर्शवतात. डॉट कार्टोग्रामवर, निवडलेल्या घटनेची पातळी ठिपके वापरून दर्शविली जाते.
कार्टोग्राम- हे भौगोलिक नकाशा किंवा आकृतीसह त्याची योजना यांचे संयोजन आहे. हे आपल्याला अभ्यासाधीन घटनेच्या वितरणामध्ये, त्याची संरचनात्मक वैशिष्ट्ये प्रत्येक प्रदेशाची वैशिष्ट्ये प्रतिबिंबित करण्यास अनुमती देते.
सध्या, संगणक ग्राफिक्ससाठी विविध सॉफ्टवेअर पॅकेजेस विकसित केली गेली आहेत, उदाहरणार्थ, एक्सेल, स्टॅटग्राफ, स्टॅटिस्टिका.
सांख्यिकीय डेटा अशा प्रकारे सादर केला पाहिजे की ते वापरता येतील. सांख्यिकीय डेटा सादर करण्याचे 3 मुख्य प्रकार आहेत:
1) मजकूर - मजकूरात डेटा समाविष्ट करणे;
2) सारणी - सारण्यांमध्ये डेटाचे सादरीकरण;
3) ग्राफिक - आलेखांच्या स्वरूपात डेटाची अभिव्यक्ती.
जेव्हा थोड्या प्रमाणात डिजिटल डेटा असतो तेव्हा मजकूर फॉर्म वापरला जातो.
टॅब्युलर फॉर्म बहुतेक वेळा वापरला जातो, कारण हा सांख्यिकीय डेटा सादर करण्याचा अधिक कार्यक्षम प्रकार आहे. गणितीय सारण्यांच्या विपरीत, जे, प्रारंभिक परिस्थितीनुसार, एक किंवा दुसरे परिणाम प्राप्त करण्यास अनुमती देतात, सांख्यिकीय सारण्या अभ्यासाधीन वस्तूंबद्दल संख्यांची भाषा सांगतात.
सांख्यिकी सारणी- ही पंक्ती आणि स्तंभांची एक प्रणाली आहे, ज्यामध्ये सामाजिक-आर्थिक घटनेबद्दल सांख्यिकीय माहिती एका विशिष्ट क्रमाने आणि कनेक्शनमध्ये सादर केली जाते.
तक्ता 2. 2000 - 2006 साठी रशियन फेडरेशनचा परकीय व्यापार, अब्ज डॉलर्स
निर्देशांक | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 |
विदेशी व्यापार उलाढाल | 149,9 | 155,6 | 168,3 | 280,6 | 368,9 | 468,4 | |
निर्यात करा | 101,9 | 107,3 | 135,9 | 183,2 | 243,6 | 304,5 | |
आयात करा | 44,9 | 53,8 | 76,1 | 97,4 | 125,3 | 163,9 | |
व्यापार शिल्लक | 60,1 | 48,1 | 46,3 | 59,9 | 85,8 | 118,3 | 140,7 |
यासह: | |||||||
परदेशी देशांसह | |||||||
निर्यात | 90,8 | 86,6 | 90,9 | 114,6 | 210,1 | 261,1 | |
आयात | 31,4 | 40,7 | 48,8 | 77,5 | 103,5 | 138,6 | |
व्यापार शिल्लक | 59,3 | 45,9 | 42,1 | 53,6 | 75,5 | 106,6 | 122,5 |
उदाहरणार्थ, टेबलमध्ये. 2 रशियाच्या परकीय व्यापाराची माहिती सादर करते, जी मजकूर स्वरूपात व्यक्त करणे अकार्यक्षम असेल.
भेद करा विषयआणि अंदाजसांख्यिकी सारणी. विषय वैशिष्ट्यीकृत ऑब्जेक्ट दर्शवतो - एकतर लोकसंख्येची एकके, किंवा युनिट्सचे गट, किंवा संपूर्णता. प्रेडिकेटमध्ये, विषयाचे वैशिष्ट्य दिले जाते, सहसा संख्यात्मक स्वरूपात. अनिवार्य शीर्षलेखसारणी, जे सूचित करते की टेबलमधील डेटा कोणत्या श्रेणीचा आणि कोणत्या वेळेचा आहे.
विषयाच्या स्वरूपानुसार, सांख्यिकीय तक्त्यामध्ये विभागले गेले आहेत सोपे, गटआणि संयुक्त. साध्या सारणीच्या विषयामध्ये, अभ्यासाचा विषय गटांमध्ये विभागलेला नाही, परंतु एकतर लोकसंख्येच्या सर्व एककांची यादी दिली आहे किंवा संपूर्ण लोकसंख्या दर्शविली आहे (उदाहरणार्थ, तक्ता 11). गट सारणीच्या विषयामध्ये, अभ्यासाचे ऑब्जेक्ट एका गुणधर्मानुसार गटांमध्ये विभागले गेले आहे आणि प्रेडिकेट गटांमधील एककांची संख्या (निरपेक्ष किंवा टक्केवारी म्हणून) आणि गटांसाठी सारांश निर्देशक (उदाहरणार्थ, सारणी) दर्शवते. 4). संयोजन सारणीच्या विषयामध्ये, लोकसंख्या एकानुसार नाही तर अनेक निकषांनुसार (उदाहरणार्थ, तक्ता 2) गटांमध्ये विभागली गेली आहे.
तक्ते तयार करताना, आपण खालील गोष्टींद्वारे मार्गदर्शन केले पाहिजे सर्वसाधारण नियम.
1. सारणीचा विषय डावीकडे (कमी वेळा - वरच्या) भागात स्थित आहे, आणि प्रेडिकेट - उजवीकडे (कमी वेळा - खालचा) आहे.
2. स्तंभ शीर्षकांमध्ये निर्देशकांची नावे आणि त्यांच्या युनिट्स असतात.
3. अंतिम ओळ सारणी पूर्ण करते आणि त्याच्या शेवटी स्थित असते, परंतु काहीवेळा ती पहिली असते: या प्रकरणात, दुसरी ओळ "सहीत" लिहिली जाते आणि त्यानंतरच्या ओळींमध्ये एकूण ओळीचे घटक असतात.
4. अंकांच्या खाली असलेल्या संख्येच्या अंकांसह, प्रत्येक स्तंभामध्ये समान प्रमाणात अचूकतेसह अंकीय डेटा लिहिला जातो आणि पूर्णांक भाग अपूर्णांक स्वल्पविरामाने विभक्त केला जातो.
5. टेबलमध्ये रिक्त सेल असू नयेत: जर डेटा शून्य असेल, तर “–” चिन्ह (डॅश) ठेवले जाईल; जर डेटा माहित नसेल, तर "माहिती नाही" अशी नोंद केली जाते किंवा "..." (लंबवर्तुळ) चिन्ह लावले जाते. जर घातांक मूल्य शून्य नसेल, परंतु पहिला महत्त्वाचा अंक अचूकतेच्या स्वीकृत डिग्रीनंतर दिसत असेल, तर 0.0 रेकॉर्ड केला जाईल (जर, 0.1 च्या अचूकतेची डिग्री स्वीकारली असेल).
काहीवेळा सांख्यिकी सारण्यांना आलेखांसह पूरक केले जाते जेव्हा लक्ष्य डेटाच्या काही वैशिष्ट्यांवर जोर देणे, त्यांची तुलना करणे हे असते. ग्राफिकल फॉर्म त्यांच्या आकलनाच्या दृष्टीने डेटा सादरीकरणाचा सर्वात प्रभावी प्रकार आहे. आलेखांच्या मदतीने, संरचनेची वैशिष्ट्ये, गतिशीलता, घटनांमधील संबंध आणि त्यांची तुलना यांची दृश्यमानता प्राप्त केली जाते.
सांख्यिकी आलेख- या रेषा, भौमितिक आकार, रेखाचित्रे किंवा भौगोलिक तक्त्यांद्वारे संख्यात्मक मूल्ये आणि त्यांचे गुणोत्तर यांच्या सशर्त प्रतिमा आहेत. ग्राफिकल फॉर्म सांख्यिकीय डेटाचा विचार करणे सुलभ करते, ते दृश्यमान, अर्थपूर्ण आणि दृश्यमान बनवते. तथापि, आलेखांना काही मर्यादा आहेत: सर्व प्रथम, आलेखामध्ये जितका डेटा टेबलमध्ये बसू शकतो तितका समाविष्ट करू शकत नाही; याव्यतिरिक्त, आलेख नेहमी गोलाकार डेटा दर्शवतो - अचूक नाही, परंतु अंदाजे. अशा प्रकारे, आलेख फक्त सामान्य परिस्थिती दर्शविण्यासाठी वापरला जातो, तपशील नाही. शेवटची कमतरता म्हणजे प्लॉटिंगची जटिलता. वैयक्तिक संगणक वापरून त्यावर मात केली जाऊ शकते (उदाहरणार्थ, पॅकेजमधील "डायग्राम विझार्ड". मायक्रोसॉफ्ट ऑफिस एक्सेल).
ग्राफिक्स तयार करण्याच्या पद्धतीनुसार, ते विभागलेले आहेत आकृत्या, कार्टोग्रामआणि चार्ट आकृत्या.
डेटाचे ग्राफिकल प्रतिनिधित्व करण्याचा सर्वात सामान्य मार्ग म्हणजे चार्ट, जे खालील प्रकारचे आहेत: रेखीय, रेडियल, स्कॅटर, प्लानर, व्हॉल्यूमेट्रिक, कर्ली. आकृत्यांचा प्रकार सादर केलेल्या डेटाच्या प्रकारावर आणि बांधकाम कार्यावर अवलंबून असतो. कोणत्याही परिस्थितीत, आलेखासह शीर्षलेख असणे आवश्यक आहे - आलेख फील्डच्या वर किंवा खाली. शीर्षक दर्शवते की कोणता निर्देशक प्रदर्शित केला जातो, कोणत्या प्रदेशासाठी आणि कोणत्या वेळेसाठी.
रेषा आलेख परिमाणवाचक चलांचे प्रतिनिधित्व करण्यासाठी वापरले जातात: त्यांच्या मूल्यांच्या भिन्नतेची वैशिष्ट्ये, गतिशीलता, चलांमधील संबंध. वापरून डेटा भिन्नतेचे विश्लेषण केले जाते वितरण क्षेत्र, जमा करते(वक्र पेक्षा कमी) आणि ogives(वक्र "पेक्षा मोठे"). वितरण बहुभुज विषय 4 मध्ये चर्चा केली आहे (उदा. चित्र 5.). क्युम्युलेट तयार करण्यासाठी, व्हेरिएबल वैशिष्ट्याची मूल्ये abscissa च्या बाजूने प्लॉट केली जातात आणि ऑर्डिनेट्स म्हणजे फ्रिक्वेन्सी किंवा फ्रिक्वेन्सीजची एकत्रित बेरीज (पासून f1ते ∑ f). ओगिव्ह तयार करण्यासाठी, फ्रिक्वेन्सीची जमा झालेली बेरीज y-अक्षावर उलट क्रमाने ठेवली जाते (∑ पासून fआधी f1). सारणीनुसार एकत्रित करा आणि ओजीव्ह करा. 4. अंजीर मध्ये चित्रण. एक
तांदूळ. 1. सीमाशुल्क मूल्याच्या मूल्यानुसार वस्तूंच्या वितरणाचे संचित आणि ओजीव्ह
ट्रेंड अॅनालिसिसमध्ये लाइन चार्टचा वापर विषय 5 (उदा. आकृती 13) आणि विषय 6 (उदा. आकृती 21) मध्ये लिंक विश्लेषणासाठी वापरण्यात आलेला आहे. विषय 6 मध्ये स्कॅटर प्लॉटचा वापर देखील समाविष्ट आहे (उदा. आकृती 20).
रेखा चार्ट उपविभाजित आहेत एक-आयामी, एका व्हेरिएबलवरील डेटाचे प्रतिनिधित्व करण्यासाठी वापरले जाते, आणि द्विमितीय- दोन व्हेरिएबल्ससाठी. एक-आयामी रेखा आलेखाचे उदाहरण म्हणजे वितरण बहुभुज, आणि द्विमितीय एक प्रतिगमन रेषा आहे (उदा. चित्र 21).
कधीकधी, निर्देशकामध्ये मोठ्या बदलांसह, लॉगरिदमिक स्केल वापरला जातो. उदाहरणार्थ, जर इंडिकेटरची व्हॅल्यू 1 ते 1000 पर्यंत बदलत असतील तर प्लॉटिंग करताना यामुळे अडचणी येऊ शकतात. अशा परिस्थितीत, ते सूचक मूल्यांच्या लॉगरिदमवर स्विच करतात, जे इतके वेगळे नसतील: lg 1 = 0, lg 1000 = 3.
मध्ये प्लॅनरबार आलेख (हिस्टोग्राम) वापराच्या वारंवारतेनुसार वेगळे केले जातात, ज्यामध्ये निर्देशक बार म्हणून सादर केला जातो, ज्याची उंची निर्देशकाच्या मूल्याशी संबंधित असते (उदाहरणार्थ, अंजीर 4).
एका विशिष्ट भौमितीय आकृतीच्या क्षेत्रफळाच्या निर्देशकाच्या मूल्याच्या प्रमाणानुसार इतर प्रकारच्या प्लॅनर आकृत्यांचा समावेश होतो: त्रिकोणी, चौरस, आयताकृती. आपण वर्तुळाच्या क्षेत्रांची तुलना देखील वापरू शकता - या प्रकरणात, वर्तुळाची त्रिज्या सेट केली आहे.
पट्टी चार्टक्षैतिज ताणलेल्या आयताच्या स्वरूपात निर्देशक सादर करते आणि अन्यथा बार चार्ट सारखेच असते.
प्लॅनर आकृत्यांपैकी, ते बर्याचदा वापरले जाते पाई चार्ट, ज्याचा उपयोग अभ्यासलेल्या लोकसंख्येची रचना स्पष्ट करण्यासाठी केला जातो. संपूर्ण संच 100% म्हणून घेतला जातो, तो वर्तुळाच्या एकूण क्षेत्राशी संबंधित असतो, सेक्टरचे क्षेत्र सेटच्या भागांशी संबंधित असतात. टेबलनुसार 2006 मध्ये रशियन फेडरेशनच्या परदेशी व्यापाराच्या संरचनेचा सेक्टर आकृती तयार करूया. 2 (अंजीर 2 पहा). संगणक प्रोग्राम वापरताना, सेक्टर डायग्राम त्रि-आयामी स्वरूपात तयार केले जातात, म्हणजे, दोन नव्हे तर तीन विमानांमध्ये (चित्र 3 पहा).
तांदूळ. 2. साधा पाई चार्ट 3. 3D पाई चार्ट
कुरळे (चित्र) आकृत्या प्रतिमेची स्पष्टता वाढवतात, कारण त्यात प्रदर्शित निर्देशकाचे चित्र समाविष्ट असते, ज्याचा आकार निर्देशकाच्या आकाराशी संबंधित असतो.
आलेख प्लॉट करताना, सर्वकाही तितकेच महत्वाचे आहे - ग्राफिक प्रतिमेची योग्य निवड, प्रमाण, आलेख डिझाइन करण्याच्या नियमांचे पालन. हे मुद्दे अधिक तपशीलवार आणि मध्ये समाविष्ट आहेत.
कार्टोग्राम आणि कार्टोग्राम्सचा उपयोग अभ्यासल्या जाणार्या घटनेची भौगोलिक वैशिष्ट्ये दर्शवण्यासाठी केला जातो. ते अभ्यासाधीन घटनेचे स्थान, विशिष्ट प्रदेशात त्याची तीव्रता दर्शवतात - प्रजासत्ताक, प्रदेश, आर्थिक किंवा प्रशासकीय जिल्ह्यात, उदाहरणार्थ, कार्टोग्राम आणि कार्टोग्रामचे बांधकाम विशेष साहित्यात मानले जाते.
1. आकडेवारीची संकल्पना
सांख्यिकी ही ज्ञानाच्या सर्वात जुन्या शाखांपैकी एक आहे जी आर्थिक लेखांकनाच्या आधारे उद्भवली. त्याचा उदय विविध प्रकारच्या माहितीच्या समाजाच्या गरजांशी संबंधित आहे.
असे मानले जाते की सांख्यिकी हा शब्द लॅटिन शब्द स्टेटो (स्टेट) आणि स्टेटस (स्थिती, राज्य) पासून आला आहे.
व्यापक अर्थाने, सांख्यिकी हे एक विज्ञान म्हणून समजले जाते जे वस्तुमान घटना आणि त्यांच्या नियमिततेचा परिमाणात्मक दृष्टिकोनातून अभ्यास करते.
सांख्यिकींचा सामान्य सिद्धांत हे एक पद्धतशीर शास्त्र आहे, अशा पद्धतीचे विज्ञान जे कोणत्याही क्षेत्रातील नमुने ओळखण्यासाठी लागू होते जेथे निष्कर्ष वस्तुमान निरीक्षणावर आधारित असतात, जेथे लोकसंख्येच्या वैयक्तिक घटकांमध्ये चिन्हाचा फरक असतो, जेथे सामान्य नमुने वैयक्तिक युनिट्समधील यादृच्छिकतेच्या परस्पर रद्दीकरणाद्वारेच स्वतःला प्रकट करू शकते. .
2. विज्ञान म्हणून सांख्यिकी
2.1 आकडेवारी विकसित करण्याचे मार्ग
विज्ञान म्हणून आकडेवारीचा विकास दोन दिशांनी झाला:
प्रथम दिशा जर्मनीमध्ये उद्भवली आणि राज्य अभ्यास किंवा वर्णनात्मक शाळा म्हणून ओळखली जाते. या शाळेच्या प्रतिनिधींनी त्यांच्यातील नमुने आणि नातेसंबंधांचे विश्लेषण न करता राज्यातील स्थळांचे वर्णन करणे हे त्यांचे मुख्य कार्य मानले. वर्णनात्मक शाळेचे संस्थापक जर्मन शास्त्रज्ञ हर्मन कोनिंग होते.
आकडेवारीच्या विकासाचा दुसरा ट्रेंड इंग्लंडमध्ये उद्भवला आणि त्याला राजकीय अंकगणित म्हणून ओळखले जाते. या शाळेच्या प्रतिनिधींनी मोठ्या संख्येने निरीक्षणे, विविध नियमितता आणि अभ्यास केलेल्या घटनेच्या परस्परसंबंधांच्या आधारे प्रकट करणे हे त्यांचे मुख्य कार्य मानले. शाळेचे संस्थापक विल्यम पेटी होते.
2.2 सांख्यिकी आणि मूलभूत संकल्पनांचा विषय
बेल्जियन गणितज्ञ अॅडॉल्फ केटी यांनी राज्य अभ्यासातून सैद्धांतिक माहितीचा सारांश दिला आणि राजकीय अंकगणित शाळेच्या प्रतिनिधींच्या व्यावहारिक कार्यासाठी लेखांकन केले. तोही दिला आकडेवारीच्या विषयाची व्याख्या - ही समाज आणि माणसाच्या जीवनाशी संबंधित वस्तुमान घटना आहेत.त्यांनी सांख्यिकीमध्ये सामाजिक अनुभूतीचे साधन पाहिले.
वस्तुमान घटनेची विशिष्ट वैशिष्ट्ये:
1. सेटच्या प्रत्येक घटकामध्ये वैयक्तिक किंवा विशिष्ट वैशिष्ट्ये तसेच सामान्य किंवा समान वैशिष्ट्ये आहेत.
2. वस्तुमान घटनेच्या घटकांपैकी एकाची वैशिष्ट्ये इतर घटकांच्या वैशिष्ट्यांच्या आधारे मिळवता येत नाहीत.
व्याख्या: वेगवेगळ्या वैयक्तिक वैशिष्ट्यांसह समान-गुणवत्तेच्या एककांच्या संचाच्या रूपात आकडेवारीद्वारे अभ्यासलेल्या वस्तुमान घटनांना सांख्यिकीय समुच्चय म्हणतात. याच्या आधारे, आम्ही असे म्हणू शकतो की सांख्यिकी विषय विविध सांख्यिकीय समुच्चय आहेत, ज्याचा अभ्यास परिमाणवाचक वैशिष्ट्य आणि त्यांच्या मूळ नमुन्यांची ओळख यांच्याशी संबंधित आहे. सांख्यिकीय संपूर्णता ही सांख्यिकीय विज्ञानाच्या मुख्य संकल्पनांपैकी एक आहे. हे अशा संकल्पनांशी देखील संबंधित आहे: लोकसंख्येचे एकक. व्याख्या: ज्या घटकांचा संच अभ्यासाखाली तयार होतो, त्यांना एकक म्हणतात. लोकसंख्या एककांची चिन्हे:
लोकसंख्येचे प्रत्येक एकक विविध प्रकारच्या गुणात्मक आणि परिमाणात्मक वैशिष्ट्यांद्वारे दर्शविले जाऊ शकते.
जर एखाद्या विशिष्ट गुणधर्माची लोकसंख्येच्या विशिष्ट एककांसाठी भिन्न मूल्ये असतील तर त्याला भिन्नता म्हणतात. व्याख्या: वस्तुमान निरीक्षणाच्या आधारे ओळखला जाणारा नमुना, उदा. त्याच्या वैयक्तिक घटकाच्या अंतर्निहित यादृच्छिकतेवर मात करून मोठ्या प्रमाणात घटनांमध्ये प्रकट होते, त्याला सांख्यिकीय नियमितता म्हणतात. यादृच्छिकतेपासून गोषवारा काढणे आणि ठराविक, नियमित ओळखणे हे आकडेवारीचे मुख्य कार्य आहे.
नमुने ओळखण्याचे तीन मार्ग आहेत:
1. तार्किक;
2. अनुभवजन्य;
3. मोठ्या संख्येच्या कायद्यावर आधारित.
2.3 आकडेवारीची पद्धत
वस्तुमान निरीक्षण, गटबद्धता आणि त्याच्या परिणामांचा सारांश, सामान्यीकरण निर्देशकांची गणना आणि विश्लेषण. हे सर्व एकत्रितपणे आकडेवारीची पद्धत देते.
3.सांख्यिकीय निरीक्षण
3.1 सांख्यिकीय संशोधनाचा टप्पा म्हणून सांख्यिकीय निरीक्षण. सांख्यिकीय निरीक्षण योजना
सांख्यिकीय निरीक्षण हा सांख्यिकीय संशोधनाचा पहिला टप्पा आहे.
व्याख्या: सांख्यिकीय निरीक्षण हे अभ्यासाधीन प्रक्रिया आणि घटनांवरील वस्तुमान डेटाचे वैज्ञानिकदृष्ट्या आयोजित केलेले संकलन आहे, जे पूर्व-डिझाइन केलेल्या कार्यक्रमानुसार केले जाते.
मोठ्या प्रमाणात डेटा आवश्यकता:
सांख्यिकीय डेटा पुरेसा पूर्ण असणे आवश्यक आहे. प्रत्येक इंद्रियगोचरमध्ये विविध परस्परसंबंधित वैशिष्ट्ये असतात. डेटाची पूर्णता वस्तुनिष्ठ निष्कर्ष प्राप्त करण्यासाठी आवश्यक असलेल्या सर्वात लक्षणीय वैशिष्ट्यांचे कव्हरेज प्रदान करते. जर सांख्यिकीय निरीक्षणाचा डेटा वेगवेगळ्या कालावधीचा, प्रदेशांचा संदर्भ घेत असेल तर त्यांची तुलना सुनिश्चित करणे आवश्यक आहे. सांख्यिकीय माहितीच्या तुलनात्मकतेचा अर्थ त्यांच्या मोजमापाच्या युनिट्सची एकसमानता, खर्च अंदाज, प्रशासकीय प्रदेशांच्या सीमा, तात्पुरती वैशिष्ट्ये इ. सांख्यिकीय निरीक्षण सुरू करण्यापूर्वी, त्याच्या अंमलबजावणीसाठी प्रक्रिया स्थापित करणे आवश्यक आहे. हे करण्यासाठी, तपशीलवार देखरेख योजना विकसित केली आहे, ज्यामध्ये हे समाविष्ट आहे:
1. कार्यक्रम आणि पद्धतशीर भाग:
2. संघटनात्मक भाग.
1. निरीक्षण योजनेचे कार्यक्रम आणि पद्धतशीर समस्या.
योजनेच्या या भागामध्ये हे समाविष्ट असावे:
अ) निरीक्षणाचा उद्देश आणि उद्दिष्टे:
b) सर्वेक्षण केले जाणारे ऑब्जेक्ट आणि युनिट्स;
c) देखरेख कार्यक्रम.
निरीक्षण कार्यक्रम म्हणजे सर्वेक्षणादरम्यान उत्तरे मिळणे अपेक्षित असलेल्या प्रश्नांची यादी. माहितीची पूर्णता आणि कव्हरेजच्या रुंदीने कार्यक्रम ओळखला जावा. प्रश्नांची शब्दरचना शक्य तितकी लहान आणि स्पष्ट असावी, उत्तरांमध्ये अयोग्यता आणि अस्पष्टता वगळा, आवश्यक असल्यास, प्रश्नांचे एकसंध स्पष्टीकरण आणि समजून घेण्यासाठी एक इशारा दिला जातो. निरीक्षणाचा कार्यक्रम पद्धतशीर भाग सांख्यिकीय अभ्यासाच्या विशिष्ट साधनांना सूचित करतो, म्हणजे. फॉर्म, ज्यामध्ये तयार केलेल्या प्रश्नांची उत्तरे, तसेच ते भरण्याच्या सूचना असाव्यात.
2. निरीक्षण योजनेचे संस्थात्मक मुद्दे.
निरीक्षणाच्या यशस्वी संस्थेसाठी आणि लोकसंख्येच्या कव्हरेजच्या पूर्णतेसाठी, निरीक्षणासाठी एक संस्थात्मक योजना विकसित केली जाते.
त्यात असे म्हटले आहे:
अ) निरीक्षणाचा विषय:
ब) अभ्यासाची वेळ आणि ठिकाण;
c) डेटा संकलनाची संघटना आणि त्यांच्या प्रक्रियेसाठी तंत्रज्ञान.
3.2 सांख्यिकीय निरीक्षणाचे फॉर्म आणि प्रकार
सांख्यिकीय निरीक्षणाचे फॉर्म, प्रकार आणि पद्धती.
सांख्यिकीय निरीक्षणाचे संस्थात्मक स्वरूप | सांख्यिकीय निरीक्षणाचे प्रकार | सांख्यिकीय निरीक्षणाच्या पद्धती |
|
तथ्यांच्या नोंदणीच्या वेळेपर्यंत | लोकसंख्या युनिट्सच्या कव्हरेजद्वारे |
||
1. सांख्यिकी अहवाल. 2. विशेष आयोजित निरीक्षण. 3. निरीक्षण नोंदवा. | 1. वर्तमान किंवा सतत. 2. खंडित: अ) नियतकालिक; ब) एक वेळ. | 1. घन. 2. खंडित: अ) निवडक; ब) मुख्य अॅरे; c) मोनोग्राफिक. | 1. तात्काळ. 2. माहितीपट. अ) फॉरवर्डिंग; ब) स्व-नोंदणी; c) वार्ताहर; ड) प्रश्नावली; e) परिचर. |
देशांतर्गत आकडेवारीमध्ये, सांख्यिकीय निरीक्षणाचे तीन संस्थात्मक प्रकार (प्रकार) वापरले जातात:
1. अहवाल देणे- सांख्यिकीय निरीक्षणाचा हा मुख्य प्रकार आहे, ज्याच्या मदतीने सांख्यिकी अधिकारी एंटरप्राइजेस, संस्था आणि संस्थांकडून विशिष्ट कालावधीत कायदेशीररित्या स्थापित अहवाल दस्तऐवजांच्या स्वरूपात आवश्यक डेटा प्राप्त करतात, त्यांच्यासाठी जबाबदार व्यक्तींनी स्वाक्षरी केली आहे. तरतूद आणि गोळा केलेल्या माहितीची विश्वासार्हता.
सामायिक: टेलिफोन, टेलिटाइप, मेल.
2. विशेष आयोजित पाळत ठेवणेअहवालात नसलेली माहिती मिळविण्यासाठी किंवा त्याचा डेटा सत्यापित करण्यासाठी केला जातो. व्यावहारिक आकडेवारी लोकसंख्या, भौतिक संसाधने, बारमाही वृक्षारोपण, विस्थापित उपकरणे, प्रगतीपथावर असलेल्या उपकरणांचे बांधकाम प्रकल्प इत्यादींची जनगणना करते. जनगणनेव्यतिरिक्त, आकडेवारी इतर विशेष आयोजित निरीक्षणे देखील आयोजित करते, विशेषत: अर्थसंकल्पीय सर्वेक्षणांमध्ये, जे ग्राहकांच्या संरचनेचे वैशिष्ट्य दर्शवतात. खर्च आणि कौटुंबिक उत्पन्न.
3. नोंदणी पर्यवेक्षणदीर्घकालीन प्रक्रियांच्या निरंतर सांख्यिकीय निरीक्षणाचा एक प्रकार आहे ज्याची निश्चित सुरुवात, विकासाचा टप्पा आणि निश्चित शेवट असतो. हे सांख्यिकी रजिस्टरच्या देखभालीवर आधारित आहे. रजिस्टर ही एक प्रणाली आहे जी निरीक्षणाच्या युनिटच्या स्थितीवर सतत लक्ष ठेवते आणि अभ्यास केलेल्या निर्देशकांवर विविध घटकांच्या प्रभावाच्या ताकदीचे मूल्यांकन करते.
सांख्यिकी सराव मध्ये, लोकसंख्या नोंदवही आणि व्यवसाय नोंदणी यांच्यात फरक केला जातो.
तथ्यांच्या नोंदणीच्या वेळेनुसार सांख्यिकीय निरीक्षणाचे प्रकार
घटना घडत असताना वर्तमान निरीक्षण पद्धतशीरपणे केले जाते. नियतकालिक निरीक्षणासह, अभ्यासाधीन घटनांची नोंदणी ठराविक, सामान्यतः समान, वेळेच्या अंतराने केली जाते. एखाद्या समस्येचे निराकरण करण्यासाठी एकदा एक-वेळचे निरीक्षण केले जाते किंवा आवश्यकतेनुसार ठराविक कालावधीनंतर एपिसोडिकरित्या पुनरावृत्ती होते.
लोकसंख्या युनिट्सच्या कव्हरेजद्वारे सांख्यिकीय निरीक्षणाचे प्रकार
सतत निरीक्षणासह, लोकसंख्येच्या सर्व युनिट्स अपवाद न करता रेकॉर्ड केल्या जातात. निवडक निरीक्षणामध्ये, संपूर्ण लोकसंख्या वैशिष्ट्यीकृत करण्यासाठी लोकसंख्या युनिट्सचा यादृच्छिकपणे निवडलेला भाग तपासला जातो.
अपूर्णपणे सतत निरीक्षणासह (मुख्य अॅरेचे), लोकसंख्येचा मुख्य भाग तपासला जातो आणि एक विशिष्ट भाग जाणूनबुजून वगळला जातो, ज्याबद्दल हे ज्ञात आहे की ते संपूर्ण लोकसंख्येच्या वैशिष्ट्यांमध्ये मोठी भूमिका बजावत नाही. मोनोग्राफिक निरीक्षणामध्ये लहान संख्येचे किंवा लोकसंख्येच्या वैयक्तिक विशिष्ट युनिट्सचे तपशीलवार वर्णन असते.
तथ्ये नोंदवण्याच्या पद्धती किंवा प्राथमिक साहित्य मिळविण्याच्या पद्धती
प्रत्यक्ष तपासणी, मोजणी, वजन, साधन वाचन इत्यादींच्या आधारे विशेष नियुक्त केलेल्या व्यक्तींद्वारे अभ्यासाधीन युनिट्स आणि त्यांची वैशिष्ट्ये नोंदवून प्रत्यक्ष निरीक्षण केले जाते. सांख्यिकीय माहितीचा स्रोत म्हणून एंटरप्राइजेस, संस्था आणि संस्थांच्या विविध प्राथमिक लेखा दस्तऐवजांच्या वापरावर डॉक्युमेंटरी निरीक्षण आधारित आहे. सर्वेक्षणादरम्यान, मुलाखत घेतलेल्या व्यक्तींनी दिलेल्या उत्तरांची नोंद करून सांख्यिकीय साहित्य मिळवले जाते. फॉरवर्डिंग पद्धतीमध्ये विशेष प्रशिक्षित रजिस्ट्रार सर्वेक्षणाद्वारे सूत्रे भरतात, त्याच वेळी प्राप्त माहितीच्या स्वातंत्र्यावर नियंत्रण ठेवतात. स्व-नोंदणी किंवा स्व-गणना दरम्यान, सांख्यिकी संस्थांचे कर्मचारी मुलाखतींना प्रश्नावली फॉर्म वितरीत करतात, त्यांना सूचना देतात आणि नंतर प्राप्त झालेल्या माहितीची पूर्णता आणि शुद्धता नियंत्रित करून पूर्ण केलेले फॉर्म गोळा करतात. प्रश्नावली सर्वेक्षणामध्ये हे तथ्य असते की विकसित प्रश्नावली लोकांच्या वर्तुळात पाठविली जाते आणि भरल्यानंतर, निरीक्षणे आयोजित करणाऱ्या संस्थांना परत केली जाते. वार्ताहर म्हणजे संस्थेत सांख्यिकी अधिकार्यांच्या सांख्यिकी अधिकार्यांचा समावेश आहे ज्या क्षेत्रात राहणार्या व्यक्तींकडून वार्ताहरांचे एक विशेष नेटवर्क आहे जे विकसित फॉर्म आणि सूचनांनुसार निरीक्षणे घेतात आणि सांख्यिकी अधिकार्यांना माहितीचा अहवाल देतात. अवांछित आधारावर पाळत ठेवणार्या संस्थांना माहिती सादर करण्याची तरतूद आहे.
4. आकडेवारीचा सारांश आणि समूहीकरण
4.1 कार्ये आणि सांख्यिकीय सारांशाचे प्रकार
व्याख्या: सारांश हा विशिष्ट एकल तथ्यांचे सामान्यीकरण करण्यासाठी अनुक्रमिक ऑपरेशन्सचा एक संच आहे जो संपूर्ण अभ्यासाधीन घटनेमध्ये अंतर्निहित वैशिष्ट्यपूर्ण वैशिष्ट्ये आणि नमुने ओळखण्यासाठी एक संच तयार करतो.
अशा प्रकारे, जर सांख्यिकीय निरीक्षणादरम्यान एखाद्या वस्तूच्या प्रत्येक युनिटबद्दल डेटा गोळा केला असेल तर सारांशाचा परिणाम तपशीलवार डेटा आहे जो संपूर्णपणे त्याची संपूर्णता प्रतिबिंबित करतो.
सांख्यिकीय सारांश घटना आणि प्रक्रियांच्या प्राथमिक सैद्धांतिक विश्लेषणावर आधारित असावा.
सामग्री प्रक्रियेच्या खोलीनुसारसारांश दोन्ही साधे आणि जटिल आहेत.
एक साधा सारांश म्हणजे निरीक्षणाच्या एककांच्या संचासाठी बेरीज मोजण्याचे ऑपरेशन.
एक जटिल सारांश हा ऑपरेशन्सचा एक संच आहे ज्यामध्ये निरीक्षण युनिट्सचे समूह करणे, प्रत्येक गटासाठी आणि संपूर्ण ऑब्जेक्टसाठी बेरीज मोजणे आणि सांख्यिकीय सारण्यांच्या स्वरूपात गट आणि सारांश परिणाम सादर करणे समाविष्ट आहे.
सारांश त्याच्या प्रोग्रामच्या विकासापूर्वी आहे, ज्यामध्ये खालील चरणांचा समावेश आहे:
गटबद्ध वैशिष्ट्यांची निवड;
गट तयार करण्याच्या क्रमाचे निर्धारण;
समूह आणि संपूर्ण ऑब्जेक्टचे वैशिष्ट्य दर्शविण्याकरिता सांख्यिकीय निर्देशकांच्या प्रणालीचा विकास;
सांख्यिकी सारण्यांच्या लेआउटचा विकास ज्यामध्ये सारांशाचे परिणाम सादर केले जावेत.
साहित्य प्रक्रिया त्यानुसारसारांश विकेंद्रित आणि केंद्रीकृत आहे.
विकेंद्रित सारांश (सांख्यिकीय अहवालाच्या प्रक्रियेत, एक नियम म्हणून वापरला जातो), सामग्रीचा विकास सलग टप्प्यात केला जातो. अशा प्रकारे, रशियन फेडरेशनच्या घटक घटकांच्या सांख्यिकी अधिकार्यांकडून एंटरप्राइझचे अहवाल सारांशित केले जातात आणि प्रदेशाचे निकाल आधीच रशियाच्या राज्य सांख्यिकी समितीकडे पाठवले जातात आणि तेथे संपूर्णपणे राष्ट्रीय अर्थव्यवस्थेचे निर्देशक आहेत. निर्धारित केंद्रीकृत सारांशासह, सर्व प्राथमिक सामग्री एका संस्थेत प्रवेश करते, जिथे ती सुरुवातीपासून शेवटपर्यंत प्रक्रिया केली जाते. केंद्रीकृत सारांश सामान्यतः एक-वेळच्या सांख्यिकीय सर्वेक्षणांमधून सामग्रीवर प्रक्रिया करण्यासाठी वापरला जातो. अंमलबजावणीच्या तंत्रानुसार, सांख्यिकीय सारांश मशीनीकृत आणि मॅन्युअलमध्ये विभागलेला आहे.
सारांश आयोजित करण्यासाठी, एक योजना तयार केली जाते जी संस्थात्मक समस्या सेट करते: सर्व ऑपरेशन्स कोणाद्वारे आणि केव्हा केल्या जातील, ते आयोजित करण्याची प्रक्रिया आणि नियतकालिक प्रेसमध्ये प्रकाशित केलेल्या माहितीची रचना.
4.2 सांख्यिकी मध्ये गटबद्ध पद्धत
सांख्यिकीय गटीकरण म्हणजे सामाजिक जीवनातील घटना आणि प्रक्रियांचा व्यापक अभ्यास करण्यासाठी आवश्यक वैशिष्ट्यांनुसार गट आणि उपसमूहांमध्ये सामग्रीच्या संपूर्ण संचाचे विभाजन.
अंतर्निहित चिन्हास समूहीकरण म्हणतात.
सांख्यिकीमध्ये गट तयार करण्यासाठी, दोन प्रकारची वैशिष्ट्ये प्रामुख्याने वापरली जातात:
1. परिमाणवाचक (संख्यात्मक);
2. गुणात्मक (विशेषता).
त्याच आधारावर गट करणे म्हणतात सोपे, आणि एकमेकांच्या संयोजनात घेतलेल्या दोन किंवा अधिक वैशिष्ट्यांनुसार गटांना म्हणतात संयुक्त(कठीण).
ग्रुपिंग विशेषता निवडल्यानंतर, गटांची संख्या निवडली जाते. जर गटबद्धता गुणात्मक गुणधर्मावर आधारित असेल, तर गटांच्या संख्येचा प्रश्न आपोआप सोडवला जाईल - अभ्यास केलेल्या लोकसंख्येच्या (त्याची एकके) गुणात्मक अवस्था त्यांच्यापैकी अनेक असतील.
परिमाणवाचक वैशिष्ट्यांनुसार गटबद्ध करताना, गटबद्ध अंतराल ठरवण्याचा प्रश्न उद्भवतो. मध्यांतराचे मूल्य हे प्रत्येक गटातील विशेषताच्या कमाल आणि किमान मूल्यातील फरक आहे.दिलेल्या वैशिष्ट्यासाठी लोकसंख्येच्या युनिट्सच्या वितरणाच्या स्वरूपावर अवलंबून, मध्यांतर भिन्न आणि आकारात असमान असू शकतात. जर एखाद्या वैशिष्ट्याचे त्याच्या भिन्नतेच्या सीमांमध्ये वितरण पुरेसे एकसमान असेल, तर वैशिष्ट्याच्या चढउतारांची श्रेणी समान अंतराने विभागली जाते, ज्याची लांबी सूत्राद्वारे निर्धारित केली जाते:
कुठे एक्समाकआणि एक्समिअनुक्रमे, या लोकसंख्येतील वैशिष्ट्याचे कमाल आणि किमान मूल्य,
n ही तयार झालेल्या गटांची संख्या आहे.
मागील अभ्यासाच्या आधारे गटांची संख्या सेट केली जाऊ शकते. जर तुम्हाला गटांची संख्या स्वतः ठरवायची असेल, तर तुम्ही गटांची इष्टतम संख्या निर्धारित करण्यासाठी स्टर्जेस सूत्र वापरू शकता:
n - गटांची संख्या
N ही लोकसंख्या एककांची संख्या आहे
बंद अंतराल आहेत, ज्यामध्ये वरच्या आणि खालच्या सीमा दिल्या आहेत आणि खुल्या अंतराल आहेत, ज्यामध्ये फक्त एक सीमा आहे: वरची किंवा खालची.
त्यांच्या मदतीने सोडवलेल्या कार्यांनुसार सांख्यिकीय गटांमध्ये विभागले गेले आहेत:
टायपोलॉजिकल ग्रुपिंग- वैज्ञानिक गटबद्धतेच्या नियमांनुसार वर्ग, सामाजिक-आर्थिक प्रकार, एकसंध गटांमध्ये अभ्यास केलेल्या गुणात्मकदृष्ट्या विषम लोकसंख्येची ही विभागणी आहे.
स्ट्रक्चरलसमूह म्हणतात ज्यामध्ये एकसंध लोकसंख्या काही भिन्न वैशिष्ट्यांनुसार त्याच्या संरचनेचे वैशिष्ट्य असलेल्या गटांमध्ये विभागली जाते.
विश्लेषणात्मकअभ्यास केलेल्या घटना आणि त्यांची वैशिष्ट्ये यांच्यातील संबंध प्रगट करणारे समूह म्हणतात.
4.3 आकडेवारी मध्ये वितरण मालिका
सांख्यिकीय वितरण मालिका म्हणजे विशिष्ट भिन्न गुणधर्मांनुसार लोकसंख्या युनिट्सचे गटांमध्ये क्रमबद्ध वितरण.
वितरण शृंखला तयार करणाऱ्या चिन्हावर अवलंबून, तेथे आहेत:
1. गुणात्मक - गुणात्मक आधारावर तयार केलेली वितरण मालिका.
2. व्हेरिएशनल - परिमाणवाचक आधारावर तयार केलेली वितरण मालिका. कोणत्याही भिन्नता चिन्हामध्ये 2 घटक असतात: रूपे आणि वारंवारता.
रूपे ही वैशिष्ठ्येची वैयक्तिक मूल्ये आहेत जी ती भिन्नता मालिकेत घेते.
फ्रिक्वेन्सी ही वैयक्तिक रूपे किंवा भिन्नता मालिकेतील प्रत्येक गटाची संख्या आहे.
फ्रिक्वेन्सीला फ्रिक्वेन्सी म्हणतात, जे युनिटच्या अपूर्णांकांमध्ये किंवा एकूण टक्केवारी म्हणून व्यक्त केले जाते.
वैशिष्ट्याच्या भिन्नतेच्या स्वरूपावर अवलंबून आहे:
1. एक स्वतंत्र व्हेरिएशनल शृंखला एका वेगळ्या विशेषतानुसार लोकसंख्या एककांचे वितरण दर्शवते (परिमाणवाचक गुणधर्माचे मूल्य केवळ पूर्णांक मूल्ये घेते).
2. इंटरव्हल व्हेरिएशन शृंखला - हे गुणविशेषाच्या सतत भिन्नतेसाठी योग्य आहे, आणि जर भिन्न भिन्नता स्वतःला विस्तृत श्रेणीमध्ये प्रकट करते, उदा. वेगळ्या वैशिष्ट्यासाठी पर्यायांची संख्या खूप मोठी आहे.
त्यांच्या Ugaric प्रतिमा वापरून वितरण मालिकेचे विश्लेषण करणे सर्वात सोयीचे आहे.
भिन्न भिन्नता मालिका प्रदर्शित करताना बहुभुज वापरला जातो.
इंटरव्हल व्हेरिएशन मालिका प्रदर्शित करण्यासाठी हिस्टोग्राम घेतला जातो.
5. सांख्यिकीय निर्देशक
सांख्यिकीय निर्देशक हे गुणात्मक निश्चिततेच्या दृष्टीने सामाजिक-आर्थिक घटना आणि प्रक्रियांचे परिमाणात्मक वैशिष्ट्य आहे. निर्देशकाची गुणात्मक निश्चितता ही वस्तुस्थिती आहे की ती घटना किंवा प्रक्रियेच्या अभ्यासाच्या अंतर्गत सामग्रीशी थेट संबंधित आहे, त्याचे सार.
नियमानुसार, आकडेवारीद्वारे अभ्यास केलेल्या प्रक्रिया आणि घटना खूप जटिल आहेत आणि त्यांचे सार एका निर्देशकाद्वारे प्रतिबिंबित केले जाऊ शकत नाही. अशा प्रकरणांमध्ये, सांख्यिकीय निर्देशकांची प्रणाली वापरली जाते (आंतरसंबंधित निर्देशकांचा एक संच ज्याची एकल-स्तरीय किंवा बहु-स्तरीय रचना असते आणि विशिष्ट सांख्यिकीय समस्या सोडवण्याच्या उद्देशाने असते).
5.1 परिपूर्ण आणि संबंधित निर्देशक
परिपूर्ण आकडेवारी.
निरपेक्ष मूल्यांच्या स्वरूपात सांख्यिकीय निर्देशक आकडेवारीद्वारे अभ्यासलेल्या प्रक्रिया आणि घटनांचे परिपूर्ण परिमाण दर्शवितात: त्यांचे वस्तुमान, क्षेत्रफळ, खंड, लांबी; त्यांची तात्पुरती वैशिष्ट्ये प्रतिबिंबित करतात आणि लोकसंख्येचे प्रमाण देखील दर्शवू शकतात, उदा. त्याच्या घटक घटकांची संख्या.
वैयक्तिक परिपूर्ण निर्देशक, एक नियम म्हणून, स्वारस्याच्या परिमाणवाचक वैशिष्ट्याचे मोजमाप, वजन, मोजणी आणि मूल्यांकन करण्याच्या परिणामी सांख्यिकीय निरीक्षणाच्या प्रक्रियेत थेट प्राप्त केले जातात.
एकत्रित व्हॉल्यूम निर्देशक वैयक्तिक मूल्यांचा सारांश आणि गटबद्ध करण्याच्या परिणामी प्राप्त केले जातात (अभ्यासाखाली असलेल्या ऑब्जेक्टसाठी आणि त्याच्या कोणत्याही भागासाठी संपूर्णपणे वैशिष्ट्याचे खंड किंवा लोकसंख्येचे प्रमाण दर्शवा).
निरपेक्ष सांख्यिकीय निर्देशक खालील मोजमापाच्या युनिट्समध्ये व्यक्त केले जातात:
नैसर्गिक (टन, किलोग्राम, किलोमीटर, तुकडे);
खर्च (सामाजिक-आर्थिक घटना आणि प्रक्रियांचे आर्थिक मूल्यांकन);
श्रम (मनुष्य-दिवस, मनुष्य-तास).
सापेक्ष आकडेवारी.
सापेक्ष सूचक हा एका निरपेक्ष निर्देशकाला दुसर्याने विभाजित केल्याचा परिणाम आहे आणि सामाजिक-आर्थिक प्रक्रिया आणि घटनांच्या परिमाणवाचक वैशिष्ट्यांमधील गुणोत्तर व्यक्त करतो. अंशामध्ये, निर्देशकाला वर्तमान किंवा तुलनात्मक निर्देशक म्हणतात, भाजकात त्याला तुलनाचा आधार किंवा आधार म्हणतात.
जर तुलनेचा आधार 1 घेतला असेल, तर सापेक्ष सूचक गुणांकांमध्ये व्यक्त केला जाईल, जर आधार 100 घेतला असेल, तर तो टक्केवारी (%) म्हणून व्यक्त केला जाईल, जर 1000 साठी असेल, तर तो ppm (% 0) मध्ये व्यक्त केला जाईल. ), जर आधार 10.000 घेतला असेल, तर तो डेसिमिलमध्ये व्यक्त केला जातो.
टक्केवारी, एक नियम म्हणून, अशा प्रकरणांमध्ये वापरली जाते जेथे तुलनात्मक परिपूर्ण निर्देशक बेस एक पेक्षा 2-3 वेळा जास्त नाही. 200-300 पेक्षा जास्त स्वारस्ये सहसा एकाधिक गुणोत्तराने बदलले जातात, गुणांक.
५.२ सरासरी (मूल्ये)
सरासरी मूल्य, जे स्थान आणि वेळेच्या विशिष्ट परिस्थितीत सांख्यिकीय लोकसंख्येतील वैशिष्ट्यांचे सामान्यीकृत परिमाणवाचक वैशिष्ट्य आहे, हे सांख्यिकीय निर्देशकांचे सर्वात सामान्य प्रकार आहे.
भिन्नता मालिकेतील प्रत्येक रूपे फक्त एकदाच आढळतात (मग सरासरीला साधा किंवा अभारित म्हटले जाते) आणि जेव्हा भिन्नता किंवा मध्यांतरांची पुनरावृत्ती होते (भारित सरासरी) अशा प्रकरणांसाठी सरासरीच्या प्रकारांचा विचार करा. पुनरावृत्तीची संख्या पर्याय - वारंवारता. सरासरीचा एक किंवा दुसरा प्रकार निवडताना, सारांश करताना किंवा वजन करताना परिणामाच्या अर्थपूर्णतेच्या तत्त्वावरून पुढे जावे.
अंकगणित क्षुद्र.
X हा पॉवर मीन आहे;
Z हा घातांक आहे जो सरासरीचा प्रकार ठरवतो;
Xi - पर्याय;
mi – प्रकारांची वारंवारता किंवा सांख्यिकीय वजन.
सरासरी हार्मोनिक (z=-1).
शिकवणी
विषय शिकण्यासाठी मदत हवी आहे?
आमचे तज्ञ तुम्हाला स्वारस्य असलेल्या विषयांवर सल्ला देतील किंवा ट्यूशन सेवा प्रदान करतील.
अर्ज सबमिट करासल्लामसलत मिळण्याच्या शक्यतेबद्दल शोधण्यासाठी आत्ताच विषय सूचित करत आहे.
:
मजकूर फॉर्म
सारणी फॉर्म
सांख्यिकी सारणी
सांख्यिकीय आलेख म्हणजे संख्यात्मक मूल्यांचे सशर्त प्रतिनिधित्व आणि रेषा, भौमितिक आकार, रेखाचित्रे किंवा भौगोलिक तक्त्यांद्वारे त्यांचे गुणोत्तर. ग्राफिकल फॉर्म सांख्यिकीय डेटाचा विचार करणे सुलभ करते, ते दृश्यमान, अर्थपूर्ण आणि दृश्यमान बनवते. तथापि, आलेखांना काही मर्यादा आहेत: सर्व प्रथम, आलेखामध्ये जितका डेटा टेबलमध्ये बसू शकतो तितका समाविष्ट करू शकत नाही; याव्यतिरिक्त, आलेख नेहमी गोलाकार डेटा दर्शवतो - अचूक नाही, परंतु अंदाजे. अशा प्रकारे, आलेख फक्त सामान्य परिस्थिती दर्शविण्यासाठी वापरला जातो, तपशील नाही. शेवटची कमतरता म्हणजे प्लॉटिंगची जटिलता. वैयक्तिक संगणक वापरून त्यावर मात करता येते (उदाहरणार्थ, मायक्रोसॉफ्ट ऑफिस एक्सेल पॅकेजमधील "चार्ट विझार्ड").
अनुभवजन्य वितरण कार्याचे निर्धारण.
नमुना (अनुभवजन्य) वितरण कार्यगणितीय सांख्यिकीमध्ये, हे सैद्धांतिक वितरण फंक्शनचे अंदाजे आहे जे त्यातील नमुना वापरून तयार केले आहे.
व्याख्या
डिस्ट्रिब्युशन फंक्शनने दिलेल्या यादृच्छिक व्हेरिएबलच्या वितरणातील नमुना असू द्या. आम्ही असे गृहीत धरू की , जेथे , प्राथमिक परिणामांच्या काही जागेवर परिभाषित स्वतंत्र यादृच्छिक चल आहेत. द्या . चला यादृच्छिक चल परिभाषित करूया खालील प्रकारे:
इव्हेंट इंडिकेटर कुठे आहे, हेविसाइड फंक्शन आहे. अशा प्रकारे, एका बिंदूवर नमुना वितरण कार्य हे मूल्यापेक्षा जास्त नसलेल्या नमुना घटकांच्या सापेक्ष वारंवारतेइतके असते. यादृच्छिक व्हेरिएबलला यादृच्छिक व्हेरिएबलचे नमुना वितरण कार्य म्हटले जाते आणि ते फंक्शनसाठी अंदाजे असते. एक परिणाम दर्शवितो की साठी , फंक्शन एकसमानपणे अभिसरण करते, आणि अभिसरण दर दर्शविते.
बार चार्ट
वितरणाचे ग्राफिकली प्रतिनिधित्व करण्यासाठी हिस्टोग्राम वापरला जातो सतत बदलणारे गुणधर्मआणि अंजीर मध्ये दर्शविल्याप्रमाणे, समीप आयत असतात. २.१. प्रत्येक आयताचा पाया ग्रुपिंग इंटरव्हलच्या रुंदीइतका असतो आणि त्याची उंची एवढी असते चौरसआयत हे दिलेल्या मध्यांतराला मारण्याच्या वारंवारतेच्या (किंवा वारंवारता) प्रमाणात असते. जर पंक्ती नॉन-इंटरव्हल असेल, तर सर्व स्तंभांची रुंदी अनियंत्रितपणे निवडली जाते, परंतु समान असते. अशा प्रकारे, आयताची उंची मूल्यांच्या प्रमाणात असावी
कुठे n i- वारंवारता i-व्या गटाचे अंतराल; हाय- रुंदी i-व्या गटाचे अंतराल.
हिस्टोग्राम चार्टवर, आयताचा पाया x-अक्षाच्या बाजूने प्लॉट केला जातो ( x), आणि उंची y-अक्षाच्या बाजूने आहे ( येथे) आयताकृती समन्वय प्रणालीचे.
तथापि, ज्या प्रकरणांमध्ये सर्व गटबद्ध अंतरालांची रुंदी समान असते, y-अक्षावर मूल्ये प्लॉट न केल्यास हिस्टोग्रामचे स्वरूप बदलणार नाही. p i, आणि मध्यांतर वारंवारता n i.
तांदूळ. २.१. मागील उदाहरणातील परिणामांच्या वितरणाचा हिस्टोग्राम (जेव्हा काही गटीकरण मध्यांतरांची रुंदी समान नसते).
या प्रकरणात, हिस्टोग्राम तयार करण्याच्या तत्त्वाचे उल्लंघन न करण्यासाठी (आयताचे क्षेत्र मध्यांतरांच्या फ्रिक्वेन्सीच्या प्रमाणात आहेत), फ्रिक्वेन्सी यापुढे y-अक्षाच्या बाजूने प्लॉट केल्या जाऊ शकत नाहीत, परंतु आयताची उंची. (जे गुणोत्तरांच्या प्रमाणात असणे आवश्यक आहे) प्लॉट करणे आवश्यक आहे.
वारंवारता बहुभुज
आणखी एक सामान्य ग्राफिकल प्रतिनिधित्व वारंवारता बहुभुज आहे.
फ्रिक्वेन्सीचा बहुभुज गटबद्ध अंतरालांच्या मध्यवर्ती मूल्यांशी संबंधित बिंदूंना जोडणाऱ्या तुटलेल्या रेषेद्वारे तयार केला जातो आणि या मध्यांतरांच्या फ्रिक्वेन्सी, मध्यवर्ती मूल्ये अक्षाच्या बाजूने प्लॉट केली जातात. एक्स, आणि फ्रिक्वेन्सी - अक्षाच्या बाजूने येथे.
प्रायोगिक वितरणाच्या ग्राफिकल प्रतिनिधित्वाच्या दोन विचारात घेतलेल्या पद्धतींच्या तुलनेत, असे दिसून येते की तयार केलेल्या हिस्टोग्राममधून वारंवारता बहुभुज मिळविण्यासाठी, हिस्टोग्राम तयार करणार्या आयताच्या शिरोबिंदूंच्या मध्यबिंदूंना सरळ रेषाखंडांसह जोडणे आवश्यक आहे. . वारंवारता बहुभुजाचे उदाहरण अंजीर मध्ये दर्शविले आहे. २.२.
तांदूळ. २.२. वारंवारता बहुभुज
वारंवारता बहुभुज दोन्ही सतत आणि वेगळ्या वैशिष्ट्यांचे वितरण दर्शवण्यासाठी वापरले जाते. सातत्यपूर्ण वितरणाच्या बाबतीत, फ्रिक्वेन्सी बहुभुज हा हिस्टोग्रामपेक्षा ग्राफिकल प्रतिनिधित्वाचा अधिक श्रेयस्कर मार्ग आहे, जर अनुभवजन्य वितरणाचे कथानक गुळगुळीत अवलंबनाने वर्णन केले असेल.
21.गृहीतक(प्राचीन ग्रीक ὑπόθεσις - गृहितक; ὑπό वरून - खालून, अंतर्गत + θέσις - थीसिस) - गृहितक किंवा अनुमान; एक विधान जे स्वयंसिद्धांच्या विरूद्ध पुरावा गृहीत धरते
पुराव्याची आवश्यकता नसलेली पोस्ट्युलेट्स. एक गृहितक वैज्ञानिक मानले जाते जर ते पॉपर निकष पूर्ण करते, म्हणजे. एखाद्या गंभीर प्रयोगाद्वारे संभाव्यत: चाचणी केली जाऊ शकते, तसेच जर ते विज्ञान आणि गैर-विज्ञान वेगळे करणारे इतर निकष पूर्ण करत असेल तर.
सांख्यिकीय गृहीतकयादृच्छिक व्हेरिएबल्स किंवा इव्हेंटच्या गुणधर्मांबद्दल एक गृहितक आहे ज्याची आम्ही उपलब्ध डेटाच्या विरूद्ध चाचणी करू इच्छितो. शैक्षणिक संशोधनातील सांख्यिकीय गृहीतकांची उदाहरणे:
गृहीतक 1. वर्गाची स्टोकास्टिकली कामगिरी (कदाचित) विद्यार्थ्यांच्या शिकण्याच्या स्तरावर अवलंबून असते.
गृहीतक 2. गणिताच्या सुरुवातीच्या अभ्यासक्रमाच्या आत्मसात करण्यामध्ये वयाच्या 6 किंवा 7 व्या वर्षी अभ्यास सुरू केलेल्या विद्यार्थ्यांमध्ये लक्षणीय फरक नाही.
गृहीतक 3. विद्यार्थ्यांच्या सर्वांगीण विकासाच्या संबंधात पारंपारिक शिक्षण पद्धतींपेक्षा पहिल्या इयत्तेतील समस्या-आधारित शिक्षण अधिक प्रभावी आहे.
उदाहरण १काही वैद्यकीय उत्पादनांची निर्मिती प्रक्रिया अत्यंत क्लिष्ट असते. पहिल्या दृष्टीक्षेपात, तंत्रज्ञानातील क्षुल्लक विचलनांमुळे अत्यंत विषारी बाजूची अशुद्धता दिसून येते. या अशुद्धतेची विषारीता इतकी जास्त असू शकते की हे औषध घेणार्या व्यक्तीसाठी पारंपारिक रासायनिक विश्लेषणाद्वारे शोधले जाऊ शकत नाही असे प्रमाण देखील धोकादायक असू शकते. परिणामी, नवीन उत्पादित बॅच विक्रीसाठी सोडण्यापूर्वी, जैविक पद्धतींद्वारे विषारीपणावर अभ्यास केला जातो. उंदरांसारख्या अनेक प्रायोगिक प्राण्यांना औषधाचे छोटे डोस दिले जातात आणि त्याचा परिणाम नोंदवला जातो. जर औषध विषारी असेल तर सर्व किंवा जवळजवळ सर्व प्राणी मरतात. अन्यथा, वाचलेल्यांचे प्रमाण जास्त आहे.
औषधावरील संशोधनामुळे पुढीलपैकी एक संभाव्य कृती घडू शकते: बाजारात लॉट सोडणे (a 1), पुरवठादाराला पुन्हा काम करण्यासाठी किंवा संभाव्यतः नष्ट करण्यासाठी लॉट परत करणे (a 2).
1 आणि 2 या क्रियांशी संबंधित दोन प्रकारच्या त्रुटी पूर्णपणे भिन्न आहेत आणि त्या टाळण्याचे महत्त्व देखील भिन्न आहे. प्रथम त्या केसचा विचार करा जिथे कृती 1 लागू केली आहे, तर 2 श्रेयस्कर आहे. हे औषध रुग्णासाठी धोकादायक आहे, परंतु ते सुरक्षित म्हणून ओळखले जाते. अशा प्रकारच्या त्रुटीमुळे हे औषध वापरणाऱ्या रुग्णांचा मृत्यू होऊ शकतो. ही एक प्रकार I त्रुटी आहे, कारण ती टाळणे आपल्यासाठी अधिक महत्त्वाचे आहे.
2 ची कारवाई केली जाते तर 1 अधिक श्रेयस्कर आहे अशा प्रकरणाचा विचार करा. याचा अर्थ असा की प्रयोगाच्या आचरणातील चुकीमुळे, बिनविषारी औषधाची तुकडी धोकादायक म्हणून वर्गीकृत करण्यात आली. त्रुटीचे परिणाम आर्थिक नुकसान आणि औषधाच्या किंमतीत वाढ होण्यामध्ये व्यक्त केले जाऊ शकतात. तथापि, पूर्णपणे सुरक्षित औषधाचा अपघाती नकार रुग्णांच्या अधूनमधून मृत्यूपेक्षा कमी अवांछनीय आहे. औषधाचा गैर-विषारी भाग नाकारणे ही एक प्रकार II त्रुटी आहे.
परवानगीयोग्य प्रकार I त्रुटी संभाव्यता(Rkr) 5% किंवा 1% (0.05 किंवा 0.01) च्या बरोबरीचे असू शकते.
22. सांख्यिकीय गृहीतक चाचणी(सांख्यिकीय गृहीतकांची चाचणी) ही दिलेली सांख्यिकीय गृहीतक डेटाच्या निरीक्षण केलेल्या नमुन्याशी विसंगत आहे की नाही हे ठरवण्याची प्रक्रिया आहे.
सांख्यिकीय चाचणीकिंवा सांख्यिकीय चाचणी- एक कठोर गणितीय नियम ज्याद्वारे स्वीकारला किंवा नाकारला जातो सांख्यिकीय गृहीतक.
· 23. गृहीतकांचे वर्गीकरण
· सोपे- एक परिस्थिती दर्शविली आहे, ज्याच्या उपस्थितीत किंवा अनुपस्थितीत कायदेशीर मानदंड वैध आहे;
· जटिल- एकाच वेळी दोन किंवा अधिक परिस्थितींच्या गृहीतकांमध्ये उपस्थिती, जे एकत्रितपणे सर्वसामान्य प्रमाणांचे ऑपरेशन निर्धारित करतात;
· पर्यायी- परिस्थितीचे अनेक प्रकार (पर्यायी) सूचित केले आहेत ज्या अंतर्गत नियम लागू केला जाऊ शकतो. या प्रकरणात, जेव्हा त्यापैकी एक उद्भवते, तेव्हा सर्वसामान्य प्रमाण वैध आहे;
पॅरामेट्रिक गृहीतकगृहीतक म्हणतात वितरण पॅरामीटर्सची मूल्येकिंवा दोन वितरणांच्या पॅरामीटर्सच्या तुलनात्मक मूल्याबद्दल. पॅरामेट्रिक सांख्यिकीय गृहीतकेचे उदाहरण म्हणजे गृहीतक गणितीय अपेक्षांची समानतादोन सामान्य संच.
नॉनपॅरामेट्रिक गृहीतकेबद्दल गृहीतक म्हणतात यादृच्छिक वितरणप्रमाण
निरर्थक,मुख्य किंवा परीक्षित गृहितक हे मूळत: पुढे ठेवलेले गृहितक आहे, जे दर्शविले जाते H0.
सांख्यिकीय गृहीतकयादृच्छिक व्हेरिएबलच्या वितरणाच्या कायद्याबद्दल किंवा नमुन्याच्या आधारे तयार केलेल्या या कायद्याच्या पॅरामीटर्सबद्दल काही गृहितकांचे प्रतिनिधित्व करते. सांख्यिकीय गृहीतकांची उदाहरणे ही गृहीतके आहेत: सामान्य लोकसंख्या घातांकीय कायद्यानुसार वितरीत केली जाते; दोन घातांकरीत्या वितरित नमुन्यांच्या गणितीय अपेक्षा एकमेकांच्या समान आहेत. त्यापैकी पहिल्यामध्ये, वितरण कायद्याच्या स्वरूपाबद्दल आणि दुसर्यामध्ये, दोन वितरणांच्या पॅरामीटर्सबद्दल गृहीत धरले जाते. विशिष्ट प्रकारच्या वितरण कायद्याबद्दल कोणतीही गृहितके नसलेल्या गृहीतकांना म्हणतात नॉनपॅरामेट्रिक, अन्यथा - पॅरामीट्रिक.
तुलना केलेल्या वैशिष्ट्यांमध्ये कोणताही फरक नसल्याचा गृहितक आणि निरीक्षण केलेले विचलन केवळ नमुन्यांमधील यादृच्छिक चढउतारांद्वारे स्पष्ट केले जाते ज्याच्या आधारे तुलना केली जाते, त्याला म्हणतात. निरर्थक(मुख्य) गृहीतक आणि सूचित करा एच 0 मुख्य गृहीतकासह, आम्ही देखील विचार करतो पर्यायी(स्पर्धा, विरोधाभासी) तिची गृहीते एचएक आणि जर शून्य गृहीतक नाकारले गेले तर पर्यायी गृहीतक घडेल.
साध्या आणि जटिल गृहीतकांमध्ये फरक करा. गृहीतक म्हणतात सोपे, जर ते यादृच्छिक व्हेरिएबलचे वितरण पॅरामीटर अद्वितीयपणे वैशिष्ट्यीकृत करते. उदाहरणार्थ, जर घातांकीय वितरणाचे पॅरामीटर असेल, तर गृहीतक एचसमानतेबद्दल 0 = 10 एक साधी गृहितक आहे. जटिलयाला गृहीतक म्हणतात ज्यामध्ये साध्या गृहितकांचा मर्यादित किंवा अमर्याद संच असतो. जटिल गृहीतक एच० असमानतेबद्दल > 10 मध्ये साध्या गृहितकांची असीम संख्या असते एचसमानतेबद्दल 0 =b i, कुठे b i- 10 पेक्षा मोठी कोणतीही संख्या. गृहीतक एच 0 की अज्ञात भिन्नतेसाठी सामान्य वितरणाची अपेक्षा दोन आहे हे देखील अवघड आहे. एक जटिल गृहीतक हे यादृच्छिक व्हेरिएबलच्या वितरणाविषयी गृहीतक असेल एक्ससामान्य नियमानुसार, गणितीय अपेक्षा आणि भिन्नता यांची विशिष्ट मूल्ये निश्चित नसल्यास.
हायपोथिसिस चाचणी काही यादृच्छिक चलांच्या गणनेवर आधारित आहे - एक निकष, ज्याचे अचूक किंवा अंदाजे वितरण ज्ञात आहे. हे प्रमाण द्वारे दर्शवू z, त्याचे मूल्य नमुन्यातील घटकांचे कार्य आहे z=z(x 1, x 2, …, x n). गृहीतक चाचणी प्रक्रिया प्रत्येक निकष मूल्यासाठी दोन निर्णयांपैकी एक ठरवते - गृहितक स्वीकारणे किंवा नाकारणे. अशा प्रकारे, संपूर्ण नमुना जागा आणि त्यानुसार, निकष मूल्यांचा संच दोन नॉन-ओव्हरलॅपिंग उपसंचांमध्ये विभागलेला आहे एस 0 आणि एसएक जर निकषाचे मूल्य zक्षेत्रात येते एस 0 , नंतर गृहीतक स्वीकारले जाते, आणि जर एस 1 , - गृहीतक नाकारले आहे. खूप एस 0 म्हणतात गृहितकाच्या स्वीकृतीचे क्षेत्र किंवा स्वीकार्य मूल्यांचे क्षेत्र, आणि संच एस 1 – गृहीतक नकार क्षेत्र किंवा गंभीर क्षेत्र. एका क्षेत्राची निवड विशिष्टपणे दुसरे क्षेत्र निश्चित करते.
गृहीतकाचा स्वीकार किंवा नकार एचयादृच्छिक नमुन्यानुसार 0 काही संभाव्यतेसह सत्याशी संबंधित आहे आणि त्यानुसार, दोन प्रकारच्या त्रुटी शक्य आहेत. टाइप I त्रुटी संभाव्यतेसह उद्भवते जेव्हा योग्य परिकल्पना नाकारली जाते. एच 0 आणि प्रतिस्पर्धी गृहीतक स्वीकारले आहे एचएक दुस-या प्रकारची त्रुटी संभाव्यतेसह उद्भवते जेव्हा चुकीचे गृहितक स्वीकारले जाते तेव्हा एच 0 , तर प्रतिस्पर्धी गृहीतक सत्य आहे एच 1 . आत्मविश्वास संभाव्यता Type I त्रुटी न करण्याची आणि योग्य गृहीतक स्वीकारण्याची संभाव्यता आहे एच 0 खोटी गृहितक नाकारण्याची शक्यता एच 0 म्हणतात निकषाची शक्ती. म्हणून, गृहीतकाची चाचणी करताना, चार संभाव्य परिणाम आहेत, सारणी. ३.१.
तक्ता 3.1.
उदाहरणार्थ, पॅरामीटरचा काही निष्पक्ष अंदाज व्हॉल्यूमच्या नमुन्यावरून मोजला जातो तेव्हा केस विचारात घ्या n, आणि या अंदाजामध्ये वितरण घनता आहे f(), अंजीर. ३.१.
तांदूळ. ३.१. गृहीतकेचे क्षेत्र आणि विचलन
असे गृहीत धरा की अंदाजित पॅरामीटरचे खरे मूल्य समान आहे ट. जर आपण गृहीतकांचा विचार केला तर एचसमानतेबद्दल 0 = ट, तर आणि मधील फरक किती मोठा असावा टहे गृहितक नाकारण्यासाठी. या प्रश्नाचे उत्तर सांख्यिकीय अर्थाने दिले जाऊ शकते, आणि मधील काही दिलेल्या फरकापर्यंत पोहोचण्याची संभाव्यता लक्षात घेऊन टपॅरामीटरच्या नमुना वितरणावर आधारित .
पॅरामीटरच्या संभाव्यतेची समान मूल्ये मध्यांतराच्या खालच्या आणि वरच्या मर्यादेच्या पलीकडे जाण्याचा सल्ला दिला जातो. बर्याच प्रकरणांमध्ये अशी धारणा एखाद्याला आत्मविश्वास मध्यांतर कमी करण्यास अनुमती देते, म्हणजे. चाचणी निकषाची शक्ती वाढवा. पॅरामीटर 1– /2 आणि /2 सीमांच्या मध्यांतराच्या पलीकडे जाण्याची एकूण संभाव्यता आहे . हे मूल्य इतके लहान निवडले पाहिजे की ते मध्यांतराच्या पलीकडे जाण्याची शक्यता नाही. जर पॅरामीटरचा अंदाज दिलेल्या अंतरात आला असेल, तर या प्रकरणात चाचणी केल्या जाणार्या गृहितकावर शंका घेण्याचे कारण नाही, म्हणून, समानतेचे गृहितक = टस्वीकारले जाऊ शकते. परंतु, नमुना प्राप्त केल्यानंतर, असे दिसून आले की अंदाज स्थापित मर्यादेच्या बाहेर आहे, तर या प्रकरणात गृहितक नाकारण्याची गंभीर कारणे आहेत एच 0 हे खालीलप्रमाणे आहे की प्रकार I त्रुटी बनवण्याची संभाव्यता (निकषाच्या महत्त्वाच्या पातळीइतकी) आहे.
गृहीत धरून, उदाहरणार्थ, पॅरामीटरचे खरे मूल्य प्रत्यक्षात समान आहे ट+d, नंतर गृहीतकानुसार एचसमानतेबद्दल 0 = ट- पॅरामीटरचा अंदाज गृहितकाच्या स्वीकृतीच्या क्षेत्रात येण्याची संभाव्यता , अंजीर असेल. ३.२.
दिलेल्या नमुन्याच्या आकारासाठी, Type I त्रुटी बनवण्याची संभाव्यता महत्त्वाची पातळी कमी करून कमी केली जाऊ शकते . तथापि, या प्रकरणात, दुसऱ्या प्रकारच्या त्रुटीची संभाव्यता वाढते (निकषाची शक्ती कमी होते). जेव्हा पॅरामीटरचे खरे मूल्य बरोबरीचे असते तेव्हा केससाठी समान तर्क केले जाऊ शकतात ट– d.
दोन्ही संभाव्यता कमी करण्याचा एकमेव मार्ग म्हणजे नमुना आकार वाढवणे (पॅरामीटर अंदाजाची वितरण घनता अधिक "अरुंद" होते). गंभीर क्षेत्र निवडताना, ते न्यूमन-पियरसन नियमानुसार मार्गदर्शन करतात: एखाद्याने गंभीर क्षेत्र अशा प्रकारे निवडले पाहिजे की संभाव्यता जर गृहितक सत्य असेल तर ती लहान असेल आणि अन्यथा मोठी असेल. तथापि, च्या विशिष्ट मूल्याची निवड तुलनेने अनियंत्रित आहे. सामान्य मूल्ये 0.001 ते 0.2 पर्यंत असतात. मॅन्युअल गणना सुलभ करण्यासाठी, च्या ठराविक मूल्यांसाठी 1– /2 आणि /2 सीमांसह मध्यांतरांची सारणी आणि निकष तयार करण्याच्या विविध पद्धती संकलित केल्या आहेत.
महत्त्वाची पातळी निवडताना, पर्यायी गृहीतके अंतर्गत निकषाची शक्ती विचारात घेणे आवश्यक आहे. काहीवेळा निकषाची मोठी शक्ती लहान महत्त्वाच्या पातळीपेक्षा अधिक महत्त्वपूर्ण असल्याचे दिसून येते आणि त्याचे मूल्य तुलनेने मोठे निवडले जाते, उदाहरणार्थ, 0.2. जर दुसऱ्या प्रकारच्या त्रुटींचे परिणाम पहिल्या प्रकारच्या त्रुटींपेक्षा अधिक लक्षणीय असतील तर अशी निवड न्याय्य आहे. उदाहरणार्थ, "वर्तमान संकेतशब्दांसह वापरकर्त्यांसह सुरू ठेवा" हा योग्य निर्णय नाकारला गेल्यास, टाइप I त्रुटीमुळे संकेतशब्द बदलांमुळे सिस्टमच्या सामान्य कार्यामध्ये थोडा विलंब होईल. अनधिकृत व्यक्तींकडून माहितीवर अनधिकृत प्रवेशाचा धोका असूनही पासवर्ड न बदलण्याचा निर्णय घेतल्यास, या चुकीचे अधिक गंभीर परिणाम होतील.
परिकल्पना तपासल्या जाणार्या कल्पनेचे स्वरूप आणि वैशिष्ट्याचे मूल्यांकन आणि त्याचे सैद्धांतिक मूल्य यांच्यातील विसंगतीचे उपाय यावर अवलंबून, विविध निकष वापरले जातात. वितरण कायद्यांबद्दल गृहीतके तपासण्यासाठी सर्वात सामान्यपणे वापरल्या जाणार्या निकषांमध्ये पिअर्सन, कोल्मोगोरोव्ह, मिसेस, विल्कोक्सन ची-स्क्वेअर चाचण्या आणि पॅरामीटर मूल्यांसाठी फिशर आणि विद्यार्थी चाचण्यांचा समावेश होतो.
25. गंभीर क्षेत्र- सॅम्पल स्पेसचा एक भाग ज्यामध्ये यादृच्छिक व्हेरिएबलच्या निरीक्षण मूल्याची घटना, ज्याच्या वितरणासह परीक्षित गृहितक संबंधित आहे, या गृहीतकाला नकार देणे आवश्यक आहे
गंभीर मुद्दे(सीमा) k cr हे गृहीतके स्वीकारण्याच्या क्षेत्रापासून गंभीर क्षेत्र वेगळे करणारे बिंदू आहेत.
एकतर्फी (उजवीकडे किंवा डावी बाजू असलेला) आणि द्वि-बाजूचे गंभीर क्षेत्र आहेत.
यादृच्छिक मापन त्रुटी मोठ्या संख्येने घटकांच्या प्रभावाखाली तयार होतेमोजमाप प्रक्रियेसह. प्रत्येक विशिष्ट परिस्थितीची स्वतःची त्रुटी निर्माण यंत्रणा असते. म्हणून, प्रत्येक परिस्थितीचे स्वतःचे त्रुटी वितरणाचे प्रकार असावेत असे गृहीत धरणे स्वाभाविक आहे. तथापि, बर्याच प्रकरणांमध्ये मोजमापाच्या आधी वितरण कार्याच्या स्वरूपाबद्दल काही गृहितके बांधणे शक्य आहे, जेणेकरून मोजमापानंतर केवळ अंदाजे अभिव्यक्तीमध्ये समाविष्ट असलेल्या काही पॅरामीटर्सची मूल्ये निश्चित करणे बाकी आहे. वितरण कार्य.
यादृच्छिक त्रुटी निरिक्षणांच्या परिणामी प्राप्त झालेल्या मोजलेल्या मूल्याच्या खऱ्या मूल्याविषयी आपल्या ज्ञानाची अनिश्चितता दर्शवते. के. शॅननच्या मते, यादृच्छिक चल X द्वारे वर्णन केलेल्या परिस्थितीच्या अनिश्चिततेचे मोजमाप म्हणजे एन्ट्रॉपी
जे विभेदक वितरण कार्याचे कार्यात्मक आहे. असे गृहीत धरले जाऊ शकते की कोणतीही मापन प्रक्रिया अशा प्रकारे तयार केली जाते की निरीक्षण परिणामाची अनिश्चितता परवानगीयोग्य त्रुटी मूल्यांद्वारे निर्धारित केलेल्या विशिष्ट मर्यादेत सर्वात मोठी असते. म्हणून, सर्वात संभाव्य असे वितरण असावे ज्यामध्ये एन्ट्रॉपी जास्तीत जास्त वळते.
सर्वात संभाव्य वितरणाचा प्रकार ओळखण्यासाठी, चला काही सर्वात सामान्य प्रकरणांचा विचार करूया.
1. निरीक्षणात्मक परिणामांच्या वितरणाच्या वर्गात, ज्यामध्ये मूल्यांमधील विशिष्ट स्कॅटर झोन असतो x = bआणि x = aरुंदी b-a=2अ, आम्हाला एक आढळतो जो मर्यादित परिस्थितींच्या उपस्थितीत एन्ट्रॉपी वाढवतो:
, , ,
निरीक्षण परिणामांची गणितीय अपेक्षा कुठे आहे. Lagrange multipliers च्या पद्धतीद्वारे समस्येचे निराकरण केले जाते.
निरीक्षणांच्या परिणामांच्या वितरणाची इच्छित घनता अभिव्यक्तीद्वारे वर्णन केली जाते
एकसमान वितरणाची संख्यात्मक वैशिष्ट्ये परिभाषित करूया. यादृच्छिक त्रुटीची गणितीय अपेक्षा सूत्रानुसार आढळते (१०):
यादृच्छिक एकसमान वितरित त्रुटीचे फैलाव सूत्र (18) द्वारे शोधले जाऊ शकते:
गणितीय अपेक्षेच्या संदर्भात वितरणाच्या सममितीमुळे, स्क्युनेस गुणांक शून्याच्या समान असणे आवश्यक आहे:
कर्टोसिस निश्चित करण्यासाठी, आम्ही प्रथम यादृच्छिक त्रुटीचा चौथा क्षण शोधतो:
म्हणून
शेवटी, आकृती 7 मधील छायांकित क्षेत्राच्या बरोबरीने दिलेल्या मध्यांतरामध्ये यादृच्छिक त्रुटी येण्याची शक्यता आम्हाला आढळते.
2. निरीक्षणात्मक परिणामांच्या वितरणाच्या वर्गामध्ये, विशिष्ट भिन्नता असलेल्या, आम्हाला एक आढळतो जो प्रतिबंधांच्या उपस्थितीत एंट्रॉपी वाढवतो:
, , , .
या समस्येचे निराकरण Lagrange multipliers च्या पद्धतीद्वारे देखील आढळते. निरीक्षणांच्या परिणामांच्या वितरणाची इच्छित घनता अभिव्यक्तीद्वारे वर्णन केली जाते
समीकरण (25) आणि (26) द्वारे वर्णन केलेले वितरण म्हणतात सामान्यकिंवा गौसियन वितरण.
आकृती 8 मानक विचलनाच्या विविध मूल्यांसाठी यादृच्छिक त्रुटींच्या सामान्य वितरणाचे वक्र दर्शविते .
आकृती दर्शविते की जसे मानक विचलन वाढते, वितरण अधिकाधिक पसरते, मोठ्या त्रुटींची संभाव्यता वाढते आणि लहान त्रुटींची संभाव्यता कमी होते, म्हणजे. निरिक्षण परिणामांचे प्रमाण वाढते.
निरीक्षणाचा परिणाम काही दिलेल्या मध्यांतरात येईल या संभाव्यतेची गणना करूया:
चल बदलूया:
मग आपल्याला इच्छित संभाव्यतेसाठी खालील अभिव्यक्ती मिळेल:
चौरस कंसातील अविभाज्य घटक प्राथमिक फंक्शन्समध्ये व्यक्त केले जात नाहीत, म्हणून ते तथाकथित सामान्यीकृत सामान्य वितरण वापरून विभेदक कार्यासह मोजले जातात.
फंक्शन F च्या मदतीने z) संभाव्यता कसे शोधा
(29) |
हे सूत्र वापरताना ओळख लक्षात ठेवायला हवी
फंक्शनच्या व्याख्येवरून थेट अनुसरण करा Ф( z).
मापन सरावातील त्रुटींच्या सामान्य वितरणाचे विस्तृत वितरण संभाव्यता सिद्धांताच्या मध्यवर्ती मर्यादा प्रमेयाद्वारे स्पष्ट केले आहे, जे सर्वात उल्लेखनीय गणितीय प्रमेयांपैकी एक आहे, ज्याच्या विकासामध्ये अनेक प्रमुख गणितज्ञांनी भाग घेतला - डी मोइव्रे, लाप्लेस, गॉस , चेबिशेव्ह आणि ल्यापुनोव्ह. केंद्रीय मर्यादा प्रमेयअसा युक्तिवाद करतो की जेव्हा जेव्हा निरीक्षणाचे परिणाम मोठ्या संख्येने स्वतंत्रपणे कार्य करणार्या घटकांच्या प्रभावाखाली तयार होतात तेव्हा यादृच्छिक त्रुटींचे वितरण सामान्य असते, ज्यापैकी प्रत्येकाचा इतर सर्वांच्या एकूण परिणामाच्या तुलनेत थोडासा प्रभाव असतो.
3. समजा की निरीक्षणांचे परिणाम सामान्यतः वितरीत केले जातात, परंतु त्यांचे मानक विचलन हे एक यादृच्छिक मूल्य आहे जे अनुभवानुसार बदलते. हे गृहितक संपूर्ण मोजमाप वेळेत असमानतेच्या गृहीतकापेक्षा अधिक सावध आहे. या प्रकरणात, पूर्वीप्रमाणेच तर्क करणे, हे शोधणे सोपे आहे की जर निरीक्षणांच्या परिणामांमध्ये घनतेसह लॅपेस वितरण असेल तर एन्ट्रॉपी कमाल केली जाते.
(30) |
गणितीय अपेक्षा कुठे आहे, निरीक्षण परिणामांचे मानक विचलन आहे. ज्या प्रकरणांमध्ये अचूकता वैशिष्ट्ये अगोदर माहित नसतात किंवा कालांतराने अस्थिर असतात अशा प्रकरणांमध्ये Laplace वितरण वापरले जावे.
यादृच्छिक त्रुटींचे विभेदक वितरण कार्य बदलून आणि अभिव्यक्तीद्वारे प्राप्त केले जाते (30):
वितरण तिरपेपणा शून्याच्या बरोबरीचे आहे, कारण वितरण शून्याबाबत सममितीय आहे आणि सूत्र (22) नुसार कर्टोसिस आहे.
अशा प्रकारे, सामान्य वितरणाच्या तुलनेत ( उदा= 0) एकसमान वितरण अधिक सपाट आहे ( उदा= -1.2), आणि लॅप्लेस वितरण अधिक शिखरावर आहे ( उदा = 3).
सांख्यिकीय डेटाच्या सादरीकरणाचे स्वरूप.
सांख्यिकीय डेटा अशा प्रकारे सादर केला पाहिजे की ते वापरता येतील. 3 मुख्य आहेत सांख्यिकीय डेटाच्या सादरीकरणाचे प्रकार:
मजकूर - मजकूरात डेटा समाविष्ट करणे;
टॅब्युलर - सारण्यांमध्ये डेटाचे सादरीकरण;
ग्राफिकल - आलेखांच्या स्वरूपात डेटाची अभिव्यक्ती.
मजकूर फॉर्मथोड्या प्रमाणात डिजिटल डेटासह वापरले जाते.
सारणी फॉर्मबहुतेकदा वापरले जाते, कारण हा सांख्यिकीय डेटा सादर करण्याचा अधिक कार्यक्षम प्रकार आहे. गणितीय सारण्यांच्या विपरीत, जे, प्रारंभिक परिस्थितीनुसार, एक किंवा दुसरे परिणाम प्राप्त करण्यास अनुमती देतात, सांख्यिकीय सारण्या अभ्यासाधीन वस्तूंबद्दल संख्यांची भाषा सांगतात.
सांख्यिकी सारणी- ही पंक्ती आणि स्तंभांची एक प्रणाली आहे, ज्यामध्ये सामाजिक-आर्थिक घटनेबद्दल सांख्यिकीय माहिती एका विशिष्ट क्रमाने आणि कनेक्शनमध्ये सादर केली जाते.
सांख्यिकीय सारणीचा विषय आणि अंदाज वेगळे करा. विषय वैशिष्ट्यीकृत ऑब्जेक्ट दर्शवतो - एकतर लोकसंख्येची एकके, किंवा युनिट्सचे गट, किंवा संपूर्णता. प्रेडिकेटमध्ये, विषयाचे वैशिष्ट्य दिले जाते, सहसा संख्यात्मक स्वरूपात. सारणीचे शीर्षक आवश्यक आहे, जे टेबल डेटा कोणत्या श्रेणीशी संबंधित आहे आणि कोणत्या वेळेशी संबंधित आहे हे सूचित करते.
विषयाच्या स्वरूपानुसार, सांख्यिकी तक्ते साधे, गट आणि संयोजन सारण्यांमध्ये विभागले जातात. साध्या सारणीच्या विषयामध्ये, अभ्यासाचा विषय गटांमध्ये विभागलेला नाही, परंतु एकतर लोकसंख्येच्या सर्व एककांची यादी दिली आहे किंवा संपूर्ण लोकसंख्या दर्शविली आहे. गट सारणीच्या विषयामध्ये, अभ्यासाचा ऑब्जेक्ट एका गुणधर्मानुसार गटांमध्ये विभागलेला आहे आणि प्रेडिकेट गटांमधील एककांची संख्या (निरपेक्ष किंवा टक्केवारी म्हणून) आणि गटांसाठी सारांश निर्देशक दर्शवितो. संयोजन सारणीच्या विषयामध्ये, लोकसंख्या एकानुसार नाही तर अनेक निकषांनुसार गटांमध्ये विभागली गेली आहे.
टेबल तयार करताना, खालील सामान्य नियमांचे पालन केले पाहिजे.
सारणीचा विषय डावीकडे (क्वचितच - वरच्या) भागात स्थित आहे आणि प्रेडिकेट - उजवीकडे (कमी वेळा - खालचा) आहे.
स्तंभ शीर्षकांमध्ये निर्देशकांची नावे आणि त्यांच्या मोजमापाची एकके असतात.
अंतिम ओळ सारणी पूर्ण करते आणि त्याच्या शेवटी स्थित असते, परंतु काहीवेळा ती पहिली असते: या प्रकरणात, दुसरी ओळ "सहीत" लिहिली जाते आणि त्यानंतरच्या ओळींमध्ये एकूण ओळीचे घटक असतात.
अंकांच्या खाली असलेल्या संख्येच्या अंकांसह, प्रत्येक स्तंभामध्ये समान प्रमाणात अचूकतेसह अंकीय डेटा लिहिला जातो आणि पूर्णांक भाग अपूर्णांक स्वल्पविरामाने विभक्त केला जातो.
टेबलमध्ये रिक्त सेल असू नयेत: जर डेटा शून्य असेल तर “–” चिन्ह (डॅश) ठेवले जाते; जर डेटा माहित नसेल, तर "माहिती नाही" अशी नोंद केली जाते किंवा "..." (लंबवर्तुळ) चिन्ह लावले जाते. जर घातांक मूल्य शून्य नसेल, परंतु पहिला महत्त्वाचा अंक अचूकतेच्या स्वीकृत डिग्रीनंतर दिसत असेल, तर 0.0 रेकॉर्ड केला जाईल (जर, 0.1 च्या अचूकतेची डिग्री स्वीकारली असेल).
काहीवेळा सांख्यिकी सारण्यांना आलेखांसह पूरक केले जाते जेव्हा लक्ष्य डेटाच्या काही वैशिष्ट्यांवर जोर देणे, त्यांची तुलना करणे हे असते. ग्राफिकल फॉर्म त्यांच्या आकलनाच्या दृष्टीने डेटा सादरीकरणाचा सर्वात प्रभावी प्रकार आहे. आलेखांच्या मदतीने, संरचनेची वैशिष्ट्ये, गतिशीलता, घटनांमधील संबंध आणि त्यांची तुलना यांची दृश्यमानता प्राप्त केली जाते.
ग्राफिक प्रतिमा, सर्व प्रथम, सांख्यिकीय निर्देशकांच्या विश्वासार्हतेवर नियंत्रण ठेवण्यास अनुमती देते, कारण, आलेखावर सादर केलेले, ते निरीक्षणातील त्रुटींच्या उपस्थितीशी किंवा अभ्यासाधीन घटनेच्या साराशी संबंधित विद्यमान अयोग्यता अधिक स्पष्टपणे दर्शवतात. ग्राफिक प्रतिमेच्या मदतीने, एखाद्या घटनेच्या विकासाच्या नमुन्यांचा अभ्यास करणे, विद्यमान संबंध स्थापित करणे शक्य आहे. डेटाची साधी तुलना नेहमीच कारणात्मक संबंधांची उपस्थिती पकडणे शक्य करत नाही, त्याच वेळी, त्यांचे ग्राफिकल प्रतिनिधित्व कार्यकारण संबंध ओळखण्यास मदत करते, विशेषत: प्रारंभिक गृहीतके स्थापित करण्याच्या बाबतीत, जे नंतर पुढील विकासाच्या अधीन असतात. प्रभावांची रचना, कालांतराने त्यांचे बदल आणि अंतराळातील त्यांचे स्थान यांचा अभ्यास करण्यासाठी आलेखांचा मोठ्या प्रमाणावर वापर केला जातो. तुलना केलेली वैशिष्ट्ये त्यांच्यामध्ये अधिक स्पष्टपणे प्रकट होतात आणि मुख्य विकास ट्रेंड आणि अभ्यासाच्या अंतर्गत घटना किंवा प्रक्रियेमध्ये अंतर्भूत असलेले संबंध स्पष्टपणे दृश्यमान आहेत.
सांख्यिकीमध्ये, आलेख हे भौमितिक बिंदू, रेषा, आकृत्या किंवा भौगोलिक नकाशे वापरून सांख्यिकीय प्रमाणांचे आणि त्यांच्या संबंधांचे दृश्य प्रतिनिधित्व आहे.
आलेख सांख्यिकीय डेटाचे सादरीकरण सारण्यांपेक्षा अधिक स्पष्टता देतात, अभिव्यक्ती देतात, त्यांची समज आणि विश्लेषण सुलभ करतात. सांख्यिकीय आलेख आपल्याला अभ्यासाधीन घटनेचे स्वरूप, त्याचे अंतर्निहित नमुने, विकास ट्रेंड, इतर निर्देशकांशी संबंध आणि अभ्यासलेल्या घटनेचे भौगोलिक निराकरण यांचे दृश्यमानपणे मूल्यांकन करण्यास अनुमती देतो. अगदी प्राचीन काळातही, चिनी लोक म्हणाले की एक प्रतिमा हजार शब्दांची जागा घेऊ शकते. आलेख सांख्यिकीय सामग्री अधिक समजण्यायोग्य बनवतात, गैर-तज्ञांसाठी प्रवेशयोग्य असतात, मोठ्या प्रेक्षकांचे लक्ष सांख्यिकीय डेटाकडे आकर्षित करतात आणि आकडेवारी आणि सांख्यिकीय माहिती लोकप्रिय करतात.
जेव्हा शक्य असेल तेव्हा, सांख्यिकीय डेटाचे विश्लेषण त्यांच्या ग्राफिक प्रतिनिधित्वासह नेहमी सुरू करण्याची शिफारस केली जाते. आलेख आपल्याला ताबडतोब सांख्यिकीय निर्देशकांच्या संपूर्ण संचाची सामान्य कल्पना मिळविण्यास अनुमती देतो. विश्लेषणाची ग्राफिकल पद्धत सारणी पद्धतीची तार्किक निरंतरता म्हणून कार्य करते आणि वस्तुमान घटनांमध्ये अंतर्भूत असलेल्या प्रक्रियांचे सामान्यीकरण सांख्यिकीय वैशिष्ट्ये प्राप्त करण्याच्या उद्देशाने कार्य करते.
सांख्यिकीय डेटाच्या ग्राफिकल प्रतिनिधित्वाच्या मदतीने, सांख्यिकीय संशोधनाची अनेक कार्ये सोडविली जातात:
- 1) एकमेकांच्या तुलनेत निर्देशक (घटना) च्या विशालतेचे दृश्य प्रतिनिधित्व;
- 2) कोणत्याही घटनेच्या संरचनेचे वैशिष्ट्यीकरण;
- 3) वेळेत इंद्रियगोचर बदल;
- 4) योजनेची प्रगती;
- 5) एका घटनेतील बदलाचे दुसर्या घटनेवर अवलंबून राहणे;
- 6) प्रदेशावरील कोणत्याही प्रमाणात प्रसार किंवा वितरण.
दुसऱ्या शब्दांत, सांख्यिकीय अभ्यासामध्ये विविध प्रकारचे आलेख वापरले जातात.
प्रत्येक आलेखामध्ये खालील मुख्य घटक असतात:
- 1) अवकाशीय संदर्भ बिंदू (समन्वय प्रणाली);
- 2) ग्राफिक प्रतिमा;
- 3) चार्ट फील्ड;
- 4) स्केल खुणा;
- 5) वेळापत्रक स्पष्टीकरण;
- 6) तक्त्याचे नाव
स्थानिक लँडमार्क्स समन्वय ग्रिडची एक प्रणाली म्हणून निर्दिष्ट केली जातात. सांख्यिकीय आलेखांमध्ये, आयताकृती निर्देशांकांची प्रणाली बहुतेकदा वापरली जाते. कधीकधी ध्रुवीय (कोनीय) निर्देशांक (परिपत्रक आलेख) चे तत्त्व वापरले जाते. कार्टोग्राममध्ये, अवकाशीय अभिमुखतेचे साधन म्हणजे राज्यांच्या सीमा, त्याच्या प्रशासकीय भागांच्या सीमा, भौगोलिक खुणा (नद्यांचे रूपरेषा, समुद्र आणि महासागरांचे किनारे).
समन्वय प्रणालीच्या अक्षांवर किंवा नकाशावर, चित्रित केलेल्या घटना किंवा प्रक्रियांच्या सांख्यिकीय वैशिष्ट्यांची वैशिष्ट्ये एका विशिष्ट क्रमाने स्थित आहेत. समन्वय अक्षांवर स्थित वैशिष्ट्ये गुणात्मक किंवा परिमाणात्मक असू शकतात.
सांख्यिकीय डेटाची ग्राफिकल प्रतिमा म्हणजे रेषा, आकृत्या, बिंदूंचा संग्रह आहे जो विविध आकारांच्या (वर्तुळ, चौरस, आयत, इ.) वेगवेगळ्या हॅचिंग, रंग, बिंदू घनतेसह भौमितीय आकार तयार करतो.
सांख्यिकीद्वारे अभ्यासलेल्या कोणत्याही घटनेचे ग्राफिक पद्धतीने प्रतिनिधित्व केले जाऊ शकते. हे करण्यासाठी, आपल्याला योग्य ग्राफिक समाधान शोधण्याची आवश्यकता आहे, या इंद्रियगोचरसाठी सर्वात योग्य असलेली ग्राफिक प्रतिमा निश्चित करा, अधिक स्पष्टपणे सांख्यिकीय डेटा दर्शवितो. ग्राफिक प्रतिमा चार्टच्या उद्देशाशी संबंधित असावी. म्हणून, आलेख प्लॉट करण्यापूर्वी, घटनेचे सार आणि ग्राफिक प्रतिमेसाठी निर्धारित केलेले लक्ष्य समजून घेणे आवश्यक आहे. आलेखाचा निवडलेला फॉर्म सांख्यिकीय निर्देशकाच्या अंतर्गत सामग्री आणि स्वरूपाशी संबंधित असावा. उदाहरणार्थ, आलेखावरील तुलना क्षेत्रफळ, आकृत्यांच्या एका बाजूची लांबी, बिंदूंचे स्थान, त्यांची घनता इत्यादी मोजमापानुसार केली जाते.
तर, कालांतराने एखाद्या घटनेतील बदलांचे चित्रण करण्यासाठी, आलेखाचा सर्वात नैसर्गिक प्रकार म्हणजे रेषा. वितरण मालिकेसाठी - बहुभुज किंवा हिस्टोग्राम.
आलेख फील्ड ही जागा आहे ज्यामध्ये ग्राफिक प्रतिमा स्थित आहेत (भौमितिक शरीर जे आलेख बनवतात).
आलेख फील्ड आकार आणि प्रमाण द्वारे दर्शविले जाते. फील्डचा आकार चार्टच्या उद्देशावर अवलंबून असतो. चार्टचे प्रमाण आणि आकार (चार्ट स्वरूप) देखील चित्रित केलेल्या घटनेच्या साराशी संबंधित असणे आवश्यक आहे. सांख्यिकीय अभ्यासासाठी, असमान बाजू असलेले आलेख अनेकदा वापरले जातात, उदाहरणार्थ, 1: किंवा 1:1.33 ते 1:1.6 + 5.8 च्या फील्ड गुणोत्तरासह. परंतु कधीकधी आलेखांचा चौरस आकार सोयीस्कर असतो.
भौमितिक प्रतिमेला परिमाणवाचक निश्चितता प्रदान करणारे स्केल लँडमार्क म्हणजे ग्राफिक्समध्ये वापरल्या जाणार्या स्केलची प्रणाली. आलेखाचा स्केल हा सांख्यिकीय संख्यात्मक मूल्याचे ग्राफिकमध्ये भाषांतर करण्याचे सशर्त माप आहे. स्केल स्केल ही एक ओळ आहे, ज्याचे वैयक्तिक बिंदू सांख्यिकीय निर्देशकाचे विशिष्ट मूल्य म्हणून स्वीकारलेल्या स्केलनुसार वाचले जाऊ शकतात. स्केल अशा प्रकारे निवडले जाते की प्रदर्शित केलेल्या मूल्यांपैकी सर्वात मोठे आणि सर्वात लहान आलेखावर बसू शकतात.
स्केल स्केल एकसमान आणि नॉन-युनिफॉर्म, रेक्टिलीनियर (सामान्यत: समन्वय अक्षांच्या बाजूने स्थित) आणि वक्र (पाय चार्टमध्ये गोलाकार) असतात.
चार्ट स्पष्टीकरण हे त्याच्या सामग्रीचे मौखिक स्पष्टीकरण आहे (तक्ताचे नाव आणि त्याच्या वैयक्तिक भागांचे संबंधित स्पष्टीकरण).
तक्त्याच्या शीर्षकाने त्यातील सामग्रीचे स्पष्ट आणि संक्षिप्त वर्णन केले पाहिजे. स्पष्टीकरणात्मक मजकूर ग्राफिक प्रतिमेमध्ये, त्याच्या पुढे, किंवा त्याच्या बाहेर, स्केलसह स्थित असू शकतात. ते मानसिकरित्या भौमितिक प्रतिमांपासून घटना आणि ग्राफवर चित्रित केलेल्या प्रक्रियांकडे जाण्यास मदत करतात.
ग्राफिक प्रतिमांचे वैशिष्ठ्य म्हणजे त्यांची अभिव्यक्ती, सुगमता आणि दृश्यमानता. तथापि, ग्राफिक प्रतिमा केवळ उदाहरणात्मक नसून त्या विश्लेषणात्मक देखील आहेत. म्हणून, सध्या, उपक्रम आणि संस्थांच्या लेखा आणि सांख्यिकीय सराव, संशोधन कार्य, उत्पादन आणि आर्थिक क्रियाकलाप, शैक्षणिक प्रक्रिया, प्रचार आणि इतर क्षेत्रांमध्ये वेळापत्रकांचा मोठ्या प्रमाणावर वापर केला जातो.
ग्राफिक्सचे अनेक प्रकार आहेत. त्यांचे वर्गीकरण अनेक वैशिष्ट्यांवर आधारित आहे:
- अ) ग्राफिक प्रतिमा तयार करण्याची पद्धत;
- b) सांख्यिकीय निर्देशक आणि संबंध दर्शविणारी भौमितिक चिन्हे;
- c) ग्राफिक प्रतिमेच्या मदतीने सोडवलेली कार्ये.
ग्राफिक प्रतिमेच्या स्वरूपात सांख्यिकीय आलेख:
रेखीय: सांख्यिकीय वक्र.
प्लॅनर: बार, पट्टी, चौरस, वर्तुळाकार, सेक्टर, कुरळे, बिंदू, पार्श्वभूमी.
व्हॉल्यूमेट्रिक: वितरण पृष्ठभाग.
बांधकाम आणि प्रतिमा कार्यांच्या पद्धतीनुसार सांख्यिकीय आलेख:
आकृत्या: तुलना आकृती, गतिशील आकृती, स्ट्रक्चरल आकृत्या.
सांख्यिकीय नकाशे: कार्टोग्राम, कार्टोग्राम.
बांधकाम पद्धतीनुसार, सांख्यिकीय आलेख आकृत्या आणि सांख्यिकीय नकाशे मध्ये विभागलेले आहेत.
चार्ट हे ग्राफिक प्रेझेंटेशनचे सर्वात सामान्य मार्ग आहेत. हे परिमाणवाचक संबंधांचे आलेख आहेत. त्यांच्या बांधकामाचे प्रकार आणि पद्धती विविध आहेत. आकृती एकमेकांपासून स्वतंत्र असलेल्या मूल्यांच्या विविध पैलूंमध्ये (स्थानिक, तात्पुरती, इ.) दृश्य तुलना करण्यासाठी वापरली जातात: प्रदेश, लोकसंख्या इ. या प्रकरणात, अभ्यास केलेल्या लोकसंख्येची तुलना काही महत्त्वपूर्ण भिन्नतेनुसार केली जाते. विशेषता
सांख्यिकी नकाशे - पृष्ठभागावरील परिमाणवाचक वितरणाचे आलेख. त्यांच्या मुख्य उद्देशामध्ये, ते आकृत्यांना जवळून जोडतात आणि केवळ या अर्थाने विशिष्ट आहेत की ते समोच्च भौगोलिक नकाशावरील सांख्यिकीय डेटाचे सशर्त प्रतिनिधित्व आहेत, म्हणजेच ते सांख्यिकीय डेटाचे स्थानिक वितरण किंवा स्थानिक वितरण दर्शवतात. भौमितिक चिन्हे, वर नमूद केल्याप्रमाणे, एकतर बिंदू, किंवा रेषा किंवा समतल किंवा भौमितिक शरीर आहेत. याच्या अनुषंगाने, बिंदू, रेषा, समतल आणि अवकाशीय (व्हॉल्यूमेट्रिक) आलेख आहेत.
स्कॅटर प्लॉट्स तयार करताना, बिंदूंचे संच ग्राफिक प्रतिमा म्हणून वापरले जातात; रेषीय - रेषा बांधताना. सर्व प्लॅनर आकृत्या तयार करण्याचे मूलभूत तत्त्व म्हणजे सांख्यिकीय प्रमाण भौमितिक आकृत्यांच्या स्वरूपात चित्रित केले जातात आणि त्या बदल्यात, बार, पट्टी, वर्तुळाकार, चौरस आणि कुरळे मध्ये विभागले जातात.
ग्राफिक प्रतिमेनुसार सांख्यिकीय नकाशे कार्टोग्राम आणि कार्टोग्राममध्ये विभागले गेले आहेत.
सोडवल्या जाणार्या कार्यांच्या श्रेणीनुसार, तुलना आकृती, स्ट्रक्चरल आकृती आणि डायनॅमिक्स आकृती वेगळे केले जातात.