सांख्यिकी
सांख्यिकी के उदाहरण
सांख्यिकी के कुछ वास्तविक जीवन के उदाहरण हैं:
सांख्यिकी की मूल बातें
गणितीय सांख्यिकी
गणितीय सांख्यिकी गणित का सांख्यिकी पर अनुप्रयोग है, जिसे प्रारंभ में राज्य के विज्ञान के रूप में सोचा गया था — एक देश के बारे में तथ्यों का संग्रह और विश्लेषण: इसकी अर्थव्यवस्था, सैन्य, जनसंख्या, आदि। विभिन्न विश्लेषणों के लिए उपयोग की जाने वाली गणितीय तकनीकों में गणितीय विश्लेषण, रेखीय बीजगणित, स्टोकास्टिक विश्लेषण, अवकल समीकरण और माप-थ्योरी आधारित संभाव्यता सिद्धांत शामिल हैं।
सांख्यिकी के प्रकार
आधारभूत रूप से, सांख्यिकी के दो प्रकार हैं।
वर्णनात्मक सांख्यिकी के मामले में, डेटा या डेटा का संग्रह संक्षेप में वर्णित किया जाता है। लेकिन अनुमानात्मक सांख्यिकी के मामले में, इसका उपयोग वर्णनात्मक सांख्यिकी को समझाने के लिए किया जाता है। इन दोनों प्रकारों का बड़े पैमाने पर उपयोग किया गया है।
वर्णनात्मक सांख्यिकी में डेटा को संक्षेपित और समझाया जाता है। संक्षेपण एक जनसंख्या नमूने से किया जाता है, जिसमें कई कारकों जैसे औसत और मानक विचलन का उपयोग किया जाता है। वर्णनात्मक सांख्यिकी डेटा के एक सेट को चार्ट, ग्राफ़ और संक्षेप उपायों के माध्यम से व्यवस्थित, प्रस्तुत और समझाने का एक तरीका है। हिस्टोग्राम, पाई चार्ट, बार, और स्कैटर प्लॉट डेटा को संक्षेपित करने और इसे तालिकाओं या ग्राफ़ में प्रस्तुत करने के सामान्य तरीके हैं। वर्णनात्मक सांख्यिकी केवल वर्णनात्मक होती हैं: इन्हें उस डेटा से परे सामान्यीकृत करने की आवश्यकता नहीं होती है जो वे एकत्र करते हैं।
हम वर्णनात्मक सांख्यिकी के अर्थ को अनुमानात्मक सांख्यिकी का उपयोग करके समझने का प्रयास करते हैं। हम एकत्रित डेटा के अर्थ को संप्रेषित करने के लिए अनुमानात्मक सांख्यिकी का उपयोग करते हैं, जब इसे एकत्र किया गया, मूल्यांकित किया गया, और संक्षेपित किया गया हो। अनुमानात्मक सांख्यिकी में संभाव्यता सिद्धांत का उपयोग इस बात को निर्धारित करने के लिए किया जाता है कि किसी अध्ययन नमूने में पाए गए पैटर्न को उस व्यापक जनसंख्या पर लागू किया जा सकता है, जिससे नमूना लिया गया था। अनुमानात्मक सांख्यिकी का उपयोग परिकल्पनाओं का परीक्षण करने और चर के बीच संबंधों का अध्ययन करने के लिए किया जाता है, और इसका उपयोग जनसंख्या के आकार की भविष्यवाणी करने के लिए भी किया जा सकता है। अनुमानात्मक सांख्यिकी का उपयोग नमूनों से निष्कर्ष और अनुमान निकालने के लिए किया जाता है, अर्थात्, सटीक सामान्यीकरण बनाने के लिए।
सांख्यिकी सूत्र
सांख्यिकीय विश्लेषण में सामान्यतः उपयोग किए जाने वाले सूत्र नीचे दिए गए तालिका में प्रस्तुत हैं।
सांख्यिकी में, सारांश सांख्यिकी वर्णात्मक सांख्यिकी का एक भाग है (जो सांख्यिकी के प्रकारों में से एक है), जो नमूना डेटा के बारे में जानकारी की सूची प्रदान करता है। हम जानते हैं कि सांख्यिकी डेटा को दृश्य रूप से और मात्रात्मक रूप से प्रस्तुत करने से संबंधित है। इस प्रकार, सारांश सांख्यिकी सांख्यिकीय जानकारी को संक्षेपित करने का कार्य करती है। सारांश सांख्यिकी सामान्यतः डेटा को एक सरल रूप में संक्षेपित करने का प्रयास करती है, ताकि पर्यवेक्षक एक नज़र में जानकारी को समझ सके। सामान्यतः, सांख्यिकीविद् अवलोकनों का वर्णन करने के लिए निम्नलिखित खोजने का प्रयास करते हैं:
सारांश सांख्यिकी तालिका
सारांश सांख्यिकी तालिका डेटा के सारांशित सांख्यिकीय जानकारी का दृश्य प्रतिनिधित्व है जो तालिका रूप में प्रस्तुत किया जाता है। उदाहरण के लिए, कक्षा के 20 छात्रों के रक्त समूह O, A, B, AB, B, B, AB, O, A, B, B, AB, AB, O, O, B, A, AB, B, A हैं।
इस प्रकार, सारांश सांख्यिकी तालिका दर्शाती है कि कक्षा में 4 छात्रों का रक्त समूह O है, 4 छात्रों का रक्त समूह A है, 7 छात्रों का रक्त समूह B है और 5 छात्रों का रक्त समूह AB है। सारांश सांख्यिकी तालिका सामान्यतः जनसंख्या, बेरोजगारी, और अर्थव्यवस्था से संबंधित बड़े डेटा का प्रतिनिधित्व करने के लिए व्यवस्थित रूप से सारांशित करने के लिए उपयोग की जाती है, ताकि सटीक परिणामों की व्याख्या की जा सके।
आंकड़ों की सीमा
आंकड़ों का उपयोग कई क्षेत्रों में किया जाता है जैसे कि मनोविज्ञान, भूविज्ञान, सामाजिक विज्ञान, मौसम पूर्वानुमान, संभावना और भी बहुत कुछ। आंकड़ों का उद्देश्य डेटा से समझ प्राप्त करना है, यह अनुप्रयोगों पर ध्यान केंद्रित करता है, और इसलिए इसे एक गणितीय विज्ञान के रूप में विशिष्ट रूप से माना जाता है।
आंकड़ों में विधियाँ
विधियाँ डेटा को इकट्ठा करने, संक्षेपित करने, विश्लेषण करने और व्याख्या करने में शामिल हैं। यहां कुछ विधियाँ नीचे प्रदान की गई हैं।
आंकड़ों में डेटा क्या है?
डेटा तथ्यों का एक संग्रह है, जैसे कि संख्या, शब्द, माप, अवलोकन आदि।
डेटा के प्रकार
संख्यात्मक डेटा के प्रकार
डेटा का प्रतिनिधित्व
डेटा का प्रतिनिधित्व करने के विभिन्न तरीके हैं जैसे कि ग्राफ, चार्ट या तालिकाएँ। सांख्यिकीय डेटा का सामान्य प्रतिनिधित्व इस प्रकार है:
बार ग्राफ
बार ग्राफ समूहित डेटा को आयताकार बार के साथ प्रदर्शित करता है जिनकी लंबाई उन मानों के अनुपात में होती है जिन्हें वे दर्शाते हैं। बार को लंबवत या क्षैतिज रूप से प्लॉट किया जा सकता है।
पाई चार्ट
यह एक प्रकार का ग्राफ है जिसमें एक वृत्त को क्षेत्रों में विभाजित किया जाता है। इन क्षेत्रों में से प्रत्येक पूरे का एक अनुपात दर्शाता है।
रेखा ग्राफ
रेखा चार्ट एक सीधी रेखा से जुड़े डेटा बिंदुओं की श्रृंखला द्वारा प्रदर्शित किया जाता है। डेटा बिंदुओं की श्रृंखला को 'मार्कर' कहा जाता है।
चित्रग्राफ
एक शब्द या वाक्यांश के लिए चित्रात्मक प्रतीक, अर्थात् चित्रों की मदद से डेटा दिखाना। जैसे कि सेब, केला और चेरी के अलग-अलग संख्या हो सकते हैं, और यह केवल डेटा का प्रतिनिधित्व है।
हिस्टोग्राम
एक आरेख जो आयतों से बना होता है। जिसका क्षेत्र एक चर की आवृत्ति के अनुपात में होता है और जिसकी चौड़ाई वर्ग अंतराल के बराबर होती है।
आवृत्ति वितरण
एक डेटा मान की आवृत्ति को अक्सर "f" द्वारा प्रदर्शित किया जाता है। एक आवृत्ति तालिका एकत्रित डेटा मानों को उनके संबंधित आवृत्तियों के साथ बढ़ते क्रम में व्यवस्थित करके बनाई जाती है।
केंद्रीय प्रवृत्ति के माप
गणित में, सांख्यिकी का उपयोग समूहित और असंगठित डेटा की केंद्रीय प्रवृत्तियों का वर्णन करने के लिए किया जाता है। केंद्रीय प्रवृत्ति के तीन माप हैं:
केंद्रीय प्रवृत्ति के ये तीनों माप डेटा सेट के केंद्रीय मान को खोजने के लिए उपयोग किए जाते हैं।
व्यतिकरण के माप
सांख्यिकी में, व्यतिकरण के माप डेटा की विविधता को समझने में मदद करते हैं, अर्थात् यह समझने में कि डेटा कितना समरूप या विषम है। सरल शब्दों में, यह दर्शाता है कि चर कितना संकुचित या बिखरा हुआ है। हालांकि, व्यतिकरण के दो प्रकार होते हैं, पूर्ण और सापेक्ष। इन्हें नीचे सारणीबद्ध किया गया है:
सांख्यिकी में स्क्यूनेस
स्क्यूनेस, सांख्यिकी में, एक संभावना वितरण में विषमत्व का माप है। यह दिए गए डेटा सेट के लिए सामान्य वितरण की वक्रता के विचलन को मापता है। स्क्यूड वितरण का मान सकारात्मक, नकारात्मक या शून्य हो सकता है। सामान्य वितरण का बेल वक्र आमतौर पर शून्य स्क्यूनेस रखता है।
ANOVA सांख्यिकी ANOVA का अर्थ है Variance का विश्लेषण। यह सांख्यिकी मॉडल का एक संग्रह है, जिसका उपयोग दिए गए डेटा सेट के लिए औसत भिन्नता को मापने के लिए किया जाता है।
स्वतंत्रता के डिग्री
सांख्यिकीय विश्लेषण में, स्वतंत्रता के डिग्री का उपयोग उन मूल्यों के लिए किया जाता है जो बदलने के लिए स्वतंत्र होते हैं। स्वतंत्र डेटा या जानकारी, जिसे एक पैरामीटर का अनुमान लगाने के दौरान स्थानांतरित किया जा सकता है, वह स्वतंत्रता के डिग्री कहलाता है।
सांख्यिकी के अनुप्रयोग
सांख्यिकी के गणित और वास्तविक जीवन में व्यापक अनुप्रयोग हैं। सांख्यिकी के कुछ अनुप्रयोग निम्नलिखित हैं:
संभाव्यता के शर्तें और परिभाषाएँ
संभाव्यता की परिभाषा किसी घटना की संभाव्यता की गणितीय परिभाषा इसकी अनुकूल मामलों की संख्या का कुल मामलों की संख्या के अनुपात के रूप में परिभाषित की जाती है। S को एक नमूना स्थान मानते हैं और E को एक घटना मानते हैं, ऐसा मानते हैं कि n(S) = n, n(E) = m और प्रत्येक परिणाम समान रूप से संभावित है। तब
संभावनाओं के प्रकार
संभावनाओं की तीन महत्वपूर्ण श्रेणियाँ हैं:
आइए हम इन तीनों के बारे में विस्तार से जानते हैं:
सैद्धांतिक संभावना
सैद्धांतिक संभावना किसी घटना के घटने की संभावनाओं पर आधारित होती है। यह संभावना मुख्यतः संभाव्यता के पीछे के तर्क पर निर्भर करती है। उदाहरण के लिए, यदि एक सिक्का उछाला जाता है, तो सिर या पूँछ आने की सैद्धांतिक संभावना ½ या 0.5 होगी।
प्रायोगिक संभावना
यह प्रकार की संभावना एक प्रयोग के अवलोकनों पर आधारित होती है। प्रायोगिक संभावना को संभावित परिणामों की संख्या को कुल परीक्षणों की संख्या से निर्धारित किया जा सकता है। उदाहरण के लिए, यदि एक सिक्का 8 बार उछाला जाता है और सिर 4 बार आता है, तो सिर आने की प्रायोगिक संभावना 4/8 या 1/2 होगी।
आक्ष्मिक संभावना
आक्ष्मिक संभावना में एक सेट कमांड या धारणाएँ निर्धारित की जाती हैं जो सभी प्रकारों पर लागू होती हैं। ये आक्सिमों को कोलमोरोव द्वारा सेट किया गया है और इन्हें कोलमोरोव के तीन आक्सिम कहते हैं। आक्ष्मिक संभावना के तरीकों से घटनाओं के अस्तित्व या अनुपस्थिति की संभावनाओं को मापना संभव है।
पूरक घटनाएँ
ऐसी घटनाएँ जिनमें केवल दो परिणाम हो सकते हैं, जो यह बताती हैं कि कोई घटना होगी या नहीं होगी। उदाहरण के लिए, एक व्यक्ति आपके निवास पर आएगा या नहीं आएगा, सरकारी नौकरी पाना या नौकरी न पाना आदि पूरक घटनाओं के उदाहरण हैं। किसी घटना के घटने की पूरक संभावना, उस घटना के न घटने की संभावना का बिल्कुल विपरीत होती है। कुछ और अतिरिक्त उदाहरण हैं:
संभाव्यता घनत्व फ़ंक्शन
संभाव्यता घनत्व फ़ंक्शन (PDF) वह संभाव्यता फ़ंक्शन है जो एक निरंतर यादृच्छिक चर की घनत्व के लिए निर्धारित किया गया है, जो निश्चित मानों की श्रेणी में विद्यमान है। PDF सामान्य वितरण को स्पष्ट करता है और यह बताता है कि कैसे औसत और विचलन मौजूद हैं। मानक सामान्य वितरण का उपयोग सांख्यिकी के एक डेटाबेस को बनाने के लिए किया जाता है, जो अक्सर विज्ञान में वास्तविक मान वाले चर का वर्णन करने के लिए उपयोग किया जाता है, जिसका वितरण पहचाना नहीं गया है।
संभाव्यता के उदाहरणों में, एक चीज जो बहुत मदद करती है, वह है सूत्र और प्रमेय, क्योंकि कभी-कभी संभाव्यता थोड़ी भ्रमित करने वाली हो जाती है, इसलिए हम अगले भाग में सूत्रों पर नज़र डालेंगे;
मान लें A और B कोई दो घटनाएँ हैं जो एक यादृच्छिक प्रयोग से संबंधित हैं। फिर, घटना A की होने की संभाव्यता उस स्थिति में, जब B पहले ही हो चुकी है, और B की संभाव्यता शून्य के बराबर नहीं है (P(B) ≠ 0), इसे संविधानिक संभाव्यता कहा जाता है और इसे P(A|B) द्वारा दर्शाया जाता है।
यदि A और B किसी यादृच्छिक प्रयोग में दो घटनाएँ हैं, तो; P(A ∩ B) = P(A | B) P(B), यदि P(B) ≠ 0। P(A ∩ B) = P(B | A) P(A), यदि P(A) ≠ 0।
इस अनुभाग में हम कुछ महत्वपूर्ण संभावना संबंधित प्रमेयों की जांच करेंगे जैसे कुल संभावना का नियम, बायेस का प्रमेय, बाइनोमियल वितरण आदि।
कुल संभावना का नियम: मान लीजिए E1, E2, ….., En n आपस में विशिष्ट और पूर्ण घटनाएँ हैं जो एक यादृच्छिक प्रयोग से संबंधित हैं। यदि A एक घटना है जो E1 या E2 या ... या En के साथ होती है, तो; P(A) = P(E1) × P(A | E1) + P(E2) × P(A | E2) + ... + P(En) × P(A | En)।
बायेस का प्रमेय: मान लीजिए E1, E2, ….., En n आपस में विशिष्ट और पूर्ण घटनाएँ हैं जो एक यादृच्छिक प्रयोग से संबंधित हैं और S नमूना स्थान है। यदि A एक घटना है जो E1 या E2 या ... या En के साथ होती है, ऐसी स्थिति में P(A) ≠ 0।
बाइनोमियल वितरण: यदि किसी घटना में विशेष प्रयास की सफलता की संभावना p है और असफलता की संभावना q = 1 – p है, तो n स्वतंत्र प्रयोगों में ठीक x सफल घटनाओं की संभावना इस प्रकार है:
बाइनोमियल वितरण का औसत और विचलन: बाइनोमियल वितरण B(n, p) का औसत और विचलन इस प्रकार दिया गया है:
औसत: औसत, माध्य, और मोड का कुछ सिद्धांत: औसत को औसत मान/अपेक्षित मान के रूप में परिभाषित किया गया है। माध्य डेटा/अवलोकन की केंद्रीय भाग है। मोड उस भाग से संबंधित है जो प्रदान किए गए अवलोकन में सबसे अधिक हुआ है। औसत, माध्य, और मोड के बीच का संबंध इस प्रकार है; मोड = 3 माध्य – 2 औसत।
हल की गई संभावना के उदाहरणों के साथ संभावना के बारे में अधिक जानें:
उदाहरण 1: दो पासे एक साथ फेंके जाते हैं। उनके ऊपर आए संख्याओं का कुल योग एक प्रमुख संख्या है, इसकी संभावना ज्ञात कीजिए।
हल: दो पासों को एक साथ फेंकने के लिए नमूना स्थान है: S = {(a, b)} {जहाँ a = 1, 2, ….., 6 और b = 1, 2, ……, 6} ⇒ n (S) = 36
मान लीजिए A S का एक उपसमुच्चय है जिसे इस प्रकार परिभाषित किया गया है: A = {(a, b) | a+b एक प्रमुख संख्या है}। A = {(1, 1), (1, 2), (1, 4), (1, 6), (2, 1), (2, 3), (2, 5), (3, 2), (3, 4), (4, 1), (4, 3), (5, 2), (5, 6), (6, 1), (6, 5)} ⇒ n (A) = 15।
उदाहरण 2: यदि एक निष्पक्ष पासा 4 बार फेंका जाता है, तो ठीक 2 बार 6 आने की संभावना ज्ञात कीजिए।
हल: दिया गया, एक निष्पक्ष पासा 4 बार फेंका जाता है। मान लीजिए p 6 आने की संभावना है = 1 / 6 और q 6 न आने की संभावना है, अर्थात = 1 – (1 / 6) = 5 / 6
जैसा कि हम जानते हैं, बाइनोमियल वितरण के अनुसार: यहाँ हम पाते हैं, n = 4, x = 2, p = 1 / 6 और q = 5 / 6।
इसलिए निष्पक्ष पासा 4 बार फेंके जाने पर ठीक 2 बार 6 आने की संभावना इस प्रकार है;
मान लीजिए कि E1, E2, ….., En एक बेतरतीब प्रयोग से जुड़े n पारस्परिक रूप से विशिष्ट और समग्र घटनाएँ हैं। यदि A एक ऐसी घटना है जो E1 या E2 या … या En के साथ होती है, तो:
P(A) = P(E1) × P(A | E1) + P(E2) × P(A | E2) + … + P(En) × P(A | En)
संभाव्यता के बारे में अधिक जानें, हल की गई संभाव्यता उदाहरणों के साथ:
उदाहरण 1: दो पासे एक साथ फेंके जाते हैं। उन पर आने वाले संख्याओं का योग एक अभाज्य संख्या (prime number) होने की संभावना ज्ञात कीजिए।
समाधान: दो पासों के एक साथ फेंकने के लिए नमूना स्थान है: S = {(a, b)} {जहाँ a = 1, 2, ….., 6 और b = 1, 2, ……, 6} ⇒ n (S) = 36
मान लीजिए A एक उपसमुच्चय है S का, जिसे इस प्रकार परिभाषित किया गया है:
A = {(a, b) | a + b एक अभाज्य संख्या है। A = {(1, 1), (1, 2), (1, 4), (1, 6), (2, 1), (2, 3), (2, 5), (3, 2), (3, 4), (4, 1), (4, 3), (5, 2), (5, 6), (6, 1), (6, 5)} ⇒ n (A) = 15
जैसा कि हम जानते हैं:
उदाहरण 2: यदि एक निष्पक्ष पासा 4 बार फेंका जाता है, तो ठीक 2 बार 6 आने की संभावना ज्ञात कीजिए।
समाधान: दिया गया है, एक निष्पक्ष पासा 4 बार फेंका जाता है। मान लीजिए p 6 आने की संभावना है = 1 / 6 और q 6 न आने की संभावना है, यानी = 1 – (1 / 6) = 5 / 6
जैसा कि हम जानते हैं, बायनॉमियल वितरण के अनुसार: यहाँ हम पाते हैं, n = 4, x = 2, p = 1 / 6 और q = 5 / 6। अतः जब एक निष्पक्ष पासा 4 बार फेंका जाता है, तो ठीक 2 बार 6 आने की संभावना इस प्रकार दी जाती है:
142 videos|172 docs|185 tests
|