सामान्य वितरण सूत्र दो सामान्य मापदंडों पर आधारित होता है - मतलब और मानक विचलन - जो किसी दिए गए डाटासेट की विशेषताएं हालांकि मतलब संपूर्ण डेटासेट के "केंद्रीय" या औसत मूल्य को इंगित करता है, मानक विचलन उस माध्य मूल्य के आसपास "प्रसार" या डेटा-बिंदु के भिन्नरूप को इंगित करता है।
निम्न 2 डेटासेटों पर विचार करें:
डेटासेट 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
डेटासेट 1, माध्य = 10 और मानक विचलन (stddev) = 0 के लिए - 1 ->डेटासेट 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
डेटासेट 2, माध्य = 10 और मानक विचलन (stddev) = 2. 83
के लिए इन मानों को DataSet1 के लिए साजिश करते हैं:
इसी तरह DataSet2 के लिए:
उपर्युक्त दोनों रेखों में लाल क्षैतिज रेखा प्रत्येक डेटासेट के "मतलब" या औसत मूल्य (दोनों मामलों में 10) इंगित करता है। दूसरे ग्राफ में गुलाबी तीर मतलब मान से डेटा मूल्यों के प्रसार या भिन्नता को दर्शाते हैं। यह 2 के मानक विचलन मूल्य द्वारा प्रतिनिधित्व किया है। 83 डेटासेट 2 के मामले में। चूंकि DataSet1 के सभी मूल्य समान हैं (प्रत्येक के रूप में 10) और कोई भिन्नता नहीं है, stddev मान शून्य है, और इसलिए कोई गुलाबी तीर लागू नहीं है।
-3 ->stddev मान में कुछ महत्वपूर्ण और उपयोगी विशेषताएं हैं जो डेटा विश्लेषण में बहुत उपयोगी हैं। सामान्य वितरण के लिए, डेटा वैल्यू मतलब के दोनों तरफ सममित रूप से वितरित किया जाता है। किसी भी सामान्य रूप से वितरित डाटासेट के लिए, क्षैतिज अक्ष पर stddev के साथ आलेखीचित्रण ग्राफ और नंबर। ऊर्ध्वाधर अक्ष पर डेटा मानों का, निम्न ग्राफ़ प्राप्त होता है
एक सामान्य वितरण की संपत्ति
- सामान्य वक्र मतलब के बारे में सममित है;
- मतलब बीच में है और क्षेत्र को दो हिस्सों में विभाजित करता है;
- वक्र के नीचे कुल क्षेत्रफल = 0 और stdev = 1 के लिए 1 के बराबर है;
- वितरण को पूरी तरह से इसके माध्य और stddev
द्वारा वर्णित किया गया है जैसा कि ऊपर ग्राफ़ से देखा जा सकता है, stddev निम्न का प्रतिनिधित्व करता है:
- 68। 3% डेटा मूल्य का 1 मानक विचलन माध्य (-1 से 1) 95 के भीतर है 4%
- डेटा मूल्यों के भीतर 2 मानक विचलन माध्य (-2 से +2) 99 के भीतर है 7%
- डेटा मूल्यों के भीतर 3 मानक विचलन मतलब (-3 से 3) घंटी के आकार का वक्र के नीचे का क्षेत्र, जब मापा जाता है, किसी दिए गए की वांछित संभावना को इंगित करता है श्रेणी: एक्स से कम: -
ई। जी। डेटा मान की संभावना 70 से कम * 99 9> एक्स से अधिक -
- ई जी। डेटा मूल्य की संभावना 99 एक्स
- 1 और एक्स
- 2 - ई से अधिक है। जी। 65 और 85 के बीच डेटा मूल्यों की संभावना जहां एक्स रुचि का मान है (नीचे दिए गए उदाहरण) क्षेत्र का प्लॉटिंग और गणना करना हमेशा सुविधाजनक नहीं होता है, क्योंकि अलग-अलग डेटासेट का अलग अर्थ और stddev मान होगा।वास्तविक दुनिया की समस्याओं के लिए आसान गणना और प्रयोज्यता के लिए एक समान मानक विधि की सुविधा के लिए, Z- मानों के लिए मानक रूपांतरण शुरू किया गया था, जो सामान्य वितरण तालिका
का हिस्सा है।
Z = (एक्स - माध्य) / stddev, जहां एक्स यादृच्छिक चर है। असल में, यह रूपांतरण माध्य और stddev को क्रमशः 0 और 1 के मानकीकृत करने के लिए मजबूर करता है, जो आसान गणनाओं के लिए इस्तेमाल किए जाने के लिए Z-values ( सामान्य वितरण तालिका
से) के मानक परिभाषित सेट को सक्षम करता है । मानक z- मान तालिका का एक स्नैप-शॉट जिसमें संभाव्यता मान शामिल हैं:
z 0 00 0। 01
0। 02 |
0। 03 |
0। 04 |
0। 05 |
0। 06 |
0। 0 |
0। 00000 |
0। 00,399 |
0। 00,798 |
0। 01,197 |
0। 01,595 |
0। 01,994 |
… |
0। 1 |
0। 0398 |
0। 04,380 |
0। 04,776 |
0। 05172 |
0। 05,567 |
0। 05966 |
… |
0। 2 |
0। 0793 |
0। 08,317 |
0। 08,706 |
0। 09,095 |
0। 09,483 |
0। 09,871 |
… |
0। 3 |
|
0। 11791 |
0। 12172 0। 12,552 |
0। 12930 |
0। 13307 |
0। 13,683 |
… |
0। 4 |
0। 15542 |
0। 15,910 |
0। 16,276 |
0। 16,640 |
0। 17003 |
0। 17364 |
… |
0। 5 |
0। 19146 |
-2 -> |
0। 19,497 |
0। 19,847 0। 20194 |
0। 20,540 |
0। 20,884 |
… |
|
0। 6 |
0। 22,575 0। 22,907 |
0। 23237 |
0। 23,565 |
0। 23891 |
0। 24,215 |
… |
0। 7 |
0। 25,804 |
|
0। 26115 |
0। 26,424 0। 26,730 |
0। 27035 |
0। 27,337 |
… |
… |
-2 -> |
… |
… … |
… |
… |
… |
… |
0 के z-value से संबंधित संभावना को खोजने के लिए। 23 9 65 , पहले दो दशमलव स्थानों (यानी 0. 24) के लिए इसे पहले दौर। फिर पंक्तियों में पहले 2 महत्वपूर्ण अंकों (0. 2) और स्तंभ में कम से कम महत्वपूर्ण अंक (शेष 0. 04) की जांच करें। इससे 0. 0 9 4 3 के मूल्य तक पहुंच जाएगा। |
|
पूर्ण सामान्य वितरण तालिका, संभाव्यता मूल्यों (उन लोगों के लिए नकारात्मक मानों सहित) के लिए 5 दशमलव बिंदु तक परिशुद्धता के साथ, यहां पाई जा सकती है। |
आइए कुछ वास्तविक जीवन उदाहरण देखें। एक बड़े समूह में व्यक्तियों की ऊंचाई सामान्य वितरण पद्धति के अनुसार होती है। मान लें कि हमारे पास 100 ऐसे व्यक्तियों का एक सेट है जिनकी ऊंचाइयों को दर्ज किया गया है और माध्य और stddev को क्रमशः 66 और 6 इंच के रूप में गिना जाता है।
यहां कुछ नमूना प्रश्न दिए गए हैं, जिन्हें आसानी से ज़-मूल्य तालिका का उपयोग करके उत्तर दिया जा सकता है:
यह संभावना क्या है कि समूह में एक व्यक्ति 70 इंच या उससे कम है?
प्रश्न खोजने के लिए हैसंचयी मूल्य पी (एक्स <= 70) i। ई। 100 के पूरे डाटासेट में, कितने मूल्य 0 और 70 के बीच होंगे।
- -3 ->
चलिए पहले एक्स-वैल्यू 70 की समकक्ष जेड-वैल्यू में परिवर्तित करें। जेड = (एक्स - मिड) / स्टैडएव = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (दो दशमलव स्थानों पर गोल) हमें अब पी (जेड <= 0. 67) = 0. 24857 (उपरोक्त z- तालिका से)
i ई। एक 24. 857% संभावना है कि समूह में कोई व्यक्ति 70 इंच से कम या उसके बराबर होगालेकिन लटका - ऊपर अधूरा हैयाद रखें, हम सभी संभावित ऊंचाइयों की संभावना 70 i तक देख रहे हैं। ई। 0 से 70 तक। उपर्युक्त सिर्फ मतलब से आप वांछित मूल्य (i। 66 से 70) के लिए भाग देता है। सही जवाब पर पहुंचने के लिए हमें दूसरी आधे को शामिल करना होगा - 0 से 66 तक।
चूंकि 0 से 66 आधे भाग का प्रतिनिधित्व करता है (यानी एक चरम मध्य मार्ग से), इसकी संभावना सिर्फ 0. 5 है।
इसलिए एक व्यक्ति की सही संभावना 70 इंच या उससे कम = 0. 24857 + 0. 5 = 0. 74857 =
74 857% ग्राफ़िकल (क्षेत्र की गणना करके), ये दो नमस्ते समाधान के प्रतिनिधित्व वाले क्षेत्र हैं:
संभावना है कि एक व्यक्ति 75 इंच या अधिक है?
मैं। ई। ढूंढें
पूरक संचयी
पी (X> = 75)।
- Z = (एक्स - माध्य) / stddev = (75-66) / 6 = 9/6 = 1. 5
पी (Z> = 1 .5) = 1- पी (Z <= 1 5) = 1 - (0. 5 + 0 4331 9) = 0. 06681 = 6. 681% 52 इंच और 67 इंच के बीच होने वाले व्यक्ति की संभावना क्या है? पी खोजें (52 <= x <= 67)। पी (52 <= x <= 67) = पी [(52-66) / 6 <= z <= (67-66) / 6] = पी (-2। 33 <= z <= 0। 17)
= पी (Z <= 0. 17) -पी (Z <= -0। 233) = (0. 5 + 0। 5674 9) - (40905) =
यह
- सामान्य वितरण तालिका
(और जेड-वैल्यू) शेयरों और सूचकांकों के लिए स्टॉक मार्केट में अपेक्षित मूल्य चाल पर किसी भी संभावना गणना के लिए आमतौर पर उपयोग करता है। वे श्रेणी आधारित व्यापार में उपयोग किए जाते हैं, अपट्रेंड या डाउनट्रेन्ड, समर्थन या प्रतिरोध स्तर की पहचान करते हैं, और औसत और मानक विचलन के सामान्य वितरण अवधारणाओं के आधार पर अन्य तकनीकी संकेतक।