कक्षा 11 → सम्भाव्यता और सांख्यिकी → सांख्यिकी ↓
सहसंबंध और प्रतिगमन
परिचय
सांख्यिकी में, दो चर के बीच संबंध को समझना महत्वपूर्ण होता है। यह प्रकट कर सकता है कि एक चर दूसरे को कैसे प्रभावित कर सकता है। दो मुख्य अवधारणाएँ जो इन संबंधों को समझने में हमारी मदद करती हैं, वे हैं "सहसंबंध" और "प्रतिगमन"। ये अवधारणाएँ हमें यह जाँचने की अनुमति देती हैं कि क्या चर एक-दूसरे से संबंधित हैं और कितनी मज़बूती से। आइए इन दिलचस्प विषयों पर विस्तार से चर्चा करें!
सहसंबंध
सहसंबंध एक सांख्यिकीय उपाय है जो दो चरों के बीच संबंध के आकार और दिशा का वर्णन करता है, आमतौर पर इसे X और Y के रूप में दर्शाया जाता है। यह हमें बताता है कि क्या चर एक साथ चलते हैं (और अगर हां, तो क्या वे एक ही दिशा में या विपरीत दिशाओं में जाते हैं) बिना किसी कारण-प्रभाव संबंध को प्रस्तावित किए हुए।
सहसंबंध को समझना
जब दो चर सहसंबद्ध होते हैं, तो इसका मतलब होता है कि उनके बीच परिवर्तन में एक पूर्वानुमानित पैटर्न है। सहसंबंध सकारात्मक, नकारात्मक, या शून्य हो सकता है।
- सकारात्मक सहसंबंध: जैसे एक चर बढ़ता है, दूसरा भी बढ़ता है। उदाहरण के लिए, अध्ययन में बिताए गए समय और परीक्षा में प्राप्त अंकों के बीच संबंध सकारात्मक सहसंबंध प्रदर्शित कर सकता है।
- नकारात्मक सहसंबंध: जैसे एक चर बढ़ता है, दूसरा घटता है। इसका उदाहरण हो सकता है कि प्रति सप्ताह देखी गई फिल्में और अध्ययन में बिताया गया समय।
- कोई सहसंबंध नहीं (शून्य सहसंबंध): कोई पूर्वानुमानित परिवर्तन चरों को नहीं जोड़ता। उदाहरण के लिए, आँखों के रंग और बुद्धिमान स्तर के बीच संबंध कोई सहसंबंध प्रदर्शित नहीं करने का अनुमान है।
सहसंबंध का दृश्य उदाहरण
स्कैटर प्लॉट में, दो चरों के बीच सहसंबंध दृश्य रूप में प्रदर्शित होता है:
गणितीय रूप से सहसंबंध व्यक्त करना
सबसे अधिक उपयोग किया जाने वाला सहसंबंध गुणांक पीयरसन सहसंबंध गुणांक है, जिसे r
द्वारा दर्शाया जाता है। इसे निकालने का सूत्र निम्नलिखित है:
R = Σ((X_i - X̄)(Y_i - Ȳ)) / (√(Σ(X_i - X̄)² * Σ(Y_i - Ȳ)²))
जहां:
X_i
औरY_i
भिन्न डेटा पॉइंट्स हैं।X̄
X मानों का माध्य है औरȲ
Y मानों का माध्य है।r
की सीमा -1 से +1 तक है।
यदि r = 1
, यह पूर्ण सकारात्मक रैखिक संबंध इंगित करता है। यदि r = -1
, यह पूर्ण नकारात्मक रैखिक संबंध है। जब r
का मान 0 के करीब होता है, तो इसका अर्थ है कि कोई रैखिक संबंध मौजूद नहीं है।
उदाहरण
एक सरल डेटासेट के साथ दो वेरिएबल्स पर विचार करें:
- X: 1, 2, 3, 4, 5
- Y: 2, 4, 5, 4, 5
X और Y के बीच सहसंबंध निर्धारित करने के लिए, आपको उपरोक्त वर्णित सूत्र लागू करना होगा।
प्रतिगमन
जबकि सहसंबंध दो चरों के बीच संबंध की ताकत और दिशा को मापता है, प्रतिगमन एक चर को दूसरे पर आधारित होने की भविष्यवाणी करने के बारे में है। यह स्वतंत्र चर (अक्सर Y के रूप में दर्शाया गया) का उपयोग करके आश्रित चर (X) की भविष्यवाणी करता है।
प्रतिगमन को समझना
प्रतिगमन यह समझने में मदद करता है कि जब स्वतंत्र चर को बदला जाता है तो एक निश्चित मूल्य कैसे बदलता है। इसका सरलतम रूप रैखिक प्रतिगमन है, जो एक रेखा के रूप में प्रदर्शित होता है।
रैखिक प्रतिगमन
रैखिक प्रतिगमन दो चरों के बीच संबंध को मॉडल करने की कोशिश करता है। एक रेखीय समीकरण को फिट करने का प्रयास करता है। रेखा की समीकरण आमतौर पर इस तरह प्रस्तुत की जाती है:
y = a + bx
जहां:
Y
आश्रित चर है जिसका हम पूर्वानुमान कर रहे हैं।X
स्वतंत्र चर है जिसका हम भविष्यवाणी के लिए उपयोग कर रहे हैं।a
इंटरसेप्ट है, X=0 पर Y का मान।b
ढाल है, जो Y में एक यूनिट परिवर्तन के लिए परिवर्तन का प्रतिनिधित्व करता है।
प्रतिगमन का दृश्य उदाहरण
डेटा बिंदुओं के ऊपर से गुजरती हुई रेखा को अक्सर स्कैटर प्लॉट में इस तरह देखा जा सकता है:
लाल रेखा को सबसे उपयुक्त फिट रेखा या प्रतिगमन रेखा कहा जाता है। यह सभी बिंदुओं की रेखा से दूरी को कम करता है जिसे न्यूनतम वर्ग पद्धति के रूप में जाना जाता है।
गणितीय रूप से प्रतिगमन रेखा निकालना
ढलान b
और अंतर से a
की गणना के सूत्र इस प्रकार दिए गए हैं:
B = Σ((X_i - X̄)(Y_i - Ȳ)) / Σ((X_i - X̄)²) a = Ȳ − bx̄
ये सूत्र लाइन से प्रेक्षित मानों के वर्गीय अंतर को न्यूनतम करने से उत्पन्न होती हैं।
उदाहरण
पहले डेटासेट का उपयोग करके वेरिएबल्स X: [1, 2, 3, 4, 5] और Y: [2, 4, 5, 4, 5]।
- पहले
X̄
औरȲ
की गणना करें। - फिर, उपरोक्त सूत्र का उपयोग करके,
b
औरa
निर्धारित करें।
गणना के बाद:
b = 0.6 a = 2.2 Y = 2.2 + 0.6X
इस प्रकार, आपका प्रतिगमन समीकरण Y = 2.2 + 0.6X
बन जाता है।
मुख्य अंतर और सारांश
- उद्देश्य: सहसंबंध संबंध की दिशा और ताकत को मापता है। हालांकि, प्रतिगमन एक चर को दूसरे से मॉडल और भविष्यवाणी करता है।
- निर्भरता: सहसंबंध कारण और प्रभाव पर निर्भर नहीं करता है। प्रतिगमन, सिद्धांत रूप में, एक आश्रित दिशा मानता है।
- सममिति: सहसंबंध सममित है क्योंकि
corr(X, Y) = corr(Y, X)
। प्रतिगमन दिशा बदलता है क्योंकिY = a + bX
X = c + dY
के समान नहीं है।
निष्कर्ष में, सहसंबंध और प्रतिगमन चर के बीच संबंधों में मूल्यवान अंतर्दृष्टि प्रदान करते हैं। इन अवधारणाओं को समझना डेटा विश्लेषण के लिए कई क्षेत्रों में अत्यंत आवश्यक है और उन्नत सांख्यिकीय मॉडलिंग के लिए एक महत्वपूर्ण नींव प्रदान करता है।