पीएचडी

पीएचडीप्रायिकता और सांख्यिकीसांख्यिकी अनुमान


प्रतिगमन विश्लेषण


प्रतिगमन विश्लेषण एक सांख्यिकीय विधि है जिसका उपयोग एक आश्रित चर और एक या एकाधिक स्वतंत्र चर के बीच संबंध को मॉडलिंग और विश्लेषण करने के लिए किया जाता है। यह सांख्यिकीय अनुमान में एक मौलिक उपकरण है, जिसका उपयोग स्वतंत्र चर के मानों के आधार पर आश्रित चर के मान की भविष्यवाणी करने के लिए व्यापक रूप से किया जाता है। यह विधि हमें चर के बीच संबंध की शक्ति और प्रकृति को समझने में भी मदद करती है।

प्रतिगमन विश्लेषण का परिचय

अपने मूल में, प्रतिगमन विश्लेषण आपके डेटा सेट में डेटा बिंदुओं का वर्णन करने वाली सर्वोत्तम-फिट रेखा या वक्र खोजने में शामिल है। इस संबंध को आमतौर पर एक समीकरण के रूप में व्यक्त किया जाता है जहाँ गुणांक प्रत्येक स्वतंत्र चर के आश्रित चर पर प्रभाव की ताकत को दर्शाते हैं।

हमारे संदेह किए गए संबंध और डेटा के प्रकार के आधार पर, विभिन्न प्रकार के प्रतिगमन विश्लेषण होते हैं। सबसे सामान्य प्रकारों में शामिल हैं:

  • रेखीय प्रतिगमन
  • बहु रेखीय प्रतिगमन
  • बहुपद प्रतिगमन
  • लॉजिस्टिक प्रतिगमन

रेखीय प्रतिगमन

आइए सबसे सरल रूप से रेखीय प्रतिगमन से शुरू करते हैं। रेखीय प्रतिगमन में, हम प्रेक्षित डेटा के लिए एक रेखीय समीकरण को जोड़कर दो चर के बीच संबंध को मॉडल करने का प्रयास करते हैं। एक चर को व्याख्यात्मक चर (स्वतंत्र) माना जाता है, और दूसरे को आश्रित चर माना जाता है।

सरल रेखीय प्रतिगमन

सरल रेखीय प्रतिगमन एक आश्रित चर y और एक स्वतंत्र चर x के बीच संबंध को निम्नलिखित समीकरण द्वारा दर्शाता है:

y = β₀ + β₁x + ε
  • y वह आश्रित चर है जिसे हम भविष्यवाणी करने का प्रयास कर रहे हैं।
  • β₀ y-अक्ष के साथ रेखा का अवरोध है।
  • β₁ रेखा का ढलान है।
  • ε त्रुटि पद है, जो y में परिवर्तनशीलता का प्रतिनिधित्व करता है जो मॉडल द्वारा नहीं समझाया गया है।

सरल रेखीय प्रतिगमन का उदाहरण

मान लीजिए कि हम तापमान और बेचे गए आइस क्रीम की संख्या के बीच संबंध का अध्ययन कर रहे हैं। यहाँ एक बिखराव प्लॉट है जो इस संबंध को दर्शा रहा है:


    
    
    
    
    
    
    
    
    
    तापमान
    बेचे गए आइस क्रीम

ग्राफ पर प्रत्येक बिंदु एक दिन का प्रतिनिधित्व करता है। हमारा लक्ष्य उन सभी बिंदुओं के लिए एक ऐसी रेखा ढूँढना है जो सबसे अच्छी तरह फिट हो, यह सुझाते हुए कि जैसे ही तापमान बढ़ता है, अधिक आइस क्रीम बेची जाती है। फिटिंग लाइन का अनुमान सबसे छोटे वर्गों की विधि का उपयोग करके लगाया जाता है, जो प्रेक्षित मानों और रेखा द्वारा भविष्यवाणी किए गए मानों के बीच वर्गान्तर को कम करता है।

बहु रेखीय प्रतिगमन

जब एकल स्वतंत्र चर आश्रित चर को सटीक रूप से भविष्यवाणी करने के लिए पर्याप्त नहीं होता है, तो हम बहु रेखीय प्रतिगमन का उपयोग करते हैं। इसमें आश्रित चर y का पूर्वानुमान करने के लिए एक से अधिक स्वतंत्र चर (x₁, x₂, ..., xn) शामिल होते हैं। समीकरण इस प्रकार दिखता है:

y = β₀ + β₁x₁ + β₂x₂ + ... + βnxn + ε

बहु रेखीय प्रतिगमन का उदाहरण

गृह मूल्य की भविष्यवाणी करने पर विचार करें, जिसमें शयनकक्षों की संख्या, वर्ग फुट में गृह का आकार, और पड़ोस की गुणवत्ता सूचकांक शामिल हैं। मॉडल इस प्रकार दिख सकता है:

मूल्य = β₀ + β₁ * शयनकक्ष + β₂ * आकार + β₃ * पड़ोस + ε

प्रत्येक β गुणांक मूल्य में परिवर्तन का अनुमान लगाता है, एक इकाई परिवर्तन की भविष्यवाणी करने वाले चर में, सभी अन्य भविष्यवक्ताओं को स्थिर रखते हुए।

बहुपद प्रतिगमन

बहुपद प्रतिगमन रेखीय प्रतिगमन का एक विस्तार है जिसका उपयोग तब किया जाता है जब स्वतंत्र चर x और आश्रित चर y के बीच संबंध वक्राकार होता है। बहुपद प्रतिगमन समीकरण इस प्रकार व्यक्त किया जाता है:

y = β₀ + β₁x + β₂x² + ... + βnxⁿ + ε

बहुपद प्रतिगमन का उदाहरण

बहुपद प्रतिगमन का एक उदाहरण पौधे की वृद्धि को समय के साथ मॉडलिंग करना हो सकता है, जहाँ वृद्धि दर तेज होती है और फिर पौधे के परिपक्व होने पर धीमी हो जाती है।


    
    
    
    
    
    
    
    
    
    समय
    पौधे की वृद्धि

लॉजिस्टिक प्रतिगमन

लॉजिस्टिक प्रतिगमन का उपयोग एक द्विआधारी परिणाम की संभावना को मॉडल करने के लिए किया जाता है, जो एक या एकाधिक पूर्वानुमान चर पर आधारित होता है। रेखीय प्रतिगमन के विपरीत, लॉजिस्टिक प्रतिगमन में, परिणाम चर श्रेणीबद्ध होता है, जिसका अर्थ है कि यह एक द्विआधारी परिणाम होता है जहाँ डेटा केवल दो वर्गों में से एक में गिर सकता है।

लॉजिस्टिक प्रतिगमन में उपयोग किया गया सूत्र लॉजिस्टिक फ़ंक्शन है:

p = 1 / (1 + e^-(β₀ + β₁x₁ + β₂x₂ + ... + βnxn))

लॉजिस्टिक प्रतिगमन का उदाहरण

एक व्यावहारिक उदाहरण में एक ग्राहक द्वारा उत्पाद खरीदने (1) या न खरीदने (0) की संभावना शामिल है, जो आय और आयु जैसे कारकों पर आधारित होता है।

प्रतिगमन विश्लेषण में धारणाएँ

प्रतिगमन विश्लेषण मान्य होने के लिए, कुछ धारणाएँ सही होनी चाहिए:

  • रेखीयता: स्वतंत्र और आश्रित चर के बीच संबंध रैखिक होना चाहिए।
  • स्वतंत्रता: अवशेष (त्रुटियाँ) स्वतंत्र होने चाहिए।
  • समरूपता: अवशेषों में स्वतंत्र चर के सभी स्तरों पर स्थिर परिवर्तनशीलता होनी चाहिए।
  • सामान्य वितरण: अवशेष सामान्य रूप से वितरित होने चाहिए।

निष्कर्ष

अंत में, प्रतिगमन विश्लेषण चर के बीच संबंधों को समझने के लिए एक शक्तिशाली उपकरण है। यह पूर्वानुमान करने और डेटा के आधार पर अंतर्दृष्टियां प्रदान करने के लिए आवश्यक है। जबकि रेखीय प्रतिगमन प्रतिगमन विश्लेषण का सबसे सरल रूप है, बहुपद और लॉजिस्टिक प्रतिगमन के व्यापक संदर्भ को समझना सांख्यिकीय अनुमान समस्याओं की एक विस्तृत श्रृंखला का मुकाबला करने के लिए एक व्यापक टूलकिट प्रदान करता है।

इन धारणाओं के ढांचे के भीतर प्रतिगमन विश्लेषण को लागू करना अधिक सटीक और विश्वसनीय पूर्वानुमान मॉडल की ओर ले जाता है, जिससे शोधकर्ताओं और पेशेवरों को अनुभवजन्य डेटा के आधार पर सूचित निर्णय लेने में मदद मिलती है।


पीएचडी → 8.3.2


U
username
0%
में पूर्ण हुआ पीएचडी


टिप्पणियाँ