स्नातकोत्तर → प्रायिकता और सांख्यिकी → सांख्यिकीय व्युत्पत्ति ↓
बायज़ियन विधियाँ
परिचय
बायज़ियन विधियाँ सांख्यिकीय अनुमान में एक आकर्षक भूमिका निभाती हैं, जो अनिश्चितता के बारे में तर्क करने के लिए एक ढांचा प्रदान करती हैं। यह दृष्टिकोण बायज़ के प्रमेय पर आधारित है, जिसका नाम 18वीं सदी के सांख्यिकीविद और धर्मशास्त्री रेवरेन्ड थॉमस बायज़ के नाम पर रखा गया है। आवृत्तिवादी आँकड़ों के विपरीत, जो संभावना का उपयोग केवल दीर्घकालिक आवृत्तियों को संदर्भित करने के लिए करता है, बायज़ियन आँकड़े संभावनाओं को किसी घटना के बारे में विश्वास या निश्चितता की अभिव्यक्ति करने की अनुमति देते हैं।
बायज़ का प्रमेय
बायज़ियन अनुमान का आधार बायज़ का प्रमेय है, जिसे गणितीय रूप से इस प्रकार व्यक्त किया जाता है:
P(H|E) = (P(E|H) * P(H)) / P(E)
इस सूत्र को इसके घटकों में विभाजित किया जा सकता है:
P(H|E)
: पश्च संभाव्यता। देखे गए प्रमाणE
के आधार पर परिकल्पनाH
की संभावनाP(E|H)
: संभावना। परिकल्पनाH
सत्य होने पर प्रमाणE
को देखने की संभावना।P(H)
: पूर्व संभाव्यता।E
को देखने से पहले परिकल्पनाH
में विश्वास की प्रारंभिक डिग्रीP(E)
: सीमांत संभाव्यता। सभी संभावित परिकल्पनाओं के तहत प्रमाण की समग्र संभावना।
मूल उदाहरण: सिक्का उछालना
एक साधारण उदाहरण पर विचार करें जहाँ हम जानना चाहते हैं कि क्या कोई सिक्का सिर की ओर झुका हुआ है। हम दस सिक्का उछाल को देखते हैं, जिनमें से सात सिर हैं। हम बायज़ियन ढांचा का उपयोग करके सिक्के के झुके होने की संभावना का पता लगाना चाहते हैं।
उदाहरण
मान लें H
वह परिकल्पना है कि सिक्का सिरों की ओर झुका हुआ है, और E
वह प्रमाण है कि दस उछालों में से सात बार सिर आए। अब, हमें निर्दिष्ट करना होगा:
P(H)
: सिक्के को झुके होने के बारे में हमारा पूर्व विश्वास। मान लें कि हमें विश्वास है कि हर सिक्के के झुके होने की 50% संभावना है। इसलिए,P(H) = 0.5
।P(E|H)
: परिकल्पना के तहत सात सिर देखने की संभावना। यदि यह झुका हुआ है, तो मान लेंP(E|H) = 0.9
।P(E)
: सीमांत संभाव्यता को सभी परिकल्पनाओं पर विचार करके गणना की जा सकती है। सरलता के लिए, मान लेंP(E) = 0.5
।
अब बायज़ के प्रमेय को लागू करें:
P(H|E) = (0.9 * 0.5) / 0.5 = 0.9
इसलिए, सिक्के के झुके होने की प्रबल संभावना है।
पूर्व अपेक्षाएँ
पूर्व संभाव्यता P(H)
प्रमाण देखने से पहले प्रारंभिक विश्वास को संप्रेषित करती है। बायज़ियन विश्लेषण में, पूर्व का चयन अंतिम परिणाम को काफी प्रभावित कर सकता है, विशेष रूप से छोटे डेटा आकार के साथ। पूर्व सूचनात्मक या गैर-सूचनात्मक हो सकते हैं।
सूचनात्मक प्राथमिकताएँ
सूचनात्मक पूर्व ज्ञान में रुचि के पैरामीटर के बारे में विशिष्ट, पूर्व ज्ञान शामिल होता है। सिक्का उदाहरण में, यदि पिछले प्रयोग दिखाते हैं कि सिक्का 70% संभावना के साथ सिर गिरता है, तो यह जानकारी हमारे पूर्व चयन को मार्गदर्शन करेगी।
गैर-सूचनात्मक प्राथमिकताएँ
गैर-सूचनात्मक या कमजोर पूर्वानुमान परिकल्पना के बारे में अधिक विशिष्ट जानकारी प्रदान नहीं करते, अक्सर तुलनात्मक अज्ञानता की स्थिति को दर्शाते हैं। सामान्य विकल्पों में समान वितरण शामिल हैं जहाँ सभी परिणाम समान रूप से संभावित होते हैं।
पश्चात
एक बार जब प्रमाण बायज़ के प्रमेय के माध्यम से ध्यान में आ जाता है, तो हमें पश्च संभाव्यता प्राप्त होती है, code{P(H|E)}, जो परिकल्पना के बारे में हमारी सारी जानकारी - पूर्व और डेटा को एकीकृत करता है। पश्च संभाव्यता बायज़ियन अनुमान का सबसे महत्वपूर्ण पहलू है, क्योंकि यह दर्शाती है कि नया डेटा द्वारा परिकल्पना की हमारी समझ कैसे संशोधित होती है।
संभाव्यता
संभाव्यता बायज़ियन गणनाओं का एक मुख्य घटक है। यह मापता है कि विभिन्न परिकल्पनाओं के तहत प्रेक्षित डेटा कितना संभावित है। गणितीय रूप से, संभावना, code{P(E|H)}, डेटा और परिकल्पना के बीच संगतता का आकलन करती है।
सीमांत संभाव्यता
सीमांत संभाव्यता, code{P(E)}, सुनिश्चित करती है कि पश्च संभाव्यताओं का योग 1 हो। इसमें सभी परिकल्पनाओं के बीच संभाव्यताओं का योग शामिल होता है। व्यवहार में, सीमांत संभाव्यता की गणना करना जटिल हो सकता है, विशेषकर ऐसे मॉडलों में जिनमें कई पैरामीटर होते हैं।
उन्नत उदाहरण: रोग परीक्षण
मान लीजिए कि एक चिकित्सा परीक्षण निम्नलिखित विशेषताओं के साथ किसी रोग की जाँच करता है:
- इस परीक्षण की संवेदनशीलता 95% है, जिसका अर्थ है कि यह रोग से पीड़ित 95% मरीजों की सही पहचान करता है।
- इस परीक्षण की विशिष्टता 90% है, जिसका अर्थ है कि यह स्वस्थ मरीजों की 90% सही पहचान करता है।
- आबादी के 1% को यह रोग है।
उदाहरण
मान लें कि H
घटना है कि मरीज को रोग हो जाता है, और E
सकारात्मक परीक्षण परिणाम है।
P(H) = 0.01
(रोग होने की पूर्व संभाव्यता)P(E|H) = 0.95
(बीमार होने पर सकारात्मक परीक्षण की संभावना)
सकारात्मक परीक्षण की समग्र संभाव्यता की गणना करने के लिए, code{P(E)}, सही और गलत सकारात्मक परिणामों पर विचार करें:
P(E) = P(E|H) * P(H) + P(E|H') * P(H')
P(E) = 0.95 * 0.01 + 0.1 * 0.99 = 0.1045
अंतिम रूप से, पश्चात ज्ञात करने के लिए बायज़ के प्रमेय का उपयोग करें:
P(H|E) = (0.95 * 0.01) / 0.1045 ≈ 0.091
सकारात्मक परीक्षण के बावजूद, इस परिणाम के आधार पर रोग होने की संभावना केवल 9.1% है।
विश्वास अद्यतन करना
बायज़ियन अनुमान एक दोहराव प्रक्रिया है। जैसे-जैसे अधिक प्रमाण संग्रहित होते जाते हैं, आप लगातार बायज़ के प्रमेय का उपयोग करके अपने विश्वासों को अद्यतन करते रहते हैं। प्रत्येक नया प्रमाण पिछले विश्वासों को संशोधित करने के लिए एक संभाव्यता के रूप में कार्य करता है ताकि नए विश्वासों का निर्माण किया जा सके। समय के साथ, यह प्रक्रिया हमारी समझ को परिष्कृत करती है और निर्णय को सुधराती है।
सन्निकट पूर्व
कई मामलों में, सन्निकट पूर्व का चयन गणना को सरल बना देता है। एक सन्निकट पूर्व वह है, जो जब एक पूर्व के रूप में उपयोग किया जाता है, तो उसी परिवार के एक पश्च वितरण को उत्पन्न करता है, जिससे विश्लेषणात्मक समाधान को सरल बनाता है। उदाहरण के लिए, द्विपद संभाव्यताओं में, एक पूर्व के रूप में बीटा वितरण एक बीटा पश्च वितरण उत्पन्न करेगा - इसलिए वितरण प्रकार स्थिर रहता है।
अनुप्रयोग
बायज़ियन विधियों का विभिन्न क्षेत्रों में व्यापक अनुप्रयोग होता है। कुछ उल्लेखनीय हैं:
- चिकित्सा: रोगों का निदान करने के लिए, बायज़ियन विधियाँ रोग के प्रसार के बारे में पूर्व जानकारी और निदान परीक्षण के प्रमाण को संतुलित करती हैं।
- वित्त: बायज़ियन मॉडल ऐतिहासिक डेटा और विशेषज्ञ पूर्वानुमानों को सम्मिलित करते हुए स्टॉक की कीमतों का पूर्वानुमान लगाने के लिए प्रयोग किए जाते हैं।
- मशीन लर्निंग: बायज़ियन तकनीकें वर्गीकरण, क्लस्टरिंग, और प्रतिपादन जैसी कार्यों के लिए संभाव्यता मॉडल को सशक्त करती हैं।
- प्राकृतिक भाषा प्रसंस्करण: बायज़ियन अनुमान मॉडल जैसे विषय मॉडल्स को पाठ डाटा में पैटर्न पहचानने के लिए विस्तार करता है।
चुनौतियाँ
हालांकि शक्तिशाली, बायज़ियन विधियाँ चुनौतियाँ भी प्रस्तुत करती हैं। जटिल मॉडलों को अक्सर पर्याप्त कम्प्यूटेशनल संसाधनों की आवश्यकता होती है। पश्च वितरण की विश्लेषणात्मक गणना करना कठिन हो सकता है, जिसके लिए मार्कोव चेन मोंटे कार्लो (MCMC) जैसे सरलीकरण तकनीकों की आवश्यकता होती है।
निष्कर्ष
बायज़ियन विधियाँ सांख्यिकीय अनुमान के लिए एक लचीला, सुसंगत ढांचा प्रदान करती हैं। नए प्रमाण के साथ पूर्व विश्वासों को संयोजित करके, बायज़ियन अनुमान को एक तार्किक, सहज तरीके से समझ को परिष्कृत करता है। विभिन्न परिस्थितियों में गणना की चुनौतियों के बावजूद, इसके सिद्धांत कई वास्तविक दुनिया के अनुप्रयोगों में चमकते हैं, जिससे इसे सांख्यिकीविद के उपकरण किट में अमूल्य बना दिया जाता है।