स्नातकोत्तर → प्रायिकता और सांख्यिकी → सांख्यिकीय व्युत्पत्ति ↓

बायज़ियन विधियाँ

परिचय

बायज़ियन विधियाँ सांख्यिकीय अनुमान में एक आकर्षक भूमिका निभाती हैं, जो अनिश्चितता के बारे में तर्क करने के लिए एक ढांचा प्रदान करती हैं। यह दृष्टिकोण बायज़ के प्रमेय पर आधारित है, जिसका नाम 18वीं सदी के सांख्यिकीविद और धर्मशास्त्री रेवरेन्ड थॉमस बायज़ के नाम पर रखा गया है। आवृत्तिवादी आँकड़ों के विपरीत, जो संभावना का उपयोग केवल दीर्घकालिक आवृत्तियों को संदर्भित करने के लिए करता है, बायज़ियन आँकड़े संभावनाओं को किसी घटना के बारे में विश्वास या निश्चितता की अभिव्यक्ति करने की अनुमति देते हैं।

बायज़ का प्रमेय

बायज़ियन अनुमान का आधार बायज़ का प्रमेय है, जिसे गणितीय रूप से इस प्रकार व्यक्त किया जाता है:

P(H|E) = (P(E|H) * P(H)) / P(E)

इस सूत्र को इसके घटकों में विभाजित किया जा सकता है:

P(H|E): पश्च संभाव्यता। देखे गए प्रमाण E के आधार पर परिकल्पना H की संभावना
P(E|H): संभावना। परिकल्पना H सत्य होने पर प्रमाण E को देखने की संभावना।
P(H): पूर्व संभाव्यता। E को देखने से पहले परिकल्पना H में विश्वास की प्रारंभिक डिग्री
P(E): सीमांत संभाव्यता। सभी संभावित परिकल्पनाओं के तहत प्रमाण की समग्र संभावना।

मूल उदाहरण: सिक्का उछालना

एक साधारण उदाहरण पर विचार करें जहाँ हम जानना चाहते हैं कि क्या कोई सिक्का सिर की ओर झुका हुआ है। हम दस सिक्का उछाल को देखते हैं, जिनमें से सात सिर हैं। हम बायज़ियन ढांचा का उपयोग करके सिक्के के झुके होने की संभावना का पता लगाना चाहते हैं।

उदाहरण

मान लें H वह परिकल्पना है कि सिक्का सिरों की ओर झुका हुआ है, और E वह प्रमाण है कि दस उछालों में से सात बार सिर आए। अब, हमें निर्दिष्ट करना होगा:

P(H): सिक्के को झुके होने के बारे में हमारा पूर्व विश्वास। मान लें कि हमें विश्वास है कि हर सिक्के के झुके होने की 50% संभावना है। इसलिए, P(H) = 0.5।
P(E|H): परिकल्पना के तहत सात सिर देखने की संभावना। यदि यह झुका हुआ है, तो मान लें P(E|H) = 0.9।
P(E): सीमांत संभाव्यता को सभी परिकल्पनाओं पर विचार करके गणना की जा सकती है। सरलता के लिए, मान लें P(E) = 0.5।

अब बायज़ के प्रमेय को लागू करें:

P(H|E) = (0.9 * 0.5) / 0.5 = 0.9

इसलिए, सिक्के के झुके होने की प्रबल संभावना है।

पूर्व अपेक्षाएँ

पूर्व संभाव्यता P(H) प्रमाण देखने से पहले प्रारंभिक विश्वास को संप्रेषित करती है। बायज़ियन विश्लेषण में, पूर्व का चयन अंतिम परिणाम को काफी प्रभावित कर सकता है, विशेष रूप से छोटे डेटा आकार के साथ। पूर्व सूचनात्मक या गैर-सूचनात्मक हो सकते हैं।

सूचनात्मक प्राथमिकताएँ

सूचनात्मक पूर्व ज्ञान में रुचि के पैरामीटर के बारे में विशिष्ट, पूर्व ज्ञान शामिल होता है। सिक्का उदाहरण में, यदि पिछले प्रयोग दिखाते हैं कि सिक्का 70% संभावना के साथ सिर गिरता है, तो यह जानकारी हमारे पूर्व चयन को मार्गदर्शन करेगी।

गैर-सूचनात्मक प्राथमिकताएँ

गैर-सूचनात्मक या कमजोर पूर्वानुमान परिकल्पना के बारे में अधिक विशिष्ट जानकारी प्रदान नहीं करते, अक्सर तुलनात्मक अज्ञानता की स्थिति को दर्शाते हैं। सामान्य विकल्पों में समान वितरण शामिल हैं जहाँ सभी परिणाम समान रूप से संभावित होते हैं।

पश्चात

एक बार जब प्रमाण बायज़ के प्रमेय के माध्यम से ध्यान में आ जाता है, तो हमें पश्च संभाव्यता प्राप्त होती है, code{P(H|E)}, जो परिकल्पना के बारे में हमारी सारी जानकारी - पूर्व और डेटा को एकीकृत करता है। पश्च संभाव्यता बायज़ियन अनुमान का सबसे महत्वपूर्ण पहलू है, क्योंकि यह दर्शाती है कि नया डेटा द्वारा परिकल्पना की हमारी समझ कैसे संशोधित होती है।

संभाव्यता

संभाव्यता बायज़ियन गणनाओं का एक मुख्य घटक है। यह मापता है कि विभिन्न परिकल्पनाओं के तहत प्रेक्षित डेटा कितना संभावित है। गणितीय रूप से, संभावना, code{P(E|H)}, डेटा और परिकल्पना के बीच संगतता का आकलन करती है।

सीमांत संभाव्यता

सीमांत संभाव्यता, code{P(E)}, सुनिश्चित करती है कि पश्च संभाव्यताओं का योग 1 हो। इसमें सभी परिकल्पनाओं के बीच संभाव्यताओं का योग शामिल होता है। व्यवहार में, सीमांत संभाव्यता की गणना करना जटिल हो सकता है, विशेषकर ऐसे मॉडलों में जिनमें कई पैरामीटर होते हैं।

उन्नत उदाहरण: रोग परीक्षण

मान लीजिए कि एक चिकित्सा परीक्षण निम्नलिखित विशेषताओं के साथ किसी रोग की जाँच करता है:

इस परीक्षण की संवेदनशीलता 95% है, जिसका अर्थ है कि यह रोग से पीड़ित 95% मरीजों की सही पहचान करता है।
इस परीक्षण की विशिष्टता 90% है, जिसका अर्थ है कि यह स्वस्थ मरीजों की 90% सही पहचान करता है।
आबादी के 1% को यह रोग है।

उदाहरण

मान लें कि H घटना है कि मरीज को रोग हो जाता है, और E सकारात्मक परीक्षण परिणाम है।

P(H) = 0.01 (रोग होने की पूर्व संभाव्यता)
P(E|H) = 0.95 (बीमार होने पर सकारात्मक परीक्षण की संभावना)

सकारात्मक परीक्षण की समग्र संभाव्यता की गणना करने के लिए, code{P(E)}, सही और गलत सकारात्मक परिणामों पर विचार करें:

P(E) = P(E|H) * P(H) + P(E|H') * P(H')

P(E) = 0.95 * 0.01 + 0.1 * 0.99 = 0.1045

अंतिम रूप से, पश्चात ज्ञात करने के लिए बायज़ के प्रमेय का उपयोग करें:

P(H|E) = (0.95 * 0.01) / 0.1045 ≈ 0.091

सकारात्मक परीक्षण के बावजूद, इस परिणाम के आधार पर रोग होने की संभावना केवल 9.1% है।

विश्वास अद्यतन करना

बायज़ियन अनुमान एक दोहराव प्रक्रिया है। जैसे-जैसे अधिक प्रमाण संग्रहित होते जाते हैं, आप लगातार बायज़ के प्रमेय का उपयोग करके अपने विश्वासों को अद्यतन करते रहते हैं। प्रत्येक नया प्रमाण पिछले विश्वासों को संशोधित करने के लिए एक संभाव्यता के रूप में कार्य करता है ताकि नए विश्वासों का निर्माण किया जा सके। समय के साथ, यह प्रक्रिया हमारी समझ को परिष्कृत करती है और निर्णय को सुधराती है।

सन्निकट पूर्व

कई मामलों में, सन्निकट पूर्व का चयन गणना को सरल बना देता है। एक सन्निकट पूर्व वह है, जो जब एक पूर्व के रूप में उपयोग किया जाता है, तो उसी परिवार के एक पश्च वितरण को उत्पन्न करता है, जिससे विश्लेषणात्मक समाधान को सरल बनाता है। उदाहरण के लिए, द्विपद संभाव्यताओं में, एक पूर्व के रूप में बीटा वितरण एक बीटा पश्च वितरण उत्पन्न करेगा - इसलिए वितरण प्रकार स्थिर रहता है।

अनुप्रयोग

बायज़ियन विधियों का विभिन्न क्षेत्रों में व्यापक अनुप्रयोग होता है। कुछ उल्लेखनीय हैं:

चिकित्सा: रोगों का निदान करने के लिए, बायज़ियन विधियाँ रोग के प्रसार के बारे में पूर्व जानकारी और निदान परीक्षण के प्रमाण को संतुलित करती हैं।
वित्त: बायज़ियन मॉडल ऐतिहासिक डेटा और विशेषज्ञ पूर्वानुमानों को सम्मिलित करते हुए स्टॉक की कीमतों का पूर्वानुमान लगाने के लिए प्रयोग किए जाते हैं।
मशीन लर्निंग: बायज़ियन तकनीकें वर्गीकरण, क्लस्टरिंग, और प्रतिपादन जैसी कार्यों के लिए संभाव्यता मॉडल को सशक्त करती हैं।
प्राकृतिक भाषा प्रसंस्करण: बायज़ियन अनुमान मॉडल जैसे विषय मॉडल्स को पाठ डाटा में पैटर्न पहचानने के लिए विस्तार करता है।

चुनौतियाँ

हालांकि शक्तिशाली, बायज़ियन विधियाँ चुनौतियाँ भी प्रस्तुत करती हैं। जटिल मॉडलों को अक्सर पर्याप्त कम्प्यूटेशनल संसाधनों की आवश्यकता होती है। पश्च वितरण की विश्लेषणात्मक गणना करना कठिन हो सकता है, जिसके लिए मार्कोव चेन मोंटे कार्लो (MCMC) जैसे सरलीकरण तकनीकों की आवश्यकता होती है।

निष्कर्ष

बायज़ियन विधियाँ सांख्यिकीय अनुमान के लिए एक लचीला, सुसंगत ढांचा प्रदान करती हैं। नए प्रमाण के साथ पूर्व विश्वासों को संयोजित करके, बायज़ियन अनुमान को एक तार्किक, सहज तरीके से समझ को परिष्कृत करता है। विभिन्न परिस्थितियों में गणना की चुनौतियों के बावजूद, इसके सिद्धांत कई वास्तविक दुनिया के अनुप्रयोगों में चमकते हैं, जिससे इसे सांख्यिकीविद के उपकरण किट में अमूल्य बना दिया जाता है।

पढ़ा हुआ के रूप में चिह्नित करें

स्नातकोत्तर → 5.2.3

username

में पूर्ण हुआ स्नातकोत्तर

← पिछला (5.2.2)

विश्वास अंतराल

अगला (5.2.4) →

अधिकतम संभाव्यता अनुमान

बायज़ियन विधियाँ

परिचय

बायज़ का प्रमेय

मूल उदाहरण: सिक्का उछालना

उदाहरण

पूर्व अपेक्षाएँ

सूचनात्मक प्राथमिकताएँ

गैर-सूचनात्मक प्राथमिकताएँ

पश्चात

संभाव्यता

सीमांत संभाव्यता

उन्नत उदाहरण: रोग परीक्षण

उदाहरण

विश्वास अद्यतन करना

सन्निकट पूर्व

अनुप्रयोग

चुनौतियाँ

निष्कर्ष

टिप्पणियाँ

बायज़ियन विधियाँ