स्टेटटा फॉरेक्स में प्रतिगमन विच्छेदन उदाहरण


ली और लिम्यूक्स (पृष्ठ 31, 200 9) ने सुझाव दिया कि शोधकर्ता ने रेगमेंट डिसऑन्टिन्यूइटी डिजाइन विश्लेषण (आरडीडी) करते समय ग्राफ पेश करने का सुझाव दिया। वे निम्नलिखित प्रक्रिया का सुझाव देते हैं: कुछ बैंडविड्थ एच के लिए, और क्रमशः कटऑफ वैल्यू के बाएं और दाहिनी किनारों के कुछ संख्या के लिए के0 और के 1 के लिए, यह विचार डिब्बे (बीके, बी, के लिए 1 कश्मीर के के 0 के 1 के लिए, जहां बीके सी (के 0 के 1) सीडीट एच। तो औसत परिणामों की तुलना सिर्फ बाएं और कटऑफ बिंदु के दाईं ओर करें। सभी मामलों में, हम कटऑफ बिंदु के प्रत्येक पक्ष से अलग-अलग अनुमान वाले क्वार्टिक रिग्रेशन मॉडल से टेट मूल्य दिखाते हैं। (पी 34 एक ही कागज) मेरा प्रश्न यह है कि हम तेज आरडीडी के लिए असाइनमेंट वैरिएबल (विश्वास अंतराल के साथ) के परिणामस्वरूप ग्राम के ग्राफ़ की छानबीन करने के लिए स्टाटा या आर में उस प्रक्रिया को किस प्रकार प्रोग्राम करते हैं। Stata में एक नमूना उदाहरण यहां और यहां उल्लेख किया गया है rdobs) और आर में एक नमूना उदाहरण यहाँ है। हालांकि, मुझे लगता है कि इन दोनों ने चरण 1 को लागू नहीं किया है। ध्यान दें, दोनों के पास भूखंडों में फिट लाइनों के साथ कच्चे डेटा है। आत्मविश्वास चर ली और लिमियक्स के बिना नमूना ग्राफ़, 2009 अग्रिम में आपका धन्यवाद। 5 दिसंबर को 13: 04 को निर्देश दिया गया ysis विश्लेषण आवश्यकताएँ मूल आरडी डिजाइन एक दो समूह pretest-posttest मॉडल के रूप में डिजाइन संकेतन में संकेत दिया है। इस डिजाइन संरचना के अन्य संस्करणों की तरह (उदाहरण के लिए, कॉवरिएरैण्डैण्डैज्ड एक्सपिरियम, काल्पनिक समूह डिज़ाइन का विश्लेषण), हमें एक सांख्यिकीय मॉडल की आवश्यकता होगी जिसमें प्रीटेस्ट के लिए एक शब्द, एक पोस्टटेस्ट के लिए एक और एक डमी-कोडेड वैरिएबल कार्यक्रम। विश्लेषण में धारणाएं विशिष्ट विश्लेषणात्मक मॉडल पर विचार करने वाली मान्यताओं को समझने से पहले महत्वपूर्ण होती हैं जिन्हें पूरा किया जाना चाहिए। यह प्रस्तुति यह मानती है कि हम मूल आरडी डिजाइन के साथ काम कर रहे हैं जैसा कि पहले बताया गया है। डिजाइन में बदलाव बाद में चर्चा करेंगे। पांच केंद्रीय धारणाएं हैं जो विश्लेषणात्मक मॉडल के लिए बनाई गई हैं जो उचित होने के लिए प्रस्तुत की जाती हैं, जिनमें से प्रत्येक की बारीकी से चर्चा की गई है: कटऑफ मानदंड। कटऑफ के कसौटी को अपवाद के बिना पालन किया जाना चाहिए। जब कटऑफ मूल्य के संबंध में गलत तरीके से जुड़ा होता है (जब तक कि इसे यादृच्छिक नहीं कहा जाता है), एक चयन खतरे उठता है और कार्यक्रम के प्रभाव का अनुमान पक्षपातपूर्ण होने की संभावना है। कटऑफ़ के सापेक्ष गैरसमंडन, अक्सर एक फजी आरडी डिजाइन कहा जाता है, विश्लेषणात्मक जटिलताओं का परिचय देता है जो इस चर्चा के दायरे से बाहर हैं। प्री-पोस्ट डिस्ट्रीब्यूशन माना जाता है कि पूर्व-पोस्ट वितरण एक बहुपद समारोह के रूप में वर्णन योग्य है। अगर सच्चे प्री-पोस्ट रिलेशन लॉगरिदमिक, घातीय या कुछ अन्य फ़ंक्शन है, तो नीचे दी गई मॉडल को याद नहीं किया गया है और कार्यक्रम के प्रभाव का अनुमान पक्षपातपूर्ण होने की संभावना है। बेशक, यदि डेटा को विश्लेषण से पहले एक बहुपद वितरण बनाने के लिए तब्दील किया जा सकता है, तो नीचे दिए गए मॉडल उपयुक्त हो सकते हैं, हालांकि व्याख्या करने में अधिक समस्या होने की संभावना है। यह कभी-कभी ऐसा मामला भी होता है कि भले ही सच्चे रिश्ते बहुपद नहीं हो, एक उच्च-क्रम बहुपद पर्याप्त रूप से जो कुछ भी कार्य करता है, उसके लिए पर्याप्त रूप से खाता होगा। हालांकि, विश्लेषक यह जानने की संभावना नहीं है कि यह मामला है या नहीं। तुलना समूह प्रेटेस्ट विरिएंस उस समूह के लिए सच्चे रिश्तों का पर्याप्त आकलन (यानी पूर्व-पूर्व प्रतिगमन रेखा) को सक्षम करने के लिए तुलना समूह में पर्याप्त मात्रा में प्रेटेस्ट मान होने चाहिए। यह आमतौर पर कार्यक्रम समूह में परिवर्तनशीलता के साथ-साथ वांछनीय भी है हालांकि यह सख्ती से आवश्यक नहीं है क्योंकि कोई प्रोग्राम समूह के लिए एक एकल बिंदु के लिए तुलना समूह रेखा को प्रोजेक्ट कर सकता है। निरंतर प्रेटेस्ट डिस्ट्रीब्यूशन कटऑफ द्वारा निर्धारित समूह के बीच विभाजन के साथ दोनों समूहों को एक ही लगातार छद्म वितरण से आना चाहिए। कुछ मामलों में एक बरकरार समूहों (उदाहरण के दो अलग भौगोलिक स्थानों से रोगियों के दो समूह) पा सकते हैं, जो कुछ कटऑफ को इंगित करने के लिए कुछ मापने में विभाजित हैं। इस तरह के स्वाभाविक रूप से असंतोषजनक समूहों को सावधानी के साथ सावधानी के साथ इस्तेमाल किया जाना चाहिए क्योंकि यदि कार्यक्रम के पहले कटऑफ में वे स्वाभाविक रूप से मतभेद करते थे तो इस तरह के अंतर उन पूर्वाग्रहों को प्रतिबिंबित कर सकते हैं जो उस समय प्राकृतिक प्री-पोस्ट असंतोष प्रकट कर सकते हैं। कार्यक्रम का कार्यान्वयन यह माना जाता है कि कार्यक्रम समान रूप से सभी प्राप्तकर्ताओं को दिया जाता है, यानी कि वे सभी एक ही खुराक, रहने की लंबाई, प्रशिक्षण की मात्रा, या जो भी हो यदि ऐसा नहीं है, तो स्पष्ट रूप से इस कार्यक्रम को कार्यान्वित करने के लिए मॉडल के लिए आवश्यक है, इस प्रकार इस विश्लेषण को कुछ हद तक जटिल बना दिया गया है। कड़वापन समस्या आरडी डिजाइन से डेटा का विश्लेषण करने में बड़ी समस्या मॉडल मिस्प्शन है। जैसा कि नीचे दिखाया जाएगा, जब आप सांख्यिकीय मॉडल को याद करेंगे, तो आपको उपचार प्रभाव के पक्षपातपूर्ण अनुमान प्राप्त होने की संभावना है। इस विचार को पेश करने के लिए, यदि डेटा (अर्थात द्विवार्षिक प्री-पोस्ट रिलेशनशिप) कर्करायन कर रहे हैं और हम आंकड़ों के लिए एक सीधी रेखा के मॉडल को फिट करते हैं तो क्या होता है यह विचार करने से शुरू हो रही है। चित्रा 1. चित्रा 1। चित्रा 1 चित्रा 1 एक सरल curvilinear संबंध दिखाता है यदि चित्रा 1 में घुमावदार रेखा प्री-पोस्ट रिश्ते का वर्णन करता है, तो हमें इसे हमारे सांख्यिकीय मॉडल में लेना होगा। ध्यान दें कि, हालांकि आकृति में 50 में कटऑफ वैल्यू है, कटऑफ़ में लाइन में कोई छलांग या असंतुलन नहीं है। यह इंगित करता है कि उपचार का कोई प्रभाव नहीं है। चित्रा 2 चित्रा 2. एक सीधी रेखा के मॉडल के साथ एक कड़ी रिश्ते फिट। अब, चित्रा 2 को देखें। यह आंकड़ा बताता है कि जब हम एक सीधी रेखा के मॉडल को चित्रा 1 के शिरेदार संबंध में फिट करते हैं, तो क्या होता है। इस मॉडल में, हमने दोनों सीधी रेखाओं की ढलानों को समान बना दिया (यानी हमने कार्यक्रम और pretest के बीच किसी भी बातचीत के लिए)। आप देख सकते हैं कि सीधी रेखा के मॉडल से पता चलता है कि कटऑफ में एक छलांग है, भले ही हम यह देख सकें कि सच्चे समारोह में कोई असंतुलन नहीं है। चित्रा 3. चित्रा 3. प्रत्येक पंक्ति (एक संपर्क प्रभाव) के लिए अलग-अलग ढलानों के साथ एक सीधी रेखा के मॉडल के साथ एक शिरापरक संबंध फिट। यहां तक ​​कि सीधी रेखा की ढलानों की समस्या को हल करने की अनुमति नहीं है। चित्रा 3 दिखाता है कि इस मामले में क्या होता है। यद्यपि इस मामले में छद्म प्रभाव ढलानों को बराबर करने के लिए मजबूर होने से छोटा होता है, फिर भी हम एक छद्म प्रभाव प्राप्त करते हैं। निष्कर्ष एक सरल एक है अगर सही मॉडल घुमावदार है और हम केवल सीधी रेखाओं में फिट होते हैं, तो हम गलत तरीके से निष्कर्ष निकालने की संभावना रखते हैं कि इलाज के दौरान कोई फर्क नहीं पड़ा है। यह मॉडल विनिर्देश की अधिक सामान्य समस्या का एक विशिष्ट उदाहरण है। मॉडल विनिर्देश मॉडल विनिर्देश समस्या को समझने के लिए और यह कैसे आरडी डिजाइन से संबंधित है, हमें तीन प्रकार के विशिष्टताओं को भेद करना चाहिए। चित्रा 4 वह स्थिति दिखाता है जहां हम वास्तव में सही मॉडल निर्दिष्ट करते हैं। वास्तव में क्या मतलब है इसका मतलब है कि शीर्ष समीकरण डेटा के लिए सच्चाई का वर्णन करता है। यह उपचार प्रभाव के साथ एक सरल सीधी रेखा के प्री-पोस्ट रिश्ते का वर्णन करता है। ध्यान दें कि इसमें पोस्ट-टेस्ट वाई, प्रीटेस्ट एक्स और डमी-कोडित उपचार चर जेड के लिए शर्तें शामिल हैं। नीचे समीकरण उस मॉडल को दिखाता है जिसे हम विश्लेषण में निर्दिष्ट करते हैं। इसमें पोस्ट-टेस्ट वाई, प्रीटेस्ट एक्स और डमी-कोडित उपचार चर जेड के लिए भी एक शब्द शामिल है। इसमें शामिल सभी शामिल हैं - ऐसे मॉडल में कोई अनावश्यक शब्द नहीं हैं जो हम निर्दिष्ट करते हैं। जब हम वास्तव में सही मॉडल को निर्दिष्ट करते हैं, तो हम इलाज प्रभाव के निष्पक्ष और कुशल अनुमान प्राप्त करते हैं। चित्रा 4. एक बिल्कुल निर्दिष्ट मॉडल। अब, चित्रा 5 में स्थिति को देखते हैं। असली मॉडल चित्रा 4 जैसा है। हालांकि, इस समय हम एक विश्लेषणात्मक मॉडल निर्दिष्ट करते हैं जिसमें एक अतिरिक्त और अनावश्यक शब्द शामिल होता है। इस मामले में, क्योंकि हम सभी आवश्यक शर्तों को शामिल करते हैं, हमारे उपचार के प्रभाव का अनुमान निष्पक्ष होगा। हालांकि, हम अपने विश्लेषण में अनावश्यक शर्तों को शामिल करने के लिए एक मूल्य का भुगतान करते हैं - उपचार के प्रभाव का आकलन कुशल नहीं होगा। इसका क्या मतलब है इसका मतलब यह है कि यह मौका हम यह निष्कर्ष निकालना होगा कि जब यह वास्तव में बढ़ता है, तब हम काम नहीं करते। विश्लेषण में एक अनावश्यक शब्द शामिल करना, डेटा के लिए अनावश्यक शोर जोड़ने जैसी है - यह हमारे लिए इलाज के प्रभाव को देखने के लिए बहुत कठिन बना देता है, भले ही वहां मौजूद हो। चित्रा 5. एक overspecified मॉडल। अंत में, चित्रा 6 में वर्णित उदाहरण पर विचार करें। यहां, सत्य हमारे मॉडल की तुलना में अधिक जटिल है। हकीकत में, दो शब्दों में हम अपने विश्लेषण में शामिल नहीं थे। इस मामले में, हम एक उपचार प्रभाव अनुमान प्राप्त करेंगे जो पक्षपाती और अक्षम दोनों है चित्रा 6. एक underspecified मॉडल। विश्लेषण रणनीति मॉडल मिस्प्लेसीफिकेशन की चर्चा को देखते हुए, हम एक मॉडलिंग रणनीति विकसित कर सकते हैं जो पक्षपातपूर्ण अनुमानों से रक्षा करने के लिए पहले तैयार की गई है, और दूसरी, अनुमानों की अधिकतम दक्षता को आश्वस्त करने के लिए। सबसे अच्छा विकल्प स्पष्ट रूप से सही मॉडल को बिल्कुल निर्दिष्ट करना होगा। लेकिन व्यवहार में प्राप्त करना अक्सर मुश्किल होता है क्योंकि सही मॉडल अक्सर डेटा में त्रुटि से छिपा होता है। अगर हमें गलती करनी है - अगर हमें मॉडल को याद करना चाहिए - तो हम आम तौर पर अंडरस्कोपी के बजाए सही मॉडल को ओवरस्सिस्ट करना पसंद करेंगे। ओवरस्पर्शिफिकेशन यह आश्वासन देता है कि हमने अनावश्यक लोगों की कीमत पर भी सभी आवश्यक पदों को शामिल किया है। यह प्रभाव का निष्पक्ष अनुमान देगा, भले ही वह अक्षम हो जाएगा। अंडर-स्पष्टीकरण वह स्थिति है जिसे हम सबसे अधिक से बचाना चाहते हैं क्योंकि यह पक्षपाती और अक्षम दोनों अनुमानों को पैदा करता है इस वरीयता अनुक्रम को देखते हुए, हमारे सामान्य विश्लेषण रणनीति को एक मॉडल निर्दिष्ट करके शुरू करना होगा कि हम निश्चित रूप से अधिक स्पष्ट हैं। इस मॉडल के लिए उपचार प्रभाव अनुमान निष्पक्ष होने की संभावना है हालांकि यह अक्षम हो जाएगा। इसके बाद, लगातार विश्लेषण में, धीरे-धीरे उच्च-आदेश की शर्तों को हटा दें जब तक उपचार प्रभाव का अनुमान प्रारंभिक एक या जब तक मॉडल निदान (जैसे अवशिष्ट भूखंडों) से अलग न हो, तब तक ये संकेत मिलता है कि मॉडल खराब है। विश्लेषण में चरण बुनियादी आरडी विश्लेषण में पांच चरणों शामिल हैं: चित्रा 7. कटऑफ मूल्य को घटाकर प्रीटेस्ट को ट्रांसफ़ॉर्म करना। विश्लेषण प्रत्येक छद्म अंक से कटऑफ वैल्यू घटाकर शुरू होता है, चित्रा 7 में दिखाए गए संशोधित प्रीटेस्ट शब्द का निर्माण किया जाता है। कटऑफ मूल्य के बराबर अवरोध सेट करने के लिए यह किया जाता है। यह कैसे काम करता है यदि हम प्रत्येक प्रीटेस्ट वैल्यू से कटऑफ को घटाते हैं, तो संशोधित प्रीटेस्ट 0 के बराबर होगा जहां मूल रूप से कटऑफ वैल्यू पर होगा। चूंकि अवरोधन परिभाषा के अनुसार है, जब x0, हमने जो किया है, कटऑफ में एक्स से 0 सेट कर दिया जाता है, जिससे कटऑफ इंटरसेप्ट बिंदु बनाते हैं। नज़दीकी से रिश्ते की जांच करें प्री-पोस्ट रिलेशनशिप के ग्राफ़ में देखने के लिए दो प्रमुख चीजें हैं सबसे पहले यह निर्धारित करना महत्वपूर्ण है कि क्या कटऑफ़ में संबंध में किसी भी दृष्टिगत दृष्टि से असंतुलन है। असंतुलन स्तर में खड़ी बदलाव (मुख्य प्रभाव), ढलान में बदलाव (इंटरैक्शन प्रभाव) या दोनों हो सकता है। अगर यह स्पष्ट रूप से स्पष्ट है कि कटऑफ में एक विघटन है तो विश्लेषणात्मक परिणामों से संतुष्ट नहीं होना चाहिए, जो कोई प्रोग्राम प्रभाव नहीं दर्शाते हैं। हालांकि, अगर कोई विच्छेदन स्पष्ट रूप से स्पष्ट नहीं है, तो यह हो सकता है कि डेटा में परिवर्तनशीलता एक प्रभाव मास्किंग कर रही है और विश्लेषणात्मक परिणामों के लिए ध्यान से अवश्य ही भाग लेना चाहिए। द्वितीयक संबंध में तलाश करने वाली दूसरी बात बहुपद की डिग्री है, जिसे वितरण की बिवियरेट ढलान, विशेषकर तुलना समूह में दर्शाया गया है। एक अच्छा दृष्टिकोण है कि वितरण बिंदुओं की संख्या (जैसे वितरण वितरण या झुकाव की संख्या) की गणना करना, जो वितरण में स्पष्ट है। यदि वितरण रैखिक प्रतीत होता है, तो कोई विचलन अंक नहीं होता है। एक एकल बल बिंदु एक दूसरे (द्विघात) आदेश बहुपद का संकेत हो सकता है इस जानकारी का उपयोग शुरुआती मॉडल को निर्धारित करने के लिए किया जाएगा जो निर्दिष्ट किया जाएगा। उच्च-आदेश की शर्तें और सहभागिता निर्दिष्ट करें चरण 2 में पाए गए फ्लेनन पॉइंट की संख्या के आधार पर, एक आगे संशोधित असाइनमेंट वैरिएबल के परिवर्तन, एक्स बनाता है। अंगूठे का नियम यहाँ है कि आप बहुपद के दो आदेशों को देखते हैं जो विक्केन बिंदुओं की संख्या से संकेत दिया गया था। इस प्रकार, यदि द्विपक्षीय संबंध रैखिक प्रकट होते हैं (अर्थात् कोई विचलन अंक नहीं होता), तो एक दूसरे क्रम (0 2) बहुपद को बदलना चाहता है। यह चित्रा 8 में दिखाया गया है। चित्रा 8 के द्विविभाजन वितरण में किसी भी प्रकार के झुकाव या झुकता दिखाई नहीं देता है। चित्रा 8. कोई विचलन अंक के साथ बायवेरेट वितरण। पहला क्रम बहुपद मॉडल (एक्स) में पहले से ही मौजूद है और इसलिए केवल एक्स 2 प्राप्त करने के लिए एक्स को स्क्वरिंग करके दूसरा क्रम बहुपद बनाना होगा। एक्स के प्रत्येक परिवर्तन से जेपी द्वारा बहुपद को गुणा करके भी इंटरैक्शन टर्म बनाता है इस उदाहरण में दो इंटरैक्शन शर्तें होंगे: एक्स आई जेड i और एक्स आई 2 जेड i। प्रत्येक परिवर्तन कंप्यूटर पर सीधे गुणा करके आसानी से पूरा किया जा सकता है। यदि द्विवार्षिक वितरण में दो मोड़ बिंदु दिखाई देते हैं, तो एक चौथा (2 2) शक्ति और उनकी बातचीत के लिए परिवर्तन पैदा करेगा। दृश्य निरीक्षण को बहुपद की डिग्री के प्रारंभिक निर्धारण के लिए एकमात्र आधार की आवश्यकता नहीं है जो कि जरूरी है। निश्चित रूप से, पूर्व अनुभव मॉडलिंग के समान डेटा को ध्यान में रखा जाना चाहिए। यहां दिए गए अंगूठे का नियम यह दर्शाता है कि एक आदर्श बहुपद समारोह को अंजाम देने के पक्ष में गलती करनी चाहिए जो मॉडल विनिर्देशों पर चर्चा में उपर्युक्त कारणों के लिए आवश्यक है। जो भी शक्ति प्रारंभिक रूप से दृश्य निरीक्षण से अनुमानित है, उसके लिए सभी परिवर्तनों का निर्माण करना चाहिए और उस शक्ति तक उनकी बातचीत करना चाहिए। इस प्रकार अगर चौथे शक्ति को चुना जाता है, तो सभी चार शब्द एक्स से एक्स 4 का निर्माण करना चाहिए और उनकी बातचीत इस बिंदु पर, एक विश्लेषण शुरू करने के लिए तैयार है। किसी स्वीकार्य कई प्रतिगमन कार्यक्रम का उपयोग कंप्यूटर पर पूरा करने के लिए किया जा सकता है। एक बस पोस्टटेस्ट स्कोर को पीछे छोड़ देता है, वाई, संशोधित प्रीटेस्ट एक्स, उपचार चर जेड, और ऊपर के चरण 3 में बनाए गए सभी उच्च-क्रम के परिवर्तन और इंटरैक्शन। जेड टर्म के साथ जुड़ी प्रतिगमन गुणांक (अर्थात समूह सदस्यता चर) कार्यक्रम के मुख्य प्रभाव का अनुमान है। यदि कटऑफ़ में एक ऊर्ध्वाधर विरक्ति है तो यह इस गुणांक द्वारा अनुमान लगाया जाएगा। एक गुणांक के मानक त्रुटि का उपयोग करके एक मानक टी-टेस्ट का निर्माण करके गुणांक (या कोई अन्य) के महत्व का परीक्षण कर सकता है जो कि कंप्यूटर प्रोग्राम आउटपुट में लगातार आपूर्ति की जाती है। 9 चित्रा। कोई फ्लेनन अंक (पूर्ण वर्ग का मॉडल विनिर्देश) के मामले के लिए प्रारंभिक मॉडल। यदि चरण 3 के विश्लेषक ने वितरण के मॉडल के लिए आवश्यक बहुपदीय कार्य को सही तरीके से पेश किया तो कार्यक्रम के प्रभाव का अनुमान कम से कम निष्पक्ष हो जाएगा। हालांकि, सही मॉडल में जिन शब्दों की ज़रूरत नहीं होती है उन्हें शामिल करके, अनुमान अक्षम होने की संभावना है, अर्थात, मानक त्रुटि शब्द बढ़ेगा और इसलिए कार्यक्रम के प्रभाव का महत्व कम नहीं हो सकता है। फिर भी, यदि विश्लेषण में इस बिंदु पर गुणांक अत्यधिक महत्वपूर्ण है, तो यह निष्कर्ष निकालना उचित होगा कि एक कार्यक्रम प्रभाव है। गुणांक की दिशा और पोस्ट-टेस्ट के पैमाने की दिशा के आधार पर प्रभाव की दिशा की व्याख्या की जाती है। इंटरैक्शन प्रभावों की जांच भी की जा सकती है। उदाहरण के लिए, एक रैखिक बातचीत को एक्सजेड टर्म के लिए एक महत्वपूर्ण प्रतिगमन गुणांक द्वारा निरूपित किया जाएगा। चरण 4 के परिणामों के आधार पर जाहिरा तौर पर अनावश्यक शर्तों को हटाने और अधिक दक्षता के साथ इलाज के प्रभाव को पुनर्जीवित करने का प्रयास करना हो सकता है। यह एक मुश्किल प्रक्रिया है और अगर आप पक्षपात की संभावना को कम करना चाहते हैं तो सावधानी से संपर्क किया जाना चाहिए। इसे पूरा करने के लिए निश्चित रूप से 4 डिग्री में प्रतिगमन विश्लेषण के उत्पादन की जांच करनी चाहिए, जिसमें कुल मिलाकर आंकड़े फिट बैठते हैं, किसी भी तुच्छ गुणांक की मौजूदगी और अवशेषों का पैटर्न। मॉडल को परिष्कृत करने का निर्णय लेने का एक रूढ़िवादी तरीका मौजूदा मॉडल में उच्चतम-आदेश अवधि की जांच करके और उसके अंतःक्रिया को शुरू करना होगा। यदि दोनों गुणांकों को अनियंत्रित हैं, और अच्छाई के योग्य उपाय और अवशेषों के पैटर्न से संकेत मिलता है कि एक अच्छा फिट हो सकता है तो इन दो शब्दों को छोड़ सकता है और परिणामस्वरूप मॉडल को पुन: प्राप्त कर सकते हैं। इस प्रकार, यदि कोई चौथा-क्रम बहुपद के अनुमान लगाता है, और पाया गया कि एक्स 4 और एक्स 4 जेड के गुणांक अनियंत्रित हैं, तो इन शब्दों को हटा दिया जा सकता है और तीसरे क्रम के मॉडल को पुनः निर्दिष्ट किया गया है। एक यह प्रक्रिया तब तक दोहराएगा जब तक कि: 1) गुणांकों में से कोई भी महत्वपूर्ण होता है ख) भलाई की फिटनेस सराहनीय हो जाती है या, सी) अवशिष्टों का पैटर्न एक खराब फिटिंग मॉडल को दर्शाता है। अंतिम मॉडल में अभी भी अनावश्यक शब्द शामिल हो सकते हैं लेकिन इनमें से कम होने की संभावना है और इसके परिणामस्वरूप दक्षता अधिक होनी चाहिए। मॉडल विनिर्देश प्रक्रिया जिसमें विश्लेषण के किसी भी स्तर पर किसी भी अवधि को छोड़ना शामिल होता है, अधिक खतरनाक होते हैं और पक्षपातपूर्ण अनुमानों को प्राप्त करने की अधिक संभावना होती है क्योंकि काफी मल्टीकोलाइनेरिटी जो मॉडल में मौजूद शर्तों के बीच मौजूद होगी। उदाहरण विश्लेषण यह समझने में आसान है कि उदाहरण के लिए आरडी डिजाइन से डेटा का विश्लेषण कैसे किया जाता है। इस उदाहरण के लिए डेटा चित्रा 10 में दिखाया गया है। 10 चित्रा। उदाहरण के लिए आरडी विश्लेषण के लिए Bivariate वितरण। कई चीजें नेत्रहीन स्पष्ट हैं सबसे पहले, एक बहुत बड़ा उपचार प्रभाव है वास्तव में, चित्रा 10 सिम्युलेटेड डेटा दिखाता है जहां असली उपचार प्रभाव 10 अंक है। दूसरा, दोनों समूहों को अच्छी तरह से सीधी रेखाओं से वर्णित किया जाता है - कोई भी तरंग बिंदु स्पष्ट नहीं हैं इस प्रकार, प्रारंभिक मॉडल अच्छी तरह से स्पष्ट है, चित्रा 9 में ऊपर दिखाया गया पूर्ण वर्ग है। हमारे प्रारंभिक विनिर्देश के परिणाम चित्रा 11 में दिखाए जाते हैं। उपचार प्रभाव अनुमान समूह चर के बगल में है। यह प्रारंभिक अनुमान 10.231 (एसई 1.248) है- 10 अंकों के सही मूल्य के करीब। लेकिन ध्यान दें कि इस बात का सबूत है कि उच्चतर क्रम के कई नियम सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं और मॉडल में इसकी आवश्यकता नहीं हो सकती है। विशेष रूप से, रैखिक इंटरैक्शन शब्द लिनिट (एक्सज़), और दोनों द्विघात (एक्स 2) और द्विघात बातचीत (एक्स 2 जेड) शब्द महत्वपूर्ण नहीं हैं चित्रा 11. पूर्ण द्विघात मॉडल के लिए पुनरावृत्ति परिणाम। हालांकि हम मॉडल से तीनों पदों को छोड़ने के लिए परीक्षा (और शायद उचित भी) हो सकते हैं, अगर हम चरण 5 में दिए गए दिशानिर्देशों का पालन करते हैं, तो हम केवल दो वर्गों के परिमाण और क्वाडिंट को छोड़कर शुरू करेंगे। इस मॉडल के परिणाम चित्रा 12 में दिखाए गए हैं। चित्रा 12: कक्षा के बिना प्रारंभिक मॉडल के लिए पुनरावृत्ति परिणाम। हम देख सकते हैं कि इस मॉडल में इलाज प्रभाव अनुमान 9.8 9 (एसई .95) है। फिर, यह अनुमान सही 10-बिंदु उपचार प्रभाव के बहुत करीब है। हालांकि, सूचना, कि मूल त्रुटि (एसई) मूल मॉडल में जितनी छोटी थी। दक्षता में यह लाभ है जब हम दो अनावश्यक वर्ग की शर्तों को समाप्त करते हैं। हम यह भी देख सकते हैं कि रैखिक इंटरैक्शन टर्म लाइनिंट अभी भी अनमोल है। यह शब्द महत्वपूर्ण होगा यदि दो समूहों के लिए लाइनों के ढलान अलग-अलग होते हैं। दृश्य निरीक्षण से पता चलता है कि ढलान एक समान हैं और इसलिए यह समझ में आता है कि यह शब्द महत्वपूर्ण नहीं है अंत में, अनियंत्रित रैखिक इंटरैक्शन अवधि को छोड़ दें और मॉडल को निस्तित करें। ये परिणाम चित्रा 13 में दिखाए गए हैं। चित्रा 13. अंतिम मॉडल के लिए प्रतिगमन परिणाम। हम इन परिणामों में देखते हैं कि उपचार प्रभाव और एसई पिछले मॉडल के समान हैं और यह कि इलाज प्रभाव अनुमान 10 अंकों के सही प्रभाव का निष्पक्ष अनुमान है। हम यह भी देख सकते हैं कि अंतिम मॉडल में सभी पद सांख्यिकीय रूप से महत्वपूर्ण हैं, यह सुझाव देते हैं कि वे डेटा के मॉडल के लिए आवश्यक हैं और इसे समाप्त नहीं किया जाना चाहिए। तो, हमारा मॉडल जो दिखने वाला दिखता है, चित्रा 14 में फिट बेपरेट डिस्ट्रीब्यूशन को उचित प्रतिगमन मॉडल के साथ दिखाया गया है। चित्रा 14. अंतिम प्रतिगमन मॉडल के साथ Bivariate वितरण। जाहिर है, मॉडल दोनों अच्छी तरह से फिट, सांख्यिकीय और नेत्रहीन

Comments