प्रतिगमन सांख्यिकी मॉडेल व्याख्या

प्रतिगमन चिरचकल्पात संबंधांचे विश्लेषण करते

प्रतिगमन एक डेटा खाण तंत्र आहे ज्यायोगे एका विशिष्ट डेटासेटला दिलेल्या संख्यात्मक मूल्यांची श्रेणी (ज्याला सतत मूल्ये देखील म्हटले जाते) सांगतात. उदाहरणार्थ, प्रतिगमन दुसर्या व्हेरिएबल्सद्वारा दिलेली उत्पादन किंवा सेवेची किंमत दर्शविण्याकरिता वापरली जाऊ शकते.

प्रतिगमन व्यवसाय आणि विपणन नियोजन, आर्थिक अंदाज, पर्यावरण मॉडेलिंग आणि ट्रेंडचे विश्लेषण करण्यासाठी अनेक उद्योगांमध्ये वापरले जाते.

प्रतिगमन वि. वर्गीकरण

उलटगणती व वर्गीकरण म्हणजे डेटाच्या खाणकाम तंत्रांचा वापर समान समस्यांचे निराकरण करण्यासाठी होतो, परंतु ते वारंवार गोंधळलेले असतात. दोन्हीचा अंदाज विश्लेषणात वापरला जातो, परंतु वर्गीकरण वेगळ्या मूल्यांकनासाठी वापरला जातो तेव्हा वर्गीकरण स्वतंत्र श्रेणींमध्ये डेटा प्रदान करतो.

उदाहरणार्थ, रीग्रेसचा वापर एखाद्या ठिकाणाचे स्थान, चौरस फूट, शेवटचे विकले जाणारे भाव, समान घरे किंमत आणि अन्य घटक यावर आधारित घरांच्या मूल्याची अंदाज लावण्यासाठी केला जाईल. आपण त्याऐवजी घरे मध्ये walkability, लॉट आकार किंवा गुन्हेगारी दर म्हणून आयोजित करायचे असल्यास वर्गीकरण क्रमाने होईल.

प्रतिगमन तंत्रांचे प्रकार

रीग्रेशनचा सर्वांत सोपा आणि सर्वात जुना प्रकार रेखीय प्रतिगमन आहे ज्याचा वापर दोन व्हेरिएबल्स मधील संबंधांचा अंदाज लावण्यासाठी केला जातो. हे तंत्र एका सरळ रेषाच्या गणिती सूत्राचा (y = mx + b) वापर करते. साध्या शब्दात, याचा अर्थ असा की, एक वाई आणि एक एक्स-अक्ष असलेली एक आलेख दिलेली आहे, एक्स आणि वाई यांच्यात संबंध काही आउटलाइनकसह एक सरळ रेषा आहे उदाहरणार्थ, आम्ही असे गृहीत धरू की, लोकसंख्येत वाढ झाल्याने, अन्नधान्य उत्पादन त्याच दराने वाढेल - यासाठी दोन वर्णांमधील मजबूत, रेखीय संबंध असणे आवश्यक आहे. हे चित्रित करण्यासाठी, एक आकृतीचा विचार करा ज्यामध्ये Y- अक्षावर लोकसंख्या वाढते, आणि एक्स-अक्ष अन्न उत्पादन लक्ष ठेवतो. Y मूल्य वाढते तसे, एक्स मूल्य समान दराने वाढत जाईल, जेणेकरून त्यांच्यामध्ये एक सरळ रेषा असेल.

प्रगत तंत्रे, जसे की एकाधिक प्रतिगमन, एकापेक्षा जास्त वेरियेबल्समधील संबंधांचा अंदाज लावा - उदाहरणार्थ, मिळकत, शिक्षण आणि कुठे राहणे निवडतात यामध्ये एक परस्परसंबंध आहे? अधिक वेरियेबल्सच्या वाढीमुळे पूर्वानुमानाच्या गुंतागुंतीत वाढ होते. मानक, श्रेणीबद्ध, सेटवर्ड आणि स्टेप-यासह विविध पुनरावृत्ती तंत्राची अनेक प्रकार आहेत, प्रत्येका स्वतःच्या अनुप्रयोगासह.

या मुद्यावर आपण अंदाज लावण्याचा प्रयत्न करीत आहोत (आश्रित किंवा अंदाज केलेले व्हेरिएबल) आणि डेटा आम्ही पूर्वानुमान (स्वतंत्र किंवा भविष्यवाचक चलने) करण्यासाठी वापरत आहोत हे समजणे महत्वाचे आहे. आमच्या उदाहरणामध्ये, आम्ही त्या ठिकाणाचा अंदाज लावू इच्छितो जेथे एखादे निवृत्तीवेतन उत्पन्न आणि शिक्षणाचे ( भाकीत व्हेरिएबल्स दोन्ही) निवडू शकता .