آموزش ویدئویی تحلیل خروجی مدل رگرسیون پانل و نیکویی برازش

(دیدگاه کاربر 1)

۳۳,۰۰۰ تومان

در این بسته آموزشی، تحلیل کامل مدل رگرسیون پانل نهایی استخراج شده از ایویوز بیان شده است. همچنین آزمون هاي زیر به صورت کامل آموزش داده شده اند {نحوه انجام و تحلیل آنها}: معنی داری مدل در حالت کلی، ضريب تعيين، دوربين واتسون، همخطي (VIF)، ناهمساني واريانس، نرمال بودن باقيمانده ها.

مدرس: سید مجتبی فرشچی، کارشناس ارشد رشته آمار اقتصادی از دانشگاه شهید بهشتی تهران و مدیریت شرکت آماری اطمینان شرق با سالها تجربه انجام تحلیل های کاربردی اقتصادسنجی.

پشتیبانی و ارتباط مستقیم با مدرس (آقای فرشچی) فقط از طریق واتساپ: 09155136129

مدت زمان فیلم آموزشی و فایلهای ضمیمه: 67 دقیقه، همراه با داده ها در اکسل و ورک فایل EViews. حجم فایل دانلودی 241 مگابایت.

این محصول یکی از گامهای آموزش جامع و گام به گام رگرسیون OLS داده های ترکیبی با نرم افزار EViews می باشد. پیشنهاد می شود آموزش کامل داده های پانل (با 12 گام) را دریافت نمایید تا در خصوص داده های ترکیبی همه نکات فنی را در اختیار داشته باشید و با هر سطح از اطلاعات که هستید، به صورت کامل مفهوم و روش را فرا بگیرید (از اینجا).

بلافاصله بعد از خریداری، لینک دانلود فعال می گردد. برای خریداری بر روی “افزودن به سبد خرید” کلیک نمایید:

۵ دقیقه اول از این فیلم آموزشی

 

۱- مقدمه

در جلسه (گام) آموزشی قبلی نحوه تشخیص نوع مدل را گفتیم. در این گام از آموزش استخراج نتایج رگرسیون و آزمونهای نیکویی برازش را می گوییم. و در گام آتی نیز نحوه آزمون فرضیه ها را تشریح خواهیم کرد.

۲- استخراج نتایج اجرای مدل رگرسیون و تحلیل آن

با توجه به نتایج آزمونهای اف لیمر و هاسمن (که در گام قبلی انجام شد: بسته آموزشی آزمونهای اف لیمر و هاسمن) در نهایت رگرسیونی که بدست خواهد آمد، یکی از سه حالت زیر خواهد بود:

  1. مدل تجمیعی (پولد) یا مدل بدون اثرات
  2. مدل با اثرات ثابت
  3. مدل با اثرات تصادفی

حال لازم است به تحلیل دقیق نتایج بدست آمده و بررسی نیکویی برازش بپردازیم.

منظور از نیکویی برازش این است که از صحت نتایج اطمینان حاصل کنیم، پیش فرضهای لازم رعایت شده باشند و در یک کلام مدلی که برای داده ها دوخته ایم، برازنده آنها باشد.

   ۱-۲- تحلیل معنی داری مدل در حالت کلی

برای تحلیل معنی داری مدل رگرسیون در حالت کلی، به مقدار آماره اف در نتایج رگرسیون و مقدار احتمال آن مراجعه می کنیم. شرح این مساله به صورت کامل در فیلم آموزشی آمده است.

   ۲-۲- تحلیل ضریب تعیین

{توجه نمایید که در این صفحه از سایت به صورت کامل به بحث در خصوص ضریب تعیین پرداخته ایم. اگر علاقه مند به دانستن صفر تا صد ضریب تعیین هستید به اینجا بروید:  تحلیل کامل ضریب تعیین}. البته در فیلم آموزشی این بسته، ضریب تعیین به صورت کامل مورد بحث قرار گرفته است.

۱-۲-۲- ضریب تعیین چیست؟

ضریب تعیین که به آن ضریب تشخیص نیز گفته می شود (Coefficient of Determination)، و تقریبا همه جا با علامت R۲ نمایش داده می شود، معروف ترین معیار سنجش نیکویی برازش مدل است و عبارتست از : مجذور ضریب همبستگی بین y   و)  ý   یعنی توان دوم ضریب همبستگی بین مقادیر واقعی متغیر وابسته و مقادیر برآورد شده حاصل از مدل(

بنا بر تعریف، ضریب همبستگی می بایست بین ۱-  و  ۱  قرار گیرد. در نتیجه R۲  که توان دوم آن است بین صفر و یک قرار خواهد داشت. اگر این همبستگی زیاد باشد، مدل داده ها را خوب برازش کرده است، در حالی که اگر همبستگی پایین (نزدیک به صفر) باشد، مدل برازش خوبی از داده ها ارائه نداده است.

۲-۲-۲- ضریب همبستگی بین متغیر وابسته و مقادیر پیش بینی شده آن

ریشه دوم ضریب تعیین را ضریب همبستگی بین y  (متغیر وابسته مدل رگرسیون) و)   ý  مقدارهای پیش بینی شده برای y ) می نامند. هر چه مقدار این ضریب بیشتر باشد، همبستگی بین متغیر وابسته و مقادیر پیش بینی شده آن بیشتر خواهد بود و مدل رگرسیون بهتری برازش شده است.

۳-۲-۲- بیان گرافیکی از مفهوم ضریب تعیین

مقدار ضریب تعیین بالاتر نشان می دهد که در مدل رگرسیونی مقدار مشاهده شده به خط برازش شده نزدیک تر هستند. از لحاظ تئوری اگر R۲ =۱۰۰.۰% شود تمامی مقادیر مشاهده شده با مقادیر برازش شده یکسان خواهند بود و همه نقاط داده ها بر روی خط برازش شده قرار خواهند گرفت.

۴-۲-۲- ضریب تعیین یکی از معروف ترین شاخص های نیکویی برازش است.

۵-۲-۲- معایب ضریب تعیین به عنوان شاخص نیکویی برازش

محاسبه R۲یا ضریب تعیین آسان و تفسیر آن ساده است، ولی با این حال این معیار معروف نیکویی برازش معایبی نیز به شرح زیر دارد:

عیب اول

R۲ بر حسب تغییرات y نسبت به ý تعریف می شود؛ حال اگر مقادیر و متغیر وابسته کمی تغییر کند، حتی اگر مدل حاصله نسبت به مدل قبلی تفاوت چندانی نداشته باشد و  RSS (تغییراتی که مدل قادر به توضیح آن نیست) دو مدل نیز برابر باشد، R۲   تغییر می کند. بنابراین، مقایسه R۲در مدل هایی که متغیر وابسته متفاوت دارند معقول نیست

عیب دوم

اگر متغیرهای توضیحی بیشتری وارد مدل شوند،  R2 افزایش می یابد و یا ثابت می ماند. زیرا متغیر اضافه شده جدید، نقشی هر چند کم در تبیین متغیر y خواهد داشت. این ویژگی، R۲را به عنوان معیاری جهت انتخاب مدل و متغیرهای آن، غیر معقول جلوه می دهد.

۶-۲-۲- ضریب تعیین تعدیل شده

به منظور اجتناب از عیب دوم، تعدیلی روی ضریب تعیین صورت می گیرد به این طریق که، کاهش درجه آزادی بوجود آمده ناشی از افزایش متغیرهای اضافی، که در محاسبه ضریب تعیین لحاظ نمی شود، در نظر گرفته می شود (زیرا با افزایش متغیرهای توضیحی جدید به مدل، درجه آزادی کاهش می یابد(

این  R۲  جدید یا ضریب تعیین تعدیل شده به صورت زیر تعریف می شود:

adj. R۲   =  ۱ –  { (T-1)/(T-k)  *  (۱- R۲ ) }

در این صورت با اضافه شدن یک متغیر مستقل جدید به مدل، تعداد پارامترها (k) افزایش می یابد و اثر افزایش R۲ را خنثی می کند. بنابراین در مدل سازی، R۲  تعدیل شده می تواند به عنوان ابزار تصمیم گیری، جهت تعیین وجود یا عدم وجود متغیر مورد نظر، در مدل استفاده شود. اگر با اضافه شدن متغیر مستقل به مدل، R۲تعدیل شده افزایش یابد، متغیر اضافه شده در مدل باقی می ماند و اگر R۲تعدیل شده کاهش یابد، متغیر از مدل حذف می شود.

معایب ضریب تعیین تعدیل شده

البته هنوز مشکلاتی در رابطه با حداکثر سازی R۲تعدیل شده به عنوان معیار انتخاب مدل وجود دارد؛ اصلی ترین مشکل این است که این معیار بسیار انعطاف پذیر یا به اصطلاح “نرم” است و لذا محققان با پیروی از آن به یک مدل بزرگ، با تعداد زیادی متغیر مستقل می رسند که بیشتر متغیرهای آن به صورت مرزی معنا دارند یا اصلا معنا دار نمی باشند.

   ۳-۲- تحلیل معنی داری ضرایب متغیرهای رگرسیون

ضریبی که مقدار احتمال آن کمتر از ۰.۰۵ باشد، در مدل معنی دار خواهد بود. یعنی تغییر در مقادیر این متغیر باعث تغییر معنی دار در متغیر وابسته (با توجه به ساختار مدل) می گردد.

۳- اصول و پیش فرضها برای اعتبار رگرسیون

چنانچه یکی از پیش فرضها نقض گردد و توسط دانشجو نادیده گرفته شود و وی به کار خویش ادامه دهد، پیامد آن برآورد ناصحیح ضرایب رگرسیون و معنی داری آنهاست.

مهمترین پیش فرضهایی که برای تحلیل رگرسیون داده های پانل می بایست مد نظر قرار گیرند به قرار زیر است:

   ۱-۳- صفر بودن میانگین جملات خطا

اگر یک جمله ثابت در رگرسیون لحاظ گردد، این پیش فرض به راحتی حاصل می شود و این فرض هرگز نقض نخواهد شد. بنابراین حتما در مدلهای رگرسیونی خود در نرم افزار ایویوز، جمله ثابت (عرض از مبدا) که با C  نشان داده می شود را لحاظ نمایید.

   ۲-۳- عدم وجود خودهمبستگی

در یک مدل کلاسیک رگرسیون خطی فرض بر آن است که کوواریانس بین اجزای اخلال برابر صفر است. به عبارت دیگر، بین اجزای اخلال همبستگی وجود ندارد. به این معنی که جزء اخلال مربوط به یک مشاهده، تحت تأثیر جزء اخلال مربوط به مشاهده دیگر قرار نمی‌گیرد.

به عبارت دیگر یکی از مفروضاتی که در رگرسیون مد نظر قرار می‌گیرد؛ استقلال خطا (تفاوت بین مقادیر واقعی و مقادیر پیش‌بینی‌شده توسط معادله رگرسیون) از یکدیگر است. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند؛ امکان استفاده از رگرسیون وجود ندارد.

برای تشخیص بصری با هدف توضیح مساله نمودار باقیمانده ها در مقابل باقیمانده ها با یک درجه تاخیر (لگ) را ترسیم می کنیم. اما توجه شود که این راه مناسبی برای تشخیص نیست. {برای ایجاد سری باقیمانده ها، از proc دستور ساختن باقیمانده ها اجرا شود. بعد با دستور genr لگ ساخته شده و همبستگی محاسبه شود}.

با ترسیم نمودار باقیمانده ها طی زمان، اشکال زیر نشان دهنده خودهمبستگی مثبت و منفی است:

خودهمبستگی

برای تشخیص وجود خودهمبستگی می‌توان از آزمون دوربین – واتسون استفاده نمود که در مدل‌های پانل به کار می‌رود و از انعطاف‌پذیری بالایی برخوردار است.

به‌منظور بررسی استقلال خطاها از یکدیگر از آزمون دوربین- واتسون استفاده می‌شود که آماره آن به کمک فرمول زیر محاسبه می‌شود:

et= میزان اختلال یا خطا در دوره زمانی t

et-1= میزان اختلال یا خطا در دوره زمانی t-1

اگر همبستگی بین خطاها را با ρ نشان دهیم در این صورت آمارهDW به کمک رابطه زیر محاسبه می‌شود:

DW=2(1-ρ)m

مقدار آماره این آزمون در دامنه ۰ و ۴+ قرار دارد:

اگر ۰= ρآنگاهDW=2 خواهد بود که نشان می‌دهد خطاها از یکدیگر مستقل هستند (عدم خودهمبستگی).

اگر ۱ =ρ آنگاه DW=0 خواهد بود که نشان می‌دهد خطاها دارای خودهمبستگی مثبت هستند.

اگر ۱- =ρ آنگاهDW=4 خواهد بود که نشان می‌دهد خطاها دارای خودهمبستگی منفی هستند.

فرض H0 و H1 به قرار زیر است:

H۰ : همبستگی بین خطاها وجود ندارد.

H۱ : همبستگی بین خطاها وجود دارد.

نحوه داوری: نحوه داوری در خصوص آزمون دوربین واتسون و نکات و منابع ارزشمند در این خصوص را در داخل بسته آموزشی خواهید دید.

   ۳-۳- عدم وجود هم خطی (collinearity)

یکی از فرضیاتی که در زمان استفاده از روش OLS در نظر گرفته می شود، این است که متغیرهای توضیحی به هم وابسته نیستند. زمانی که بین متغیرهای توضیحی رابطه ای وجود نداشته باشد، گفته می شود آنها نسبت به هم متعامد هستند. اگر متغیرهای توضیحی نسبت به هم متعامد باشند، افزودن یک متغیر توضیحی جدید که متعامد هم باشد به مدل یا حذف یک متغیر توضیحی از مدل، باعث تغییری در ضرایب سایر متغیرها نمی شود.

بهرحال متغیرها دارای درجه از همبستگی هستند، اما تا زمانی که این همبستگی خیلی قوی نباشد، مشکلی پیش نمی آید.

در آموزش قبل، همبستگی دو گانه و دو به دو را با روش ماتریس همبستگی توضیح دادیم {این بسته آموزشی: هم انباشتگی و همخطی در داده های ترکیبی}. و در این آموزش به صورت عملیاتی آزمون عامل تورم واریانس (VIF) را برای داده های ترکیبی (تابلویی یا پانلی) خواهیم گفت که برای بررسی هم خطی چند گانه بین چند متغیر نیز کاربرد دارد.

   ۴-۳- عدم وجود ناهمسانی وایانس

پیش فرض مهمی که در رگرسیون OLS وجود دارد این است که واریانس خطاها مقدار ثابتی باشد (در طول زمان ثابت باشد). این فرض به همسانی واریانس (عدم وجود ناهمسانی واریانس) معروف است.

اگر خطاها (باقیمانده ها یا پسماندها) واریانس (پراکنش) ثابت نداشته باشند، گفته می شود آنها ناهمسان (Heteroskedasticity) هستند.  به عنوان مثال چنانچه پس از برآورد یک رگرسیون، باقیمانده های محاسبه شده را در مقابل یکی از متغیرهای توضیحی رسم کنیم، در صورت ناهمسانی وایانس چنین شکلی خواهد داشت:

ناهمسانی واریانس
ناهمسانی واریانس

یعنی اگر چه میانگین ثابت و برابر صفر است اما میزان پراکندگی (وایانس) انها با افزایش متغیر مستقل افزایش می یابد. اما روش ترسیمی راه صحیح تشخیص ناهمسانی وایانس نیست. بلکه معروف ترین و عمومی ترین روشی که برای آزمون همسانی وایانس به کار می رود، آزمون وایت است.

شیوه استخراج آزمون وایت برای داده های پانلی در این بسته آموزشی به صورت کامل بیان شده است.

   ۵-۳- نرمال بودن باقیمانده های مدل

با توجه به محتوای آموزش نرمالیتی در داده ها در نرم افزار ایویوز، این مساله که باقیمانده ها بایست دارای توزیع نرمال باشند، یک ضرورت است. البته در خصوص داده های پانل مساله کمی متفاوت است. توضیحات کامل در این خصوص در ویدئو آمده است به همراه منابع معتبر.

۴- آزمونهای نیکویی برازش و راه حل رفع مساله

   ۱-۴- نیکویی برازش چیست

لازم است که همواره شاخص هایی برای سنجش چگونگی و میزان دقت برازش داده ها، بوسیله مدل های رگرسیونی داشته باشیم. به عبارت دیگر مایلیم برای سوال زیر، یک پاسخ داشته باشیم:

مدل رگرسیون شامل متغیرهای توضیحی تا چه حد توانسته است تغییرات در متغیر وابسته را توضیح دهد؟

معیارهایی به نام “نیکویی برازش” وجود دارند که برای آزمون چگونگی و میزان دقت برازش داده ها توسط تابع رگرسیون مورد استفاده قرار می گیرند.

   ۲-۴- لزوم اجرای مجدد مدل با توجه به نتیجه آزمونهای نیکویی برازش

در صورت وجود مشکل در آزمونهای نیکویی برازش لازم است به مدل رگرسیون برگردیم و تغییرات لازم را اعمال و با برآورد مجدد مدل اصلاح شده، مساله عدم نیکویی برازش را حل کنیم.

   ۳-۴- آزمون دوربین واتسون برای بررسی خود همبستگی باقیمانده ها، رفع خودهمبستگی

برای رفع می توان correlogram  باقیمانده ها را ترسیم کرد تا مرتبه فرآیند اتورگرسیو (AR) یا میانگین متحرک (MA) را تعیین کرد. بعد برای رفع آن جملات AR(a) یا MA(b) را به مدل می توان اضافه کرد. البته کار به این سادگی ها هم نیست و شما در اصل با اینکار مدل خود را تغییر داده اید یا اینکه با خطاهای نرم افزار ایویوز مواجه خواهید شد.

در خصوص داده های پانل تا حد زیادی از این مساله خود همبستگی می توانید چشم پوشی کنید. به مستندات و منابع ضمیمه شده در این بسته آموزشی مراجعه نمایید.

   ۴-۴- آزمون همخطی متغیرهای مستقل با آزمون عامل تورم وایانس (VIF)، رفع همخطی

چنانچه مقدار این آزمون کمتر از ۵ باشد، نتیجه می گیریم همخطی چندگانه وجود ندارد.

نکات لازم برای رفع همخطی و توضیحات مرتبط در ویدئوی آموزشی آمده است.

   ۵-۴- آزمون ناهمسانی واریانس «وایت»، رفع ناهمسانی واریانس

برای رفع ناهمسانی واریانس در گزینه های برآورد مدل، گزینه مناسب را انتخاب می کنیم. توضیحات کامل در ویدئو آمده است.

   ۶-۴- آزمون نرمال بودن باقیمانده ها «جارک-برا» ؟؟

برای حل مساله نرمال نبودن باقیمانده ها به ویدئوی آموزشی مراجعه نمایید. مستندات لازم و منبع معتبر در فایلهای پیوست آمده است.

همچنین برای رفع به آموزش رفع داده های پرت مراجعه نمایید. توجه نمایید که حذف داده های پرت یا استفاده از متغیرهای مجازی برای نمایش آنها، هر دو موجب از دست رفتن درجه آزادی و کاهش اعتبار آماره ها می گردد. اما بهرحال منافع آن بیشتر از مضرات آن است و ما در آموزش خود بر روی حذف داده های پرت کار کردیم.

1 دیدگاه برای آموزش ویدئویی تحلیل خروجی مدل رگرسیون پانل و نیکویی برازش

  1. Avatar

    محمدامین

    واقعا تشکر بخاطر ویدئوهای عملیاتی و عالی

دیدگاه خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا

سلام دانشجوی عزیز؛

1- بهترین راه ارتباط با ما (سفارش انجام تحلیل آماری یا مشاوره یا سوال) واتساپ می باشد. زیرا لازم است قبل از هر پاسخی، فایلهای ارسالی شما بررسی شوند. فایلهایی مثل داده ها، مدل رگرسیونی و فرضیات و امثال آن. یا اینکه به متخصص مربوطه ارجاع گردید.

2- در صورتیکه که داده ها جمع آوری نشده اند، امکان انجام تحلیل با EViews را نداریم (جمع آوری داده توسط این شرکت انجام نمی گردد)

تحلیل آماری اطمینان شرق

بستن
بستن
Open chat
1
سلام. چنانچه قصد سفارش تحلیل دارید، می توانید از طریق واتس آپ {09155136129} با ما ارتباط بگیرید.
روی آیکن واتس آپ کلیک کنید: