۷ دقیقه اول از فیلم آموزشی تشخیص نوع اثرات مدل
آموزش ویدئویی آزمون های اف لیمر- هاسمن
۱- سخت ترین مرحله در تحلیل داده های پانل (تابلویی)
در این آموزش قصد داریم مهمترین گلوگاه هنگام انجام تحلیل رگرسیون داده های پانلی را بیان کنیم. این گلوگاه همان درک دقیق و تشخیص درست مدل به صورت تجمیعی و یا مدل به صورت پانل (دارای اثرات ثابت یا تصادفی) است.
اکثر دانشجویان و محققان هنگام انجام تحلیل های اقتصادی و یا کار با نرم افزار EViews در این زمینه دچار مشکل و نیازمند مشاوره هستند.
بدیهی است اگر مدل در این گلوگاه تحلیلی به خوبی تشخیص داده نشود، نتایج معتبر و درستی در برازش مدل بدست نخواهد آمد و به عنوان مثال، رابطه متغیر مستقل با متغیر وابسته و فرضیه ای که می بایست تایید گردد، رد می شود. و کشف و بیان این مساله توسط اساتید داور در هنگام دفاع از پایان نامه دانشجو به رد شدن دفاعیه و نتایج منجر خواهد شد.
ضمن آنکه تفهیم درست این مفاهیم و توان محقق و دانشجو در بیان این مدلها و این آزمون ها در جلسه دفاعیه پایان نامه کارشناسی ارشد یا دکتری، استرس دانشجو را تا حد خیلی زیادی کاهش خواهد داد و با تسلط و بدون نگرانی از نتایج تحقیقات خود دفاع خواهد کرد.
۲- مدلهای رگرسیونی داده های پانلی (ترکیبی)
در این بخش لازم است مبانی تئوری و پایه ای آموزش داده شود. بدون درک این مبانی تئوری امکان درک کامل تحلیل رگرسیون داده های ترکیبی وجود ندارد. بنابراین کمربندها را محکم ببندید. با آسان ترین و گویاترین بیان این بخش در این ویدئو ارائه شده است و نکته خیلی پیچیده ای ندارد.
همانطور که در گامهای قبلی این آموزش بطور مفصل بیان شد، کلمه رگرسیون (regression) به معنای بازگشت است و رگرسیون عبارتست از بیان تغییرات متغیر وابسته بر اساس متغیر/متغیرهای دیگر.
به بیان دیگر، رگرسیون عبارتست از کشف تاثیر یا عدم تاثیر متغیرهای مستقل (سمت راست معادله رگرسیون) بر روی متغیر وابسته (تنها متغیر سمت چپ رگرسیون) در مدل زیر:

در مدل فوق، Y متغیر وابسته، X متغیر مستقل و Zi نیز متغیری است که خصوصیات ویژه هر شرکت (ناهمگنی های مقاطع) یا هر کشور را نشان می دهد.
در اینجا لازم است مجدد بیان شود که ما در حال صحبت از داده های پانل هستیم که در این داده ها، علاوه بر عامل زمان، شرکتهای مختلف بازار بورس (یا کشورها) نیز به داده های ما هویت می دهند. بنابراین طبیعی است که به ازای هر شرکت یا هر کشور، خصوصیت ویژه ای در مدل داشته باشیم.
به تصویر داده ها خود در اکسل نگاهی دوباره بیندازیم. همانطور که مشاهده می شود می توانیم مدلی داشته باشیم که در آن به ازای هر شرکت بورسی، خصوصیتی خاص در مدل داشته باشیم و در مدل فوق، i از یک تا ۱۰ (داده های ۱۰ شرکت را در اختیار داریم) و t از سال ۲۰۱۰ تا ۲۰۱۶ دستخوش تغییر باشد.
با برآورد ضرایب مدل فوق می توان تک تک داده های خود را به فرم فوق نوشت.
در خصوص این عبارت سه حالت زیر را می توان متصور بود:
که حالت ها به قرار زیر است:
۱-۲- حالت ۱- مدل تجمیعی (پولد- Pooled)
اگر Zi فقط شامل یک جمله ثابت باشد که برای همه گروه ها یکسان است، در این صورت معادله به صورت زیر خواهد شد:

در این حالت، مدل تجمیعی یا پولد را داریم (ناهمگنی های مقاطع معنی دار نیستند و در مدل حضور ندارند).
در رگرسیون پولد این حقیقت که داده ها به صورت پانل هستند نادیده گرفته می شود و با داده ها همانند داده های مقطعی برخورد می گردد. یعنی در این حالت بدون توجه به مقاطع (شرکتها) و تفاوت های بین آنها، داده ها را مورد تجزیه و تحلیل قرار می دهیم. و تفاوت بین مقاطع را در نظر نمی گیریم.
در این حالت رگرسیون، عرض از مبدا مشترک (آلفای مشترک) برای تمام مقاطع (تمام شرکتها یا تمام کشورها) در نظر گرفته می شود.
۲-۲- حالت ۲- مدل با اثرات ثابت (fixed effect)
اگر در مدل بین مقاطع مختلف تفاوت معنی دار وجود داشته باشد، و Zi با Xi (متغیرهای مستقل در سمت راست مدل) همبستگی داشته باشد، در این صورت برای هر گروه یک عرض از مبدأ ( ai) خواهیم داشت که معادله آن عبارتست از:

در اینجا ai=aZi است که تمام اثرات قابل مشاهده را در بر دارد و بیانگر یک میانگین شرطی قابل تخمین می باشد. در این رویکرد که به آن مدل با «اثرات ثابت» می گوییم به هر گروه یک مقدار ثابت مانند ai اختصاص داده می شود.
در مدل با اثرات ثابت فرض می شود که تفاوت های مقاطع را می توان در جمله ثابت (عرض از مبدا) منعکس نمود. هر ai یک ضریب مجهول است بایستی برآورد گردد.
توجه نمایید که اصطلاح «ثابت» بدان معنا است که «در طول زمان تغییر نمی کند»، اما از یک مقطع (شرکت) به مقطع دیگر دچار تغییر می شود. همچنین توجه شود که در این حالت Corr ( ai , Xi) ≠ ۰ برقرار است.
از آنجایی که مدل فوق را با استفاده از متغیرهای مجازی می توان بازنویسی کرد و سپس روش OLS برای برآورد ضرایب آن به کار می رود، لذا آن را روش حداقل مربعات متغیرهای مجازی (LSDV) نیز می گویند.
۳-۲- حالت ۳- مدل با اثرات تصادفی (random effect)
اگر ناهمگنی های مقاطع (شرکتها) قابل تفکیک به ازای هر مقطع نباشند، و این ناهمگنی ها و تاثیرات مقاطع با متغیرهای مستقل مدل (متغیرهای سمت راست مدل) همبستگی نداشته باشند، به عبارت دیگر اگر نتوانیم ارتباطی بین این تاثیرات و هر یک از متغیرهای مستقل پیدا کنیم و ناچارا بپذیریم که این تفاوت های بین مقاطع ناشی از عوامل تصادفی است، آنگاه
را می توان ناشی از عوامل تصادفی فرض نمود که مستقل از Xit است.
برای هر متغیر تصادفی می توان رابطه زیر را نوشت:

رابطه فوق نشان می دهد که
از دو جزء تشکیل شده است: یکی جزء مورد انتظار که فرض می کنیم برای همه مقاطع یکسان است و عوامل تصادفی در آن نقشی ندارند و لذا آن را به صورت
می نویسیم. دیگری جزء تصادفی است که به خاطر وجود عوامل تصادفی، در اطراف a نوسان می کند که آن را با ui نشان می دهیم. در واقع ui برابر با
است. بدین ترتیب معادله زیر را خواهیم داشت:

در مدل با اثرات تصادفی، تصریح می شود که ui عنصر تصادفی مختص هر گروه است.
توجه شود که در این حالت Corr ( i , Xi) = ۰ برقرار است. در اینجا خصوصیات مقاطع، ارتباطی با متغیرهای توضیحی ندارند، زیرا تصادفی هستند. مثلا در بررسی خصوصیات شرکتها به این نتیجه می رسیم که با هم دارای تفاوت های قابل توجهی هستند ولی این تفاوت ها به صورت تصادفی به وجود آمده است {ارتباطی با متغیرهای مستقل ندارند}، زیرا عوامل بسیار زیادی در ایجاد آنها نقش داشته اند و برای ما قابل تشخیص نیستند.
۳- مدل مورد بررسی در این آموزش
همانطور که در درسها و گامهای قبلی اعلام شد، مدل ما در این مثال آموزشی به قرار زیر است:

و در این آموزش قصد داریم به صورت عملی تشخیص دهیم که مدل ما می بایست کدام یک از سه نوع مدل زیر باشد:
- مدل تجمیعی (پولد)
- مدل با اثرات ثابت
- مدل با اثرات تصادفی
۴- آزمون اف لیمر: رگرسیون تجمیعی (پولد- pooled) یا مدل دارای اثرات (پانل)
برخی به اشتباه آزمون اف لیمر را آزمونی برای تعیین رگرسیون پولد در برابر رگرسیون با مدل اثرات ثابت تصور می کنند. در حالی که اینگونه نیست و در آن مدل تجمیعی (پولد) در برابر مدل پانل یا مدل با اثرات (بدون اطلاع از اینکه اثرات ثابت یا تصادفی است) آزمون می شود.
برای انجام این آزمون که به آن آزمون چاو نیز می گویند، H۰ و H۱ به صورت زیر بیان میشود.
H۰: عرض از مبدأ تمام مقاطع یکسان است.
H۱: حداقل یک مقطع عرض از مبدأ متفاوت دارد.
و یا به صورت زیر:

برای انجام این آزمون به شیوه ذکر شده در ویدئوی آموزشی اقدام می شود.
در این آزمون فرضیه H0 یعنی یکسان بودن عرض از مبداءها در مقابل فرضیه H1 یعنی ناهمسانی عرض از مبداءها قرار میگیرد. در صورتی که فرضیه H0 پذیرفته شود به معنی یکسان بودن شیبها برای مقاطع مختلف بوده و قابلیت ترکیب شدن دادهها و استفاده از مدل رگرسیون ترکیب شده مورد تأیید آماری قرار میگیرد و فرضیههای پژوهش با استفاده از روش دادههای ترکیب شده مورد آزمون قرار خواهد گرفت. اما در صورت رد فرضیه H0 روش دادههای پانل پذیرفته میشود و فرضیههای پژوهش با استفاده از روش دادههای پانل آزمون میشود.
چنانچه مدل به صورت تجمیعی بود که هیچ، کار تمام است و به آزمون هاسمن نیاز نیست. اما اگر مدل به صورت پانل بود، برای تشخیص مدل با اثرات ثابت یا تصادفی نیاز به آزمون هاسمن است.
در این ویدئوی آموزشی به صورت عملیاتی و با مثال واقعی این آزمون به اجرا گذاشته و تحلیل شده است.
۵- آزمون هاسمن: مدل با اثرات ثابت (LSDV) یا تصادفی
در صورتی که بر اساس نتایج آزمون چاو برای هر یک از فرضیه ها، استفاده از روش دادههای پانل مورد تأیید واقع شود، به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) برای برآورد مناسبتر میباشد (تشخیص ثابت یا تصادفی بودن تفاوتهای واحدهای مقطعی) از آزمون هاسمن استفاده میشود.
آزمون هاسمن بر پایه وجود یا عدم وجود ارتباط بین خطای رگرسیون تخمین زده شده و متغیرهای مستقل مدل استوار است. اگر چنین ارتباطی وجود داشته باشد، مدل اثر ثابت و اگر این ارتباط وجود نداشته باشد، مدل اثر تصادفی کاربرد خواهد داشت. فرضیه H۰ نشان دهنده عدم ارتباط بین متغیرهای مستقل و خطای تخمین و فرضیهH۱ نشان دهنده وجود ارتباط است.
به عبارت دیگر، قاعده تصمیم گیری آماری به قرار زیر است:
H0: بین اثرات فردی (مقاطع) و متغیرهای توضیحی همبستگی وجود ندارد = مدل اثرات تصادفی
H1: بین اثرات فردی (مقاطع) و متغیرهای توضیحی همبستگی وجود دارد = مدل اثرات ثابت
بنابراین رد فرض H0 (کمتر از ۰.۰۵ بودن مقدار احتمال) به معنای وجود مدل با اثرات ثابت است.
در این ویدئوی آموزشی به صورت عملیاتی و با مثال واقعی این آزمون به اجرا گذاشته و تحلیل شده است.
۶- تشریح گزینه های قسمت Weights در Panel Option
در قسمت Weights در بخش پایینی جعبه اجرای مدل رگرسیون پانل در برگه Panel Option می توان وزن های مورد نظر برای روش GLS را انتخاب نمود. در خصوص چیستی روش GLS بیان می کنیم که در این روش داده ها تبدیل زده شده و به آنها وزن داده می شود. این روش در زمانی به کار می رود که ناهمسانی واریانس وجود داشته باشد.
به عنوان مثال اگر گزینه Cross-section weights را انتخاب کنیم، ایویوز از روش GLS با این فرض استفاده می کند که ناهمسانی واریانس متعلق به مقاطع است.
اگر Cross-section SUR انتخاب شود، ایویوز از روش GLS ای استفاده می کند که ناهمسانی واریانس را با توجه به همبستگی بین جملات خطای معادلات در بین مقاطع، تخمین می زند. همچنین با انتخاب Period weights امکان ناهمسانی واریانس را در طول زمان، در نظر می گیرد. گزینه Period SUR نیز ناهمسانی واریانس را با توجه به همبستگی بین مشاهدات در داخل هر گروه منظور می کند.
۷- اثرات ثابت و تصادفی ی زمانی
توجه شود که تا اینجای کار همواره صحبت از اثرات ثابت و تصادفی مقاطع (شرکتها) مطرح بود و در خصوص زمان و اثرات مختلف آن صحبتی به میان نیامد. البته در ۹۵ درصد موارد تا حد فوق در پایان نامه ها از شما انتظار دارند، و عملا بسیار به ندرت دیده ام که مدل با اثرات ثابت یا تصادفی زمانی به نتیجه برسد.
اما بهرحال برای اینکه گرای لازم برای بررسی های بیشتر به شما داده شود، لازم است بدانید که همانند آنچه که برای مقاطع و یا شرکتها مطرح کردیم، برای زمان (سالها) نیز قابل طرح است.
این حالت حتی به اثرات همزمان بر روی مقاطع و زمان نیز قابل تعمیم است. مدل در حالت اثرات ثابت مقاطع و اثرات ثابت زمانی به صورت زیر است:

که در این ویدئو این وضعیت را بر روی مدل خود در نرم افزار ایویوز تشریح می کنیم.
قاسم زاده –
سلام. فکر نکنم از این فصیح تر فردی بتوانه بیان کنه مدل پول را