- مقدمه:

یکی از کتاب های بسیار مفید و برای دانشجویانی که مشغول تحصیل در مقاطع تحصیلی تکمیلی (کارشناسی ارشد و دکتری) میتواند کمکی بزرگ باشد، کتاب "یک راهنمای عملی استفاده از اقتصادسنجی" تالیف ای اچ استیودنمند و ترجمه جناب آقای دکتر حیدر ربیعی است. خیلی از دانشجویان و یا حتی شاغلان در بخش های اقتصادی به جهت تجزیه و تحلیل های بسیاری از موضوعات و انجام پایان نامه ها و همچنین رساله های دکتری به شناخت موضوع مهم رگرسیون نیاز دارند. در این نوشته ما دانشجویان استاد دکتر حیدر ربیعی تلاش خود را برای معرفی یک کتاب کاربردی گذاشتیم تا به سایر دانشجویان کمک کرده باشیم. در ادامه به معرفی مطالب کتاب پرداخته خواهد شد.


- اهداء کتاب

بسم الله الرحمن الرحیم

اللهم صل علی محمد و آل محمد

تقدیم می­شود به:

ارواح مقدس پدرانم حضرت امیرالمومنین علیه السلام

و حضرت ابوالفضل العباس علیه­السلام؛

و حضرت صاحب العصر روحی و ارواح الخلق له الفداء.


- مشخصات کتاب

مشخصات ناشر کتاب : انتشارات پرتو واقعه،انتشارات لیلاز

نویسندگان: ا.اج.استیودنمند، بروس کی. جانسون

مترجم : دکتر حیدر ربیعی

نوبت چاپ : اول 1398

شابک 7-19-6245-622-978

آدرس فروش کتاب: تهران خیابان انقلاب بین خیابان قدس و وصال شیرازی کوچه اسکو پلاک 14 واحد 6.

تلفن :66414616-66128346


- پیش­گفتار کتاب

اقتصادسنجی، به معنای اندازه­ گیری و تحلیل کمّی پدیده­ های واقعی اقتصادی و کسب و کار است و کاربردهای اقتصادسنجی بیشتر در سه دسته توصیف واقعیت­ های اقتصادی، آزمون فرضیه­ ها در مورد نظریه ­ها و سیاست ­های اقتصادی، پیش­بینی فعالیت­ های اقتصادی آینده قرار می­گیرند. رویکردهای مختلفی برای کمّی­ سازی اقتصادسنجی وجود دارند، اما این کتاب در بر رویکرد تحلیل رگرسیون خطی تک معادله تمرکز دارد. بنابراین بیشتر این کتاب به تحلیل رگرسیون می­پردازد، اما خواننده باید بداند که رگرسیون تنها یکی از رویکردهای کمّی ­سازی اقتصادسنجی و پرکاربردترین آنهاست.

در پیشگفتار مولف در کتاب اصلی آمده: «‌یک رویکرد نوآورانه برای شناخت اقتصادسنجی، به کارگیری آن است. این کتاب موضوع تحلیل رگرسیون خطی تک معادله را در قالبی ساده و قابل درک مبتنی بر مثال­ های دنیای واقعی پوشش می­دهد. همانطور که «یک راهنمای عملی» زیر عنوان کتاب نشان می­دهد، جامعه هدف این کتاب نه تنها دانشجویان مبتدی اقتصادسنجی می­باشد بلکه آن دسته از کاربران رگرسیون است که به دنبال یک مرجع مناسب هستند.»

کتاب حاضر ترجمه ویرایش هفتم از کتاب اصلی است که در این ویرایش آزمایشگاه اقتصادسنجی، آزمون­ های اقتصادسنجی توسعه یافته مانند بروش-پاگان و غیره اضافه شده است. در این ترجمه به دلیل تمرکز بر مباحث نظری و با توجه به اینکه در سرتاسر متن مثال­ های کاربردی فراوان برای درک مطلب وجود دارد، دیگر آزمایشگاه ­های اقتصادسنجی که به صورت تمرین در انت های هر فصل در متن اصلی ارائه شده­، ترجمه نشده ­اند. در صورت استقبال از این ترجمه و درخواست خوانندگان در فرصت بعدی، این بخش­ نیز ان­شاءالله به کتاب افزوده خواهد شد.

اینجانب در تحقیقات علمی تکنیک رگرسیون را به دفعات استفاده کرده­ ام و کتاب حاضر، مرجع عمده (زبان انگلیسی) من برای فراگیری و به کارگیری اقتصادسنجی و رگرسیون بوده و از میان کتاب­ های در دسترس انگلیسی زبان، آن را به دلیل متنی روال و مثال­ های کاربردی متعدد، بسیار مفیدتر دیدم. به همین دلیل تصمیم گرفتم تا برای دانشجویان فارسی زبان عزیز که درک مطلب انگلیسی برایشان دشوار است، آن را ترجمه کنم. امیدوارم که تلاشم مفید واقع شود.

خوشحال و ممنون می­شوم نظرات و پیشنهادهای خود را به اطلاع من برسانید.

و من ا... توفیق

دکتر حیدر ربیعی


- خلاصه فصول

خلاصه فصل اول کتاب (مروری بر تحلیل رگرسیون)

1- اقتصادسنجی (در ادبیات، «اندازه­گیری اقتصاد») شاخ ه­ای از اقتصاد است که تلاش می­کند روابط نظری را کمّی کند. تحلیل رگرسیون تنها یکی از روش­ های مورد استفاده در اقتصادسنجی اما پرکاربردترین آنها تاکنون است.

2- کاربردهای اصلی اقتصادسنجی توصیف،‌ آزمون فرضیه و پیش­بینی هستند. به کارگیری هر روش خاص به کاربرد تحقیق بستگی دارد.

3- تحلیل رگرسیون مشخص می­کند که یک متغیر وابسته، تابعی از یک یا چند متغیر مستقل است، اما تحلیل رگرسیون نمی­تواند روابط علت و معلولی را اثبات یا ایجاب کند.

4- برای تغییرات متغیر وابسته که به طور کامل با متغیرهای مستقل توضیح داده نمی ­شوند، باید یک عبارت خطای تصادفی به همه معادلات رگرسیون اضافه شود. اجزای این عبارت خطا عبارتند از:

الف- متغیرهای حذف یا کنارگذاشته شده

ب-خطاهای اندازه­ گیری در داده­ ها

پ- معادله نظری که شکل تابعی متفاوتی از معادله رگرسیون دارد

ت-رخدادهای پیش­بینی نشده و کاملا تصادفی

5- یک معادله رگرسیون برآورد شده تقریبی از معادله حقیقی با استفاده از داده­ های نمونه از X و Yهای واقعی است. از آنجاکه هرگز نمی­توان معادله حقیقی را شناخت، در تحلیل اقتصادسنجی به معادله رگرسیون برآورد شده تمرکز کرده و ضرایب رگرسیون را برآورد می­کنند. تفاوت بین یک مشاهده خاص متغیر وابسته و مقدار برآوردشده آن از معادله رگرسیون، باقی­مانده نامیده می­شود.

خلاصه فصل دوم کتاب (حد اقل مربعات معمولی)

1- حداقل مربعات معمولی (OLS) پرکاربردترین روش برآورد ضرایب رگرسیون از یک مجموعه داده­هاست. OLS ، β هایی را انتخاب می­کند که مجموع مربعات باقیمانده ­ها (ei2) برای نمونه ­ای خاص را کمینه کنند.

2- R2 ، درصد تغییرات Y حول میانگین آن که بوسیله معادله رگرسیون خاصی توضیح داد شده و برای درجه آزادی تعدیل شده را اندازه می­گیرد. وقتی که یک متغیر جدید به معادله اضافه می­شود، R2 تنها درصورتی افزایش می­یابد که بهبودی که در برازش رخ میدهد، بر کاهش درجه آزادی برازش که در تخمین ضریب متغیر جدید استفاده می­شود، برتری داشته باشد. در نتیجه، بیشتر محققان به طور خودکار برای ارزیابی برازش معادلات رگرسیون برآوردشده از R2 استفاده می­کنند.

3- همیشه به خاطر داشته باشید که برازش یک معادله برآورد شده، تنها یکی از معیارهای کیفیت کلی رگرسیون است. تعدادی از معیارهای دیگر، مثل درجه انطباق ضرایب برآورد شده با نظریه اقتصادی و انتظارات (که محقق قبل از جمع­ آوری داده­ ها آن را فرض می­کند) بسیار مهم­تر از اندازه R2 هستند.

خلاصه فصل سوم کتاب (روش استفاده از تحلیل رگرسیون)

1- شش گامی که به طور معمول در تجزیه و تحلیل رگرسیون کاربردی یک متغیر وابسته مفروض طی می­شوند، عبارتند از:

الف- مرور ادبیات و توسعه مدل نظری؛

ب- تعیین مدل: انتخاب متغیرهای مستقل و شکل تابعی؛

پ- فرض کردن علائم مورد انتظار ضرایب؛

ت- جمع­ آوری داده­ ها: بازبینی و پاک­سازی داده ­ها؛

ث- برآورد و ارزیابی معادله؛

ج- نتایج را مستند کنید.

2- یک متغیر موهومی بسته به تحقق یک شرط، فقط مقدار 1 یا 0 می­گیرد. به عنوان مثال متغیر موهومی X اگر یک فرد خاص زن باشد، مقدار 1 و اگر آن شخص مرد باشد، مقدار صفر می­گیرد.

خلاصه فصل چهارم کتاب (مدل کلاسیک)

1- هفت فرضیه کلاسیک، بیان می­کنند که مدل رگرسیونی که خطی باشد با یک عبارت خطای دارای میانگین صفر، بدون همبستگی با متغیرهای توضیحی و مشاهدات دیگر عبارت خطا، دارای یک واریانس ثابت است و توزیع نرمال دارد (اختیاری). علاوه بر این، متغیرهای توضیحی نباید توابع خطی کامل از یکدیگر باشند.

2-دو تا از مهم­ترین ویژگی­ های یک تخمین­ زن، بدون تورش بودن و داشتن حداقل واریانس است. زمانی یک تخمین ­زن بدون تورش است که امید ریاضی ضریب برآورد شده برابر با مقدار واقعی باشد. حداقل واریانس زمانی اتفاق می­افتد که توزیع برآورد شده دارای کوچکترین واریانس از میان تمام تخمین­ زن­ ها در یک کلاس تخمین­ زن (مثلا تخمین­ زن­ های بدون تورش) باشد.

3- با توجه به فرضیه ­های کلاسیک، می­توان نشان داد که OLS، تخمین­ زنی با حداقل واریانس، خطی و بدون تورش (یا BLUE یعنی بهترین تخمین­ زن خطی بدون تورش) ضرایب رگرسیون است. این قضیه گاوس-مارکوف است. هنگامی که یک یا چند ویژگی کلاسیک (به استثناء نرمال بودن) برقرار نباشد، OLS دیگر BLUE نیست، هرچند ممکن است در بعضی موارد، OLS برآوردهای بهتری از سایر روش­ های برآورد بحث شده در فصل­ های بعدی ارائه دهد.

4- از آنجا که توزیع نمون ه­ای تخمین ­زن OLS از βk ، BLUE است، دارای ویژگی­ های مطلوبی است. علاوه بر این، با افزایش تعداد مشاهدات، واریانس یا معیار پراکندگی توزیع نمونه ­ای βk کاهش می­یابد.

5- نمادهای استانداردی در ادبیات اقتصادسنجی استفاده می­شود. جدول 4-1 نمادهای قراردادی مورد استفاده در تجزیه و تحلیل رگرسیون را نشان می­دهد. مبتدیان باید هر از گاهی این جدول را مرور کنند.

خلاصه فصل پنجم کتاب (آزمون فرض و استنتاج آماری)

1- آزمون فرض، استنتاج در مورد اعتبار نظریه­ های اقتصادی (یا سایر) خاص از نمونه ­ای از جامعه است که برای آن نظریه ­ها درست فرض می­شوند. چهار گام اساسی آزمون فرض (به عنوان مثال با استفاده از آزمون t) عبارتند از:

الف. تنظیم فرضیه ­های صفر و جایگزین؛

ب. انتخاب یک سطح معنادار و سپس یک مقدار t بحرانی؛

پ. اجرای رگرسیون و به دست آوردن مقادیر t؛

ت. اعمال قاعده تصمیم با مقایسه مقدار t محاسبه شده با مقدار t بحرانی و رد کردن یا نکردن فرض صفر.

2- فرضیه صفر، دامنه ­ای از مقادیری را نشان می­دهد که انتظار می­رود اگر نظریه محقق درست نباشد، ضریب رگرسیون آن مقادیر را اخذ کند. فرضیه جایگزین عبارت از دامنه ­ای از مقادیر است که اگر نظریه محقق درست باشد، انتظار می­رود ضریب رگرسیون آن­ها را اخذ کند.

3- دو نوع خطا در چنین آزمون­ های فرضی رخ می­دهد که عبارتند از:

نوع 1: رد فرض صفر درست

نوع 2: رد نکردن فرض صفر نادرست

4- آزمون t، فرضیه ­های مربوط به ضرایب فردی معادلات رگرسیون را آزمون می­کند. شکل آماره t به صورت زیر است:

tk=βk-βH0SEβk k=1,2,…,K

در بسیاری از کاربردهای رگرسیون، βH0 صفر است. همین­که مقدار t را محاسبه کرده و یک مقدار t بحرانی را انتخاب کردید، اگر قدر مطلق t بیشتر از مقدار t بحرانی باشد، و اگر مقدار t دارای علامت نشان داده شده در فرض جایگزین باشد، فرض صفر را رد کنید.

5- استفاده از آزمون t به دلایل مختلف آسان است، اما هنگام استفاده از آزمون t باید مراقب بود تا معناداری آماری با اعتبار نظری یا شواهد تجربی، اشتباه گرفته نشود.

6- آزمون F، یک آزمون فرض رسمی است که برای آزمون فرض صفری که حاوی فرضیه­ های چندگانه یا یک فرضیه واحد در مورد یک گروه از ضرایب است، طراحی شده است. معمول­ترین استفاده از آزمون F ، آزمودن معناداری سراسری یک معادله برآورد شده است.

خلاصه فصل ششم کتاب (انتخاب متغیرهای مستقل)

1- حذف یک متغیر از معادله، موجب تورش در برآورد سایر ضرایب خواهد شد، به حدی که متغیر حذف شده با متغیرهای داخل شده هم­بستگی دارد.

2- تورش مورد انتظار از حذف یک متغیر از یک معادله، برابر با ضریب متغیر خارج­شده ضربدر تابعی از ضریب هم­بستگی ساده بین متغیر خارج­شده و متغیر داخل شده در مسئله است.

3- داخل کردن یک متغیر در یک معادله که در واقع با آن بی­ارتباط است باعث ایجاد تورش نمی­شود، اما معمولا واریانس ضرایب برآورد شده متغیرهای داخل شده را افزایش می­دهد، بنابراین مقادیر t آنها را کاهش داده، فواصل اطمینان آنها را افزایش داده و R2 را کاهش می­دهد.

4- چهار معیار مفید برای وارد­کردن یک متغیر در معادله عبارتند از:

الف. نظریه

ب. آزمون t

پ. R2

ت. تورش

5- نظریه، و نه برازش آماری، باید مهمترین معیار برای ورود یک متغیر در یک معادله رگرسیون باشد. در غیر این صورت، ریسک ایجاد نتایج نادرست و یا غیرقابل باور وجود دارد.

خلاصه فصل هفتم کتاب (انتخاب یک شکل تابعی)

1- عبارت ثابت را حذف نکنید. از سوی دیگر، به برآوردهای عبارت ثابت برای استنتاج، حتی اگر از لحاظ آماری معنادار به نظر میرسد، تکیه نکنید.

2- انتخاب یک شکل تابعی باید بر اساس نظریه اقتصادی پایه­ ای باشد تا آنجا که نظریه، شکلی شبیه یک شکل تابعی خاص ارائه دهد. باید از یک شکل تابعی با متغیرهای خطی استفاده کرد، مگر اینکه یک فرضیه خاص خلاف آن را نشان دهد.

3- اشکال تابعی دارای متغیرهای غیرخطی شامل لگاریتمی دوگانه، نیمه لگاریتمی و چند جمله­ ای هستند. به ویژه اگر انتظار کشش ثابت داشته باشیم، فرم لگاریتمی دوگانه مفید است. مزیت شکل نیمه لگاریتمی آن است که اثر یک متغیر مستقل با افزایش آن، کاهش بیشتری دارد. اگر انتظار داشته باشیم که شیب­ها، علامت را بسته به سطح یک متغیر مستقل تغییر دهند، شکل چند­ جمله­ ای مفید خواهد بود.

4- شیب موهومی، یک متغیر موهومی ضربدر یک متغیر مستقل است تا شیب رابطه بین متغیر وابسته و متغیر مستقل خاص، بسته به تحقق یک شرایط خاص تغییر کند.

5- استفاده از شکل­ های تابعی غیرخطی تعدادی مشکل بالقوه دارد. به طور خاص، مقایسه R2 ها درصورتی که Y تبدیل شده باشد، بسیار دشوار است و اگر با استفاده از یک شکل تابعی نادرست در خارج از دامنه نمونه، برای پیش­بینی مورد استفاده قرار گیرد، باقی­مانده­ ها، بالقوه بزرگ خواهند بود.

خلاصه فصل هشتم کتاب (هم خطی چندگانه)

­1- هم­خطی چندگانه کامل، نقض این فرض است که هیچ متغیر توضیحی یک تابع خطی کامل از سایر متغیرهای توضیحی نیست. همخطی چندگانه کامل، منجر به برآوردهای نامعین ضرایب رگرسیون و خطاهای استاندارد بی ­نهایت از آن برآوردها می­شود، که برآورد OLS را غیرممکن می­کند.

2- هم­خطی چندگانه ناقص که معمولا به صورت «هم­خطی چندگانه» استفاده می­شود، یک رابطه خطی بین دو یا چند متغیر مستقل و به اندازه­ کافی قوی است که به طور معناداری بر برآورد معادله تاثیر می­گذارد. هم­خطی چندگانه پدیده نمونه ­ای و همچنین نظری است. نمونه ­های مختلف، می­توانند درجات مختلفی از هم­خطی چندگانه نشان دهند.

3- پیامد اصلی هم­خطی چندگانه شدید، افزایش واریانس ضرایب رگرسیون برآورد شده و درنتیجه کاهش معیارهای t محاسبه شده این ضرایب و گسترش فواصل اطمینان است. هم­خطی چندگانه، موجب تورش در ضرایب برآوردشده نمی ­شود و تاثیر کمی بر معناداری کلی رگرسیون یا برآورد ضرایب هر متغیر توضیحی غیر­هم­خط دارد.

4- از آنجاییکه هم­خطی چندگانه تا درجاتی، تقریبا در هر مجموعه داده وجود دارد، سوالی که در کشف آن پرسیده می­شود این است که شدت هم­خطی چندگانه در یک نمونه خاص چقدر است.

5- دو روش مفید برای تشخیص هم­خطی چندگانه شدید عبارتند از:

الف. آیا ضریب همبستگی ساده بین متغیرهای توضیحی بالاست؟

ب. آیا عامل تورم واریانس بالاست؟
اگر هر کدام از این پاسخ ­ها بله باشد، هم­خطی چندگانه قطعا وجود دارد؛ هرچند اگر پاسخ منفی باشد، باز هم می­تواند وجود داشته باشد.

6-سه روش رایج برای اصلاح هم­خطی چندگانه وجود دارد:

الف. هیچ کاری انجام ندهید (و بنابراین از تورش مشخصات اجتناب کنید).

ب. یک متغیر زائد را حذف کنید. ج. حجم نمونه را افزایش دهید.

7- اغلب، انجام ندادن هیچ اقدامی، بهترین راه­حل برای اصلاح هم­خطی چندگانه است. اگر هم­خطی چندگانه، معیارهای t را تا حد معنادار نبودن کاهش ندهد، تا زمانیکه متغیرها از لحاظ نظری قوی هستند، هیچ راه­ حلی نباید در نظر گرفت. حتی اگر معیارهای t معنادار نباشد، باید اقدامات اصلاحی با احتیاط انجام شود، زیرا هزینه برآورد ممکن است بیشتر از مزیت رفع هم­خطی چندگانه از معادله باشد.

خلاصه فصل نهم کتاب (هم بستگی سریالی)

1- هم­بستگی سریالی یا خودهم­بستگی، نقض فرضیه کلاسیک 4 است که می­گوید مشاهدات عبارت خطا با یکدیگر هم­بستگی ندارند. معمولا اقتصادسنجان بر هم­بستگی سریالی مرتبه اول تمرکز می­کنند که در آن، مشاهده فعلی عبارت خطا،‌ تابعی از مشاهده پیشین آن و یک عبارت خطای فاقد همبستگی سریالی (u) در نظر گرفته می­شود:

ϵt=ρϵt-1+ut -1

که در آن ρ یا «رو»، ضریب خودهم­بستگی است.

2- هم­بستگی سریالی خالص، تابعی از عبارت خطای معادله رگرسیونی با مشخصات درست است. هم­بستگی سریالی ناخالص، ناشی از اشتباهات مشخصات مانند یک متغیر حذف شده یا یک شکل تابعی نادرست است. هم­بستگی سریالی ناخالص مثبت (0ρ ) یا منفی (-1ρ ) است، اما هم­بستگی سریالی خالص در شرایط اقتصادی و یا کسب و کار تقریبا همیشه مثبت است.

3- پیامد اصلی هم­بستگی سریالی، تورش در SE(β) های OLS است و باعث آزمون فرض نامطمئن می­شود. هم­بستگی سریالی خالص در برآورد β ها سبب ایجاد تورش نمی­شود.

4- یک روش متداول برای شناسایی هم­بستگی سریالی مرتبه اول، آزمون دوربین-واتسون است، که با استفاده از باقی­ مانده­ های یک رگرسیون برآوردشده، احتمال هم­بستگی سریالی در عبارت خطا را آزمون می­کند. یک جایگزین مرجّح آن هم، آزمون تکرارشونده مضرب لاگرانژ (LM) است، که خیلی معمول­تر از آزمون دوربین-واتسون می­باشد.

5- اولین مرحله برای رهایی یک معادله از هم­بستگی سریالی، بررسی احتمال خطاهای مشخصات است. بعد از اینکه احتمال هم­بستگی سریالی ناخالص به حداقل رسید،‌ باید اقدامات اصلاحی برای هم­بستگی سریالی خالص درنظر گرفته شود.

6-حداقل مربعات تعمیم ­یافته (GLS) روشی برای تبدیل یک معادله به منظور رهایی از هم­بستگی سریالی خالص مرتبه اول است. استفاده از GLS نیاز به برآورد ρ دارد.

7-خطاهای استاندارد نیووی-وست یک روش جایگزین اصلاحی برای هم­بستگی سریالی است که برآوردهای OLS برای SE(β) ها را با توجه به هم­بستگی سریالی و بدون تغییر β ها تعدیل می­کند.

خلاصه فصل دهم کتاب (ناهمسانی واریانس)

1- ناهمسانی واریانس نقض فرض کلاسیک 5 است که می­گوید مشاهدات عبارت خطا از یک توزیع با واریانس ثابت به دست آمده است. مشاهدات عبارت خطای دارای همسانی واریانس از یک توزیع با واریانس ثابت برای تمام مشاهدات هستند و مشاهدات عبارت خطای دارای ناهسانی واریانس از توزیع ­هایی با واریانس ­هایی هستند که از مشاهده به مشاهده دیگر متفاوت است. ناهمسانی واریانس اغلب در مجموعه داده ­های مقطعی رخ می­دهد.

2- واریانس یک عبارت خطای دارای ناهمسانی واریانس، برابر با σ2 ، یک ثابت نیست. در عوض، برابر با σi2 است و اندیس i نشان می­دهد که واریانس می­تواند در هر مشاهده تغییر کند. بسیاری از انواع ناهمسانی واریانس امکان­پذیر است، اما مدلی رایج است که در آن واریانس به طور سیستماتیک به صورت تابعی از یک متغیر دیگر، یک عامل تناسب Z تغییر می­کند:

VARϵi=σ2Zi

عامل تناسبZ معمولا متغیری مربوط به اندازه و دقت متغیر وابسته است.

3- ناهمسانی واریانس خالص، تابعی از عبارت خطای معادله رگرسیون با مشخصات درست است. ناهمسانی واریانس ناخالص ناشی از یک خطای مشخصات مانند یک متغیر حذف شده است.

4- نتیجه اصلی ناهمسانی واریانس در OLS SE(β) ها، تورش است که باعث آزمون فرض غیرقابل اتکا می­شود. ناهمسانی واریانس خالص باعث تورش در برآوردهای خود β ها نمی­شود.

5- دو آزمون معمول برای ناهمسانی واریانس، آزمون بروش-پاگان و آزمون وایت است. هر دو آزمون با تجزیه و تحلیل میزانی که مربع باقی­ مانده­ های معادله اصلی را می­توان با یک معادله کمکی توضیح داد، ناهمسانی واریانس را بررسی می­کنند.

6- اولین قدم برای اصلاح ناهمسانی واریانس این است که وجود یک خطای مشخصات که ممکن است سبب ایجاد ناهمسانی واریانس ناخالص شود را بررسی کنید. اگر مشخصات تاحد امکان خوب باشد، باید راه­حل ­هایی مانند خطاهای استاندارد HC یا تعریف مجدد متغیرها را در نظر گرفت.

خلاصه فصل یازدهم کتاب (اجرای یک پروژه رگرسیون)

1- اجرای پروژه رگرسیون، عبارت است از انتخاب متغیر وابسته، به کاربردن شش مرحله در رگرسیون کاربردی (فصل 3) برای آن متغیر وابسته و سپس نوشتن گزارش تحقیقی که خلاصه کار را شامل می­شود.

2- یک موضوع تحقیق عالی، آن است که شما اطلاعاتی در مورد آن داشته باشید؛ موضوعی است که به یک سوال یا گزینه اقتصادی یا رفتاری ذاتا جالب توجه اشاره کند؛ موضوعی است که هم برای متغیر وابسته و هم برای متغیرهای مستقل آن، داده ­ها در دسترس باشند.

3- دشواری و اهمیت جمع ­آوری داده­ های کامل و دقیق را دست کم نگیرید. این کار خیلی مهم و ارزشمندی است.

4- هنر اقتصادسنجی یافتن بهترین معادله ممکن در کمترین تعداد ممکن اجرای رگرسیون است. تنها راه این کار این است که قبل از اجرای اولین رگرسیون، زمان زیادی را صرف فکر کردن به اصول پایه پروژه تحقیقاتی خود کنید.

5- قبل از تکمیل پروژه تحقیقاتی خود، حتما نکات عملی، راهنما و چک لیست کاربری رگرسیون در بخش­های 4.11 و 6.11 را مرور کنید.

خلاصه فصل دوازدهم کتاب (مدل های سری زمانی)

1- یک مدل تعویقی توزیع شده، مقدار فعلی Y را به صورت تابعی از مقادیر فعلی و گذشته X بیان می­کند، بنابراین تاثیر X را بر تعدادی از دوره­ های زمانی تاخیر «توزیع» می­کند. برآورد OLS معادلات تعویقی توزیع شده بدون هیچگونه محدودیتی، با مشکلات هم­خطی چندگانه، درجات آزادی و یک الگوی غیرپیوسته از ضرایب برآورد شده در طول زمان مواجه می­شود.

2-با یک مدل پویا با فرض اینکه ضرایب متغیرهای مستقل تعویقی با افزایش تاخیر به صورت هندسی کاهش می­یابند، می­توان از این مشکلات اجتناب کرد. با این فرض، مدل پویا عبارت است از:

Yt=α0+β0Xt+λYt-1+ut

که در آن Yt-1 متغیر وابسته عقب مانده و 0λ1 است.

3- در نمونه ­های کوچک، برآوردهای OLS یک مدل پویا، تورش­دار هستند و ویژگی­ های آزمون فرض نامعتبر است. حتی در نمونه ­های بزرگ اگر عبارت خطا هم­بستگی سریالی داشته باشد،OLS ، برآوردهای تورش­داری از ضرایب مدل پویا تولید خواهد کرد.

4- در یک مدل پویا، آزمون دوربین واتسون به سمت 2 تورش دارد، بنابراین نباید استفاده شود. جایگزین متداول آن،‌ آزمون مضرب لاگرانژ است.

5- علیت یا تقدم گرنجر، شرایطی است که در آن یک متغیر سری­زمانی به طور پیش فرض و قابل پیش­بینی قبل از متغیر دیگر تغییر میکند. اگر یک متغیر مقدم بر دیگری باشد، باز هم نمی­توانیم مطمئن باشیم که متغیر اول باعث «تغییر» دومی شده است.

6- یک سری بی­ثبات، آن است که تغییرات معناداری (مثلا در میانگین و واریانس) در طول زمان داشته باشد. اگر متغیر وابسته و حداقل یک متغیر مستقل بی­ثبات یا رونددار باشند، رگرسیون ممکن است با همبستگی جعلی روبرو شود که در آن R2 و معیارهای t متورم هستند.

7- با استفاده از آزمون دیکی فولر، می­توان بی­ثباتی را تشخیص داد. اگر متغیرها ریشه ­های واحد داشته و بنابراین بی­ ثباتی باشند، همانباشتگی باقی­مانده­ های معادله باید با آزمون دیکی فولر بررسی شود. اگر متغیرها بی­ثبات اما هم­انباشته نباشند، معادله باید با دیفرانسیل ­های اول برآورد شود. اگر متغیرها بی ­ثبات و هم­انباشته باشند ، معادله را می­توان در واحد­های اصلی آن برآورد کرد.

خلاصه فصل سیزدهم کتاب (روشهای متغیر موهومی وابسته)

1- یک مدل احتمال خطی یک معادله با ضرایب خطی است که برای توضیح متغیر مستقل وابسته موهومی Di استفاده می­شود. Di یک تخمین احتمال Di=1 است.

2- برآورد مدل احتمال خطی با OLS حداقل با سه مشکل اصلی مواجه است:

الف. R2 معیار دقیقی برای برازش کلی نیست.

ب مقدار موردانتظار Di محدود به 0 و 1 نیست.

ج. عبارت خطا نه هسانی واریانس و نه توزیع نرمال دارد.

3- هنگام اندازه­گیری برازش کلی معادلات با متغیرهای وابسته موهومی، یک جایگزین برای R2 ، Rp2 ، درصد متوسط مشاهدات در نمونه است که یک معادله برآوردشده خاص به درستی آن را توضیح داده است.

4- لوجیت دوجمله ­ای یک روش برآورد معادلات با متغیرهای وابسته موهومی است که از یک نوع تابع لجستیک تجمعی استفاده میکند تا مشکل نامحدود بودن مدل احتمال خطی را از بین ببرد:

L:PrDi=1=lnPi1-Pi=β0+β1X1i+β2X2i

5- بهترین راه لوجیت دوجمله ­ای، استفاده از روش حداکثر درستنمایی(ML) و یک نمونه بزرگ است. ضریب شیب یک لوجیت، تاثیر یک واحد افزایش متغیر مستقل مورد نظر (با ثابت ماندن سایر متغیرهای توضیحی) را بر لگاریتم احتمال یک گزینه مفروض اندازه میگیرد.

6- مدل پروبیت دوتایی، یک روش برآورد معادلات با متغیرهای وابسته موهومی است که از تابع توزیع نرمال تجمعی استفاده می­کند. پروبیت دوتایی دارای ویژگی­ هایی بسیار شبیه به لوجیت دوجمله ­ای است.

خلاصه فصل چهاردهم کتاب (معادلات هم زمان)

1- اکثر مدل­ های اقتصادی و کسب و کار به دلیل علیت دوطرفه، حلقه ­های بازخورد یا تعیین توأم متغیرهای خاص، ماهیت هم­زمان دارند. این متغیرهای هم­زمان، درون­زا و متغیرهای غیرهم­زمان برون­زا نامیده میشوند.

2- یک معادله ساختارمند، نظریه پایه یک متغیر خاص را مشخص می­کند و این نوع معادل ه­ای است که ما در این کتاب استفاده کرده ­ایم. یک معادله به شکل کاهش یافته، یک متغیر درون­زای خاص را فقط با توجه به یک عبارت خطا و تمام متغیرهای پیش­معین (درون­زای تعویقی و برونزا) در یک سیستم هم­زمان بیان می­کند.

3- مدل ­های معادلات هم­زمان فرض کلاسیک 3 را نقض می­کنند که می­گوید عبارت خطا با متغیرهای توضیحی هم­بستگی ندارند. این به دلیل اثرات بازخورد متغیرهای درون­زا رخ می­دهد. به عنوان مثال یک مشاهده غیرمعمول زیاد از عبارت خطای یک معادله از طریق یک سیستم هم­زمان، در نهایت منجر به یک مقدار زیاد (با ضرایب مثبت) برای متغیرهای درونی می­شود که به صورت متغیر توضیحی در معادله مورد نظر ظاهر می­شوند و به این ترتیب فرض کلاسیک 3 نقض می­شود.

4- اگر OLS برای ضرایب یک سیستم هم­زمان استفاده شود، برآوردهای حاصل از آنها تورش­دار و ناسازگارند. دلیل اصلی آن، نقض فرض کلاسیک 3 است؛ نرم­افزار رگرسیونOLS ، تغییرات متغیر وابسته ناشی از عبارت خطا (که با متغیرهای توضیحی همبستگی دارند) را به متغیرهای توضیحی نسبت می­دهد.

5- حداقل مربعات دو مرحله­ ای، یک روش تخمین سیستم­ های معادلات هم­زمان است. این روش سیستمی، با استفاده از معادلات به شکل کاهش یافته در سیستم، جایگزین ­هایی برای متغیرهای درون­زا تولید می­کند که مستقل از عبارات خطا هستند. سپس، معادلات ساختارمند سیستم را با جایگزین ­های متغیرهای درون­زا که در آن به صورت متغیر توضیحی ظاهر می­شوند، برآورد می­کند.

6- برآوردهای کمترین مربعات دو مرحله ­ای، سازگار اما تورش­دارند. خوشبختانه، تورش موردانتظار ناشی از 2SLS معمولا کمتر از تورش موردانتظار ناشی از OLS است. اگر برازش معادلات به شکل کاهش یافته ضعیف باشد، 2SLS خوب عمل نخواهد کرد.

7- نمی­توان 2SLS را در معادله­ای که تشخیص داده نشده استفاده کرد. شرط لازم (اما نه کافی) برای تشخیص، شرط نظم است که الزام دارد تعداد متغیرهای پیش­معین در سیستم بزرگ­تر یا مساوی با تعداد ضرایب شیب در معادله موردنظر باشد. شرط کافی معمولا با توانایی 2SLS در برآورد ضرایب تعیین می­شود.

خلاصه فصل پانزدهم کتاب (پیش بینی)

1- پیش­بینی، تخمین مقدار مورد انتظار یک متغیر وابسته برای مشاهداتی است که جزء مجموعه داده­ های نمونه نیستند. پیش­بینی­ (از طریق رگرسیون) به وسیله برآورد معادله ­ای که متغیر وابسته آن باید پیش­بینی شود و جای­گذاری مقادیر برای هر یک از متغیرهای مستقل در معادله انجام می­شود.

2-برای یک معادله پیش­بینی، یک برازش عالی در دوره نمونه، تضمین نمی­کند که معادله در خارج از دوره نمونه به خوبی پیش­بینی شده باشد.

3-یک پیش­بینی که در آن تمام مقادیر متغیر مستقل با اطمینان شناخته می­شود، پیش­بینی غیرشرطی نامیده می­شود؛ اما اگر یک یا چند متغیر مستقل پیش­بینی شود، پیش­بینی شرطی است. پیش­بینی شرطی هیچ تورشی در پیش­بینیY ندارد (تا زمانی که پیش­بینی­های X بدون تورش باشند)، اما افزایش واریانس خطای پیش­بینی با پیش­بینی شرطی اجتناب­ناپذیر است.

4-اگر ضرایب یک معادله با GLS (برای اصلاح هم­بستگی سریالی مرتبه اول خالص) برآورد شود، آنگاه معادله پیش­بینی شده است:

YT+1=ρYT+β01-ρ+β1XT+1-ρXT

که ρ ضریب خودهم­بستگی است.

5-اغلب مفیدتر است که پیش­بینی با فاصله اطمینان همراه باشد، که محدوده­ای است که در آن، مقدار واقعی متغیر وابسته باید در درصد مشخصی مواقع (سطح اطمینان) در آن قرار گیرد و عبارت است از:

YT+1±SF.tc

که SF خطای استاندارد برآورد پیش­بینی و tc مقدار t بحرانی دوطرفه برای سطح اطمینان مورد نظر است.

6-ARIMA یک روش برازش منحنی خیلی بهبود یافته است که از مقادیر فعلی و گذشته متغیر وابسته (و تنها متغیر وابسته) برای تولید پیش­بینی­ های اغلب دقیق کوتاه­ مدت آن متغیر استفاده می­کند. اولین گام استفاده از ARIMA باثبات کردن سری­ های متغیر وابسته با گرفتن d دیفرانسیل اول تا زمانی است که متغیر تبدیل­ شده نتیجه، دارای میانگین و واریانس ثابت باشد. آنگاه ARIMAp,d,q ، یک فرآیند خود بازگشت (با عبارت θ1Yt-1 ) از مرتبه p را با یک فرایند میانگین متحرک (با عبارت φ1ϵt-1 ) از مرتبه q ترکیب کرده تا dامین دیفرانسیل متغیر وابسته را توضیح دهد.

خلاصه فصل شانزدهم کتاب (داده های پانل و تجربی)

1- آزمایش ­های تخصیص تصادفی، هنگامی که یک اثر علّی از درمان در دستاورد ایجاد می­کنند، استاندارد طلایی درنظر گرفته می­شوند. یک گروه درمان به طور تصادفی انتخاب شده، در معرض یک درمان خاص قرار می­گیرند. اما یک گروه کنترل درمان نمی­شوند و برای بررسی معنادار بودن تفاوت نتایج دو گروه، آزمون انجام می­شود. متاسفانه چنین آزمایش ­هایی در بسیاری از زمینه ­های اقتصادی امکانپذیر نیستند.

2- اگر رویدادی طبیعی (و یا تغییر سیاست) بتوان یافت که درمان تخصیص تصادفی را تقلید کند، می­توان از آزمایش ­های طبیعی برای ارائه شواهدی از علیت در اقتصاد استفاده کرد. اگر این رویدادها موجب شوند که میانگین دستاورد برای گروه درمان به طور قابل ملاحظه­ ای بیشتر از میانگین دستاورد گروه کنترل باشد، شواهدی وجود دارد که درمان یک عامل علّی در دستاورد است.

3- معادلات حاوی اطلاعات آزمایش­ های طبیعی را می­توان با مدل تفاوت در تفاوت ­ها، که تفاوت بین تغییر در گروه درمان و تغییر در گروه کنترل را مقایسه می­کند، برآورد کرد.

4- داده ­های پانل داده ­های سری زمانی و مقطعی را با استفاده از مشاهدات متغیرهای مشابه از یک نمونه مقطعی در دو یا چند دوره زمانی ترکیب می­کند. داده ­های پانل اغلب توسط پروژه­ های بزرگ و چند ساله تحقیقاتی تولید می­شوند و منابع مهمی برای تحلیل­ های اقتصادسنجی هستند.

5- معادلات مربوط به داده ­های پانل را می­توان با استفاده از مدل اثرات ثابت و یک روش پیشرفته، یعنی مدل اثرات تصادفی، برآورد کرد.


به امید اینکه کتاب " یک راهنمای عملی استفاده از اقتصادسنجی" برای همه دانشجویان و شاغلان در حرفه مالی و اقتصادی مفید واقع شود و مورد بهره برداری آن عزیزان و بزرگواران قرارگیرد.