- مقدمه:
یکی از کتاب های بسیار مفید و برای دانشجویانی که مشغول تحصیل در مقاطع تحصیلی تکمیلی (کارشناسی ارشد و دکتری) میتواند کمکی بزرگ باشد، کتاب "یک راهنمای عملی استفاده از اقتصادسنجی" تالیف ای اچ استیودنمند و ترجمه جناب آقای دکتر حیدر ربیعی است. خیلی از دانشجویان و یا حتی شاغلان در بخش های اقتصادی به جهت تجزیه و تحلیل های بسیاری از موضوعات و انجام پایان نامه ها و همچنین رساله های دکتری به شناخت موضوع مهم رگرسیون نیاز دارند. در این نوشته ما دانشجویان استاد دکتر حیدر ربیعی تلاش خود را برای معرفی یک کتاب کاربردی گذاشتیم تا به سایر دانشجویان کمک کرده باشیم. در ادامه به معرفی مطالب کتاب پرداخته خواهد شد.
- اهداء کتاب
بسم الله الرحمن الرحیم
اللهم صل علی محمد و آل محمد
تقدیم میشود به:
ارواح مقدس پدرانم حضرت امیرالمومنین علیه السلام
و حضرت ابوالفضل العباس علیهالسلام؛
و حضرت صاحب العصر روحی و ارواح الخلق له الفداء.
- مشخصات کتاب
مشخصات ناشر کتاب : انتشارات پرتو واقعه،انتشارات لیلاز
نویسندگان: ا.اج.استیودنمند، بروس کی. جانسون
مترجم : دکتر حیدر ربیعی
نوبت چاپ : اول 1398
شابک 7-19-6245-622-978
آدرس فروش کتاب: تهران خیابان انقلاب بین خیابان قدس و وصال شیرازی کوچه اسکو پلاک 14 واحد 6.
تلفن :66414616-66128346
- پیشگفتار کتاب
اقتصادسنجی، به معنای اندازه گیری و تحلیل کمّی پدیده های واقعی اقتصادی و کسب و کار است و کاربردهای اقتصادسنجی بیشتر در سه دسته توصیف واقعیت های اقتصادی، آزمون فرضیه ها در مورد نظریه ها و سیاست های اقتصادی، پیشبینی فعالیت های اقتصادی آینده قرار میگیرند. رویکردهای مختلفی برای کمّی سازی اقتصادسنجی وجود دارند، اما این کتاب در بر رویکرد تحلیل رگرسیون خطی تک معادله تمرکز دارد. بنابراین بیشتر این کتاب به تحلیل رگرسیون میپردازد، اما خواننده باید بداند که رگرسیون تنها یکی از رویکردهای کمّی سازی اقتصادسنجی و پرکاربردترین آنهاست.
در پیشگفتار مولف در کتاب اصلی آمده: «یک رویکرد نوآورانه برای شناخت اقتصادسنجی، به کارگیری آن است. این کتاب موضوع تحلیل رگرسیون خطی تک معادله را در قالبی ساده و قابل درک مبتنی بر مثال های دنیای واقعی پوشش میدهد. همانطور که «یک راهنمای عملی» زیر عنوان کتاب نشان میدهد، جامعه هدف این کتاب نه تنها دانشجویان مبتدی اقتصادسنجی میباشد بلکه آن دسته از کاربران رگرسیون است که به دنبال یک مرجع مناسب هستند.»
کتاب حاضر ترجمه ویرایش هفتم از کتاب اصلی است که در این ویرایش آزمایشگاه اقتصادسنجی، آزمون های اقتصادسنجی توسعه یافته مانند بروش-پاگان و غیره اضافه شده است. در این ترجمه به دلیل تمرکز بر مباحث نظری و با توجه به اینکه در سرتاسر متن مثال های کاربردی فراوان برای درک مطلب وجود دارد، دیگر آزمایشگاه های اقتصادسنجی که به صورت تمرین در انت های هر فصل در متن اصلی ارائه شده، ترجمه نشده اند. در صورت استقبال از این ترجمه و درخواست خوانندگان در فرصت بعدی، این بخش نیز انشاءالله به کتاب افزوده خواهد شد.
اینجانب در تحقیقات علمی تکنیک رگرسیون را به دفعات استفاده کرده ام و کتاب حاضر، مرجع عمده (زبان انگلیسی) من برای فراگیری و به کارگیری اقتصادسنجی و رگرسیون بوده و از میان کتاب های در دسترس انگلیسی زبان، آن را به دلیل متنی روال و مثال های کاربردی متعدد، بسیار مفیدتر دیدم. به همین دلیل تصمیم گرفتم تا برای دانشجویان فارسی زبان عزیز که درک مطلب انگلیسی برایشان دشوار است، آن را ترجمه کنم. امیدوارم که تلاشم مفید واقع شود.
خوشحال و ممنون میشوم نظرات و پیشنهادهای خود را به اطلاع من برسانید.
و من ا... توفیق
دکتر حیدر ربیعی
- خلاصه فصول
خلاصه فصل اول کتاب (مروری بر تحلیل رگرسیون)
1- اقتصادسنجی (در ادبیات، «اندازهگیری اقتصاد») شاخ های از اقتصاد است که تلاش میکند روابط نظری را کمّی کند. تحلیل رگرسیون تنها یکی از روش های مورد استفاده در اقتصادسنجی اما پرکاربردترین آنها تاکنون است.
2- کاربردهای اصلی اقتصادسنجی توصیف، آزمون فرضیه و پیشبینی هستند. به کارگیری هر روش خاص به کاربرد تحقیق بستگی دارد.
3- تحلیل رگرسیون مشخص میکند که یک متغیر وابسته، تابعی از یک یا چند متغیر مستقل است، اما تحلیل رگرسیون نمیتواند روابط علت و معلولی را اثبات یا ایجاب کند.
4- برای تغییرات متغیر وابسته که به طور کامل با متغیرهای مستقل توضیح داده نمی شوند، باید یک عبارت خطای تصادفی به همه معادلات رگرسیون اضافه شود. اجزای این عبارت خطا عبارتند از:
الف- متغیرهای حذف یا کنارگذاشته شده
ب-خطاهای اندازه گیری در داده ها
پ- معادله نظری که شکل تابعی متفاوتی از معادله رگرسیون دارد
ت-رخدادهای پیشبینی نشده و کاملا تصادفی
5- یک معادله رگرسیون برآورد شده تقریبی از معادله حقیقی با استفاده از داده های نمونه از X و Yهای واقعی است. از آنجاکه هرگز نمیتوان معادله حقیقی را شناخت، در تحلیل اقتصادسنجی به معادله رگرسیون برآورد شده تمرکز کرده و ضرایب رگرسیون را برآورد میکنند. تفاوت بین یک مشاهده خاص متغیر وابسته و مقدار برآوردشده آن از معادله رگرسیون، باقیمانده نامیده میشود.
خلاصه فصل دوم کتاب (حد اقل مربعات معمولی)
1- حداقل مربعات معمولی (OLS) پرکاربردترین روش برآورد ضرایب رگرسیون از یک مجموعه دادههاست. OLS ، β هایی را انتخاب میکند که مجموع مربعات باقیمانده ها (ei2) برای نمونه ای خاص را کمینه کنند.
2- R2 ، درصد تغییرات Y حول میانگین آن که بوسیله معادله رگرسیون خاصی توضیح داد شده و برای درجه آزادی تعدیل شده را اندازه میگیرد. وقتی که یک متغیر جدید به معادله اضافه میشود، R2 تنها درصورتی افزایش مییابد که بهبودی که در برازش رخ میدهد، بر کاهش درجه آزادی برازش که در تخمین ضریب متغیر جدید استفاده میشود، برتری داشته باشد. در نتیجه، بیشتر محققان به طور خودکار برای ارزیابی برازش معادلات رگرسیون برآوردشده از R2 استفاده میکنند.
3- همیشه به خاطر داشته باشید که برازش یک معادله برآورد شده، تنها یکی از معیارهای کیفیت کلی رگرسیون است. تعدادی از معیارهای دیگر، مثل درجه انطباق ضرایب برآورد شده با نظریه اقتصادی و انتظارات (که محقق قبل از جمع آوری داده ها آن را فرض میکند) بسیار مهمتر از اندازه R2 هستند.
خلاصه فصل سوم کتاب (روش استفاده از تحلیل رگرسیون)
1- شش گامی که به طور معمول در تجزیه و تحلیل رگرسیون کاربردی یک متغیر وابسته مفروض طی میشوند، عبارتند از:
الف- مرور ادبیات و توسعه مدل نظری؛
ب- تعیین مدل: انتخاب متغیرهای مستقل و شکل تابعی؛
پ- فرض کردن علائم مورد انتظار ضرایب؛
ت- جمع آوری داده ها: بازبینی و پاکسازی داده ها؛
ث- برآورد و ارزیابی معادله؛
ج- نتایج را مستند کنید.
2- یک متغیر موهومی بسته به تحقق یک شرط، فقط مقدار 1 یا 0 میگیرد. به عنوان مثال متغیر موهومی X اگر یک فرد خاص زن باشد، مقدار 1 و اگر آن شخص مرد باشد، مقدار صفر میگیرد.
خلاصه فصل چهارم کتاب (مدل کلاسیک)
1- هفت فرضیه کلاسیک، بیان میکنند که مدل رگرسیونی که خطی باشد با یک عبارت خطای دارای میانگین صفر، بدون همبستگی با متغیرهای توضیحی و مشاهدات دیگر عبارت خطا، دارای یک واریانس ثابت است و توزیع نرمال دارد (اختیاری). علاوه بر این، متغیرهای توضیحی نباید توابع خطی کامل از یکدیگر باشند.
2-دو تا از مهمترین ویژگی های یک تخمین زن، بدون تورش بودن و داشتن حداقل واریانس است. زمانی یک تخمین زن بدون تورش است که امید ریاضی ضریب برآورد شده برابر با مقدار واقعی باشد. حداقل واریانس زمانی اتفاق میافتد که توزیع برآورد شده دارای کوچکترین واریانس از میان تمام تخمین زن ها در یک کلاس تخمین زن (مثلا تخمین زن های بدون تورش) باشد.
3- با توجه به فرضیه های کلاسیک، میتوان نشان داد که OLS، تخمین زنی با حداقل واریانس، خطی و بدون تورش (یا BLUE یعنی بهترین تخمین زن خطی بدون تورش) ضرایب رگرسیون است. این قضیه گاوس-مارکوف است. هنگامی که یک یا چند ویژگی کلاسیک (به استثناء نرمال بودن) برقرار نباشد، OLS دیگر BLUE نیست، هرچند ممکن است در بعضی موارد، OLS برآوردهای بهتری از سایر روش های برآورد بحث شده در فصل های بعدی ارائه دهد.
4- از آنجا که توزیع نمون های تخمین زن OLS از βk ، BLUE است، دارای ویژگی های مطلوبی است. علاوه بر این، با افزایش تعداد مشاهدات، واریانس یا معیار پراکندگی توزیع نمونه ای βk کاهش مییابد.
5- نمادهای استانداردی در ادبیات اقتصادسنجی استفاده میشود. جدول 4-1 نمادهای قراردادی مورد استفاده در تجزیه و تحلیل رگرسیون را نشان میدهد. مبتدیان باید هر از گاهی این جدول را مرور کنند.
خلاصه فصل پنجم کتاب (آزمون فرض و استنتاج آماری)
1- آزمون فرض، استنتاج در مورد اعتبار نظریه های اقتصادی (یا سایر) خاص از نمونه ای از جامعه است که برای آن نظریه ها درست فرض میشوند. چهار گام اساسی آزمون فرض (به عنوان مثال با استفاده از آزمون t) عبارتند از:
الف. تنظیم فرضیه های صفر و جایگزین؛
ب. انتخاب یک سطح معنادار و سپس یک مقدار t بحرانی؛
پ. اجرای رگرسیون و به دست آوردن مقادیر t؛
ت. اعمال قاعده تصمیم با مقایسه مقدار t محاسبه شده با مقدار t بحرانی و رد کردن یا نکردن فرض صفر.
2- فرضیه صفر، دامنه ای از مقادیری را نشان میدهد که انتظار میرود اگر نظریه محقق درست نباشد، ضریب رگرسیون آن مقادیر را اخذ کند. فرضیه جایگزین عبارت از دامنه ای از مقادیر است که اگر نظریه محقق درست باشد، انتظار میرود ضریب رگرسیون آنها را اخذ کند.
3- دو نوع خطا در چنین آزمون های فرضی رخ میدهد که عبارتند از:
نوع 1: رد فرض صفر درست
نوع 2: رد نکردن فرض صفر نادرست
4- آزمون t، فرضیه های مربوط به ضرایب فردی معادلات رگرسیون را آزمون میکند. شکل آماره t به صورت زیر است:
tk=βk-βH0SEβk k=1,2,…,K
در بسیاری از کاربردهای رگرسیون، βH0 صفر است. همینکه مقدار t را محاسبه کرده و یک مقدار t بحرانی را انتخاب کردید، اگر قدر مطلق t بیشتر از مقدار t بحرانی باشد، و اگر مقدار t دارای علامت نشان داده شده در فرض جایگزین باشد، فرض صفر را رد کنید.
5- استفاده از آزمون t به دلایل مختلف آسان است، اما هنگام استفاده از آزمون t باید مراقب بود تا معناداری آماری با اعتبار نظری یا شواهد تجربی، اشتباه گرفته نشود.
6- آزمون F، یک آزمون فرض رسمی است که برای آزمون فرض صفری که حاوی فرضیه های چندگانه یا یک فرضیه واحد در مورد یک گروه از ضرایب است، طراحی شده است. معمولترین استفاده از آزمون F ، آزمودن معناداری سراسری یک معادله برآورد شده است.
خلاصه فصل ششم کتاب (انتخاب متغیرهای مستقل)
1- حذف یک متغیر از معادله، موجب تورش در برآورد سایر ضرایب خواهد شد، به حدی که متغیر حذف شده با متغیرهای داخل شده همبستگی دارد.
2- تورش مورد انتظار از حذف یک متغیر از یک معادله، برابر با ضریب متغیر خارجشده ضربدر تابعی از ضریب همبستگی ساده بین متغیر خارجشده و متغیر داخل شده در مسئله است.
3- داخل کردن یک متغیر در یک معادله که در واقع با آن بیارتباط است باعث ایجاد تورش نمیشود، اما معمولا واریانس ضرایب برآورد شده متغیرهای داخل شده را افزایش میدهد، بنابراین مقادیر t آنها را کاهش داده، فواصل اطمینان آنها را افزایش داده و R2 را کاهش میدهد.
4- چهار معیار مفید برای واردکردن یک متغیر در معادله عبارتند از:
الف. نظریه
ب. آزمون t
پ. R2
ت. تورش
5- نظریه، و نه برازش آماری، باید مهمترین معیار برای ورود یک متغیر در یک معادله رگرسیون باشد. در غیر این صورت، ریسک ایجاد نتایج نادرست و یا غیرقابل باور وجود دارد.
خلاصه فصل هفتم کتاب (انتخاب یک شکل تابعی)
1- عبارت ثابت را حذف نکنید. از سوی دیگر، به برآوردهای عبارت ثابت برای استنتاج، حتی اگر از لحاظ آماری معنادار به نظر میرسد، تکیه نکنید.
2- انتخاب یک شکل تابعی باید بر اساس نظریه اقتصادی پایه ای باشد تا آنجا که نظریه، شکلی شبیه یک شکل تابعی خاص ارائه دهد. باید از یک شکل تابعی با متغیرهای خطی استفاده کرد، مگر اینکه یک فرضیه خاص خلاف آن را نشان دهد.
3- اشکال تابعی دارای متغیرهای غیرخطی شامل لگاریتمی دوگانه، نیمه لگاریتمی و چند جمله ای هستند. به ویژه اگر انتظار کشش ثابت داشته باشیم، فرم لگاریتمی دوگانه مفید است. مزیت شکل نیمه لگاریتمی آن است که اثر یک متغیر مستقل با افزایش آن، کاهش بیشتری دارد. اگر انتظار داشته باشیم که شیبها، علامت را بسته به سطح یک متغیر مستقل تغییر دهند، شکل چند جمله ای مفید خواهد بود.
4- شیب موهومی، یک متغیر موهومی ضربدر یک متغیر مستقل است تا شیب رابطه بین متغیر وابسته و متغیر مستقل خاص، بسته به تحقق یک شرایط خاص تغییر کند.
5- استفاده از شکل های تابعی غیرخطی تعدادی مشکل بالقوه دارد. به طور خاص، مقایسه R2 ها درصورتی که Y تبدیل شده باشد، بسیار دشوار است و اگر با استفاده از یک شکل تابعی نادرست در خارج از دامنه نمونه، برای پیشبینی مورد استفاده قرار گیرد، باقیمانده ها، بالقوه بزرگ خواهند بود.
خلاصه فصل هشتم کتاب (هم خطی چندگانه)
1- همخطی چندگانه کامل، نقض این فرض است که هیچ متغیر توضیحی یک تابع خطی کامل از سایر متغیرهای توضیحی نیست. همخطی چندگانه کامل، منجر به برآوردهای نامعین ضرایب رگرسیون و خطاهای استاندارد بی نهایت از آن برآوردها میشود، که برآورد OLS را غیرممکن میکند.
2- همخطی چندگانه ناقص که معمولا به صورت «همخطی چندگانه» استفاده میشود، یک رابطه خطی بین دو یا چند متغیر مستقل و به اندازه کافی قوی است که به طور معناداری بر برآورد معادله تاثیر میگذارد. همخطی چندگانه پدیده نمونه ای و همچنین نظری است. نمونه های مختلف، میتوانند درجات مختلفی از همخطی چندگانه نشان دهند.
3- پیامد اصلی همخطی چندگانه شدید، افزایش واریانس ضرایب رگرسیون برآورد شده و درنتیجه کاهش معیارهای t محاسبه شده این ضرایب و گسترش فواصل اطمینان است. همخطی چندگانه، موجب تورش در ضرایب برآوردشده نمی شود و تاثیر کمی بر معناداری کلی رگرسیون یا برآورد ضرایب هر متغیر توضیحی غیرهمخط دارد.
4- از آنجاییکه همخطی چندگانه تا درجاتی، تقریبا در هر مجموعه داده وجود دارد، سوالی که در کشف آن پرسیده میشود این است که شدت همخطی چندگانه در یک نمونه خاص چقدر است.
5- دو روش مفید برای تشخیص همخطی چندگانه شدید عبارتند از:
الف. آیا ضریب همبستگی ساده بین متغیرهای توضیحی بالاست؟
ب. آیا عامل تورم واریانس بالاست؟
اگر هر کدام از این پاسخ ها بله باشد، همخطی چندگانه قطعا وجود دارد؛ هرچند اگر پاسخ منفی باشد، باز هم میتواند وجود داشته باشد.
6-سه روش رایج برای اصلاح همخطی چندگانه وجود دارد:
الف. هیچ کاری انجام ندهید (و بنابراین از تورش مشخصات اجتناب کنید).
ب. یک متغیر زائد را حذف کنید. ج. حجم نمونه را افزایش دهید.
7- اغلب، انجام ندادن هیچ اقدامی، بهترین راهحل برای اصلاح همخطی چندگانه است. اگر همخطی چندگانه، معیارهای t را تا حد معنادار نبودن کاهش ندهد، تا زمانیکه متغیرها از لحاظ نظری قوی هستند، هیچ راه حلی نباید در نظر گرفت. حتی اگر معیارهای t معنادار نباشد، باید اقدامات اصلاحی با احتیاط انجام شود، زیرا هزینه برآورد ممکن است بیشتر از مزیت رفع همخطی چندگانه از معادله باشد.
خلاصه فصل نهم کتاب (هم بستگی سریالی)
1- همبستگی سریالی یا خودهمبستگی، نقض فرضیه کلاسیک 4 است که میگوید مشاهدات عبارت خطا با یکدیگر همبستگی ندارند. معمولا اقتصادسنجان بر همبستگی سریالی مرتبه اول تمرکز میکنند که در آن، مشاهده فعلی عبارت خطا، تابعی از مشاهده پیشین آن و یک عبارت خطای فاقد همبستگی سریالی (u) در نظر گرفته میشود:
ϵt=ρϵt-1+ut -1
که در آن ρ یا «رو»، ضریب خودهمبستگی است.
2- همبستگی سریالی خالص، تابعی از عبارت خطای معادله رگرسیونی با مشخصات درست است. همبستگی سریالی ناخالص، ناشی از اشتباهات مشخصات مانند یک متغیر حذف شده یا یک شکل تابعی نادرست است. همبستگی سریالی ناخالص مثبت (0ρ ) یا منفی (-1ρ ) است، اما همبستگی سریالی خالص در شرایط اقتصادی و یا کسب و کار تقریبا همیشه مثبت است.
3- پیامد اصلی همبستگی سریالی، تورش در SE(β) های OLS است و باعث آزمون فرض نامطمئن میشود. همبستگی سریالی خالص در برآورد β ها سبب ایجاد تورش نمیشود.
4- یک روش متداول برای شناسایی همبستگی سریالی مرتبه اول، آزمون دوربین-واتسون است، که با استفاده از باقی مانده های یک رگرسیون برآوردشده، احتمال همبستگی سریالی در عبارت خطا را آزمون میکند. یک جایگزین مرجّح آن هم، آزمون تکرارشونده مضرب لاگرانژ (LM) است، که خیلی معمولتر از آزمون دوربین-واتسون میباشد.
5- اولین مرحله برای رهایی یک معادله از همبستگی سریالی، بررسی احتمال خطاهای مشخصات است. بعد از اینکه احتمال همبستگی سریالی ناخالص به حداقل رسید، باید اقدامات اصلاحی برای همبستگی سریالی خالص درنظر گرفته شود.
6-حداقل مربعات تعمیم یافته (GLS) روشی برای تبدیل یک معادله به منظور رهایی از همبستگی سریالی خالص مرتبه اول است. استفاده از GLS نیاز به برآورد ρ دارد.
7-خطاهای استاندارد نیووی-وست یک روش جایگزین اصلاحی برای همبستگی سریالی است که برآوردهای OLS برای SE(β) ها را با توجه به همبستگی سریالی و بدون تغییر β ها تعدیل میکند.
خلاصه فصل دهم کتاب (ناهمسانی واریانس)
1- ناهمسانی واریانس نقض فرض کلاسیک 5 است که میگوید مشاهدات عبارت خطا از یک توزیع با واریانس ثابت به دست آمده است. مشاهدات عبارت خطای دارای همسانی واریانس از یک توزیع با واریانس ثابت برای تمام مشاهدات هستند و مشاهدات عبارت خطای دارای ناهسانی واریانس از توزیع هایی با واریانس هایی هستند که از مشاهده به مشاهده دیگر متفاوت است. ناهمسانی واریانس اغلب در مجموعه داده های مقطعی رخ میدهد.
2- واریانس یک عبارت خطای دارای ناهمسانی واریانس، برابر با σ2 ، یک ثابت نیست. در عوض، برابر با σi2 است و اندیس i نشان میدهد که واریانس میتواند در هر مشاهده تغییر کند. بسیاری از انواع ناهمسانی واریانس امکانپذیر است، اما مدلی رایج است که در آن واریانس به طور سیستماتیک به صورت تابعی از یک متغیر دیگر، یک عامل تناسب Z تغییر میکند:
VARϵi=σ2Zi
عامل تناسبZ معمولا متغیری مربوط به اندازه و دقت متغیر وابسته است.
3- ناهمسانی واریانس خالص، تابعی از عبارت خطای معادله رگرسیون با مشخصات درست است. ناهمسانی واریانس ناخالص ناشی از یک خطای مشخصات مانند یک متغیر حذف شده است.
4- نتیجه اصلی ناهمسانی واریانس در OLS SE(β) ها، تورش است که باعث آزمون فرض غیرقابل اتکا میشود. ناهمسانی واریانس خالص باعث تورش در برآوردهای خود β ها نمیشود.
5- دو آزمون معمول برای ناهمسانی واریانس، آزمون بروش-پاگان و آزمون وایت است. هر دو آزمون با تجزیه و تحلیل میزانی که مربع باقی مانده های معادله اصلی را میتوان با یک معادله کمکی توضیح داد، ناهمسانی واریانس را بررسی میکنند.
6- اولین قدم برای اصلاح ناهمسانی واریانس این است که وجود یک خطای مشخصات که ممکن است سبب ایجاد ناهمسانی واریانس ناخالص شود را بررسی کنید. اگر مشخصات تاحد امکان خوب باشد، باید راهحل هایی مانند خطاهای استاندارد HC یا تعریف مجدد متغیرها را در نظر گرفت.
خلاصه فصل یازدهم کتاب (اجرای یک پروژه رگرسیون)
1- اجرای پروژه رگرسیون، عبارت است از انتخاب متغیر وابسته، به کاربردن شش مرحله در رگرسیون کاربردی (فصل 3) برای آن متغیر وابسته و سپس نوشتن گزارش تحقیقی که خلاصه کار را شامل میشود.
2- یک موضوع تحقیق عالی، آن است که شما اطلاعاتی در مورد آن داشته باشید؛ موضوعی است که به یک سوال یا گزینه اقتصادی یا رفتاری ذاتا جالب توجه اشاره کند؛ موضوعی است که هم برای متغیر وابسته و هم برای متغیرهای مستقل آن، داده ها در دسترس باشند.
3- دشواری و اهمیت جمع آوری داده های کامل و دقیق را دست کم نگیرید. این کار خیلی مهم و ارزشمندی است.
4- هنر اقتصادسنجی یافتن بهترین معادله ممکن در کمترین تعداد ممکن اجرای رگرسیون است. تنها راه این کار این است که قبل از اجرای اولین رگرسیون، زمان زیادی را صرف فکر کردن به اصول پایه پروژه تحقیقاتی خود کنید.
5- قبل از تکمیل پروژه تحقیقاتی خود، حتما نکات عملی، راهنما و چک لیست کاربری رگرسیون در بخشهای 4.11 و 6.11 را مرور کنید.
خلاصه فصل دوازدهم کتاب (مدل های سری زمانی)
1- یک مدل تعویقی توزیع شده، مقدار فعلی Y را به صورت تابعی از مقادیر فعلی و گذشته X بیان میکند، بنابراین تاثیر X را بر تعدادی از دوره های زمانی تاخیر «توزیع» میکند. برآورد OLS معادلات تعویقی توزیع شده بدون هیچگونه محدودیتی، با مشکلات همخطی چندگانه، درجات آزادی و یک الگوی غیرپیوسته از ضرایب برآورد شده در طول زمان مواجه میشود.
2-با یک مدل پویا با فرض اینکه ضرایب متغیرهای مستقل تعویقی با افزایش تاخیر به صورت هندسی کاهش مییابند، میتوان از این مشکلات اجتناب کرد. با این فرض، مدل پویا عبارت است از:
Yt=α0+β0Xt+λYt-1+ut
که در آن Yt-1 متغیر وابسته عقب مانده و 0λ1 است.
3- در نمونه های کوچک، برآوردهای OLS یک مدل پویا، تورشدار هستند و ویژگی های آزمون فرض نامعتبر است. حتی در نمونه های بزرگ اگر عبارت خطا همبستگی سریالی داشته باشد،OLS ، برآوردهای تورشداری از ضرایب مدل پویا تولید خواهد کرد.
4- در یک مدل پویا، آزمون دوربین واتسون به سمت 2 تورش دارد، بنابراین نباید استفاده شود. جایگزین متداول آن، آزمون مضرب لاگرانژ است.
5- علیت یا تقدم گرنجر، شرایطی است که در آن یک متغیر سریزمانی به طور پیش فرض و قابل پیشبینی قبل از متغیر دیگر تغییر میکند. اگر یک متغیر مقدم بر دیگری باشد، باز هم نمیتوانیم مطمئن باشیم که متغیر اول باعث «تغییر» دومی شده است.
6- یک سری بیثبات، آن است که تغییرات معناداری (مثلا در میانگین و واریانس) در طول زمان داشته باشد. اگر متغیر وابسته و حداقل یک متغیر مستقل بیثبات یا رونددار باشند، رگرسیون ممکن است با همبستگی جعلی روبرو شود که در آن R2 و معیارهای t متورم هستند.
7- با استفاده از آزمون دیکی فولر، میتوان بیثباتی را تشخیص داد. اگر متغیرها ریشه های واحد داشته و بنابراین بی ثباتی باشند، همانباشتگی باقیمانده های معادله باید با آزمون دیکی فولر بررسی شود. اگر متغیرها بیثبات اما همانباشته نباشند، معادله باید با دیفرانسیل های اول برآورد شود. اگر متغیرها بی ثبات و همانباشته باشند ، معادله را میتوان در واحدهای اصلی آن برآورد کرد.
خلاصه فصل سیزدهم کتاب (روشهای متغیر موهومی وابسته)
1- یک مدل احتمال خطی یک معادله با ضرایب خطی است که برای توضیح متغیر مستقل وابسته موهومی Di استفاده میشود. Di یک تخمین احتمال Di=1 است.
2- برآورد مدل احتمال خطی با OLS حداقل با سه مشکل اصلی مواجه است:
الف. R2 معیار دقیقی برای برازش کلی نیست.
ب مقدار موردانتظار Di محدود به 0 و 1 نیست.
ج. عبارت خطا نه هسانی واریانس و نه توزیع نرمال دارد.
3- هنگام اندازهگیری برازش کلی معادلات با متغیرهای وابسته موهومی، یک جایگزین برای R2 ، Rp2 ، درصد متوسط مشاهدات در نمونه است که یک معادله برآوردشده خاص به درستی آن را توضیح داده است.
4- لوجیت دوجمله ای یک روش برآورد معادلات با متغیرهای وابسته موهومی است که از یک نوع تابع لجستیک تجمعی استفاده میکند تا مشکل نامحدود بودن مدل احتمال خطی را از بین ببرد:
L:PrDi=1=lnPi1-Pi=β0+β1X1i+β2X2i
5- بهترین راه لوجیت دوجمله ای، استفاده از روش حداکثر درستنمایی(ML) و یک نمونه بزرگ است. ضریب شیب یک لوجیت، تاثیر یک واحد افزایش متغیر مستقل مورد نظر (با ثابت ماندن سایر متغیرهای توضیحی) را بر لگاریتم احتمال یک گزینه مفروض اندازه میگیرد.
6- مدل پروبیت دوتایی، یک روش برآورد معادلات با متغیرهای وابسته موهومی است که از تابع توزیع نرمال تجمعی استفاده میکند. پروبیت دوتایی دارای ویژگی هایی بسیار شبیه به لوجیت دوجمله ای است.
خلاصه فصل چهاردهم کتاب (معادلات هم زمان)
1- اکثر مدل های اقتصادی و کسب و کار به دلیل علیت دوطرفه، حلقه های بازخورد یا تعیین توأم متغیرهای خاص، ماهیت همزمان دارند. این متغیرهای همزمان، درونزا و متغیرهای غیرهمزمان برونزا نامیده میشوند.
2- یک معادله ساختارمند، نظریه پایه یک متغیر خاص را مشخص میکند و این نوع معادل های است که ما در این کتاب استفاده کرده ایم. یک معادله به شکل کاهش یافته، یک متغیر درونزای خاص را فقط با توجه به یک عبارت خطا و تمام متغیرهای پیشمعین (درونزای تعویقی و برونزا) در یک سیستم همزمان بیان میکند.
3- مدل های معادلات همزمان فرض کلاسیک 3 را نقض میکنند که میگوید عبارت خطا با متغیرهای توضیحی همبستگی ندارند. این به دلیل اثرات بازخورد متغیرهای درونزا رخ میدهد. به عنوان مثال یک مشاهده غیرمعمول زیاد از عبارت خطای یک معادله از طریق یک سیستم همزمان، در نهایت منجر به یک مقدار زیاد (با ضرایب مثبت) برای متغیرهای درونی میشود که به صورت متغیر توضیحی در معادله مورد نظر ظاهر میشوند و به این ترتیب فرض کلاسیک 3 نقض میشود.
4- اگر OLS برای ضرایب یک سیستم همزمان استفاده شود، برآوردهای حاصل از آنها تورشدار و ناسازگارند. دلیل اصلی آن، نقض فرض کلاسیک 3 است؛ نرمافزار رگرسیونOLS ، تغییرات متغیر وابسته ناشی از عبارت خطا (که با متغیرهای توضیحی همبستگی دارند) را به متغیرهای توضیحی نسبت میدهد.
5- حداقل مربعات دو مرحله ای، یک روش تخمین سیستم های معادلات همزمان است. این روش سیستمی، با استفاده از معادلات به شکل کاهش یافته در سیستم، جایگزین هایی برای متغیرهای درونزا تولید میکند که مستقل از عبارات خطا هستند. سپس، معادلات ساختارمند سیستم را با جایگزین های متغیرهای درونزا که در آن به صورت متغیر توضیحی ظاهر میشوند، برآورد میکند.
6- برآوردهای کمترین مربعات دو مرحله ای، سازگار اما تورشدارند. خوشبختانه، تورش موردانتظار ناشی از 2SLS معمولا کمتر از تورش موردانتظار ناشی از OLS است. اگر برازش معادلات به شکل کاهش یافته ضعیف باشد، 2SLS خوب عمل نخواهد کرد.
7- نمیتوان 2SLS را در معادلهای که تشخیص داده نشده استفاده کرد. شرط لازم (اما نه کافی) برای تشخیص، شرط نظم است که الزام دارد تعداد متغیرهای پیشمعین در سیستم بزرگتر یا مساوی با تعداد ضرایب شیب در معادله موردنظر باشد. شرط کافی معمولا با توانایی 2SLS در برآورد ضرایب تعیین میشود.
خلاصه فصل پانزدهم کتاب (پیش بینی)
1- پیشبینی، تخمین مقدار مورد انتظار یک متغیر وابسته برای مشاهداتی است که جزء مجموعه داده های نمونه نیستند. پیشبینی (از طریق رگرسیون) به وسیله برآورد معادله ای که متغیر وابسته آن باید پیشبینی شود و جایگذاری مقادیر برای هر یک از متغیرهای مستقل در معادله انجام میشود.
2-برای یک معادله پیشبینی، یک برازش عالی در دوره نمونه، تضمین نمیکند که معادله در خارج از دوره نمونه به خوبی پیشبینی شده باشد.
3-یک پیشبینی که در آن تمام مقادیر متغیر مستقل با اطمینان شناخته میشود، پیشبینی غیرشرطی نامیده میشود؛ اما اگر یک یا چند متغیر مستقل پیشبینی شود، پیشبینی شرطی است. پیشبینی شرطی هیچ تورشی در پیشبینیY ندارد (تا زمانی که پیشبینیهای X بدون تورش باشند)، اما افزایش واریانس خطای پیشبینی با پیشبینی شرطی اجتنابناپذیر است.
4-اگر ضرایب یک معادله با GLS (برای اصلاح همبستگی سریالی مرتبه اول خالص) برآورد شود، آنگاه معادله پیشبینی شده است:
YT+1=ρYT+β01-ρ+β1XT+1-ρXT
که ρ ضریب خودهمبستگی است.
5-اغلب مفیدتر است که پیشبینی با فاصله اطمینان همراه باشد، که محدودهای است که در آن، مقدار واقعی متغیر وابسته باید در درصد مشخصی مواقع (سطح اطمینان) در آن قرار گیرد و عبارت است از:
YT+1±SF.tc
که SF خطای استاندارد برآورد پیشبینی و tc مقدار t بحرانی دوطرفه برای سطح اطمینان مورد نظر است.
6-ARIMA یک روش برازش منحنی خیلی بهبود یافته است که از مقادیر فعلی و گذشته متغیر وابسته (و تنها متغیر وابسته) برای تولید پیشبینی های اغلب دقیق کوتاه مدت آن متغیر استفاده میکند. اولین گام استفاده از ARIMA باثبات کردن سری های متغیر وابسته با گرفتن d دیفرانسیل اول تا زمانی است که متغیر تبدیل شده نتیجه، دارای میانگین و واریانس ثابت باشد. آنگاه ARIMAp,d,q ، یک فرآیند خود بازگشت (با عبارت θ1Yt-1 ) از مرتبه p را با یک فرایند میانگین متحرک (با عبارت φ1ϵt-1 ) از مرتبه q ترکیب کرده تا dامین دیفرانسیل متغیر وابسته را توضیح دهد.
خلاصه فصل شانزدهم کتاب (داده های پانل و تجربی)
1- آزمایش های تخصیص تصادفی، هنگامی که یک اثر علّی از درمان در دستاورد ایجاد میکنند، استاندارد طلایی درنظر گرفته میشوند. یک گروه درمان به طور تصادفی انتخاب شده، در معرض یک درمان خاص قرار میگیرند. اما یک گروه کنترل درمان نمیشوند و برای بررسی معنادار بودن تفاوت نتایج دو گروه، آزمون انجام میشود. متاسفانه چنین آزمایش هایی در بسیاری از زمینه های اقتصادی امکانپذیر نیستند.
2- اگر رویدادی طبیعی (و یا تغییر سیاست) بتوان یافت که درمان تخصیص تصادفی را تقلید کند، میتوان از آزمایش های طبیعی برای ارائه شواهدی از علیت در اقتصاد استفاده کرد. اگر این رویدادها موجب شوند که میانگین دستاورد برای گروه درمان به طور قابل ملاحظه ای بیشتر از میانگین دستاورد گروه کنترل باشد، شواهدی وجود دارد که درمان یک عامل علّی در دستاورد است.
3- معادلات حاوی اطلاعات آزمایش های طبیعی را میتوان با مدل تفاوت در تفاوت ها، که تفاوت بین تغییر در گروه درمان و تغییر در گروه کنترل را مقایسه میکند، برآورد کرد.
4- داده های پانل داده های سری زمانی و مقطعی را با استفاده از مشاهدات متغیرهای مشابه از یک نمونه مقطعی در دو یا چند دوره زمانی ترکیب میکند. داده های پانل اغلب توسط پروژه های بزرگ و چند ساله تحقیقاتی تولید میشوند و منابع مهمی برای تحلیل های اقتصادسنجی هستند.
5- معادلات مربوط به داده های پانل را میتوان با استفاده از مدل اثرات ثابت و یک روش پیشرفته، یعنی مدل اثرات تصادفی، برآورد کرد.
به امید اینکه کتاب " یک راهنمای عملی استفاده از اقتصادسنجی" برای همه دانشجویان و شاغلان در حرفه مالی و اقتصادی مفید واقع شود و مورد بهره برداری آن عزیزان و بزرگواران قرارگیرد.