رابطه رگرسیون فوق یک رابطه ساده دو متغیره است. یعنی تغییرات یک متغیر وابسته را به تغییرات یک متغیر توضیحی مستقل میتوان نسبت داد. اما بسیاری از نظریه ها و ایده های مالی مبین آن هستند که متغیر وابسته تحت تأثیر بیش از یک متغیر مستقل قرار دارد. و جود بیش از یک متغیر توضیحی در یک زمان در معادله رگرسیون و بررسی تمامی این متغیرهای توضیحی به طور همزمان بر روی متغیر وابسته موجب اعتبار بیشتر آن میشود.(عادل آذر، ۱۳۸۳)
تعمیم یک مدل ساده به مدلی با متغیر مستقل کار بسیار سادهای است. بنابرین میتوان مدل رگرسیون چند متغیره را به صورت زیر بیان کنیم:
معادله:
; =۱, ۲, …, t
رگرسیون خطی دارای مفروضاتی است که برای استفاده از این مدل وجود آن ها ضروری میباشد. در ادامه به معرفی این مفروضات و آزمونهای آن ها میپردازیم.
۳-۹-۲ آزمون ریشه واحد
داده های مورد استفاده در مطالعات اقتصاد سنجی را می توان به سه دسته داده های سری زمانی، مقطعی، پانلی تقسیم بندی کرد. به استثنای داده های مقطعی، در بقیه داده ها باید آزمون ریشه واحد صورت گیرد (صمدی، ۱۳۸۸)
روشهای سنتی اقتصادسنجی در برآورد ضرایب یک الگو، مبتنی بر پایا[۷۰] (مانا) بودن سریهای زمانی میباشند. متغیر سریزمانی وقتی مانا است که میانگین، واریانس، کواریانس و در نتیجه ضریب همبستگی آن در طول زمان ثابت باشد و مهم نباشد که در چه مقطعی از زمان، این شاخص ها را محاسبه کنیم. امّا از طرفی، «بررسیهایی که از سالهای ۱۹۹۰ به بعد انجام شده، نشان داده است که بسیاری از متغیرهای سریزمانی در اقتصاد مانا نیستند».(هژبر کیانی،۱۳۷۶).
به عبارتی دیگر، میانگین و واریانس این سریها در طول زمان متغیر بوده و کواریانس آنها در ازای وقفههای مشخص، ثابت نیست که از این خصوصیات به عنوان نامانا[۷۱]بودن سریهای زمانی یاد می شود. اگر سریهای زمانی مورد استفاده در برآورد ضرایب الگو نامانا باشند، برآورد الگو با چنین متغیرهایی ممکن است به رگرسیون کاذب[۷۲] منجر شود؛ بدین معنی که ممکن است ضریب تعیین به دست آمده از الگوی برآوردی بسیار بالا بوده، ولی هیچ رابطۀ معنیداری بین متغیرهای الگو وجود نداشته باشد. عدم توجه به چنین نکتهای، موجب گمراهی محقق و استنباطهای غلط در مورد ارتباط بین متغیرها خواهد شد. از این رو قبل از استفاده از این متغیرها لازم است نسبت به مانایی یا عدم مانایی آن ها اطمینان حاصل کرد.(نوفرستی ،۱۳۷۸).
۳-۹-۳ آزمون خود همبستگی
فرض دیگر مدل رگرسیون خطی صفر بودن کواریانس بین اجزای خطا در طول زمان (یا به صورت مقطعی برای انواع داده ها) میباشد. به عبارت دیگر فرض فوق مبین این است که خطاها به یکدیگر وابسته نیستند. در صورتی که خطاها غیر همبسته نباشند، به این معنی است که خود همبسته هستند و یا به صورت پیاپی همبسته میباشند. بنابرین فرض مذبور نیازمند آزمون است.
پیامدهای ناشی از وجود خود همبستگی، مشابه پیامدهای ناشی از نادیده گرفتن ناهمسانی واریانس است. به طوری که ضرایب برآورده شده با بهره گرفتن از OLS نااریب بوده ولی ناکارا است. یعنی حتی در نمونه های بزرگ بهترین برآورد کننده های خطی نا اریب نیست، به طوری که خطای معیار برآورد شده میتواند نادرست باشد. بنابرین امکان دارد که استنباطهای نادرستی در مورد این که آیا یک متغیر عامل تعیین کننده مهمی در تغییرات متغیر وابسته باشد یا نه صورت پذیرد.
سادهترین آزمون خود همبستگی پسماندها، آزمون دوربین- واتسون است. دوربین- واتسون آزمونی برای خود همبستگی مرتبه اول است، یعنی این آزمون تنها برای رابطه بین یک خطا و مقدار قبلی خودش میباشد. آماره دوربین واتسون بر یکی از سه مقدار مهم صفر، ۲ و ۴ دلالت دارد.
-
- در صورتی که آماره دوربین- واتسون ۲ باشد، یعنی زمانی که هیچ گونه همبستگی بین پسماندها وجود ندارد. به طور کلی میتوان گفت که اگر این آماره نزدیک عدد ۲ باشد، شواهد کمی دال بر خود همبستگی وجود دارد.
-
- اگر آماره برابر صفر باشد، خود همبستگی کامل مثبتی بین پسماندها وجود دارد.
- همچنین اگر آماره دوربین- واتسون برابر با مقدار ۴ باشد، خود همبستگی کامل منفی بین پسماندها وجود دارد.
البته آزمونهای دیپرگری نیز مانند آزمون بروش- گودفری برای آزمون خود همبستگی وجود دارد. این آزمون عمومیت بیشتری نسبت به آزمون دوربین- واتسون داشته و میتواند در شرایط گستردهتری مورد استفاده قرار گیرد، زیرا دارای محدودیتهای دوربین- واتسون به صورت شکلی از رگرسیون مرحله اول نمیباشد، در نرمافزارEviews آماره دوربین واتسون به صورت خودکار محاسبه میشود.
۳-۹-۴ آزمون نرمال بودن پسماندها
به منظور اجرای فرضیههای تک یا توأم در مورد پارامترهای مدل، فرض نرمال بودن پسماندهای مدل مطرح میشود. سومین و چهارمین گشتاور استاندارد شده یک توزیع به عنوان چولگی و کشیدگی شناخته میشود. چولگی معیاری است مبنی بر این که توزیع پیرامون میانگینش متقارن نیست و کشیدگی معیاری برای توپری و دنبالههای توزیع است. یک توزیع نرمال چوله نبوده و کشیدگی آن برابر ۳ است. همچنین میتوان ضریبی را برای کشیدگی مازاد تعریف کرد که برابر با ضریب کشیدگی منهای ۳ میباشد، به طوری که یک توزیع نرمال ضریب کشیدگی مازادی برابر صفر دارد. یک توزیع نرمال به صورت متقارن و میانه پهنا است. یک توزیع نرمال پیرامون میانگینش متقارن است در حالی که یک توزیع چوله این گونه نیست و یکی از دنبالهها طولانیتر از دیگری است.
یک توزیع کشیده توزیعی است که دارای دنبالههای توپر بوده و در بالای میانگین دارای ارتفاع بیشتری نسبت به یک متغیر تصادفی با توزیع نرمال با همان میانگین و انحراف معیار میباشد. در حالی که یک توزیع پهن در قسمت میانگین دارای ارتفاع کم با دنبالههای کم پشت و نازکتر میباشد و بیشتر توزیع در شانه های توزیع نسبت به توزیع نرمال قرار دارد.
آزمونهای مختلفی برای آزمون نرمال بودن متغیرها مورد استفاده قرار میگیرد. آزمون جاک- برا، آندرسون- دارلینگ و ریان- جوینر از آن جمله هستند.
۳-۹-۵ همبستگی
تحلیل همبستگی ابزاری آماری است که به وسیله آن میتوان درجهای را که یک متغیر به متغیر دیگر، از نظر خطی مرتبط است را اندازهگیری کرد. به عبارت سادهتر همبستگی معیاری است برای تعیین میزان ارتباط دو متغیر استفاده میشود و معمولاً همراه با تحلیل رگرسیون به کار میرود. در همبستگی دو معیار ضریب همبستگی و ضریب تعیین بحث میشود.
۳-۹-۶ ضریب همبستگی®
ضریب همبستگی نوع رابطه مستقیم یا معکوس و همچنین شدت رابطه بین دو یا چند متغیر را نشان میدهد. ضریب همبستگی همیشه بین ۱- و ۱ میباشد. اگر r =1 باشد در آن صورت تمامی نقاط بر روی یک خط راست قرار دارند و همبستگی، مثبت و کامل میباشد یعنی ضریب زاویه (شیب) خط مثبت است. اگر r = -1 باشد در این حالت تمامی نقاط روی خط مستقیم قرار دارند ولی ضریب زاویه خط منفی است و اگر چنانچه r =0 باشد نشانه عدم وجود همبستگی میان متغیرهاست.