(۳-۹)
که در این رابطه داریم:
: متغیر وابسته،
: عرض از مبدأ،
، ، … ، : متغیرهای مستقل و کنترلی مورد استفاده در پژوهش،
، ، … ، : ضریب رگرسیونی متغیرهای پژوهش و
: جملات خطا.
در چنین مدلی مفروضات اساسی زیر در نظر گرفته میشود:
۱- xها متغیرهای تصادفی هستند، علاوه بر آن رابطه خطی کامل میان دو یا چند متغیر مستقل وجود ندارد.
۲- برای تمامی مشاهدات، امید ریاضی جمله خطا معادل صفر و مقدار واریانس آن ثابت است.
۳- جملات خطای مربوط به مشاهدات مختلف با یکدیگر همبستگی ندارد.
۴- جمله خطا به صورت نرمال توزیع شده است.
نکته قابل ذکر این است که در این پژوهش چندین رگرسیون چند متغیره آزمون میشود.
۳-۱۰-۲- نبود خود همبستگی
در مدلهای رگرسیون فرض بر آن است که جملات خطا (یعنی تفاوت بین مقادیر واقعی و مقادیر پیش بینی شده توسط معادله رگرسیون) از دورهای به دوره بعد مستقل میباشند، اما در بسیاری موارد، جملات خطا در دوره های مختلف همبستهاند. به عبارت سادهتر در صورتی که داده های مورد استفاده در رگرسیون، در طول زمان جمع آوری شده باشند این امکان وجود دارد که مقدار y در زمان t، که آن را با نماد yt نشان میدهیم، با مقدار yدر زمان yt-1، ارتباط داشته باشد، در چنین مواردی جملات خطا اصطلاحاً دارای خود همبستگی[۵۹] یا همبستگی متوالی[۶۰] هستند. خود همبستگی جملات خطا در مطالعات سریهای زمانی مشاهده میشود. برخی از دلایل وجود خود همبستگی در جملات خطا عبارتند از (زارع، ۱۳۸۱، ۹۷ و ذوالنور، ۱۳۷۴، ۸۰):
۱- متغیرهای توضیحی حذف شده: در چنین حالتی، از آنجایی که اغلب متغیرهای اقتصادی خود همبسته میباشند، خطای خود همبستگی به وجود میآید، گنجانیدن متغیرهای توضیحی حذف شده در مدل، این مشکل را برطرف میکند.
۲- مدلبندی اشتباه یک الگو: اگر الگویی خاص را خطی فرض نماییم، در حالی که شکل واقعی آن غیرخطی است، خطاها میتوانند منعکس کننده برخی وابستگیها باشند.
۳- تحریف مشاهدات آماری: برخی داده های سریهای زمانی شامل نوعی از فرایند هموارسازی میباشند که توزیع واقعی داده ها در خلال دوره های مورد بررسی را به صورت میانگین متحرک درآورده و برای مثال آثار فصلی آن را در یک سری زمانی از بین میبرند. در نتیجه برای چنین متغیری، مقادیر میتوانند با یکدیگر همبستگی پیدا کنند. وجود خود همبستگی در جملات خطای مدل رگرسیون منجر به نتایج زیر میشود (زارع، ۱۳۸۱، ۱۰۰ و ذوالنور، ۱۳۷۴، ۸۵-۸۶):
الف) ضرایب رگرسیون کماکان برآورد کننده های نااریب[۶۱] میباشند، اما ویژگیهای واریانس حداقل را ندارند. این برآورده کننده ها نسبتاً ناکارا میباشند.
ب) میانگین مربعات جملات خطا، میتواند به صورتی قابل توجه واریانس واقعی جملات خطا را کم برآورد نماید.
ج) شیوه های فاصله اطمینان و آزمونها که در آنها از توزیعهای t و F استفاده میشود، اکیداً قابل کاربرد نیستند.
د) در نتیجه اریب بودن میانگین مربعات جملات خطا، نیز غیر قابل اتکا و اریب خواهد بود.
برای بررسی آن که در یک مدل رگرسیون، جملات خطا خود همبسته میباشند یا خیر، آزمونهایی طراحی شده است. در این میان آزمونی که بیشتر مورد استفاده قرار میگیرد، آزمون دوربین- واتسن[۶۲] است. آزمون دوربین- واتسن بر مدل خطای خود همبسته مرتبه اول مبتنی میباشد. این مدل به صورت زیر است:
(۳-۱۰)
که در این معادله:
پارامتر خود همبستگی با مقدار و متغیر مستقل با فرض .
در این مدل وقتی که مثبت باشد، خود همبستگی مثبت و وقتی که منفی باشد، خود همبستگی منفی وجود دارد. در حالت خود همبستگی وجود ندارد (ذوالنور، ۱۳۷۴، ۸۶-۸۸).
۳-۱۰-۳- ضریب تعیین و ضریب تعیین تعدیل شده
ضریب تعیین معیاری است که قوت رابطه میان متغیر مستقل و متغیر وابسته را تشریح میکند. مقدار این ضریب در واقع مشخص کننده آن است که چند درصد از تغییرات متغیر وابسته توسط متغیر مستقل توضیح داده میشود و هر چه مقدار آن بیشتر باشد، خطاها کمتر و مدل رگرسیون قابل اعتماد تر است. مقدار از رابطه زیر تعیین میشود (پیندیک و روبینفیلد، ۱۳۷۰، ۱۱۲):
(۳-۱۱)
که در آن:
SSE = تغییرات جمله خطا که توسط رگرسیون توضیح داده نمیشود.
SST = کل تغییرات در مقدار متغیر وابسته.
با این حال اغلب ترجیح داده میشود که از مقیاس دیگری به نام ضریب تعیین تعدیل شده[۶۳] برای بررسی نیکویی برازش[۶۴] مدل رگرسیون چند متغیره استفاده کنند. این ضریب همان ضریب تعیین است که در آن مقادیر SST و SSE با درجات آزادیشان تعدیل گردیدهاند. این ضریب در رگرسیون چند متغیره به صورت زیر محاسبه میشود (همان، ص: ۱۱۳):
(۳-۱۲)
که در آن n تعداد مشاهدات و k تعداد متغیرهای مستقل است. در واقع هدف از بهکارگیری تعدیل شده، تسهیل در مقایسه نیکویی برازش چندین معادله رگرسیون است که از نظر تعداد متغیرهای مستقل توضیحی متفاوتند.
۳-۱۰-۴- آزمون معنیدار بودن در الگوی رگرسیون
در رگرسیون چندگانه دو یا چند متغیر مستقل وجود دارد و لازم است که برای مشخص شدن معنیدار بودن آنها، دو آزمون انجام گیرد. ابتدا آزمون معنیدار بودن معادله رگرسیون و در مرحله بعد آزمون معنیدار بودن هر کدام از ضرایب متغیرهای مستقل در معادله بیان خواهد شد.
۳-۱۰-۴-۱- آزمون معنیدار بودن معادله رگرسیون
در یک معادله رگرسیون چندگانه، چنانچه هیچگونه رابطهای میان متغیر وابسته و متغیرهای مستقل وجود نداشته باشد، میبایست تمامی ضرایب متغیرهای مستقل در معادله، مساوی صفر باشند. بدین ترتیب ما میتوانیم معنیدار بودن معادله رگرسیون را آزمون کنیم. این کار با بهره گرفتن از آماره F با فرضهای زیر صورت میگیرد (عباسینژاد، ۱۳۸۰، ۸۹ و ذوالنور، ۱۳۷۴، ۵۶-۵۹):
معادله رگرسیون معنیدار نیست معادله رگرسیون معنیدار است
چنانچه در سطح اطمینان ۹۵% (خطای ۵%= ) آماره F محاسبه شده از معادله رگرسیون کوچکتر از مقدار F به دست آمده از جدول باشد فرض را نمی توان رد کرد و در غیر این صورت رد میشود. واضح است که در صورت رد شدن ، معادله رگرسیون معنیدار خواهد بود.
۳-۱۰-۴-۲- آزمون معنیدار بودن ضرایب رگرسیونی
بعد از آزمون معنیدار بودن رگرسیون، بایستی معنیدار بودن هر کدام از ضرایب آزمون گردد. هدف از انجام این آزمون آن است که مشخص شود آیا در سطح اطمینان مورد نظر ضریب محاسبه شده مخالف صفر است یا خیر؟ فرضهای این آزمون به شرح زیر است (ذوالنور، ۱۳۷۴، ۵۴-۵۶):
ضریب جامعه صفر است
ضریب جامعه مخالف صفر است
برای آزمون این فرضیه ها از آماره t استفاده میشود. اگر در سطح اطمینان ۹۵% (خطای ۵%=) آماره به دست آمده از آزمون کوچکتر از t به دست آمده از جدول با همان درجه آزادی باشد، فرض تأیید شده و در غیر این صورت رد میشود. در این آزمون عدم رد به مفهوم بی معنی بودن ضریب مورد نظر و رد به معنی معنیدار بودن ضریب مورد نظر است.