ماهيت همخطي
همخطي در اصل به معناي وجود ارتباط خطي كامل يا دقيق بين همه يا بعضي از متغيرهاي توضيحي مدل رگرسيون ميباشد. براي رگرسيون k متغيره با متغيرهاي توضيحي X1,…,Xk (كه در تمام مشاهدات براي جزء عرض از مبدأ 1=x1 منظور ميشود.)
ارتباط خطي دقيق وجود دارد اگر:
(1-10)
ها مقادير ثابتي هستند كه همه آنها به طور هم زمان صفر نيستند.
- اصطلاح هم خطي در مفهومي كلي هم شامل همخطي كامل و هم شامل همخطي ناقص ميگردد.
جزء خطاي آماري: Vi
اگر رابطه (2-10) چنين خواهد بود:
2Xتركيب خطي دقيق از ساير Xها نيست چرا كه جزء خطاي آماري Vi نيز در تعيين مقدار 2X نقش دارد.
نمودار بالتين:
در اين شكل دواير Y و 2X و 3X بهترتيب بيانگر تغييرات در Y و 2X و 3X ميباشد. درجه همخطي را ميتوان بهوسيلة سطح مشترك دواير 2 Xو 3X اندازهگيري نمود.
در حالت همخطي كامل، ضرايب رگرسيون، نامعين و انحراف معيارهاي مربوطهشان بينهايت ميباشند.
بهطور مثال:
با فرض كه در آن خواهيم داشت:
كه يك عبارت نامعين است.
تخمين در حالت وجود همخطي شديد اما غير كامل
و vi جزء خطاي آماري است بهطوري كه:
(1-3-10)
(2-3-10)
در اين جا برخلاف حالت قبل دليلي دال بر عدم قابليت تخمين نداريم. البته اگر vi به حد كافي كوچك باشد (خيلي نزديك به صفر) آنگاه رابطه (1-3-10) بر همخطي تقريباً كامل دلالت داشته لذا به حالت نامعين بازميگرديم.
+
الف) بزرگي واريانس و كوواريانس تخمينزنهاي OLS:
هرچه به طرف يك ميل كند (يعني هر چه همخطي افزايش يابد) واريانسهاي هر دو تخمين افزايش مييابد.
ج) نسبتهاي t غير معنادار :
در حالتهاي همخطي زياد انحراف معيارهاي تخمينزنها افزايش مييابد لذا مقادير t را كوچكتر ميسازد.
د) R2 بالا اما تعداد اندك نسبتهاي معنادار:
يكي از علائم همخطي معنيدارنبودن مقادير t همزمان با R2 بسيار بالاست.
ه) حساسيت تخمينزنهاي OLS و خطاي معيار آنها نسبت به تغييرات اندك در دادهها:
با توجه به جدول (3-10):
با تعويض مقادير سوم و چهارم 3X
نتيجه تغيير جزيي در دادهها اين است كه قبلاً در سطح 10% از لحاظ آماري معنيدار بود،اكنون ديگرمعني دار نيست.