رگرسیون چند متغیری (گام به گام) روشی است برای تحلیل مشارکت جمعی و فردی دو یا چند متغیر مستقل، در تغییرات یک متغیر وابسته. این روش امکان میدهد که هم میزان مشارکت مجموعه متغیرهای مستقل بطور همزمان در تغییرات متغیر وابسته برآورده شود و هم اهمیت هر یک از متغیرهای مستقل بطور جداگانه در این تغییر مشخص شود. بعبارت دیگر از طریق این روش میتوانیم تعیین کنیم که (Page, Melanie C,2007,p 82) :
چه مقدار از واریانس متغیر وابسته توسط هر یک از متغیرهای مستقل حاصل میشود.
ترکیبهای مختلف از متغیرهای مستقل، به چه میزان از قدرت ما را در پیشبینی تغییرات متغیر وابسته افزایش میدهند.
بهترین ترکیب از متغیرهای مستقل را که بتوانند مقدار همبستگی بین متغیرها را بطور معنی داری افزایش دهند، مشخص میکند
در روش رگرسیون چند متغیری گام به گام پس از محاسبه همبستگی بین متغیرهای مستقل و وابسته، ماتریس همبستگی متغیرها ارائه میگردد. سپس برای اولین گام، متغیر مستقلی که بزرگنرین همبستگی ساده را با متغیر وابسته دارد انتخاب نموده معادله رگرسیون آنرا با متغیر وابسته مینویسیم و ضریب همبستگی رگرسیون(R) متغیری که بیشترین همبستگی را با متغیر وابسته دارد، محاسبه میکنیم. تفاوت ضریب همبستگی چند متغیری با همبستگی بین یک متغیر وابسته و یک متغیر مستقل در اینست که ارزشهای ضریب همبستگی چند متغیری بین صفر و یک است. این ضریب و خصوصاً مجذور آن، مقدار رابطه بین دو متغیر را بیان میکند. یعنی پیشبینی میکند که چه مقدار از واریانس متغیر وابسته، توسط متغیر مستقل حاصل میشود و برای تعیین معنی دار بودن آن به لحاظ آماری، از طریق تحلیل واریانس، نسبت F را محاسبه میکنیم تا معنی دار بودن همبستگی تعیین گردد.
در گام بعدی متغیر مستقل دیگری را که قادر باشد میزان پیش بینی ما را از متغیر وابسته افزایش دهد وارد کرده، معادله رگرسیون دو متغیر مستقل را با متغیر وابسته مینویسیم. در این مرحله تاثیر هر دو متغیر مستقل را بر متغیر وابسته مورد بررسی قرار میدهیم. لذا ضریب همبستگی چند متغیری را محاسبه نموده و از طریق تحلیل واریانس نسبت F را تعیین میکنیم. در گامهای به همین ترتیب متغیر مستقل دیگری را وارد کرده معادلات رگرسیون آنها را ارائه میدهیم.
فرمول کلی عبارتست از:
Z=a+bx+cy+…
a: عدد ثابت
b: ضریب متغیر اول ورودی به مدل
C: ضریب متغیر دوم ورودی به مدل
x: متغیر اول ورودی به مدل
Y:متغیر دوم ورودی به مدل...
همانطور که در بالا اشاره گردید، ترتیب ورود متغیرها به معادله، بدین صورت است که هر متغیری که بالاترین تاثیر را بر متغیر وابسته داشته باشد، ابتدا به معادله بعنوان متغیر مستقل اول، وارد میشود و در ادامه متغیری که در رتبه دوم تاثیرگذاری تشخیص داده شده وارد میگردد. اینکار تا آنجایی ادامه پیدا میکند که ورود متغیر جدید، به لحاظ آماری معنادار باشد. درجه تاثیرگذاری متغیرهای مستقل جهت رعایت ترتیب ورود آنها به مدل، با استفاده از ضریب همبستگی اسپرمن مشخص خواهد شد.
آزمون معنی داری β در رگرسیون خطی :
یکی از آزمونهای معتبر دیگر جهت تست فرضیات، آزمون معنی داری β در رگرسیون خطی میباشد که در این تحقیق جهت غنیتر شدن و تایید و تکمیل نتایج آزمون t استیودنت و ضریب همبستگی اسپرمن و برآورد رابطه خطی بین متغیرها و به دلایلی که در بالا بدانها اشاره شد، از این آزمون نیز استفاده خواهد شد.
واژه رگرسیون به معنای بازگشت است و نشان دهنده این است که مقدار یک متغیر به متغیر دیگر وابسته است. این واژه را اولین بار "فرانسیس گالتون" در سال 1877 میلادی در تبیین روابط بین متغیرها به کار برد.
در رگرسیون به دنبال برآورد رابطه ای ریاضی و تحلیل آن هستیم، بطوریکه با آن بتوان کمیت متغیری مجهول را با استفاده از متغیرهای معلوم یا مستقل، تعیین کرد. این معادله بصورت زیر نشان داده میشود :
Y = a + b1x1 + b2x2 + …+ bkxk + e
در معادله فوق، a عرض از مبداء و bi ضریب رگرسیون و e خطای پیش بینی نامیده میشود.
رابطه خطی برآوردی در این آزمون و ضرایب متغیرهای مستقل تخمین زده شده، به نوعی، تفسیر پیش بینی تاثیرپذیری متغیر وابسته از متغیرهای مستقل تحقیق است. یعنی ضرایب محاسبه شده برای هر یک از متغیرهای وابسته در معادله ای که همه آنها با متغیر وابسته موجودند، نشانگر این مطلب اند که در آینده، با افزایش یک واحدی هر یک از این متغیرهای مستقل، متغیر وابسته چه اندازه تغییر خواهد کرد.
مراحل آزمون معنی داربودن β به شرح زیر است (Richard, K, and Jan copernic,2008,p 183) :
H0 : β = 0
H1 : β = 1
در این آزمون، H0 نشان دهنده آن است که شیب خط رگرسیون جامعه صفر است. یعنی رابطه خطی بین دو متغیر نمیتوان یافت و مقادیر y تابعی از x نیست و H1 بیانگر وجود رابطه خطی بین دو متغیر در جامعه است. یعنی بیانگر فرضیه پژوهشی است.
آماره آزمون که دارای توزیع t استیودنت با (n-2) درجه آزادی است، بر اساس فرمول زیر محاسبه میگردد :
که در رابطه فوق Sb خطای معیار b (ضریب رگرسیون حاصل از نمونه) از طریق رابطه زیر بدست میآید :
که در رابطه فوق، خطای معیار برآورد است که از طریق فرمول زیر برآورد میشود :
در این مرحله مقادیر بحرانی با توجه به n و α و یک دنباله یا دو دنباله بودن آزمون تعیین میشوند.
اگر چنانچه آماره آزمون با توجه به مقادیر بحرانی در ناحیه پذیرش H0 واقع باشد، فرض H0 در سطح اطمینان (α - 1) * 100 درصد پذیرفته میشود. بعبارت دیگر رابطه خطی معنی داری بین متغیر مستقل و متغیر وابسته وجود ندارد. در غیر اینصورت، دادههای نمونه، دلیل محکمی بر تایید H0 ارائه ندهد و به بیان دیگر H1 تایید شده، یعنی رابطه خطی معنی داری بین متغیر وابسته و متغیر مستقل وجود دارد (آذر، عادل، 1380، ص163 )
زمانیکه این آزمون از طریق نرم افزار spss برآورد گردد (مثل این تحقیق)، اگر سطح معناداری جدول خروجی نرم افزار، کمتر از 05/0 باشدیعنی فرض H0 در سطح معنای 95/0 تایید نشده و در نتیجه رابطه خطی معنی داری بین دو متغیر وجود دارد.