تحلیل رگرسیون

در مقاله زیر شما را با تفاوت ضریب همبستگی چند متغیری با همبستگی بین یک متغیر وابسته و یک متغیر مستقل آشنا می‌کنیم.

تحلیل رگرسیون

تحلیل رگرسیون

رگرسیون گام به گام :

رگرسیون چند متغیری (گام به گام) روشی است برای تحلیل مشارکت جمعی و فردی دو یا چند متغیر مستقل، در تغییرات یک متغیر وابسته. این روش امکان می‌دهد که هم میزان مشارکت مجموعه متغیرهای مستقل بطور همزمان در تغییرات متغیر وابسته برآورده شود و هم اهمیت هر یک از متغیر‌های مستقل  بطور جداگانه در این تغییر مشخص شود. بعبارت دیگر از طریق این روش می‌توانیم تعیین کنیم که (Page, Melanie C,2007,p 82) :

  1. چه مقدار از واریانس متغیر وابسته توسط هر یک از متغیر‌های مستقل حاصل می‌شود.

  2. ترکیب‌های مختلف از متغیرهای مستقل، به چه میزان از قدرت ما را در پیش‌بینی تغییرات متغیر وابسته افزایش می‌دهند.

  3. بهترین ترکیب از متغیرهای مستقل را که بتوانند مقدار همبستگی بین متغیرها را بطور معنی داری افزایش دهند، مشخص می‌کند

در روش رگرسیون چند متغیری گام به گام پس از محاسبه همبستگی بین متغیرهای مستقل و وابسته، ماتریس همبستگی متغیرها ارائه می‌گردد. سپس برای اولین گام، متغیر مستقلی که بزرگنرین همبستگی ساده را با متغیر وابسته دارد انتخاب نموده معادله رگرسیون آن‌را با متغیر وابسته می‌نویسیم و ضریب همبستگی رگرسیون(R) متغیری که بیشترین همبستگی را با متغیر وابسته دارد، محاسبه می‌کنیم. تفاوت ضریب همبستگی چند متغیری با همبستگی بین یک متغیر وابسته و یک متغیر مستقل در اینست که  ارزش‌های ضریب همبستگی چند متغیری بین صفر و یک است. این ضریب و خصوصاً مجذور آن، مقدار رابطه بین دو متغیر را بیان می‌کند. یعنی پیش‌بینی می‌کند که چه مقدار از واریانس متغیر وابسته، توسط متغیر مستقل حاصل می‌شود و برای تعیین معنی دار بودن آن به لحاظ آماری، از طریق تحلیل واریانس، نسبت F را محاسبه می‌کنیم تا معنی دار بودن همبستگی تعیین گردد.

در گام بعدی متغیر مستقل دیگری را که قادر باشد میزان پیش بینی ما را از متغیر وابسته افزایش دهد وارد کرده، معادله رگرسیون دو متغیر مستقل را با متغیر وابسته می‌نویسیم. در این مرحله تاثیر هر دو متغیر مستقل را بر متغیر وابسته مورد بررسی قرار می‌دهیم. لذا ضریب همبستگی چند متغیری را محاسبه نموده و از طریق تحلیل واریانس نسبت F  را تعیین می‌کنیم. در گام‌های به همین ترتیب متغیر مستقل دیگری را وارد کرده معادلات رگرسیون آنها را ارائه می‌دهیم.

فرمول کلی عبارتست از:

Z=a+bx+cy+…

a: عدد ثابت

b: ضریب متغیر اول ورودی به مدل

C: ضریب متغیر دوم ورودی به مدل

x: متغیر اول ورودی به مدل

Y:متغیر دوم ورودی به مدل...

همانطور که در بالا اشاره گردید، ترتیب ورود متغیرها به معادله، بدین صورت است که هر متغیری که بالاترین تاثیر را بر متغیر وابسته داشته باشد، ابتدا به معادله بعنوان متغیر مستقل اول، وارد می‌شود و در ادامه متغیری که در رتبه دوم تاثیرگذاری تشخیص داده شده وارد می‌گردد. اینکار تا آنجایی ادامه پیدا می‌کند که ورود متغیر جدید، به لحاظ آماری معنادار باشد. درجه تاثیرگذاری متغیرهای مستقل جهت رعایت ترتیب ورود آنها به مدل، با استفاده از ضریب همبستگی اسپرمن مشخص خواهد شد.

آزمون معنی داری β در رگرسیون خطی :

یکی از آزمون‌های معتبر دیگر جهت تست فرضیات، آزمون معنی داری β در رگرسیون خطی می‌باشد که در این تحقیق جهت غنی‌تر شدن و تایید و تکمیل نتایج آزمون t استیودنت و ضریب همبستگی اسپرمن و برآورد رابطه خطی بین متغیرها و به دلایلی که در بالا بدان‌ها اشاره شد، از این آزمون نیز استفاده خواهد شد.

واژه رگرسیون به معنای بازگشت است و نشان دهنده این است که مقدار یک متغیر به متغیر دیگر وابسته است. این واژه را اولین بار "فرانسیس گالتون" در سال 1877 میلادی در تبیین روابط بین متغیرها به کار برد.

در رگرسیون به دنبال برآورد رابطه ای ریاضی و تحلیل آن هستیم، بطوریکه با آن بتوان کمیت متغیری مجهول را با استفاده از متغیرهای معلوم یا مستقل، تعیین کرد. این معادله بصورت زیر نشان داده می‌شود :

Y = a + b1x1 + b2x2 + …+ bkxk + e

در معادله فوق، a عرض از مبداء و bi ضریب رگرسیون و e خطای پیش بینی نامیده می‌شود.

رابطه خطی برآوردی در این آزمون و ضرایب متغیرهای مستقل تخمین زده شده، به نوعی، تفسیر پیش بینی تاثیرپذیری متغیر وابسته از متغیرهای مستقل تحقیق است. یعنی ضرایب محاسبه شده برای هر یک از متغیرهای وابسته در معادله ای که همه آنها با متغیر وابسته موجودند، نشانگر این مطلب اند که در آینده، با افزایش یک واحدی هر یک از این متغیرهای مستقل، متغیر وابسته چه اندازه تغییر خواهد کرد.

مراحل آزمون معنی داربودن β به شرح زیر است (Richard, K, and Jan copernic,2008,p 183) :

1-تعیین فرضیات آزمون :

H0 : β    =  0             

H1 : β    =  1             

در این آزمون، H0  نشان دهنده آن است که شیب خط رگرسیون جامعه صفر است. یعنی رابطه خطی بین دو متغیر نمی‌توان یافت و مقادیر y تابعی از x نیست و H1  بیانگر وجود رابطه خطی بین دو متغیر در جامعه است. یعنی بیانگر فرضیه پژوهشی است.

2-محاسبه آماره آزمون :

آماره آزمون که دارای توزیع t استیودنت با (n-2) درجه آزادی است، بر اساس فرمول زیر محاسبه می‌گردد :

 

که در رابطه فوق Sb خطای معیار b (ضریب رگرسیون حاصل از نمونه) از طریق رابطه زیر بدست می‌آید :

 

که در رابطه فوق،  خطای معیار برآورد است که از طریق فرمول زیر برآورد می‌شود :

 

3-تعیین مقادیر بحرانی :

در این مرحله مقادیر بحرانی با توجه به n و α و یک دنباله یا دو دنباله بودن آزمون تعیین می‌شوند.

4-تصمیم گیری :

اگر چنانچه آماره آزمون با توجه به مقادیر بحرانی در ناحیه پذیرش H0 واقع باشد، فرض H0 در سطح اطمینان (α - 1) * 100 درصد پذیرفته می‌شود. بعبارت دیگر رابطه خطی معنی داری بین متغیر مستقل و متغیر وابسته وجود ندارد. در غیر اینصورت، داده‌های نمونه، دلیل محکمی بر تایید H0 ارائه ندهد و به بیان دیگر H1 تایید شده، یعنی رابطه خطی معنی داری بین متغیر وابسته و متغیر مستقل وجود دارد (آذر، عادل، 1380، ص163  )

زمانیکه این آزمون از طریق نرم افزار spss برآورد گردد (مثل این تحقیق)، اگر سطح معناداری جدول خروجی نرم افزار، کمتر از 05/0 باشدیعنی فرض H0 در سطح معنای 95/0 تایید نشده و در نتیجه رابطه خطی معنی داری بین دو متغیر وجود دارد.

موسسه تدبیرساز

تماس و پیام‌رسانی: