تکنیک ­های آمـار اسـتنباطی

>>> کپی برداری تنها با ذکر منبع مجاز است.
منبع: کتاب «راهنمای آسان تحلیل آماری با SPSS؛ نویسنده: رامین کریمی»

آمار استنباطی شامل یک سری روش­ های آماری است که بر اساس اطلاعات نمونه، درباره ویژگی های جمعیت، پیشگویی­ هایی را فراهم می­کند. تمرکز اولیه اکثر پژوهش­ ها بر روی پارامترهای جمعیت تحت مطالعه است. نمونه و آماره­ های توصیف­ کننده آن تنها تا جایی اهمیت دارند که اطلاعاتی را در مورد پارامترهای جمعیت فراهم کنند. بنابراین، یک جنبه مهم استنباط آماری، گزارش از صحّت احتمالی یا درجه اطمینان از آماره نمونه ه­ای است که مقدار پارامتر جمعیت را پیشگویی می­کند.
همان­طور که ذکر شد از آمار استنباطی برای استنتاج الگوها و خصوصیات جمعیّت از خصوصیات نمونه استفاده می­شود. رایج ­ترین تکنیک ­های استنباطی در تحلیل یک متغیره، برآوردهای فاصله ­ای (خطای استاندارد) و در تحلیل دو یا چند­متغیره بهره گیری از سطح معنی­ داری (سطح خطا) است.


 

    1.برآوردهای فاصله­ای یا خطای استاندارد


اگر میانگین درآمد در نمونه ­ای 18000 دلار باشد میانگین درآمد در جمعیّت چقدر خواهد بود؟ چون بعید است که نمونه بازتاب کامل جمعیّت باشد (خطای نمونه­ گیری)، نمی­توان فقط با استفاده از میانگین نمونه (که برآورد نمونه خوانده می­شود) میانگین واقعی درآمد جمعیّت را (که پارامتر جمعیّت خوانده می­شود) پیدا کرد.
لازم است راهی برای برآورد میزان دقت احتمالی برآورد نمونه پیدا کرد. چنانچه نمونه ما نمونه­ای تصادفی باشد نظریه احتمالات چنین راه ­حلی در اختیار ما قرار می ­دهد. اگر تعداد زیادی نمونه تصادفی مختلف داشته باشیم، اکثر آن­ها تقریبا نزدیک به پارامتر جمعیّت خواهند بود: میانگین اکثر آن­ها نزدیک به میانگین واقعی جمعیّت خواهد بود و فقط معدودی از آن­ها تفاوت زیادی با میانگین جمعیّت خواهند داشت. در واقع توزیع برآورد نمونه­ ها به توزیع نرمال نزدیک می­شود.
مسأله این جاست که اگر فقط یک نمونه داشته باشیم (که دارای تعدادی عضو است) چگونه بدانیم میانگین نمونه ما چقدر به میانگین حقیقی جمعیّت نزدیک است. ممکن است نمونه ما یکی از نمونه ­های پرت باشد، اما بیشتر محتمل است که یکی از نمونه ­های نزدیک به میانگین حقیقی جمعیّت باشد(چون اکثر نمونه­ ها نزدیک به آن هستند). اما حتی در این صورت تا چه حد به آن نزدیک است؟ برای برآورد میزان نزدیکی میانگین نمونه به میانگین جمعیّت از آماره­ای به نام خطای استاندارد میانگین استفاده می­کنیم.


پس از محاسبه خطای استاندارد نظریه احتمالات به ما می گوید که میانگین جمعیّت احتمالا در  چه دامنه­ای از میانگین نمونه قرار دارد. طبق نظریه احتمالات در 95 درصد نمونه­ها، میانگین جمعیّت در محدوده 2±واحد خطای استاندارد از میانگین نمونه قرار دارد. به عبارت دیگر به احتمال 95 درصد میانگین جمعیّت در محدوده 2±خطای استاندارد از میانگینِ نمونه ما قرار دارد. بنابراین می­توانیم برآورد کنیم که میانگین جمعیّت در چه دامنه­ای قرار دارد. به این دامنه فاصله اطمینان گفته می­شود و میزان قطعیتِ قرار گرفتن میانگین جمعیّت در این فاصله، سطح اطمینان خوانده می­شود. رقمی که برای خطای استاندارد به دست می­ آوریم همواره برحسب واحد متغیر مورد بررسی است. مثلا اگر متغیر درآمد بر حسب دلار باشد و خطای استاندارد 1000 باشد، بدان معناست که خطای استاندارد 1000 دلار است. معنای همه این­ها به زبان ساده چیست؟ گیریم میانگین درآمد در نمونه ما 18000 دلار است و خطای استاندارد آن 1000 دلار. در نتیجه به احتمال 95 درصد میانگین درآمد جمعیّت در محدوده 16000 تا 20000 دلار است (یعنی 18000 به اضافه و منهای دو خطای استاندارد).
اندازه خطای استاندارد تابع حجم نمونه است. بنابراین برای این که بتوان میانگین جمعیّت را در محدوده کوچکتری برآورد کرد؛ یعنی برای این که بتوان فاصله اطمینان را کاهش داد باید خطای استاندارد را کم کرد. بدین منظور باید بر حجم نمونه افزود: با چهار برابر شدن حجم نمونه، خطای استاندارد نصف می­شود.

 

    2.سطح معنی­ داری

بعد از این که مشخص شد دو متغیر با هم رابطه دارند باید دید رابطه­ ای که در نمونه مشاهده شده است به همان شدّت در جمعیّتی که نمونه از آن گرفته شده است نیز وجود دارد یا خیر: باید دید می­توان نتایج حاصله از نمونه را با اطمینان تعمیم داد یا خیر. بدین منظور از آمار استنباطی (آزمون­ های معنی­ داری) سود می­ جوییم.
منطقی که در پس این آماره­ ها نهفته است چیست؟ معمولا ابتدا فرض می­ کنیم در جمعیّت بین دو متغیر رابطه­ ای وجود ندارد (یعنی 0 = r= همبستگی). این فرضیه را فرضیه صفر می­نامند. چنانچه مشاهده کردیم در نمونه بین دو متغیر رابطه ­ای وجود دارد (مثلا 4/. = r) تفاوت فرض عدم رابطه در جمعیّت با رابطه مشاهده شده در نمونه به دو صورت قابل تفسیر است:
1-نمونه ما نمونه معرّف نیست. چه بسا با­وجود استفاده از تکنیک­ های نمونه­ گیری تصادفی، بازهم نمونه ما نمونه ­ای غیر معرّف باشد. این را خطای نمونه­ گیری می ­نامند. بدین ترتیب ممکن است تفاوت بین نتیجه حاصل از نمونه (04/. =r) و فرض عدم وجود رابطه در جمعیّت (0=r) این باشد که نمونه، معرّف خوبی از جمعیّت نیست.
2-فرض عدم رابطه در جمعیّت فرض غلطی است (فرض وجود رابطه در جمعیّت صحیح است).
اگر تفسیر اول را بپذیریم و حاصل نمونه (04/. =r) را ناشی از خطای نمونه­ گیری بدانیم، آن­گاه می گوییم بعید است که رابطه بین دو متغیر در جمعیّت از صفر تجاوز کند (یعنی فرض عدم رابطه را قبول می­کنیم). از آن جا که معمولا هدف از مطالعه نمونه، استنتاج درباره جمعیّت است، فرض را بر آن می­ گیریم که رابطه مشاهده شده در نمونه (04/. =r)، پیامد خطای نمونه ­گیری است و در نتیجه آن را معادل عدم رابطه در جمیعت (0=r) می­گیریم.
اما اگر تفسیر دوم را بپذیریم و فرض اولیه عدم رابطه در جمعیّت را غلط بدانیم، نتیجه حاصل از نمونه را بازتاب رابطه واقعا موجود در جمعیّت تفسیر می­ کنیم و چنان عمل می کنیم که گویی رابطه مشاهده شده در نمونه واقعی است و محصول نمونه غیر معرّف نیست. به بیان دیگر می ­توانیم وجود رابطه در جمعیّت را با توجه به وجود رابطه در نمونه بپذیریم.

 
 

دانلود فایل PDF متن بالا