خطای استاندارد چیست؟
اگر میانگین درآمد در نمونه ای 18000 دلار باشد میانگین درآمد در جمعیت چقدر خواهد بود؟ ار آن جا که بعید است که نمونه بازتاب کامل جمعیت باشد(خطای نمونه گیری)نمی توان فقط با استفاده از میانگین نمونه (که برآورد نمونه خوانده می شود) میانگین واقعی درآمد جمعیت را (که پارامتر جمعیت خوانده می شود) پیدا کرد.
لازم است راهی برای برآورد میزان دقت احتمالی برآورد نمونه پیدا کرد. چنانچه نمونه ما نمونه ای تصادفی باشد نظریه ی احتمالات چنین راه حلی در اختیار ما قرار می دهد. اگر تعداد زیادی نمونه ی تصادفی مختلف داشته باشیم، اکثر آن ها تقریبا نزدیک به پارامتر جمعیت خواهند بود: میانگین اکثر آن ها نزدیک به میانگین واقعی جمعیت خواهد بود و فقط معدودی از آن ها تفاوت زیادی با میانگین جمعیت خواهند داشت. در واقع توزیع برآورد نمونه ها به توزیع نرمال نزدیک می گردد.
مسئله این جاست که اگر فقط یک نمونه داشته باشیم از کجا بدانیم میانگین نمونه ی ما چقدر به میانگین حقیقی جمعیت نزدیک است. ممکن است نمونه ما یکی از نمونه های پرت باشد، اما بیشتر محتمل است که یکی از نمونه های نزدیک به میانگین حقیقی جمعیت باشد(چون اکثر نمونه ها نزدیک به آن هستند).
اما حتی در این صورت تا چه حد بدان نزدیک است؟ برای برآورد میزان نزدیکی میانگین نمونه به میانگین جمعیت از آماره ای به نام خطای استاندارد میانگین (Standard Error یا SE) استفاده می کنیم که فرمول آن بدین شرح است:
پس از محاسبه خطای استاندارد نظریه احتمالات به ما می گوید که میانگین جمعیت احتمالا در محدوده ی چه دامنه ای از میانگین نمونه قرار دارد. طبق نظریه احتمالات در 95 درصد نمونه ها میانگین جمعیت در محدوده ی 2± واحد خطای استاندارد از میانگین نمونه قرار دارد. به عبارت دیگر به احتمال 95 درصد میانگین جمعیت در محدوده ی 2 خطای استاندارد از میانگینِ نمونه ما قرار دارد. بنابراین می توانیم برآورد کنیم که میانگین جمعیت در چه دامنه ای قرار دارد. به این دامنه فاصله اطمینان گفته می شود و میزان قطعیت قرار گرفتن میانگین جمعیت در این فاصله (95 درصد) سطح اطمینان خوانده می شود. رقمی که برای خطای استاندارد به دست می آوریم همواره برحسب واحد متغیر مورد بررسی است. مثلا اگر متغیر درآمد بر حسب دلار باشد و خطای استاندارد معدل 1000 بدان معناست که خطای استاندارد 1000 دلار است.
معنای همه ی این ها به زبان ساده چیست؟ گیریم میانگین درآمد در نمونه ما 18000 دلار است و خطای استاندارد آن 1000 دلار. در نتیجه به احتمال 95 درصد میانگین درآمد جمعیت در محدوده 16000 تا 20000 دلار است (یعنی 18000 به اضافه و منهای دو خطای استاندارد). اندازه خطای استاندارد تابع حجم نمونه است. بنابراین برای این که بتوان میانگین جمعیت را در محدوده ی کوچک تری برآورد کرد یعنی برای این که بتوان فاصله ی اطمینان را کاهش داد باید خطای استاندار را کم کرد. بدین منظور باید بر حجم نمونه افزود: با 4 برابر شدن حجم نمونه خطای استاندارد نصف می شود.
منبع:
سایت آماری خوارزمی
(برگرفته از کتاب پیمایش در تحقیقات اجتماعی، دی. اِی. دواس، ترجمه ی هوشنگ نایبی، نشر نی)