چرا توزیع نرمال حائز اهمیت است؟
زمانی که پژوهشگران از نمونه آماری داده جمع آوری می کنند، برخی اوقات تمام آنچه می خواهند بدانند ویژگی های آن نمونه آماری است. برای مثال، اگر بخواهم عادات غذا خوردن 100 دانشجوی سال اولی را مورد بررسی قرار دهم می توانم 100 دانشجو را انتخاب کنم، از آن ها بپرسم که چه می خورند، و سپس داده های به دست آمده را خلاصه کنم. داده هایی که به دست آورده ام ممکن است شامل میانگین مقدار کالری مصرف شده در هر روز توسط این 100 دانشجو، مورد علاقه ترین غذا، تنوع غذایی، و غیره را شامل شود. تمام این آماره ها ویژگی های نمونه آماری مرا فقط توصیف می کنند، که به آنها آماره های توصیفی می گویند. آماره های توصیفی به طور متداول برای توصیف یک نمونه آماری مشخص به کار می روند. زمانی که تمام آنچه که می خواهیم انجام دهیم فقط توصیف یک نمونه آماری است، دیگر نرمال بودن یا نبودن توزیع نمرات آماری تفاوتی ایجاد نمی کند.
1- با وجود این، آنچه پژوهشگران در بیشتر مواقع انجام می دهند چیزی فراتر از توصیف یک نمونه آماری است. در برخی موارد آن ها می خواهند بدانند احتمال اینکه چیزی به طور اتفاقی در نمونه رخ بدهد به طور دقیق چه میزان است. برای مثال، اگر یک دانشجوی معمولی در نمونه آماری ذکر شده به طور روزانه 2000 کالری در روز انرژی مصرف می کند، احتمال یا شانس این که دانشجویی در نمونه آماری وجود داشته باشد که به طور متوسط 5000 کالری در روز انرژی مصرف کند به چه میزان است؟ ویژگی های توزیع نرمال در محاسبات آماری بسیاری حساس و مهم هستند زیرا آنها ما را قادر می سازند تا از آمار احتمالات به طور مفید استفاده کنیم.
2- علاوه بر این، پژوهشگران اغلب علاقه مند هستند با استفاده از داده های مبتنی بر نمونه آماری بتوانند درباره جامعه آماری استنباط داشته باشند. برای تعیین این که پدیده ای که در نمونه آماری مشاهده شده است نمایان گر یک پدیده واقعی در جامعه آماری است، که نمونه از آن انتخاب شده است، لازم است از آمار استنباطی استفاده کنیم. برای مثال، تصور کنید در مطالعه ای فرض اولیه ی من این است که از نظر مصرف روزانه میزان کالری انرژی تفاوتی در جامعه آماری مردها و زن ها وجود ندارد. این فرض که مبتنی بر عدم وجود تفاوت است، فرض صفر نامیده می شود. حال فرض کنید پس از انتخاب نمونه ای آماری از مردها و زن ها میزان متوسط مصرف انرژی آن ها را با یکدیگر مقایسه کرده ام و متوجه شده ام که مردها به طور متوسط روزانه 200 کالری بیش از زن ها انرژی مصرف می کنند. با توجه به فرض صفر انتخاب شده مبنی بر عدم وجود اختلاف، احتمال پیدا کردن شانسی چنین اختلاف بزرگی بین نمونه های آماری من به چه میزان است؟ برای محاسبه چنین احتمالاتی، لازم است از توزیع نرمال استفاده کنم، زیرا ویژگی های توزیع نرمال متخصصان آمار را قادر می سازند تا آمار احتمالات را به صورت دقیق محاسبه کنند.
** گردآوری: مرکز آماری خوارزمی (منبع: کتاب آمار به زبان ساده، ترجمه عبدالوهاب خادمی شمامی)