مطالب ارائه شده برگرفته از کتاب "راهنمای آسان تحلیل آماری با SPSS" تالیف آقای"رامین کریمی" است. کپی فقط با ذکر منبع مجاز می باشد.
تبدیـل داده ها
گاهی داده های خامی که برای تحلیل داریم مناسب گروهی از آزمون های آماری نیستند و برای اینکه بتوانیم از این دسته آزمون های آماری استفاده کنیم و همچنین دقت تحلیل را بالا ببریم باید در داده های خام تغییراتی ایجاد کنیم. یکی از این تغییرات، تبدیل داده ها نام دارد. تبدیل داده ها، روش هایی ریاضی است که برای تعدیل متغیرهایی به کار می رود که از مفروضه های آماری نرمال بودن، خطّی بودن و یکسانی پراکندگی پیروی نمی کنند یا الگوهایی با داده های پرت غیرمعمول دارند (میزر و دیگران،111:1391).
در مجموع زمانی که پیش شرط های آزمون های چندمتغیره برقرار نباشد، باید داده های به دست آمده را تبدیل کنیم تا امکان استفاده از برخی آزمون های مدنظر(عموما پارامتریک) فراهم شود.
در ابتدا باید میزان تخطّی و تفاوت داده ها از پیش فرض های ذکر شده را تعیین کرد و در صورتی که پیش فرض ها یا پیش شرط های آماری به دست آمده دارای تفاوت قابل اعتنایی با مقدار معیار باشند از روش تبدیل داده ها استفاده کرد. تبدیل داده ها با هدف تعدیل متغیرها از جنبه علمی روشی پذیرفته شده است. البته زمانی که اختلاف داده ها با پیش فرض های آماری اندک باشد و به طور تقریبی مفروضات آماری برقرار باشد می توان از تبدیل داده ها صرف نظر کرد.
باید توجه داشت که تبدیل داده ها تا اندازهای مانند شمشیر دولبه است. حسن این روش این است که می تواند دقت معنی داری تحلیل های آماری را افزایش دهد و عیب آن این است که ممکن است تفسیر داده ها را دشوارتر کند. در نتیجه باید از روش تبدیل داده ها به شیوه ای مدبرانه استفاده کرد.
دشوارکردن تفسیر داده ها بدین معناست که وقتی داده ها را تبدیل می کنیم، مقدار حداقل و حداکثر و شیوه توزیع متغیر وتمامی شاخص های میانگین و انحراف استاندارد تغییر می کند و با حالت معمول و عادی تفاوت پیدا می کند. مثلا اگر سن افراد که به صورت کمّی (نسبی) سنجیده شده است را به توان دو برسانیم شاخص های آماری سن افراد تغییر می کند و با سن های غیر عادی مثل 250 ، 300 و غیره مواجه می شویم. یا وقتی متغیری مانند اعتماد اجتماعی داریم و با 10 سوال این متغیر را سنجیدیم و دامنه میانگین این متغیر بین 1 تا 5 باشد، لگاریتم گرفتن از این متغیر دامنه نمرات را تغییر می دهد و توضیح و تفسیر متغیر را با مشکل مواجه می کند. یکی از راه های رفع این مشکل این است که هنگام گزارش یافته های توصیفی و شاخص های آماری (مانند میانگین، انحراف استاندارد و مقدار حداقل و حداکثر)؛ یافته ها و شاخص های آماری را هم به صورت عادی (قبل از تبدیل داده ها) و هم بعد از تبدیل داده ها گزارش کنیم.
انواع روشهای تبدیل داده
روشهای مختلفی برای تبدیل داده ها وجود دارد که برخی از روش های متداول عبارتند از: ریشه دوم، لگاریتم، وارون و مجذور کردن. بین آمارشناسان در مورد استفاده از انوع روش های تبدیل داده ها در شرایط خاص اتفاق نظر وجود ندارد. با وجود این، یک راهبرد اساسی برای به کاربردن روش های تبدیل این است که برحسب جدی بودن تخطّی از پیش فرض های آماری، راهبردهای پیشرفته تر (سطح بالاتر) به کار بسته شود. برای مثال، تاباچینک و فیدل (2001) و مرتلر واناتا (2001) برای پیشرفت تبدیل داده ها از ریشه دوم (برای اصلاح تخطّی متوسط)، لگاریتم (برای تخطّی اساسی تر) و سپس ریشه دوم وارون (برای رسیدگی به تخطّی شدید) جانبداری می کنند. مجذور کردن یک متغیر در رابطه دو متغیری غیرخطّی می تواند مشکل غیرخطّی بودن را به طور مؤثر کاهش بدهد (میزر و دیگران،113:1391).
به طور کلی زمانی که داده ها نرمال نیستند از روش های ریشه دوم، لگاریتم و وارونه کردن برای تبدیل داده ها استفاده می شود.
جدول 3-4- انواع روش های تبدیل داده ها برحسب نوع انحراف از پیش فرض ها
نوع مشکل در پیش فرض ها |
نوع تبدیل پیشنهادی |
نقض پیش فرض ها به طور کلی |
ریشه دوم (برای اصلاح تخطّی متوسط)
لگاریتم (برای تخطّی اساسی تر)
ریشه دوم وارون (برای رسیدگی به تخطّی شدید) |
غیرخطّی بودن رابطه |
مجذور کردن (به توان دو رساندن) |
چولگی متوسط (مثبت یا منفی) |
ریشه دوم |
چولگی شدید (مثبت یا منفی) |
لگاریتم (Log 10) |
نتایج آزمون های نرمال بودن نشان داد که یکی از متغیرهای مثال کتاب از توزیع نرمال برخوردار نیست. بدین جهت که قصد استفاده از آزمون های پارامتریک را داریم نیازمند این هستیم که توزیع این متغیر را به توزیع نرمال نزدیک کنیم. در نتیجه از تبدیل داده ها بهره می گیریم.
اجـ ـرا:
تبدیل داده ها در برنامه SPSS از طریق دستور Compute انجام می شود. این دستور در منوی Transform در دسترس است.
1- در پنجره ایجاد شده (Compute Variable) و در کادر Target Variable نامی برای متغیری که می خواهیم ایجاد کنیم انتخاب می کنیم (نام انتخاب شده باید با نام متغیرهای موجود تفاوت داشته باشد).
2- برای گرفتن لگاریتم، در کادر Function group بر روی گزینه All و در کادر پایین آن ( Function and Special Variables) بر روی گزینه Lg10 کلیک می کنیم و با استفاده از دستور آن را وارد کادر بیان عددی (Numeric Expression ) می کنیم. متغیر مورد نظر را از کادر متغیرها در سمت چپ انتخاب میکنیم و با دستور در داخل پرانتزِ کادر Numeric Expression قرار می دهیم و در انتها گزینه OK را می زنیم. دستورات مطرح شده در شکل بعد نشان داده شده است.
عبارت داخل کادر بیان عددی باید بدین صورت باشد
چگونگی انجام سایر روش های تبدیل
نکته: برای مجذور کردن یا به توان دو رساندن متغیر کافیست در کادر Numeric Expression متغیر مد نظر را وارد کرده و سپس علامت * (ضرب) را از کادر ماشین حساب در کادر قرار دهیم و دوباره همان متغیر را وارد کادر کنیم.
نکته: برای وارون یا معکوس کردن متغیر، عدد 1 را در کادر Numeric Expression وارد کنیم و علامت /(تقسیم) را از کادر ماشین حساب انتخاب کرده و سپس متغیر مد نظر را وارد کادر کنیم.
نکته: برای به دست آوردن ریشه دوم (جذر گرفتن) کافیست که گزینه SQRTرا از کادر Function and… را انتخاب کنیم و مانند مورد لگاریتم عمل کنیم.
نتـ ـایج:
بعد از انجام تبدیل متغیر، متغیری جدید در صفحه داده ها ایجاد می شود که در تحلیل داده ها از آن استفاده می کنیم.
-
نکته: زمانی که شیوه تعریف داده ها طوری باشد که برخی از موردها با کد 0 (صفر) نشان داده شده باشند، قبل از تبدیل داده ها باید تغییراتی در داده های خام ایجاد کرد. بدین صورت که به همه داده های خام متغیر مورد نظر عدد 1 را اضافه می کنیم تا حداقل نمره در داده ها برابر با 1 باشد و بتوان به نتایج معنی دار و مناسبی از تبدیل داده ها دست یافت. برای افزودن عدد 1 به همه داده ها کافیست در دستور Compute و در کادر Numeric Expression ابتدا نام متغیر را وارد کنیم و سپس علامت + (جمع) را وارد کنیم و عدد یک را بزنیم، مانند شکل پایین.
دانلود فایل PDF متن بالا
مطالب ارائه شده برگرفته از کتاب "راهنمای آسان تحلیل آماری با SPSS" تالیف آقای"رامین کریمی" است. کپی فقط با ذکر منبع مجاز می باشد.