نقش داده های گمشده در یک کار پژوهشی و تاثیر آن بر تحلیل آماری و انواع روشها برای تحلیل داده ها با وجود مقادیر گ

نقش داده های گمشده در یک کار پژوهشی و تاثیر آن بر تحلیل آماری و انواع روشها برای تحلیل داده ها با وجود مقادیر گ

تعداد صفحات: مشده

حجم فایل: 278 KB

فرمت فایل: word

دسته بندی:

قیمت: 269,900 ریال

تعداد نمایش: 39 نمایش

ارسال توسط:

تاریخ ارسال: 20 آوریل 2023

به روز رسانی در: 20 آوریل 2023

خرید این محصول:

پس از پرداخت لینک دانلود برای شما نمایش داده می شود.

269,900 ریال – خرید

بررسی نقش داده های گمشده در یک کار پژوهشی و تاثیر آن بر تحلیل آماری و انواع روشها برای تحلیل داده ها با وجود مقادیر گمشده      39

 

فهرست مطالب

 

داده های گمشده          4

شيوه های متفاوت در برخورد با مشكل داده‌هاي گمشده        4

بی پاسخی و داده های گمشده در آمارگیریهای نمونه ای        6

اثر بی پاسخی بر درستی برآوردها     7

آمارگیریهای پستی همراه با مصاحبه با بی پاسخها                9

مثال تشریحی              9

تعیین کسر بهینۀ بی پاسخهای آغازین برای زیرنمونه در تلاشهای متمرکز 12

سازوکارهایی که مقادیر گمشده از آنها ناشی می شود            13

گمشده کاملاً تصادفی:   14

گمشده تصادفی:           14

مقادیر گمشده غیرقابل چشم پوشی: 14

انواع روشها برای تحلیل داده ها با وجود مقادیر گمشده         18

روشهای مربوط به مورد کامل :         18

روشهای مبتنی بر جانهی :              19

روشهای تجدید  وزن دهی:              19

انواع روش های جانهی   20

جانشین کردن میانگین: 20

روش بی درنگ:            21

مثال تشریحی:             22

مدل رگرسیون لوجستیک با وجود مقادیر گمشده تصادفی در متغیر کمکی               24

زمینه و هدف:              24

مواد و روش کار:           24

منابع و مآخذ               30

 

داده های گمشده

 

معمولاً در پيمايش ها مواردي پيش مي‌آيد كه برخي از پاسخگويان به برخي از سوالات پاسخ ندهند. پس از وارد كردن داده‌ها به نرم افزارهاي آماری موارد بدون پاسخ به صورت خودكار، گمشده تعريف مي‌شوند. مشكل داده‌هاي گمشده را مي‌توان به دو حالت كلي تقسيم كرد. حالت اول زماني است كه داده‌ها به صورتي تصادفي گم شده باشند. مثلاً پاسخگويان برخي سوالات را نديده باشند و يا پرسشگران يك يا چند سوال را از قلم انداخته باشند. حالت دوم وقتي پيش مي‌آيد كه پاسخگو با قصد و نيت از پاسخ دادن به سوال يا سوالاتي خودداري ورزيده باشد.

شرايطي كه تعمدي در بي پاسخ گذاشتن سوالات وجود داشته باشد، بدترين حالت براي پژوهشگر است. در اين حالت هرگونه برخوردي با داده‌هاي گمشده نتايج پيمايش را به سمت اریبی می کشاند. ممكن است پژوهشگري در اين حالت ترجيح دهد كه پرسشنامه‌هايي را كه شامل داده‌هاي گمشده باشند به كلي حذف كند. بايد بگويم كه اين بدترين كاري است كه يك پژوهشگر مي‌تواند با اين مشكل انجام دهد، زيرا با اين كار فقط ميزان اریبی را افزايش خواهد داد. مثلاً در يك پيمايش ممكن است افراد طبقه بالاي جامعه از گفتن ميزان درآمدشان خودداري كرده باشند.

شيوه های متفاوت در برخورد با مشكل داده‌هاي گمشده

 

1      حذف ليستي

چنانچه گفتيم، در اين حالت پژوهشگر هر پرسشنامه‌اي را كه شامل داده‌هاي گمشده باشد، حذف مي‌كند. اين كار دو ايراد اساسي دارد. نخست آنكه در صورتي كه داده‌ها به شكلي تصادفي مفقود نشده باشند، حذف پرسشنامه‌ها نتايج را به سمت اریبی می کشاند. دوم آنكه اگر تعداد افرادي كه به برخي سوالات پاسخ نداده باشند، زياد باشد، به ميزان بسيار زيادي از حجم نمونه كاسته خواهد شد. بديهي است كه اين كار باعث اتلاف وقت و هزينه خواهد شد.

 

2      حذف جفتي 

در اين حالت پژوهشگر پرسشنامه‌ها را حذف نمي‌كند. اما هنگامي كه قصد محاسبه آماره‌هاي هر متغير را دارد، فقط داده‌هاي غير گمشده را در نظر مي‌گيرد. اگر به عنوان مثال پژوهشگر قصد بررسي همبستگي پيرسون بين دو متغير را داشته باشد، فقط موردهايي را در نظر مي‌گيرد كه مقاديرشان در مورد هيچ يك از دو متغير مورد بررسي گمشده نباشد.

 

3      انتساب داده‌ها 

در اين روش پژوهشگر تصميم مي‌گيرد كه مقاديري به داده‌هاي گمشده انتساب دهد. تكنيكهای متفاوتي براي انتساب مقادير به داده‌هاي گمشده وجود دارد. مثلاً يكي از اين تكنيكها، انتساب مقدار ميانگين به مقادير گمشده است. اگر به عنوان مثال چند نفر درآمدشان را اعلام نكرده باشند، پژوهشگر تصميم مي‌گيرد كه ميانگين درآمد كساني را كه درآمدشان را اعلام كرده‌اند، محاسبه كند و سپس اين مقدار را به عنوان مقدار درآمد افرادي كه درآمدشان را اعلام نكرده‌اند قرار دهد. پيداست كه اين روش هم معايب بسياري دارد.

4      نيكويي بيشينه (حداكثر درست نمايي)

بهترين و موثرترين روش كار با داده‌هاي گمشده استفاده از روش نيكويي بيشينه است. عليرغم اينكه اين روش بهترين روش برآورد داده‌هاي گمشده است، اما به ندرت از سوي پژوهشگران مورد استفاده قرار مي‌گيرد. علت اين امر آن است كه براي استفاده از اين روش پژوهشگر نيازمند تسلط به دانش رياضيات نسبتاً بالايي است. اما خوشبختانه اخيراً نرم افزارهايي وارد بازار شده‌اند كه بدون نياز به دانش رياضياتي به پژوهشگران اجازه مي‌دهد كه از اين روش به سادگي استفاده كنند. در حال حاضر تنها دو نرم افزار            توان انجام محاسبات مربوط به اين روش را دارند. اساس اين روش بر مبناي برآورد خطاهاي استاندارد با توجه به مدل تحقيق است.

پاسخ دهید