iranresearches-telegram

محصولات ایران پژوهان را در فروشگاه ببینید
 

نگارش یافته توسط مدير محتواي ايران پژوهان مجموعه: دانلود رايگان
تعداد بازدید: 6985
چاپ

آموزش نحوه محاسبه تابع دو جمله ای اصلاح شده( Exact Logistic) در نرم افزار Stata

 

هنگامیکه متغیر وابسته یک متغیر گسسته و دو بعدی باشد، برای پیش بینی ابعاد آن باید از روش رگرسیون دو جمله ای استفاده کرد. این روش رگرسیونی به حجم نمونه حساس است. روش اصلاح شده رگرسیون لجستیک یا دو جمله ای برای رفع این ضعف طراحی شده است. نرم افزار STATA نسخه 10 به بالا توانایی محاسبه این روش نسبتا جدید را داراست. به عنوان مثال محققی علاقه مند است متغیر هایی که سبب انتخاب یا عدم انتخاب یک برند تلفن همراه می شوند را شناسایی کند. به این منظور دو متغیر جنسیت و سابقه خرید از این برند را به عنوان متغیر های مستقل مورد مطالعه قرار داده است. در این تحقیق 32 نفر مشارکت داشتند به دلیل کم بودن حجم نمونه استفاده از رگرسیون لجستیک معمول، امکان پذیر نیست.

شکل کلی ورود داده ها باید به شکل زیر باشد:

input gender  cumr    accept       n
        0        0        0        12
        0        0        1         0
        0        1        0         4
        0        1        1         4       
        1        0        0         4
        1        0        1         1 
        1        1        0         0
        1        1        1         7  
end

با ورود دستور زیر در خط فرمان می توان تعداد فراوانی متغیر های تحقیق را مشاهده نمود.


-> tabulation of نام متغیر    
Gender      |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |         20       62.50       62.50
          1 |         12       37.50      100.00
------------+-----------------------------------
      Total |         32      100.00

Cumr        |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |         17       53.12       53.12
          1 |         15       46.88      100.00
------------+-----------------------------------
      Total |         32      100.00

با ورود دستور زیر می توان جدول توافقی را مشاهده نمود.

tabulate نام اولین متغیر نام دومین متغیر [fw=n]

که نتیجه به تفکیک برای تمام متغیر های مورد مطالعه به شکل زیر خواهد شد.

tabulate gender cumr [fw=n]

           |        cumr
Gender     |         0          1 |     Total
-----------+----------------------+----------
         0 |        12          8 |        20
         1 |         5          7 |        12
-----------+----------------------+----------
     Total |        17         15 |        32

tabulate female accept [fw=n]

           |         accept
    gender |         0          1 |     Total
-----------+----------------------+----------
         0 |        16          4 |        20
         1 |         4          8 |        12
-----------+----------------------+----------
     Total |        20         12 |        32


tabulate cumr accept [fw=n]

           |         accept
    Cumr   |         0          1 |     Total
-----------+----------------------+----------
         0 |        16          1 |        17
         1 |         4         11 |        15
-----------+----------------------+----------
     Total |        20         12 |        32


برای گرفتن یک خروجی کلی از وضعیت متغیر ها از دستور زیر استفاده می شود.

test groups = group(نام متغیر دوم نام متغیر اول), label
tabulate groups نام متغیر وابسته [fw=n]

خروجی زیر حاصل این دستور است.

group(gend |         accept
er cumr  ) |         0          1 |     Total
-----------+----------------------+----------
       0 0 |        12          0 |        12
       0 1 |         4          4 |         8
       1 0 |         4          1 |         5
       1 1 |         0          7 |         7
-----------+----------------------+----------
     Total |        20         12 |        32


این جداول نشان می دهند 32 مشارکت کننده در تحقیق وجود داشتند که 12 نفر خریدار این فناوری بودند و 20 نفر خریدار این فناوری نبودند. 20 نفر از افراد را مردان و 12 نفر را زنان تشکیل می دهند. 15 نفر قبلا خریدار این محصول بوده و 17 نفر سابقه استفاده از این محصول را نداشتند. نتایج نشان می دهد که 7 نفر از زنان خریدار این محصول هستند و 4 نفر از مردان خریدار این محصول هستند.
برای بررسی تاثیر متغیر های جنسیت و داشتن سابقه خرید قبلی از محصولات این شرکت؛ بر خرید یا عدم خرید این محصول جدید شرکت، می توان از رگرسیون لجستیک معمولی و جداول توافقی استفاده نمود. هر دوی این روش ها به دلیل اینکه در این مطالعه حجم نمونه کم است از قابلیت مناسبی برخوردار نیستند. به عنوان مثال با به کارگیری روش لجستیک معمولی حتی بعد از 200 بار از سر گیری تابع برازش که روشی مرسوم در روش های مبتنی بر بیشینه درستنمایی است، مدل برازش نیافت لذا باید از دستور رگرسیون لجستیک اصلاح شده یا تابع دو جمله ای اصلاح شده استفاده نمود.
لذا باید دستور زیر را در پنل command وارد نمود یا از مسیر موجود در statistics استفاده نمود.


exlogistic accept gender cumr, coef nolog


خروجی زیر حاصل این دستور است.


Exact logistic regression                        Number of obs =        32
                                                 Model score   =  18.75176
                                                 Pr >= score   =    0.0000
---------------------------------------------------------------------------
       accept|      Coef.       Suff.  2*Pr(Suff.)     [95% Conf. Interval]
-------------+-------------------------------------------------------------
      gender |   2.336592*          8      0.0302      .2044942       +Inf
      cumr   |   3.435807*         11      0.0003      1.405934       +Inf
---------------------------------------------------------------------------
(*) median unbiased estimates (MUE)

/* rerun to obtain odds ratios */

exlogistic

Exact logistic regression                        Number of obs =        32
                                                 Model score   =  18.75176
                                                 Pr >= score   =    0.0000
---------------------------------------------------------------------------
       accept| Odds Ratio       Suff.  2*Pr(Suff.)     [95% Conf. Interval]
-------------+-------------------------------------------------------------
      gender |   10.34592*          8      0.0302      1.226904       +Inf
      cumr   |   31.05645*         11      0.0003      4.079333       +Inf
---------------------------------------------------------------------------
(*) median unbiased estimates (MUE)

/* rerun to obtain score estimates */

exlogistic, coef test(score)


Exact logistic regression                        Number of obs =        32
                                                 Model score   =  18.75176
                                                 Pr >= score   =    0.0000
---------------------------------------------------------------------------
       accep |      Coef.       Score    Pr>=Score     [95% Conf. Interval]
-------------+-------------------------------------------------------------
      gender |   2.336592*   6.685974      0.0151      .2044942       +Inf
      cumr   |   3.435807*   14.78361      0.0001      1.405934       +Inf
---------------------------------------------------------------------------
(*) median unbiased estimates (MUE)


بر اساس خروجی های موجود 2.34 ضریب تابع لوجیت برای متغیر جنسیت و 3.44 برای متغیر سابقه خرید قبلی از شرکت است. مقادیر odds در در خروجی بعدی دیده می شود. نتایج برای دو متغیر نشان می دهد این متغیر ها هر دو دارای سطح معنی داری زیر 05/0 هستند. مقادیر فوق بر اساس روش تخمین نا اریب میانه یا MUE که روشی کارا در نمونه های کوچک است محاسبه شده است.
نتایج نشان می دهد برای خریدارن قبلی شانس خرید 06/31 برابر بیشتر از افرادی بوده که مشتری این شرکت نبوده اند. لذا مشخص می شود کیفیت و سابقه کار این شرکت تاثیر مثبتی بر خرید سایر محصولات آن داشته است. همچنین 35/10 برابر شانس خرید در مورد مردان بیشتر از زنان است. با توجه به نوین بودن این روش تحلیل چند متغیره شاخص های ارزیابی و برازش مدل در مراحل ابتدایی هستند و هنوز شاخص محکمی در دسترس نیست. در این مقاله هدف ارائه روش محاسبه تابع دو جمله ای اصلاح شده بود و علاقه مندان جهت کسب اطلاعات بیشتر می توانند به منبع زیر مراجعه کنند.

  • Hirji, K.F. 2006. Exact Analysis of discrete data. Boca Raton: Chapman & Hall

منبع: سايت آمار آكادمي


ایران کنفرانس

confBook

بانك موضوع پايان نامه

معرفي پايگاه هاي اطلاعاتي علمي

حمايت از پايان نامه ها

بورسهای خارجی

-->