داده‌ها و مشاهدات متغیرهای موجود در یک مدل معمولاً در سه نوع مختلف می‌تواند وجود داشته باشد: داده‌های سری زمانی[۱۴۳]، داده‌های مقطع زمانی[۱۴۴] و داده‌های تابلویی یا تلفیقی[۱۴۵].
داده های سری زمانیاین نوع از داده ها در قالب یک متغیر خاص در طول زمان رخ می دهند؛ به عبارت دیگر سری زمانی، مجموعه ای از مشاهدات است که بر حسب زمان یا هر کمیت دیگر مرتب شده باشد(آذر و مؤمنی،۱۳۸۵،ص۳۲۲).
داده های مقطعیداده هایی هستند که در یک مقطع مشخص از زمان محاسبه و جمع آوری می شوند.
داده های تلفیقیداده های تلفیقی به یک مجموعه از داده ها گفته می شود که بر اساس آن مشاهدات به وسله تعداد زیادی از متغیرهای مقطعی(N) که اغلب به صورت تصادفی انتخاب می شوند، در طول یک دوره زمانی مشخص(T) مورد بررسی قرار گرفته باشند. این داده های آماری را داده های تلفیقی یا داده های مقطعی- سری زمانی می نامند. به عبارتی دیگر، اگر ویژگی های داده های مقطعی برای دو سال یا بیشتر مورد بررسی قرار گیرند، ساختار شکل گرفته مشاهدات، مجموعه داده های تلفیقی یا مجموعه داده های طولی[۱۴۶] نامیده می شود. این مجموعه داده ها شامل هر مجموعه از اشیاء یا موجودات است که ویژگی های آن در طول زمان تکرار شود. به این دلیل که داده های تلفیقی در برگیرنده هر دو جنبه داده های سری زمانی و داده های مقطعی است، به کارگیری مدل های توضیح دهنده آماری مناسبی که ویژگی های آن متغیرها را توصیف کند پیچیده تر از مدل های استفاده شده از داده های مقطعی و سری زمانی در تحقیقات کاربردی زیادی استفاده شده است(رزا نژاد و انواری،۱۳۸۴،ص۲۴).
دانلود پروژه
در این تحقیق برای برآورد مدل های ذکر شده از داده های تابلویی استفاده شده است. استفاده از داده های تابلویی دارای مزایای فراوانی است کــه در ذیل به پاره ای از این مزایا اشاره می گردد (گجراتی،۱۳۸۳،ص۸۷):
از آن جایی که داده های تابلویی به افراد، بنگاه ها، کشورها و … طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می شود. تکنیک های تخمین با داده های تابلویی می توانند این ناهمسانی واریانس را به متغیرهای تکی خاص مورد بررسی و ملاحظه قرار دهند.
با ترکیب مشاهدات سری زمانی و مقطعی، داده های تابلویی با اطلاعات بیشتر، تغییر پذیری بیشتر، هم خطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتر را ارائه می نمایند.
داده های تابلویی، چارچوب مناسبی برای تحلیل کلی داده ها فراهم نموده و در حذف یا کاهش خطای برآورد نقش مهمی را ایفا می کند.
داده های تابلویی، تأثیراتی را که نمی توان به سادگی در داده های مقطعی و سری زمانی مشاهده کرد، بهتر معین می کند.
داده های تابلویی موجب می شود تا بتوان مدل های رفتاری پیچیده تر را مطالعه کرد.
به طور کلی باید گفت، داده های تابلویی تحلیل های تجربی را به شکلی غنی می سازد که در صورت استفاده از داده های سری زمانی و مقطعی این امکان وجود ندارد.

 

    • انواع مدل ها در داده های ترکیبی

 

در استفاده از داده های ترکیبی، از مدل ها و آزمون های خاص این روش استفاده می شود که در این قسمت به بررسی برخی از آن ها می پردازیم. شکل کلی مدل داده های ترکیبی که به مدل اجزاء خطا[۱۴۷] معروف است، به صورت زیر است(رزا نژاد و انواری،۱۳۸۴،ص۲۷):
در رابطه فوق نشان دهنده متغیر وابسته، متغیرهای توضیحی مشاهده شده و نشان دهنده متغیرهای توضیحی غیرقابل مشاهده اثرگذار بر متغیر وابسته برای هر مقطع است که برای توضیح بهتر، این دسته از متغیرها از مقادیر اجزاء خطا جدا شده است. نشان دهنده مقطع ها یا واحدهای مشاهده شده، نشان دهنده دوره زمانی و و نشان دهنده تفاوت بین متغیرهای مشاهده نشده و مشاهده شده در مدل است. نماد نشان گر خطای برآورد داده های ترکیبی است که تمامی شرایط مربوط به جملات خطا تحت فرضیه های گوس- مارکو[۱۴۸] را داراست. جمله روند نشان دهنده تغییرات جمله ثابت در طول زمان است(رزا نژاد و انواری،۱۳۸۴،ص۲۷).

 

    • مدل اثر ثابت

 

در مدل اثر ثابت، شیب رگرسیون در هر مقطع ثابت است و جمله ثابت از مقطعی به مقطع دیگر متفاوت است. هرچند اثر زمانی معنی دار نیست، اما اختلاف معنی داری میان مقطع ها وجود دارد و ضرایب مقطع ها با زمان تغییر نمی کند. یکی از روش های نشان دادن اثر مقطعی استفاده از متغیرهای مجازی است. شکل کلی این مدل به صورت زیر است(رزا نژاد و انواری،۱۳۸۴،ص۲۹):
در این رابطه، نشان دهنده برداری اط متغیرهای مستقل، متغیر مجازی برای نشان دادن اثر مقطعی، برداری از متغیرهای وابسته و جملات خطای معادله است.

 

    • مدل رگرسیون های به ظاهر نامرتبط

 

نوع دیگری از مدل داده های ترکیبی، مدل رگرسیون های به ظاهر نامرتبط است. در این مدل جمله های ثابت و شیب رگرسیون ها متفاوت است. برای تشریح این مدل، نه تنها به متغیرهای مجازی برای مقطع نیاز است، بلکه یک متغیر مجازی نیز برای نشان دادن اختلاف زمانی مورد نیاز است و اختلاف شیب نیز به وسیله متغیرهای مجازی به صورت زیر نشان داده می شود. در مورد یک مدل با سه ضریب ثابت و سه متغیر، این مدل به صورت زیر است(رزا نژاد و انواری،۱۳۸۴،ص۳۰):

 

    • مدل اثر تصادفی

 

در مدل های اثر ثابت، برای دستیابی به تخمین های کارا از روش حذف متغیرهای غیر قابل اندازه گیری اثرگذار در مدل استفاده شد. به کارگیری این روش موجب حذف بسیاری از متغیرهای مهم اثرگذار در رگرسیون داده های ترکیبی می شود. به این دلیل، می توان با وارد کردن این متغیرها در اجزاء خطا، به روش دیگر این مشکل را حل کرد. این روش به مدل اثر تصادفی معروف است. در این روش با بهره گرفتن از روش حداقل مربعات تعمیم یافته(GLS)[149] مدل به صورت زیر برآورد می شود(رزا نژاد و انواری،۱۳۸۴،ص۳۲):
که در آن به صورت زیر تعریف می شود:

 

    • تعیین نوع مدل در داده های ترکیبی

 

برای تعیین نوع مدل مورد استفاده در داده های ترکیبی از آزمون های مختلفی استفاده می شود. رایج ترین آن هاف آزمون چاو(Chow) برای استفاده از مدل اثر ثابت در مقابل مدل برآوردی داده های تلفیق شده(Pooled) است. آزمون هاسمن برای استفاده از مدل اثر ثابت در مقابل اثر تصادفی است و آزمون ضریب لاگرانژ(LM)[150] برای استفاده از مدل اثر تصادفی در مقابل مدل داده های تلفیق شده است(رزا نژاد و انواری،۱۳۸۴،ص۳۳).
آزمون هاسمن
مدل اثر ثابت
ضریب لاگرانژ
آزمون چاو
مدل اثر تصادفی
تلفیق کل داده ها
نمودار ۳-۱) مراحل تعیین نوع مدل داده های ترکیبی

 

    • آزمون چاو[۱۵۱]

 

آماره آزمون چاو بر اساس مجموع مربعات خطای مدل مقید و مدل غیر مقید به صورت زیر است(رزا نژاد و انواری،۱۳۸۴،ص۳۴):
این آماره دارای توزیعF با N-1 و NT-N-K درجه آزادی است. فرض وجود اثر متفاوت مقطعی، فرضیه های مربوط و آماره آزمون به صورت زیر است:

 

    • آزمون هاسمن[۱۵۲]

 

برای تعیین استفاده از مدل اثر ثابت در مقابل اثر تصادفی، آزمون هاسمن انجام می شود. به عبارتی دیگر، رایج ترین آزمون برای تعیین نوع مدل داده های ترکیبی آزمون هاسمن است. آزمون هاسمن بر پایه وجود یا عدم وجود ارتباط بین خطای رگرسیون تخمین زده شده و متغیرهای مستقل مدل شکل گرفته است. اگر چنین ارتباطی وجود داشته باشد، مدل اثر تصادفی و اگر این ارتباط وجود نداشته باشد، مدل اثر ثابت کاربرد خواهد داشت(رزا نژاد و انواری،۱۳۸۴،ص۳۵).

۳-۶-۲) مدل علّی

مدل های علّی در واقع نوعی تحلیل چند متغیره روابط بین متغیرهای یک پدیده است. روشی را که معمولاً مدل های علّی برای تحلیل برمی گزینند، روش رگرسیونی چند متغیره است؛ این روش برای تحلیل مشارکت جمعی و فردی دو یا چند متغیر مستقل در اثرگذاری بر تغییرات یک متغیر وابسته است. در این‌گونه تحقیق ها کشف علّت‌ها یا عوامل بروز یک رویداد یا حادثه یا پدیده موردنظر است؛ بنابراین، پس از آن که واقعه‌اى روى داد، تحقیق درباره آن شروع مى‌شود. در اینجا محقق در متغیرها دخل و تصرّفى نداشته، اساساً حضور ندارد و آنها را نمى‌شناسد، بلکه تحقیق علّى را انجام مى‌دهد تا این متغیرها و عواملى را که باعث بروز واقعه شده است شناسایى کند.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...