فایل پایان نامه روانشناسی داده های تابلویی

(گجراتی،1390).
3-5-2- مزایای استفاده از داده های تابلویی

مزایای استفاده از داده های تابلویی را می‌توان به‌صورت زیر بر می‌شمرد:
1- از آنجایی که داده¬های تابلویی به افراد، بنگاه‌ها، کشورها و از این قبیل واحدها طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می‌شود. تکنیک‌های تخمین با داده¬های تابلویی می‌توانند این ناهمسانی واریانس را با متغیرهای تکی خاص مورد ملاحظه و بررسی قرار دهند.
2- با ترکیب مشاهدات سری زمانی و مقطعی و ایجاد داده¬های تابلویی، اطلاعات بیشتر، تغییر پذیری بیشتر، هم خطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتر حاصل می‌شود.
3- با مطالعه مشاهدات مقطعی تکراری، داده های تابلویی به منظور مطالعه پویایی تغییرات مناسب‌تر و بهترند. دوره های بیکاری، چرخش شغلی و تحرک نیروی کار با داده های تابلویی بهتر بررسی می‌شوند.
4- داده های تابلویی تأثیراتی را که نمی‌توان به سادگی در داده های مقطعی و سری زمانی مشاهده کرد، بهتر معین می‌کند. برای مثال اثرات قوانین حداقل دستمزد بر اشتغال و کسب درآمد را می‌توان بهتر مطالعه کرد.
5- داده‌های تابلویی ما را قادر می‌سازند تا مدل‌های رفتاری پیچیده تر را مطالعه کنیم. برای مثال پدیده‌هایی چون صرفه جویی نسبت به مقیاس و تغییرات تکنولوژیکی را می‌توان با داده‌های تابلویی در مقایسه با داده های سری زمانی و مقطعی خیلی بهتر بررسی کرد.
6- داده های تابلویی با ارائه داده برای هزاران واحد، می‌توانند تورشی را که ممکن است در نتیجه لحاظ افراد یا بنگاه‌ها (به‌صورت جمعی و کلی) حاصل شود، حداقل سازند.
بطور کلی باید گفت داده های تابلویی تحلیل‌های تجربی را به شکلی غنی می‌سازند که در صورت استفاده از داده های سری زمانی و مقطعی این امکان وجود ندارد.
چارچوب اصلی برای داده های تابلویی به صورت زیر می‌باشد:
معادله ( 3-3)
که در آن:
: عرض از مبدأ
: شامل k متغیر توضیحی است که ضرایب آن‌ها به صورت است.
: جمله اختلال مدل است که از فروض کلاسیک رگرسیون خطی پیروی می‌کند. یعنی و
i‌: تعداد مقاطع
t: دوره زمانی
در این صورت تخمین معادله فوق، به فروض ما در رابطه با عرض از مبدأ، ضریب متغیرهای توضیحی و جمله اختلال بستگی خواهد داشت.
3-5-3-آزمون‌های انتخاب روش برآورد در داده های تابلویی
الف) آزمون F برای انتخاب بین اثرات مشترک و اثرات ثابت
برای بررسی اطلاعات به روش داده های تابلویی، گاهی از آزمون یا لیمر استفاده می‌شود که در آن فرضیه (یکسان بودن عرض از مبدأها) در مقابل فرضیه(متفاوت بودن عرض از مبدأها) آزمون می‌شود. آماره این آزمون بر مبنای مقایسه مجموع مربعات پسماندهای مقید حاصل از تخمین مدل به روش اثرات مشترک و مجموع مربعات پسماندهای غیر مقید حاصل از تخمین مدل به روش اثرات ثابت می‌باشد.
معادله( 3-4)
که در آن:
: مجموع مربعات پسماندهای مقید حاصل از تخمین مدل به روش اثرات مشترک
: مجموع مربعات پسماندهای غیر مقید حاصل از تخمین مدل به روش اثرات ثابت
N: تعداد مقاطع.
T: تعداد مشاهدات سری زمانی.
K: تعداد متغیرهای توضیحی مدل می‌باشد.
N-1: درجه آزادی صورت.
NT-N-K: درجه آزادی مخرج.
تحت فرضیه صفر در این آزمون تفاوتی بین مقاطع وجود ندارد و فرضیه مقابل بیان می‌کند که تفاوت بین مقاطع وجود دارد. به عبارت دیگر می‌توان نوشت:
‌‌‌‌تفاوت بین مقاطع وجود ندارد.
‌‌‌‌‌‌‌‌‌‌‌‌‌‌تفاوت بین مقاطع وجود دارد. در غیر این صورت
اگر مقدار F محاسبه شده از F جدول بزرگ‌تر باشد، فرضیه صفر رد شده و فرضیه مقابل را قبول می‌کنیم، در این صورت تفاوت بین مقاطع را می‌توان پذیرفت. ولی اگر F محاسبه شده از F جدول کوچک‌تر باشد، فرضیه صفر پذیرفته می‌شود و تفاوت بین مقاطع را نمی‌توان پذیرفت.
همانطور که بیان شد برای تعیین نوع مدل مورد استفاده در داده های ترکیبی از آزمون های مختلفی استفاده می شود . رایج ترین آنها آزمون CHOW برای استفاده از مدل اثرثابت در مقابل مدل برآوردی داده های ترکیب شده (POOl)، آزمون هاسمن برای استفاده از مدل اثر ثابت در مقابل مدل اثر تصادفی و آزمون LM برای استفاده از مدل اثر تصادفی در مقابل مدل POOL است.
نمودار شماره 1 مراحل تعیین نوع مدل داده های ترکیبی
آزمون chow برای بکارگیری مدل pool در برابر مدل اثر ثابت انجام می شود. فرضیات این آزمون به صورت زیر است.
H0 : Pooled Model
H1 : Fixed Effect Model
فرضیه اول بر اساس مقادیر مقید و فرضیه مقابل آن بر اساس مقادیر غیر مقید است . آماره آزمون chow بر اساس مجموع مربعات خطای مدل مقید و مدل غیر مقید به صورت زیر است:
معادله( 3-5)
این آماره دارای توزیع F با N-1 و NT-N-K درجه آزادی است.
رایج ترین آزمون برای تعیین نوع مدل داده های ترکیبی آزمون هاسمن است. آزمون هاسمن برپایه وجود یا عدم وجود ارتباط بین خطای رگرسیون تخمین زده شده و متغیرهای مستقل مدل استوار است . اگر این ارتباط وجود داشت ، مدل اثر تصادفی و اگر این ارتباط وجود نداشت، مدل اثر ثابت کاربرد خواهد داشت . فرضیه H0 نشان دهنده عدم ارتباط بین متغیرهای مستقل و خطای تخمین و فرضیه H1 نشان دهنده وجود ارتباط است. چنانچه واریانس اثرات مقطعی در مدل اثر تصادفی ناچیز باشد، می توان از روش ترکیب کل داده ها و استفاده از تخمین حداقل مربعات معمولی (pool) برای برآورد روابط بین متغیر ها استفاده کرد . بر این اساس برای تعیین مدل اثر تصادفی در مقابل مدل pool، از آزمون LM استفاده می شود. فرضیات این آزمون به صورت زیر است:
که در این فرضیات، نشان دهنده واریانس اثر مقطعی مدل برآورد شده از طریق اثر تصادفی است . برای محاسبه آماره آزمون از خطای برآورد pool به صورت زیر استفاده می شود:
معادله( 3-6)
که در رابطه فوق خطای برآورد pool و متوسط خطا در زمان اول است. با درستی فرضیه اول این آماره دارای توزی مجذورکای با یک درجه آزادی است
3-5-4- فرمهای مختلف الگو داده های تابلویی
روش‌های متداول برای تخمین معادله فوق با بهره گرفتن از داده های تابلویی عبارتند از:
روش مدل اثرات مشترک 2- روش مدل اثرات ثابت 3- روش مدل اثرات تصادفی
آزمون هاسمن به طورکلی برای انتخاب روش اثرات ثابت و اثرات تصادفی انجام می‌شود. لذا بدین منظور الگو به دو صورت اثر ثابت و تصادفی برآورد شده و سپس ضرایب به دست آمده مقایسه می‌گردند. فرضیه در این آزمون عبارت است از اینکه ضرایب برآورد شده از روش اثر تصادفی با ضرایب حاصل از روش اثر ثابت یکسان می‌باشند. آماره آزمون نیز به صورت زیر محاسبه می‌شود که دارای توزیع کای – دو با درجه آزادی K (تعداد متغیرهای مستقل)است.
معادله( 3-7)
که در آن b برآوردهای شیب به روش اثر تصادفی و برآوردهای شیب به روش اثر ثابت می‌باشد.
حال چنانچه آماره محاسباتی بزرگ‌تر از آماره جدول کای – دو باشد، آنگاه پذیرفته نشده و آزمون هاسمن برآورد مدل به صورت اثرات تصادفی را پیشنهاد می‌کند.
از این آزمون برای تشخیص اینکه الگوی مورد نظر ما اثر ثابت یا اثر تصادفی است، استفاده میکنند. فرض صفر در این آزمون، برابری ضرایب بدست آمده در هر دو روش میباشد. اگر احتمال بدست آمده از مقدار آماره کا دو کوچکتر باشد، میتوان از الگوی اثر ثابت استفاده کرد.
اساس کار این آزمون استفاده از ماتریس کوواریانس تفاضل بردار میباشد که b شیب در الگو اثرات ثابت و شیب در الگو اثرات تصادفی است.
در ادامه روش‌های فوق را به اختصار توضیح می‌دهیم.
3-5-4-1- الگو حداقل مربعات تلفیقی
ساده‌ترین روش، حذف ابعاد مکان(مقطع) و زمان از داده های ترکیبی و تخمین مدل با روش حداقل مربعات معمولی (OLS) است، یعنی همه مشاهدات سری‌های زمانی را برای هر مقطع از بالا به پایین برای هر متغیر مدل مرتب و مدل به روش OLS معمولی برآورد شود. در این صورت مدل (4-3) به صورت زیر در می‌آید:
معادله (3-8)
که در آن:
: عرض از مبدأ مشترک برای تمامی مقاطع است.
به عبارتی در مدل (3-8) فرض می‌شود که مقدار عرض از مبدأ و ضرایب شیب متغیرهای توضیحی برای مقاطع مختلف یکسان است.
اگر فرض کنیم تمام افراد یا مقاطع، کاملا همگن هستند، در این صورت لازم نیست نگران عرض از مبداهای مختلف برای هر فرد یا مقطع باشیم. در حقیقت، در چنین حالتی رویکرد داده های تابلویی، به خوبی میتواند ناهمگنی میان افراد را نشان دهد. این نکته یکی از مزایای الگو داده های تابلویی نسبت به الگوهای صرفا مقطعی یا سریزمانی است.
فرم کلی معادله حداقل مربعات تلفیقی:
معادله( 3-9)
همانطور که مشاهده میشود، پارامترهایی که در نتیجه تخمین این الگو بدست میآیند، فاقد بعد زمان و مکان میباشند. (گجراتی، 1371)
3-5-4-2- الگو اثرات ثابت
یک روش برای بررسی هر یک از واحدهای مقطعی به طور مستقل و مجزا این است که عرض از مبدأ برای هر یک از مقاطع، متفاوت و ضرایب شیب میان مقاطع ثابت باشد. به منظور توضیح بیشتر، مدل (4-3) را با لحاظ این فروض دوباره می‌نویسیم:
معادله (3-10)
در این حالت اندیس در عرض از مبدأ نشان می‌دهد که عرض از مبدأ مقاطع مختلف، متفاوت می‌باشند. در ادبیات اقتصاد سنجی، مدل (3-10 )، مدل اثرات ثابت نامیده می‌شود. اصطلاح « اثرات ثابت» ناشی از این واقعیت است که با وجود تفاوت عرض از مبدأ میان مقاطع، عرض از مبدأ هر مقطع طی زمان تغییر نمی‌کند. باید اشاره کرد که در روش اثرات ثابت در مدل(3-10)، فرض شده ضرایب (شیب) متغیرهای توضیحی بین مقاطع یا طی زمان تغییر نمی‌کنند. حال به منظور لحاظ عرض از مبدأهای متفاوت بین مقاطع از تکنیک متغیر مجازی استفاده می‌شود. بر این اساس مدل(3-10) به صورت زیر نوشته می‌شود:
معادله (3-11)
که در مدل(3-11) اگر مشاهدات متعلق به مقطع دوم باشد آنگاه و در غیر این صورت صفر خواهد بود. اگر مشاهدات متعلق به مقطع سوم باشد و در غیر این صورت صفر است و به همین صورت تا مقطع N ام، اگر مشاهدات متعلق به مقطع Nباشد و در غیر این صورت صفر است. بنابراین، به منظور اجتناب از وضعیت هم خطی کامل لازم است برای N مقطع، N-1 متغیر مجازی در مدل لحاظ شود. در این صورت عرض از مبدأ مقطع اول و عرض از مبدأهای تفاضلی‌اند که نشان می‌دهند عرض از مبدأهای مقاطع دوم، سوم، … و N ام چقدر با عرض از مبدأ مقطع اول تفاوت دارند. از این رو، مقطع اول تبدیل به مقطع معیار می‌شود.
از آنجا که در مدل روش اثرات ثابت از متغیرهای مجازی برای تخمین اثرات ثابت استفاده می‌کنیم در ادبیات اقتصاد سنجی مدل (3-11) ، مدل حداقل مربعات با متغیر مجازی (LSDV) نیز نامیده می‌شود.
در رویکرد اثرات ثابت، عرض از مبدا برای هر مقطع ثابت میباشد. در واقع فرض ما این است که جمله پسماند ما به صورتی میباشد، که تنها با جدا کردن اثر خاص مقاطع، به تصریح مورد نظر میرسیم. بنابراین فرم کلی این الگو به صورت زیر خواهد بود.
معادله( 3-12)
3-5-4-3- الگو اثرات تصادفی
مدل‌های اثرات ثابت تنها در صورتی که بتواند اختلاف بین مقاطع را به صورت انتقال تابع رگرسیون نشان دهد، منطقی خواهند بود اما چنین اطمینانی همواره وجود ندارد. از طرف دیگر، استفاده از این مدل به دلیل لحاظ متغیرهای مجازی می‌تواند از نظر کاهش درجه آزادی پرهزینه باشد. مبنای تئوریکی لحاظ متغیرهای مجازی در مدل اثرات ثابت این‌گونه استدلال می‌شود که ممکن است هنگام تصریح مدل رگرسیونی نتوانیم متغیرهای توضیحی مناسب (که طی زمان تغییر نمی‌کنند) را در مدل بگنجانیم لذا متغیرهای مجازی می‌توانند به عنوان یک ابزار، این چنین فقدان و کاستی را جبران نماید. حال سؤالی که در این رابطه به وجود آمد این است که اگر متغیرهای مجازی فقدان دانش و اطلاعات درباره مدل مناسب را نشان می‌دهند؛ چرا برای پوشش این کاستی از جمله اختلال استفاده نمی‌شود؟ پاسخ این سؤال در حقیقت بازگوکننده روش پیشنهادی مدل اثرات تصادفی می‌باشد که ایده اساسی و آغازین این روش از مدل (3-11) شروع می‌شود با این تفاوت که در این روش فرض اساسی به جای های متفاوت در مقاطع مختلف، این است که متغیرهای تصادفی با مقدار میانگین در نظر گرفته شده و مقدار عرض از مبدأ برای هر مقطع نیز به صورت زیر بیان می‌شود:

‌‌‌‌ معادله( 3-13)
که در آن:

 

اینجا فقط تکه های از پایان نامه به صورت رندم (تصادفی) درج می شود که هنگام انتقال از فایل ورد ممکن است باعث به هم ریختگی شود و یا عکس ها ، نمودار ها و جداول درج نشوند.

برای دانلود متن کامل پایان نامه ، مقاله ، تحقیق ، پروژه ، پروپوزال ،سمینار مقطع کارشناسی ، ارشد و دکتری در موضوعات مختلف با فرمت ورد می توانید به سایت  77u.ir  مراجعه نمایید

رشته روانشناسی و علوم تربیتی همه موضوعات و گرایش ها :روانشناسی بالینی ، تربیتی ، صنعتی سازمانی ،آموزش‌ و پرورش‌، کودکاناستثنائی‌،روانسنجی، تکنولوژی آموزشی ، مدیریت آموزشی ، برنامه ریزی درسی ، زیست روانشناسی ، روانشناسی رشد

در این سایت مجموعه بسیار بزرگی از مقالات و پایان نامه ها با منابع و ماخذ کامل درج شده که قسمتی از آنها به صورت رایگان و بقیه برای فروش و دانلود درج شده اند

: جمله اخلال، با میانگین صفر و واریانس می‌باشد.
با جایگذاری رابطه (3-13) در (3-11) خواهیم داشت:
‌‌‌‌‌‌‌‌معادله (3-14)

که در آن: است.
جمله خطای ترکیبی متشکل است از دو جزء، که جزء خطای مقطعی است و که جزء خطای ترکیبی سری زمانی و مقطعی است.
در این حالت معادله در معادله بالا به شکل زیر میباشد:
معادله( 3-15)
در اینجا فرض بر این است که و ناهمبسته هستند. جمله اول همان جمله مربوط به مقطع میباشد. یعنی در میان مقاطع تغییر میکند ولی در طول زمان ثابت است. این بخش میتواند با بردار X همبسته باشد یا نباشد. اما بخش دوم به طور غیر سیستماتیک (یا مستقل) در طول زمان و میان افراد تغییر میکند و فرض کردهایم که با بردار X همبسته نیست.
3-5-5- پایایی
اگر متغیرهای سری زمانی مورد استفاده در برآورد ضرایب الگو ناپایا باشند، در عین حالی که ممکن است هیچ رابطه با مفهومی بین متغیرهای الگو وجود نداشته باشد، می تواند ضریب تعیین R2 به دست آمده آن بسیار بالا باشد و موجب شود تا محقق به استنباط های غلطی در مورد میزان ارتباط بین متغیرها کشانیده شود. دلیل بزرگ بودن R2 آن است که وقتی یک سری زمانی نظیر Yt دارای روند است، کل پراکندگی رگرسیون یعنی طول میانگین محاسبه می شود که به غلط در طول زمان ثابت فرض شده است. این امر وزن زیادی به مشاهداتی می دهد که از میانگین در هر دو طرف دور هستند و در نتیجه کل پراکندگی محاسبه شده بسیار بزرگ می شود. از آن جا که ضریب تعیین R2 به صورت محاسبه می شود که در آن et جملات خطای رگرسیون است، وقتی بزرگ می شود، جمله داخل کروشه فوق کوچک می شود و در نتیجه R2 بزرگی نتیجه می شود.
وجود متغیرهای ناپایا در الگو سبب می شود تا آزمونهای t, f معمول نیز از اعتبار لازم برخوردار نباشند. در چنین شرایط کمیت های بحرانی ارائه شده توسط توزیعهای F,t کمیت های بحرانی صحیحی برای انجام آزمون نیستند. کمیت های بحرانی منتج از توزیع های f,t به گونه ای است که با افزایش نمونه امکان رد هرچه بیشتر فرضیه H0 را فراهم می آورند. با رد فرضیه و H0 به غلط نتیجه گیری می شود که رابطه مستحکم و معنی داری بین متغیرهای الگو وجود دارد، در حالی که واقعیت جز این است و رگرسیون نتیجه شده رگرسیون کاذبی (Spurious) بیش نیست. از مشخصه های معمول یک رگرسیون کاذب داشتن ضریب تعیین R2 بالا (نزدیک به یک) و آماره دوربین واتسون D.W پایین

مطلب مشابه :  پایان نامه رشته روانشناسی : علاقه اجتماعی

دیدگاهتان را بنویسید