Sirjan Students Financial Management

بیا تا گـل برافـشانیم و می در ساغر اندازیم .... فـلـک را سقـف بـشـکافیم و طرحی نو دراندازیم

فصل ششم، روایی و اعتبار تحقیق، سرچشمه پور

روایی Validity و اعتبارReliability تحقیق چیست؟

پیش ازاطمینان نهایی به ابزارهای اندازه گیری و به کارگیری آنها در مرحله اصلی جمع آوری داده ها، ضرورت دارد که پژوهشگر ازطریق علمی، اطمینان نسبی لازم را نسبت به روا بودن بکار گیری ابزار مورد نظر و معتبر بودن آن پیدا کند.

یعنی اینکه سوالات ما تا چه حد ی متناسب با فرضیات بوده، به عبارت دیگر روایی مستلزم آن است که ابزار پژوهش همان متغیری را اندازه گیری کند که پژوهشگر قصد اندازه گیری آن را دارد وباید قبل از پرسش نامه بررسی گردد بطوریکه چند نفر ازصاحبنظران رشته را پیدا کنیم تا سوالات تحقیق و پرسش نامه را برای ما تائید کنند وچنانچه تناسب بالایی داشته باشد می گوئیم تحقیق دارای روائی بوده وباید از کارائی لازم برخوردار باشد. 

اعتبار تحقیق این است که در هرزمان رجوع مجدد همان نتایج قبلی را بگیریم و آنرا با آلفای کرون باخ می سنجیم و باید بیشتر از 85% باشد.

اهمیت روایی در ارزشیابی آزمون حتی بیش از اعتبار است در حالی که اعتبار با دقت و همسانی آزمون سروکار دارد،روایی نشان میدهد که آزمون واقعا چه چیزی را می سنجد، آزمونی که برای سنجش متغیرهای پژوهش رواست باید آنچه را که موردنظراست اندازه گیرد و برای پژوهشگر اطلاعات مفیدی را فراهم کند.گرچه  آزمون ممکن است بدون داشتن روایی،معتبر و پایا باشد، اما عکس این امر صادق نیست. به عبارت دیگرسطح مناسبی ازاعتبار شرط لازم واولیه ی روایی است واعتبار به تنهایی روایی را تضمین نمی کند.

بنابراین آزمون درصورتی دارای روایی است که آنچه راکه مورد نظر است به دقت اندازه گیری کند.به عنوان مثال ،آزمونی ممکن است برای اندازه گیری علاقه به موسیقی ساخته شده باشد، اما به غلط به عنوان آزمون خلاقیت معرفی  شود. این آزمون ممکن است دارای اعتبار باشد، زیرا اگر در زمان های مختلف درباره ی افراد اجرا شود،همواره نتایج یکسان به دست می آید. باوجود این فاقد روایی است، زیرا خلاقیت را نمی سنجد.

برآورد روایی آزمون های روانی امری دشوار و پیچیده است دلیل این امر آن است که متغیر های روانی مفاهیم انتزاعی هستند،مانند هوش، اضطراب وشخصیت. این مفاهیم واقعیت محسوس و عینی خارجی ندارند، بنابراین وجود آنها را باید به روش غیر مستقیم استنباط کرد. برای برآورد روایی آزمونهای روایی سه روش اصلی وجود دارد:روایی وابسته به محتوا،روایی وابسته به ملاک (معیار) و روایی وابسته به سازه.

(Content Validity) الف) روایی محتوا

روایی محتوا نوعی اعتبار است که معمولا برای بررسی اجزای تشکیل دهنده ی یک ابزار به کار برده می شود و به ما اطمینان می دهد که ابزار مورد نظربه تعداد کافی پرشهای مناسب برای اندازه گیری مفهوم مورد سنجش در بر دارد. هر قدر عناصر مقیاس گسترده تر و قلمرو مفهوم مورد سنجش را بیشتر در برگیرند، محتوا بیشتر خواهد بود. به عنوان مثال برای یک آزمون پیشرفت تحصیلی باید اعتبار محتوای آن را مورد نظر قرار داد.اعتبار محتوای یک ابزار اندازه گیری به سوال های تشکیل دهنده ی آن بستگی دارد. اگر سوال های ابزار معرف ویژگی ها ومهارت های ویژه ای باشد که محقق قصد اندازه گیری آن ها را داشته باشد،آزمون دارای روایی محتوا است.برای اطمینان از روایی محتوا،باید در موقع ساختن ابزار چنان عمل کرد که سوال های تشکیل دهنده ی ابزار معرف قسمت های محتوای انتخاب شده باشد. بنابراین روایی محتوا ویژگی ساختاری ابزار است که همزمان با تدوین آزمون در آن تنیده می شود. روایی محتوای یک آزمون معمولا توسط افرادی متخصص در موضوع مورد مطالعه تعیین می شود.ازاین رو روایی محتوا به قضاوت داوران بستگی دارد.

در روایی محتوایی، تاکید زیاد بر قضاوت شخصی سازندگان آزمون امری اساسی به شمار می آید

روایی ظاهری یک شاخص ابتدائی و حداقل برای روایی محتوا به شمار می آید. این نوع روایی نشان می دهد که عناصر مورد سنجش به طور ظاهری توانایی اندازه گیری مفهوم مارا دارند.

 

 

(Criterion Validity)ب) روایی ملاکی یا معیار

روایی ملاکی عبارت است از کارآمدی یک ابزار اندازه گیری در پیش بینی رفتار یک فرد در موقعیت های خاص و زمانی مطرح می شود که ابزار اندازه گیری تفاوت میان افراد را بر پایه معیاری که قرار است آن را پیش بینی کند به دست می دهد. برای این منظور عملکرد هر فرد در آزمون بایک ملاک مقایسه می شود.به عبارت دیگر روایی ملاکی یک ابزار اندازه گیری عبارت است از همبستگی بین نمرات آزمون ونمره ی ملاک. اعتبار ملاکی بر دو نوع است:  1.اعتبار پیش بین   2.اعتبار همزمان

)Predictive validity) 1. روایی پیش بین :

در اندازه گیری های روانی_تربیتی،اعتبار پیش بین عبارت است از  بررسی رابطه ی نمره های آزمونی که برخی برخی ویژگی ها را می سنجد و انچه ادعای پیش بینی آن را دارد. اعتبار پیش بینی می تواند به وسیله ی رابطه ی عملکرد در یک آزمون با آزمون ملاک رفتاری به دست آید.به عبارت دیگر ضریب همبستگی نمره های  حاصل از اجرای آزمون با نمره های متغیر ملاک، نمایانگر اعتبار پیش بین است.برای مثال در یک تحقیق، 882 مرد و زن به یک آزمون رغبت شغلی پاسخ گفتند. آزمودنی ها 2ساله بودند و در 19سالگی مجددا مورد بررسی قرار گرفتند.51%به شغلی که در آزمون انتخاب کرده بودند اشتغال داشتند این داده ها اعتبار پیش بین این ابزار را نشان می دهد.

(Concurrent validity)2. روایی همزمان:

اعتبار همزمان در مواردی به کار می رود که داده های حاصله از دو اندازه گیری در یک زمان در دسترس باشد. در این گونه موارد عملکرد در یک آزمون به عملکرد در آزمون دیگر مرتبط می گردد. این فرایند اعتبار همزمان نامیده می شود.اعتبار همزمان در موردی محاسبه می شود که هدف جانشین کردن این ابزار اندازه گیری به جای ابزار دیگری باشد. این امر بیشتر به علت ملاحظات مربوط به سهولت اجرای آزمون یا جانشین  کردن یک آزمون کوتاه تر به جای یک آزمون طویل تر است. در این مورد نیز ضریب همبستگی بین نمره های حاصل از اندازه گیری دیگری که همزمان به عمل آمده است به عنوان میزان اعتبار انداز گیری به کار می رود. بنابراین اعتبار ملاکی به صورت همبستگی نمره  های آزمون با یک  ملاک خارجی که با متغیر مورد سنجش مربوط است تعریف می شود.

 به طور مثال، اگر یک ابزار اندازه گیری برای اخلاق کاری تهیه شود و در مورد گروهی از مدد جویان اجرا شود، این مقیاس باید افرادی را که تمایل به پذیرش شغل دارند و باید از فهرست دریافت کنندگان کمکهای رفاهی حذف شوند از آنها که حتی با وجود فرصت شغلی میل به کار ندارند جدا کند. بدیهی است آنها که ارزشهای اخلاق کاری را محترم می شمارند نمی خواهند کمک رفاهی دریافت کنند و مشتاق پذیرش شغل هستند. اما کسانی که به این ارزشها بها نمی دهند ترجیح می دهند بدون کارکردن از کمکهای رفاهی برخوردار شوند. اگر هردو گروه در مقیاس ارزش کاری امتیاز یکسان به دست آورند، چنین آزمونی ابزار اندازه گیری برای اخلاق کاری به شمار نمی آید بلکه چیز دیگری را می سنجد.     

 (Construct validity) ج) روایی سازه

روایی ساخت یا سازه بیان می کند نتایج به دست آمده از کاربرد یک ابزار اندازه گیری تا چه حد با نظریه هایی که آزمون بر محور آنها تدوین شده است تناسب دارد. بعبارت دیگر نمایانگر آن است که ابزار اندازه گیری تا چه اندازه یک سازه یا خصیصه ای را که مبنای نظری دارد می سنجد.در بررسی روایی سازه باید به تدوین فرضیه هایی درباره ی مفاهیم اندازه گیری شده،آزمون این فرضیه ها ومحاسبه ی این همبستگی نتایج با اندازه گیری اولیه پرداخت اگر ضریب همبستگی حاصله بالا باشد اعتبار سازه افزایش می یابد ولی اگر همبستگی معنی دار نباشد علت را می توان به عوامل زیر نسبت داد:

1.جمع آوری داده ها با اشکال همراه بوده است.

2.پیش بینی و فرضیه ها غلط بوده است.

3.ابزار خصیصه ی مورد نظر را اندازه گیری نمی کند.

از جمله شیوه هایی که برای تعیین اعتبار سازه بکار می رود موارد زیر است :

1.تفاوت های گروهی: اگر نظریه ای، تفاوتی را بین گروه ها(یا هیچ تفاوتی را)در نمرات آزمون پیش بینی کند، آزمونی که این تفاوت را نشان دهد(یا ندهد) دارای اعتبار سازه است.برای مثال پیش بینی می شود که کودکان و بزرگسالان در بلوغ اجتماعی با هم تفاوت دارند.بنابراین اگر آزمونی که برای اندازه گیری خصیصه بلوغ اجتماعی ساخته شده باشد، تفاوت معنی داری را بین کودکان وبزرگسالان نشان دهد دارای روایی سازه است.

2.تغییرات: چنانچه نظریه ای پیش بینی کند که خصیصه ی مورد اندازه گیری تحت تاثیر زمان یا مداخله آزمایشی قرار می گیرد، اگر نمرات آزمون این تاثیر را نشان دهد دارای روایی  سازه است. برای مثال اگر ازمودنی مهارت های کلامی را می سنجد باید با افزایش  سوال آزمودنی ها نمرات افزایش یابد، یا اگر مداخله  آزمایشی برای پرورش این مهارت ها صورت گرفته باشد، نمرات پیش آزمون و پس آزمون باید تغییرات معنی داری را نشان دهد.

3.اعتبار همگرا و واگرا(تشخیصی):هر گاه چند خصیصه از طریق دو یا چند روش اندازه گیری شوند همبستگی بین اندازه گیری های دو شاخص مهم اعتبار را فراهم می آورد.اگر همبستگی بین نمرات آزمون هایی که خصیصه ی واحدی را اندازه گیری می کند بالا باشد،آزمون های دارای اعتبار همگرا می باشد.چنانچه همبستگی بین آزمون هایی که خصیصه های متفاوتی را اندازه گیری می کند پایین باشد، آزمون ها دارای اعتبار تشخیصی یا واگرا است.

این سنجش مستلزم سه گام اساسی است:نخست،سازنده ی آزمون باید صفت مورد نظر را به دقت تحلیل کند.دوم چگونگی ارتباط صفت با متغیر های دیگر را مورد توجه قرار دهد.سوم از طریق آزمایش مشخص سازد که آیا روابط فرضی واقعا وجود دارند یا نه.

 

استاندارد بودن

هر ابزار اندازه گیری در مراحل تدوین و استاندارد شدن، در مورد گروه نمونه ای از افراد یک جامعه با ویژگی های فرهنگی خاص هنجاریابی می شود. هر گاه بین آزمودنی و جامعه ای که آزمون در مورد افراد آن هنجاریابی شده است همگونی لازم وجود داشته باشد، در این صورت می توان نمره ی آزمودنی را با متوسط نمره ی گروه هنجاریابی مقایسه و نتیجه را تفسیر کرد. برای مثال اگر آزمودنی در باره ی دانشجویان دانشگاه در گروه های سنی18 تا20سال استاندارد شده باشد، در این صورت می توان نمره های دانشجویان دانشگاه همان گروه سنی را با هنجار آزمون مقایسه کرد و از آن نتیجه گیری به عمل آورد.(البته درصورتی که آزمون مورد نظر از روایی و اعتبار لازم برخوردار باشد).هر اندازه تفاوت بین مشخصات آزمودنی و گروه هنجاریابی آزمون بیشتر باشد،امکان مقایسه و تفسیر نتیجه بر اساس هنجار استاندارد آزمون از روایی و اعتبار کمتری برخوردار خواهد بود.

برای اطمینان از دقت و صحت هنجارهای آزمون لازم است به پرسش های زیر پاسخ داده شود:

1)آیا گروه نمونه هنجاریابی را می توان معرف جامعه ای دانست که آزمون یا مقیاس در مورد آن جامعه استاندارد شده است؟

2)آیا حجم نمونه ای که به عنوان گروه نمونه هنجاریابی از جامعه ی مورد مطالعه انتخاب شده است به اندازه ی کافی بزرگ یوده است؟زیرا ناکافی بودن حجم نمونه،به تدوین ابزارهای ناروا ونامعتبر می انجامد.

3)آیا در آزمون برای خرده گروه های خاص نیز هنجارهای چندگانه ای تنظیم شده است تا بدان وسیله نمره های خرده،گروه های فرهنگی خاص را بتوان با این هنجارها مقایسه و تفسیر کرد؟

علاوه براین،استاندارد کردن آزمون روش های اجرا و نمره گذازی آزمون را نیز شامل می شود.یک آزمون استاندارد باید دارای دستورالعمل هایی باشد که به آزمایش کننده  امکان دهد تا آزمون را به همان روشی و تحت همان شرایطی اجرا کند که در مراحل استاندارد آزمون به کار گرفته است.پژوهش های متعدد نشان داده است که تغییر در دستورالعمل آزمون می تواند نوع و کیفیت پاسخ های آزمودنی را تغییر داده و روایی و اعتبار نتایج آزمودن را تهدید نماید.

عملی بودن

منظور از عملی بودن آن است که وسیله ی اندازه گیری متغیرها و یا ابزار جمع آوری اطلاعات،از نظر صرف وقت،امکان تهیه،در دسترس بودن و صرف هزینه و نیروی انسانی مقرون به صرفه بوده و قابلیت اجرایی داشته باشد.به عنوان مثال،اگر بخواهیم نظر دانشجویان را نسبت به یک مسئله اجتماعی مورد مطالعه قرار دهیم، استفاده از روش پرسشنامه عملی تر از روش مصاحبه است.

جدول1_6:انواع روایی

توصیف

نوع روایی

ردیف

آیا ابزار به قدر کفایت مفهوم را اندازه گیری می کند؟

روایی محتوا

1

آیا«صاحبنظران»تایید می کنند که ابزار،آنچه را که باید اندازه بگیرد اندازه می گیرد؟

روایی ظاهری

2

آیا ابزار به گونه ای که بتوان به پیش بینی متغیر ملاک پرداخت از عهده ی تفکیک(گروهها) بر می آید؟

روایی وابسطه

به معیار

3

آیا ابزار به گونه ای که بتوان به پیش بینی متغیرها معیار کنونی پرداخت،تفکیک صورت می دهد؟

روایی همزمان

4

آیا ابزار به گونه ای که بتوان به پیش بینی یک معیار آتی پرداخت افراد را از هم تفکیک می کند؟

روایی پیش

بینی

5

آیا ابزار نظریه های مرتبطبا مفهوم مورد نظر را در بر می گیرد؟

روایی سازه

6

آیا دو ابزاری را که برای اندازه گیری مفهوم به کار برده ایم همبستگی قوی دارند؟

روایی همگرا

 

7

آیا ابزار با متغیری که انتظار داریم با متغیر مورد نظرمان نامرتبط باسد همبستگی ضعیف دارد؟

روایی واگرا

(تشخیص)

8

 

اعتبار

اعتبار یا اعتماد پذیری ابزار میزان پایایی یا سازگاری آن را در اندازه گیری یک مفهوم نشان میدهد برای ارزیابی((برازش))ابزار مفید است.

پایایی ابزار

توانایی ابزاردر حفظ پایایی خود در طول زمان علیرغم شرایط غیر قابل کنترل  آزمون و وضعیت خود پاسخگویان حاکی از پایداری آن و تغییر پذیری اندک آن می باشد. این توانایی گوییای برازش ابزار است چرا که هر زمان اندازه گیری صورت گیرد نتایج پایدار به دست می آید. برای آزمون پایایی دو راه وجود دارد:

ضریب بازآزمایی

ضریب اعتبار به دست آمده از تکرار یک آزمون مشابه را اعتبار بازآزمایی می نامند. بدان معنا که وقتی در یک مرحله پرسشنامه را برای اندازه گیری یک مفهوم اجرا می کنیم وهمان پاسخگویان برای مرتبه دوم به آن پاسخ می دهند (مثلا سه تا شش هفته بعد)،همبستگی میان دو امتیازهای دو اندازه گیری را ضریب بازآزمایی می نامیم و اندازه آن معمولا" بین صفر تا یک تغییر می کند. هر قدر این ضرییب بیشتر باشد،اعتبار بازآزمایی بالاتر است که در نتیجه نشان میدهد ابزار با گذشت زمان پایداری خود را حفظ می کند.

اعتبار آزمون های موازی

هنگامی که پاسخ های دو آزمون مشابه(برای مفهوم یکسان)همبستگی زیاد داشته باشد می گوییم اعتبار آزمون های موازی وجود دارد.توجه داشته باشیم که دو آزمون دارای پرسش های مشابه و چهارچوب پاسخ های یکسان هستند و تنها جمله بندی پرسش ها و ترتیب تقدم آن ها متفاوت است.در اینجا آنچه را که اندازه می گیریم تغییر پذیری خطای مربوط به جمله بندی و ترتیب تقدم پرسش ها است.اگر این دو آزمون از همبستگی بالا برخوردار باشند (مثلا8/0وبالاتر)می توانیم به طور منطقی ادعا کنیم که آنها اعتبار دارند و واریانس خطای ناشی از جمله بندی و ترتیب تقدم یا سایر عوامل حداقل است.

سازگاری(هم آهنگی)درونی ابزار

سازگاری یا هم آهنگی درونی ابزار حاکی از متجانس بودن عناصر ابزار است که به سازه مربوط می شود. به بیان دیگر،عناصر(پرسشها)باید به عنوان یک مجموعه با هم پیوند داشته باشند و بتوانند به طور مستقیم مفهوم یکسانی را اندازه بگیرند به گونه ای که پاسخ دهندگان معنی کلی یکسانی را برای هر یک ازعناصر قایل شوند. سازگاری را به دو طریق اندازه می گیریم:

اعتبار سازگاری اجزاء

آزمونی است برای سازگاری پاسخ های فرد باهمه ی عناصرابزاراندازه گیری  تا وقتی که اجزاء آزمون یا ابزاربه طورمستقل مفهوم یکسانی را اندازه بگیرند با یکدیگر همبستگی دارند. مشهورترین آزمون برای اعتبار سازگاری اجزاء عبارت است ازضریب آلفای کرانباخ(برای پرسشها یا اجزای چند مقیاسی) وفرمول کودر_ریچاردسن (برای پرسشهای دو وجهی) به کارمی روند.

اعتبار دو نیمه ی آزمون

نشان دهنده ی همبستگی بین دو نیمه ی یک آزمون است.تخمین های اعتباردو نیمه بر حسب چگونگی تقسیم بندی اجراء به دو نیمه متفاوت است.تنها در مواقعی که آزمون باید بیش از یک جنبه ی اساسی را انداره بگیرد اعتبار دو نیمه ممکن است بزرگ تر از آلفای کرانباخ باشد.ازاین رو،تقریبا در همه ی موارد،آلفای کرانباخ را میتوان شاخص کاملا مناسب برای اعتبار سازگاری و هم آهنگی درونی به کار برد.

اعتبار ارزیابی ارزیابان

سازگاری داوری چند ارزیاب نسبت به یک پدیده یا تفسیر پاسخ ها نیز ابزاری است برای اندازه گیری اعتبار.کاربرد ویژه ی این نوع اعتبار زمانی مصداق دارد که داده ها به کمک مشاهده،آزمون های فرافکنی یا مصاحبه ی آزاد به دست می آید که این موارد همگی در معرض تفسیر ذهنی قرار دارند.اعتماد بیشتر به این گونه ابزار های اندازه گیری به کمک اعتبار ارزیابی ارزیابان به دست می آید.

+ نوشته شده در  شنبه بیستم فروردین ۱۳۹۰ساعت 23:16  توسط Sarcheshmehpour  |