نویسنده: مهدی رحمانی
چکیده
در پایان هر دوره آموزشی باید در فکر، احساسات، نگرشها و اعمال علمآموزان بر حسب هدفهای آن دوره تغییراتی به وجود آید که آن را تغییر رفتار مینامند. ابزار یا وسیلهای که برای سنجش پیشرفت تحصیلی در موقعیتهای آموزشی و تدریس به کار میرود آزمون یا امتحان نام دارد. آزمون چند گزینهای متداولترین آزمون عینی است که هم در سنجش تواناییهای مختلف و هم در سنجش یادگیری در زمینههای گوناگون تحصیلی مورد استفاده واقع میشود. آزمون چند گزینهای هم از لحاظ یکنواختی سئوالها، هم از لحاظ حساسیت کم در مقابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامهها بهترین نوع آزمونهای عینی است. در متن حاضر این نوع آزمون و طرز تهیه آن مورد بحث قرار خواهد گرفت و موارد استفاده آن در سنجش انواع مختلف بازدههای یادگیری معرفی میشود.
«طراحي سؤال علم نيست بلكه مجموعهاي از قواعد است مبتني بر تجربه و خرد استادان و ممتحنين.»
يان بروموت (1970)
کلمات کلیدی: یادگیری و آموزش، حیطه شناختی، هدفهای تربیتی، آزمون، آزمونهای چند گزینهای (MCQ).
گردآورنده: مهدی رحمانی(competition@nano.ir-09190424205)
1-مقدمه
براساس روانشناسی یادگیری و آموزشی، نظارت و ارزشیابی حلقه آخر فعالیتهای آموزشی و تکمیل کننده انجام آموزش محسوب میشود و عمدتاً با هدف اصلاح و بهبود فرایند آموزش صورت میگیرد. اساساً اطلاق مفهوم “آموزش” به یک فعالیت، منوط به انجام ارزشیابی است. به این ترتیب نظارت و ارزشیابی آموزشی یکی از مهمترین وظایف هر آموزش دهنده است و جزء لاینفکی از اجزاء یک برنامه آموزشی تلقی میشود. ابزار یا وسیلهای که برای سنجش پیشرفت تحصیلی در موقعیتهای آموزشی و تدریس به کار میرود آزمون یا امتحان نام دارد.
طرح سوالات آزمون، فرایندی است که نیاز به دقت و توجه خاص در رابطه با علمآموزان،کتاب و مواد درسی(منبع آزمون) و شرایط و نوع امتحان دارد؛ زیرا موضوعات و سرفصلهای درسی و آموزشی با هم متفاوتند و علمآموزان نیز از استعداد، درجه یادگیری، سطح دانش و اطلاعات و شرایط روحی یکسان برخوردار نیستند. بنابر این باید اصول و مقرراتی را در تنظیم سوال امتحانی رعایت نمود تا علمآموزان با استعداد وکم استعداد، در شرایط کاملاً مساوی قرار نگیرند و برای علمآموزان ضعیف نیز این فرصت را ایجاد کرد تا بتوانند به تعدادی از سوالات طرح شده متناسب با استعداد خویش جواب داده و نمرهای که مانع از افت گردد، کسب نماید که این خود باعث ایجاد حس اعتماد به نفس و افزایش علاقهمندی برای مطالعه و تلاش بیشتر در امتحانات بعدی او خواهد شد. توجه داشته باشید كه اهداف آموزشی و آزمون باید با یكدیگر همخوانی داشته باشند و در طراحی آزمون باید بیان روشن و دقیقی از اهداف آموزش و تدریس در اختیار داشته باشیم. آزمون چند گزینهای متداولترین آزمون عینی است که هم در سنجش تواناییهای مختلف و هم در سنجش یادگیری در زمینههای گوناگون تحصیلی مورد استفاده واقع میشود. آزمون چند گزینهای هم از لحاظ یکنواختی سئوالها، هم از لحاظ حساسیت کم در مقابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامهها بهترین نوع آزمونهای عینی است. ما در متن حاضر این نوع آزمون و طرز تهیه آن را مورد بحث قرار میدهیم و موارد استفاده آن را در سنجش انواع مختلف بازدههای یادگیری معرفی میکنیم. در مقاله مروري پيشرو پس از تعريف اين نوع آزمون و ويژگيهاي آن به معرفي انواع آن پرداخته و سپس تلاش بر آن خواهد بود تا راهكاري استاندارد سازي اين سئوالات ارائه گردد.
2-طبقه بندی هدفهای تربیتی[1و 2]
به طوری که میدانیم در پایان هر دوره آموزشی باید در فکر، احساسات، نگرشها و اعمال علمآموزان بر حسب هدفهای آن دوره تغییراتی به وجود آید که آن را تغییر رفتار مینامند. منظور از طبقه بندی هدفهای تربیتی آن است که معلوم بداریم این تغییر رفتار در چه زمینهها و در چه سطحی صورت میگیرد. به طور کلی هدفهای تربیتی را میتوان در سه حیطه مختلف تحت عناوین حیطه شناختی، حیطه عاطفی یا انفعالی و حیطه روانی-حرکتی طبقه بندی کرد.
2-1-حیطه شناختی
شامل تمامی رفتارهایی است که با تواناییهای ذهنی و مهارتهای عقلانی مانند بازشناسی، یادآوری، بیان مطالب آموخته شده، تعبیر و تفسیر مطالب، قضاوت در مورد امور و پدیدهها، استدلال و مانند آنها مربوطند. وقتی که علمآموز معنای یک لغت را از میان چند کلمه مختلف تشخیص میدهد، قطعه شعری را از حفظ میخواند، مفهوم یک بیت را به صورت نثر مینویسد، یک مسئله ریاضی را حل میکند و در مورد یک متن ادبی اظهار نظر میکند، رفتار وی در هر یک از این موارد جزو حیطه شناختی محسوب میشود.
2-2-حیطه عاطفی یا انفعالی
به رغبتها، نگرشها، اعتقادات و نظام ارزشها مربوط است. علمآموزی را در نظر بگیرید که بر اثر گذراندن یک دوره آموزشی در ادبیات فارسی نسبت به متون ادبی علاقمند میشود، یا از مطالعه تاریخ جنگ جهانی دوم نسبت به جنگ و تبعیض نژادی نگرش منفی پیدا میکند و یا با خواندن شرح زندگی پیامبر اسلام و ائمه اطهار اعتقاداتش نسبت به دین مبین اسلام راسختر میشود. تمامی این رفتارها در حیطه انفعالی یا عاطفی قرار دارند.
2-3-حیطه روانی-حرکتی
شامل آن دسته از رفتارهایی است که با مهارتهای عقلی و اعمال بدنی هر دو مربوطند. توانایی و مهارت علمآموز در اموری مانند ماشین نویسی، نقشه کشی، نقاشی کردن، سیم کشی، پرش با نیزه و به طور کلی تمامی مهارتهای مربوط به انجام کارهای عملی و فنی جزو حیطه روانی-حرکتی به شمار میروند. باید توجه داشت رفتارهای آموخته شده که در هر یک از حیطههای مذکور قرار میگیرند در عین حال با دو حیطه دیگر در ارتباطند و نمیتوان گفت که یک توانایی یا مهارت آموخته شده صرفاً به یک حیطه مربوط است. به عنوان مثال علم آموزی که از عهده ساختن یک رادیو برمیآید، باید اولاً اصول و مفاهیم آن قسمت از فیزیک را که در ساختن رادیو به کار میرود آموخته باشد(شناختی)، و نسبت به این کار علاقمند شده باشد(عاطفی)، زیرا علاقمندی شرط تداوم کوشش در هر زمینه است، تا سرانجام بتواند رادیوئی بسازد(روانی-حرکتی).
3-هدفهای تربیتی در حیطه شناختی(طبقه¬بندی بلوم)
روش¬های متعددی برای طبقه¬بندی دانش و مهارت¬های مورد اندازه¬گیری در سؤالات وجود دارد. یکی از مفیدترین این روش¬ها توسط بلوم ارائه شده است. همانگونه که در شکل (1) مشاهده میشود، بلوم 6 سطح از حیطه¬های شناختی (یادگیری) را از ساده تا پیچیده مرتب کرده است. بلوم بیان می¬کند در هر سطح باید یک مفهوم سؤال شود. حیطه یادگیری هدفهایی را شامل میشود که با یادآوري یا بازشناسی، دانش و رشد توانائیها و مهارتهای ذهنی سر و کار دارد. این حوزه مهمترین زمینهی کار برنامهریزان آموزشی و جریان ارزشیابی را تشکیل میدهد.
هدفهای تربیتی در حیطه شناختی را میتوان از سادهترین تواناییهای ذهنی تا پیچیدهترین مهارتهای عقلی، به ترتیب به شش طبقه، تقسیم بندی کرد: دانش، فهمیدن(فراگیری)، کاربرد، تجزیه و تحلیل، ترکیب و ارزشیابی. حیطه شناختی به دو بخش اصلی دانش و توانائیها و مهارتهای ذهنی تقسیم شده است:
شکل(1): طبقه بندی بلوم برای حیطههای شناختی
1. دانش
دانش، بازشناسی و یادآوری آموختهها، مانند مفاهیم، اصطلاحات، قواعد و اصول از مطالب جزئی تا کلی را شامل میشود. کسب دانش و گسترش اطلاعات و آگاهی، یکی از متداولترین و مهمترین هدفهای آموزشی به شمار میرود. افعالی که در این سطح به کار می¬روند عبارتند از: تعریف کنید، لیست کنید، بیان کنید، مشخص کنید، طبقه¬بندی کنید و نام ببرید. چه¬ کسی؟ کی؟ کجا؟ چه؟
رفتارهای زیر عموماً در قلمرو دانش قرار دارند. علمآموز میتواند: معنای لغتی را که آموخته است بیان کند. بخشهای مختلف یک نقشه جغرافیایی را مشخص کند. یک آزمایش علمی را شرح دهد. قطعه شعری را از حفظ بخواند. یک اصطلاح یا قاعده علمی را تعریف کند.
دانش از سه طبقه تشکیل میشود:
الف- دانش امور جزئی
1-دانش اصطلاحات: تعریف اصطلاحات علمی و فنی.
2-دانش واقعیتهای مشخص: بیان خواص فیزیکی نانولوله¬های کربنی.
مثال: اصطلاحات زیر را تعریف کنید: 1- خاصیت فوتوکاتالیستی 2- خاصیت گسیل میدانی.
ب- دانش راهها و وسائل برخورداري با امور جزئی
1-دانش امور قراردادي: توضیح قواعد.
2-دانش روالها و توالیها: توضیح تأثیرات یک عامل بر روابط پدیدهها- بیان تأثیرات عوامل بر یک عامل.
3-دانش طبقه¬بندیها و طبقات: گفتن نقش و هدف یک رشته علمی- بیان اشکال مختلف یک پدیده.
4-دانش ملاکها: بیان ملاکهای مورد استفاده درتعیین ارزش یک مورد خاص- بیان ملاکهای طبقه بندي علوم.
5-دانش روشها یا روش شناسی: نامبردن روشهای مناسب بررسی مسائل- بیان روشهای مورد استفاده دانشمندان براي پاسخ به سؤالها درباره یک موضوع خاص.
ج- دانش امور کلی و انتزاعی یک علم
1-دانش اصل¬ها و تعمیم¬ها: بیان اصول مهم در یک موضوع- بیان قوانین علمی یک موضوع.
2-دانش نظریهها و ساخت¬ها: بیان اصول و نظریهها- توضیح نظریههای مهم از یک موضوع خاص.
2. توانائیها و مهارتهای ذهنی
فعالیتها و مهارتهای ذهنی از پنج طبقه تشکیل شدهاند: فهمیدن(فراگیری)، کاربرد، تجزیه و تحلیل، ترکیب و ارزشیابی.
الف- فهمیدن(فراگیری)
فراگیری یا فهمیدن، عبارت است از درک و دریافت معنا و مفهوم ظاهری و مستتر در یک مطلب و بیان آن با عبارات و جملاتی که خود علمآموز میسازد. بنابراین فهم و بیان اصول و واقعیات، تفسیر مطالب کلامی، تفسیر جداول، نمودارها و فرمولهای ریاضی، ترجمه مطالب، بسط و پیش بینی و تعمیم اصول و قواعد، جزو فراگیری میباشند. فهمیدن یعنی درك مطالب، که فرد از آن طریق درمی¬¬یابد که هدف اصلی مطلب مورد نظر چیست. مرحله بالاتر از دانش است؛ زیرا در دانش از داوطلب خواسته میشود مطالبی را که آموخته، بدون دخل و تصرف زیاد در آن به یاد آورد؛ اما در این طبقه، داوطلب علاوه بر حفظ، باید مطالب را بفهمد. در سطح فهمیدن، داوطلب ملزم به تشریح و تفسیر معانی اصول است. افعالی که در این سطح به کار می¬روند عبارتند از: تشریح کنید، پیش¬بینی کنید، تفسیر کنید، استنباط کنید، خلاصه کنید و ترجمه کنید.
مثال: تفاوت¬های میکروسکوپ الکترونی عبوری و روبشی را در نوع تصویرگیری شرح دهید.
این طبقه شامل سه خرده طبقه میشود:
1. ترجمه
انتقال معنی از شکلی به شکل دیگر، ترجمه از یک سطح انتزاعی به سطحی دیگر، بیان یک مطلب پیچیده به زبان ساده، ترجمه از یک نمادي به شکل دیگر، توانایی خواندن علائم مخصوص یک علم، ترجمه از یک شکل کلامی به شکل دیگر، برگردان مطلب از زبان خارجی به فارسی.
2. تفسیر
توضیح مطالب از طریق معنی کردن با دادن مثالها یا خلاصه آنها، توانایی تفسیر انواع دادهها، توانایی درك و بیان اندیشه اصلی یک اثر یا یک مطلب به طورخلاصه.
مثال: جابه¬جایی رامان در طیف¬های رامان ترکیبات را تفسیر کنید.
3. برون¬یابی
بسط دادن اطلاعات و تعمیم نتایج یک تحقیق یا نمونهای از یک گروه به کل گروه، شکل دیگر برون¬یابی، درون¬یابی است که شامل پر کردن فواصل موجود در یک رشته اطلاعات است.
سؤالاتی که در دو سطح سختی دانش و فهم نوشته می¬شوند تنها توانایی یادآوری و تشریح حقایق داوطلب را مورد آزمایش قرار می¬دهند نه توانایی حل مسئله.
ب- کاربستن(کاربرد)
کاربستن عبارت است از توانایی کاربرد و استفاده از آموختههای پیشین، اصول علمی فرضیه¬ها، قضایا و دیگر مفاهیم انتزاعی در وضعیت مناسب، و موقعیتهای نوین و حل مسائل جدید و یا استفاده از مطالب و مفاهیم نظری در موارد و موقعیتهای عملی زندگی بدون این ¬که هیچگونه راه حلی ارائه شود. در سطح کارگیری، داوطلب ملزم به استفاده از مفاهیم و اصول در حل مسائل است. رسیدن به این سطح از توانایی مستلزم فراگیری روشها، مفاهیم، نظریه ها، اصول و قواعد است. این حیطه فراتر از فهمیدن است. افعالی که در این سطح به کار می¬روند عبارتند از: اعمال کنید، حل کنید، نشان دهید، اصلاح کنید، محاسبه کنید و اثبات کنید.
ج- تحلیل
تحلیل یعنی تقسیم مطالب کلی به اجزاء تشکیل دهنده آن، تعیین اجزاء و کشف و بیان روابط بین قسمتهای مختلف یک مطلب و نحوه سازمان بندی آنها و شناخت اصول حاکم بر ساخت آن مطلب. در سطح تحلیل، داوطلب ملزم به شکستن ارتباط بین اجزاء یا عناصر تشکیل¬دهنده آن به گونه¬ای است که سلسله مراتب نسبی اندیشه¬ها یا اعمال به صورت روشنی نشان داده شود. افعالی که در این سطح به کار می¬روند عبارتند از: متمایز کنید، مقایسه کنید، تشخیص دهید و ارتباط دهید. این طبقه از سه خرده طبقه زیر تشکیل میشود:
1. تحلیل عناصر
توانایی تشخیص واقعیتها از فرضیهها، توانایی تشخیص فرضهای بیان نشده در یک مطلب خواندنی.
2. تحلیل روابط
توانایی تشخیص روابط علت و معلول از سایر روابط، توانایی تشخیص بیانات مربوط از بیانات نامربوط در یک بحث.
3. تحلیل روابط سازمانی
توانایی تشخیص نقطه نظرها یا تعصبهای نویسنده، توانایی تشخیص فنون مورد استفاده در مطالب ترغیبی.
سؤالاتی که در دو سطح سختی کارگیری و تحلیل نوشته می¬شوند مهارت داوطلب برای حل مسئله را مورد آزمایش قرار می¬دهد (تقاضایی افزون بر یادآوری و تشریح حقایق و مفاهیم).
د-ترکیب(آفرینندگی)
ترکیب یعنی توانایی پیوند دادن اجزاء به منظور تهیه یک صورت و یا هیئت کلی، ابداع و ساختن یک طرح نوین با استفاده از دانستههای پیشین و خلق یک اثر علمی، ادبی، فنی، هنری و یا اجتماعی تازه. ترکیب، پهلوی هم گذاشتن عناصر و اجزاء برای ایجاد یک کل است. در سطح ترکیب، داوطلب ملزم به استفاده از جزئیات و دستیابی به موضوع است. افعالی که در این سطح به کار می¬روند عبارتند از: طراحی کنید، بسازید، گسترش دهید، فرموله کنید، تصور کنید، تولید کنید، تغییر دهید و بنویسید.
مثال: راکتوری برای تولید آزمایشگاهی نانوذرات فلزی طراحی کنید. برای این کار به چه وسایلی نیاز دارید؟
ه- ارزشیابی(سنجش)
ارزشیابی عبارت است از داوری آگاهانه درباره ارزش کارها، اندیشه ها، راه حلها، روشها و غیره برای منظوری معین و بر اساس ملاکی مشخص. ارزشیابی پیچیدهترین سطح توانایی عقلی است. کسانی که به این محله از مهارت عقلی میرسند تواناییهای مربوط به تمامی سطوح پیشین را در حیطه شناختی کسب کردهاند. در سطح ارزشیابی، داوطلب ملزم به داوری در مورد ارزش مطالب بر پایه اصول معین شده است. افعالی که در این سطح به کار می¬روند عبارتند از: تخمین بزنید، ارزیابی کنید، قضاوت کنید و تعیین کنید کدام بهتر است. داوري دربارهی ارزش مطالب و موضوعات براي مقاصد معین. این طبقه از دو خرده طبقه زیر تشکیل شده :
1. داوري بر اساس شواهد درونی: توانایی کاربرد ملاکهای داده شده براي قضاوت درباره یک اثر.
2. توانایی نشان دادن اشتباهات منطقی یک بحث.
مثال: عوامل تأثیر گذار بر پهنای پیک پراش¬سنجی اشعه ایکس را مورد ارزیابی قرار دهید.
سؤالاتی که در دو سطح سختی ترکیب و ارزشیابی نوشته می¬شوند بیش¬ترین مقدار تلاش داوطلب را می¬طلبد. این نوع سؤالات همچنین وقتگیرترین سؤالات برای پاسخ¬دهی هستند.
سطح یادگیری داوطلبان در هر یک از طبقات ششگانه حیطه شناختی و نیز در حیطه عاطفی و روانی-حرکتی را میتوان بر حسب مورد از طریق امتحانات کتبی، شفاهی، عملی و مشاهده مستقیم رفتار مورد ارزشیابی قرار داد. سؤالات باید بر اساس سطوح یادگیری شناختی، عاطفی و روانی – حرکتی طراحی شود به خصوص در بخش حیطهی شناختی، به طبقات دانش، درک و فهم، کاربرد، تجزیه و تحلیل، ترکیب و ارزشیابی توجه شود؛ به گونهای که تعداد سؤالات در هر یک از سطوح متناسب با اهداف رفتاری و بودجه بندی آزمون باشد.
4-شاخصهای آزمون[2]
خصوصیت تمام اندازهگیریها این است که خطا در آنها وجود دارد. برای اینکه مقدار خطای آزمونها کم شود چند ویژگی زیر را باید دارا باشند:
4-1-پايايي ((Reliability
پايايي به معناي تكرار پذيري نتايج است. اين مفهوم در آزمون بدين معناست كه اگر آزمون با همان شركت كنندگان و شرايط تكرار شود افرادي كه در آزمون اول نمرات بالاتري گرفتهاند در تكرار آزمون نيز نمرات بالاتري را به خود اختصاص داده باشند و در مجموع نمرات افراد تا حدود زيادي ثابت بماند. به عبارت ديگر براي آنكه آزمون پايا باشد نمرات شركتكنندگان در دو بار اجراي آزمون بايد با يكديگر همبستگي مثبت داشته باشند. طبيعي است هر چه اين همبستگي قويتر باشد آزمون پايايي بيشتري دارد .از انجا كه آزمونهاي مختلف براي مقاصد مختلف تهيه میشوند اعتبارهاي مختلفي وجود دارد و بسته به اين كه آزمون براي چه هدفي درست شده است اعتبار آن را با توجه به آن هدف معين ميكنند.
4-1-1-عوامل مؤثر بر پايايي آزمون
1. تعداد سؤالات: هرچه تعداد سؤالات بيشتر باشد پايايي بالاتر خواهد بود.
2. كيفيت سؤالات: در تعداد سؤالات برابر، آزموني كه كيفيت سؤالات آن بهتر باشد پايايي بيشتري خواهد داشت.
3. نوع متغير مورد اندازه گيري: پايايي آزمونهايي كه متغير سادهاي مثل حفظ بودن جدول ضرب را میسنجد بيشتر از پايايي آزمونهايي است كه متغيرهاي پيچيدهاي را ميسنجد.
4. تفاوت سطح علمي داوطلبان.
5. شرايط اجراي آزمون.
4-2-روايي یا اعتبار (Validity)
آزمونی اعتبار دارد که هدف آموزش را بسنجد. چیزی را که میخواهیم بسنجیم را بسنجد. مثلاً وقتی قرار است سواد دانشجو را بسنجیم ابتکار او را نسنجد. روايي در آزمون به اين معني است كه آزمون بتواند همان خصوصيتي را بسنجد كه به منظور سنجش آن طراحي شده است. بعنوان مثال اگر قرار باشد در آزمون مهارتها و دانش فرد در حيطة خاصی سنجيده شود، در صورتي آزمون Valid خواهد بود كه واقعاً فردي كه در عمل دانش و مهارت بيشتري دارد در امتحان موفقتر از ديگراني باشد كه در كل يا در بعضي از زمينههاي حيطه مورد سنجش از مهارت و دانش كافي برخوردار نيستند. با اين تعريف مشخص ميشود كه اگر هدف آزمون سنجش قابليتهاي عملی فرد باشد طرح سؤالات تئوريك و غير كاربردي از روايي آزمون ميكاهد و يا اگر آزمون به گونهاي باشد كه فرد با قابليتهاي ديگري غير از دانش مثل هوش يا منطق تست زدن موفق به پاسخدهي به سؤالات شود آن آزمون از روايي كافي برخوردار نیست. همچنين آزمون بايد حتي المقدور همه مباحثي كه بايد مورد سؤال قرار گيرد را پوشش دهد و از مباحثي كه در حيطه اهداف آزمون نيست پرهيز كند.
4-3-عینی باشد
آزمونی از عینیت برخودار است که اگر دو مصحح آنرا تصحیح نمایند، یک نتیجه بدست آید.
4-4-عملی باشد
آزمونی که برگزار میشود باید در مدت زمان مناسبی اجرا شده و نمره گذاری آن نیز به آسانی صورت گیرد و تفسیر نتایج آن هیچ ابهامی نداشته باشد.
4-5-برای داوطلب قابل پیش بینی باشد
هدف آموزش و ارزیابی باید یکسان باشد. چنانچه اهداف آموزش در ابتدای دوره به درستی تعیین شده و داوطلبان از آن مطلع باشند، در این صورت داوطلبان میتوانند سئوالات امتحانی را پیش بینی کنند. اگر بعد از اجرای آزمون داوطلبان بگویند (ما انتظار چنین سئوالاتی را نداشتیم) شیوه ارزشیابی سئوال برانگیز است.
4-6-عادلانه باشد
منصفانه باشد و فراگیر را گمراه نکند.
5- سطح ارزشیابی سؤال (آسان، متوسط، دشوار)
1. سؤالی دشوار محسوب میگردد که تا 25 درصد داوطلبان بتوانند به آن پاسخ دهند.
2. اگر 26 تا 50 درصد داوطلبان بتوانند به آن پاسخ دهند، متوسط محسوب میشود.
3. اگر از 51 تا 75 درصد داوطلبان بتوانند به سؤالی پاسخ صحیح دهند، متوسط پایین محسوب میگردد.
4. هرگاه بیش از 75 درصد داوطلبان بتوانند به آن پاسخ صحیح دهند، سؤال آسان است.
6-دسته بندی انواع آزمونها
6-1-آزمونهای شفاهی
در این آزمون ابتدا پرسش کننده، پرسشها را به صورت شفاهی مطرح میکند و سپس پاسخهای ارزشیابی شونده را یادداشت میکند. پرسش و پاسخ هر دو به صورت شفاهی مطرح میشوند.
6-2-آزمونهای کتبی
تهیه این دسته آزمونها که از متداولترین آزمونهای پیشرفت تحصیلی محسوب میشود با آنکه به نظر ساده میآید مستلزم دقت، تجربه و رعایت نکات چندی است که در مورد آنها توضیح داده خواهد شد.
6-2-1-آزمونهای گسترده پاسخ
این آزمون برای ارزشیابی برخی ازانواع تغییرات رفتاری ارزش زیادی دارد. ارزشیابی شونده در پاسخ دادن به سئوالها، محدودیت چندانی ندارد و آزاد است تا هر طور مایل است پاسخ خود را بپروراند.
6-2-2-آزمونهای محدود پاسخ
آزمونهای محدود پاسخ در واقع حد واسط بین آزمونهای گسترده پاسخ و آزمونهای گزیده پاسخ هستند و همانطور که از عنوان آن برمیآید پاسخی بسیار کوتاه و مختصر، در حد یک جمله دارد. به عبارت دیگر، میتوان یک سئوال گسترده پاسخ را به چند سئوال محدود پاسخ تجزیه کرد. اما باید در نظر داشت که هر یک از این آزمونها برای منظور و مقاصد ویژهای به کار میروند. آزمونهای محدود پاسخ معمولاً برای ارزشیابی و دستیابی به اهداف پایینتر سطح شناختی مناسبترند و ارزشیابی تواناییهای بالاتر شناختی به وسیله این گونه سئوالها دشوار است. آزمونهای محدود پاسخ بصورت یک جمله استفهامی هستند و داوطلب باید پاسخ کوتاهی به آن بدهد. این نوع سئوال را میتوان بصورت سئوالات کامل کردنی نیز مطرح نمود.
6-2-3-آزمونهای گزیده پاسخ(عینی)
در سئوالهای گزیده پاسخ، ارزشیابی شونده باید جواب سئوال را از بین گزینههایی که در اختیار او گذاشته شده انتخاب نماید. این نوع آزمونها به علت اینکه در تصحیح پاسخها، نظر شخصی تصحیح کننده دخالتی ندارد و این کار به صورت عینی (غیر ذهنی) انجام میشود به آزمونهای عینی شناخته میشوند. سئوالهای عینی به ویژه چند گزینهای را میتوان برای ارزشیابی بسیاری از اهداف آموزشی به کار برد و به شرط رعایت اصول و قواعد تهیه آن، نتایج قابل اعتمادتری را انتظار داشت. (سئوالهایی که بیش از دو گزینه در اختیار فراگیران میگذارند سئوالهای چند گزینهای نامیده میشوند). یک سئوال گزیده پاسخ، از یک پرسش و تعداد معدودی گزینه تشکیل میشود. بر حسب اینکه گزینهها چه تعدادی باشند، شکلهای متفاوتی از قبیل: صحیح/غلط (دو گزینهای) یا چهار گزینهای به خود میگیرد.
7-آزمونهای چند گزینهای-Multiple Choice Question MCQ))
آزمون چند گزینهای متداولترین آزمون عینی است که هم در سنجش تواناییهای مختلف و هم در سنجش یادگیری در زمینههای گوناگون تحصیلی مورد استفاده واقع میشود. آزمون چند گزینهای هم از لحاظ یکنواختی سئوالها، هم از لحاظ حساسیت کم در مقابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامهها بهترین نوع آزمونهای عینی است. اين آزمون از حيث روايي، پايايي، عينيت و عملي بودن يكي از بهترين انواع آزمونها ميباشد. طراحي سئوالات چند گزينهاي شايد به نظر آسان بيايد ولي طراحي آزمون استاندارد كاري بسيار دشوار است.
7-1-تعریف آزمون چند گزینهای
آزمون چند گزینهای شامل تعدادی سئوال است که هر یک از آنها از یک قسمت اصلی و تعدادی گزینه (پاسخ) تشکیل میشود و داوطلب گزینه صحیح (پاسخ سئوال) را از میان گزینههای پیشنهادی که در اختيار او قرار داده شده انتخاب میکند [3]. هر سئوال چند گزينهاي شامل يك تنه (Stem) و چند گزينه (Choice or branch) است. تعداد گزینههای سئوالهای چند گزینهای (گزینه درست و گزینه انحرافی) از 2 تا 5 متغیر است[4]. در گزينهها يك گزينه كليد و بقيه گزينهها انحرافي (Distractor) ميباشند. علت بحث بر سر تعداد گزينهها اين است كه طراحي گزينههاي انحرافي خوب و استاندارد كاري واقعاً دشوار است. و شايد نتوان بيش از دو يا حداكثر چهار گزينه انحرافي خوب طراحي نمود[4]. از لحاظ نظری هرچه تعداد گزینهها بیشتر باشد امکان حدس زدن کمتر است اما به سبب اینکه پیدا کردن بیش از سه پاسخ انحرافی کار دشواری است آزمونهای چهارگزینهای که در آنها امکان حدس زدن جواب درست یک در چهار است شهرت بیشتری کسب کردهاند.
7-2-قسمتهای مختلف سئوال چند گزینهای
هر سئوال چند گزینهای شامل قسمتهای اصلی زیر است:
1. قسمت اصلی یا تنه سئوال(Stem)
این بخش سئوال متن اصلی سئوال را تشکیل میدهد و در برگیرنده مسئله یا موضوعی است که سئوال باید آن را اندازهگیری کند.
2. گزینه درست یا پاسخ سئوال(Key)
یکی از گزینههای پیشنهادی پاسخ درست سئوال است که آزمون شونده باید آن را برگزیند. به این گزینه، گزینه کلید گفته میشود.
3. گزینههای انحرافی(Distracters)
به غیر از گزینه درست سئوال، تعدادی گزینه دیگر نیز برای هر سئوال تهیه میشود که به آن گزینههای انحرافی میگویند. نقش گزینههای انحرافی منحرف کردن آزمون شوندگانی است که پاسخ درست سئوال را نمیدانند.
متن اصلی یا تنه سئوال را یک جمله استفهامی یا یک جمله ناتمام تشکیل میدهد و گزینه پیشنهادی جواب جمله استفهامی یا تکمیل کننده جمله ناقص هستند. متخصصان آزمونسازی پیشنهاد میكنند که آزمون ساز تازه کار بهتر است کوشش کند تا متن سئوالهای خود را در قالب جملههای استفهامی طرح کند زیرا به این شکل هدف سئوال به طور آشکارتری بیان میشود اما چنانچه طرح سئوال در قالب جمله استفهامی خیلی طولانیتر از طرح آن به صورت عبارت ناتمام باشد بهتر است از همان شکل جمله ناتمام استفاده کرد اما باید سعی نمود که تمام گزینههای پیشنهادی تکمیل کننده جمله ناتمام باشند.
7-3-انواع سئوالهای چند گزينهاي
سئوالات چند گزينهاي شامل انواعي است كه بصورت خلاصه عبارتند از:
1. نوع تنها گزینه درست(The only correct answer)
این سئوال ساده ترین نوع سئوالهای چند گزینهای است در این نوع سئوال تنها یکی از گزینهها درست است و بقیه گزینهها کاملاً غلط هستند.
2. نوع بهترین گزینه(one best answer)
در این نوع سئوال همه گزینهها درست هستند اما یکی از آنها از همه درستتر یا بهتر است. طراحی این نوع سوال بسیار دشوار است.
3. نوع منفی
در این نوع سئوال تنه سئوال به صورت منفی بیان میشود و همه گزینهها بجز یکی از آنها درست هستند.
4. نوع کلاسیک
گزینههای کلاسیک شامل:
الف- گزینه درست(Key Answer)
ب- گزینه موجه نما(Foil)
ج- گزینه انحرافی(Distractor)
د- گزینه گمراه ساز(Mislead)
مثال : عکس عمل تقسیم کدام است ؟
الف- ضرب (درست)
ب- جمع (موجه نما)
ج- تفریق (انحرافی)
د- جذر (گمراه ساز به علت خطوط علایم)
یکی از مشکلات تهیه سئوالهای چند گزینهای این است که بعضی اوقات تهیه تعدادی گزینه انحرافی غلط که به ظاهر درست جلو کنند بسیار دشوار است. در این گونه مواقع، چنانچه تهیه گزینههای درست آسانتر باشد میتوان از نوع سئوالهای منفی که در آن همه گزینهها بجز یکی از آنها درست است استفاده کرد.
8-قواعد تهیه سوالهای چند گزینهای (شاخصهاي Millman)
جهت تضمين روايي ساختار سؤالات چند گزينهای، اصول ميلمن در مورد ساختار ساقه (Stem)و گزينهها(Options) تدوين شده، كه رعايت آنها در انواع آزمونهاي چهارگزینهای مورد توافق كليه صاحبنظران ميباشد:
1. هر سوال بايد داراي يك هدف آموزشی مشخص و واضح باشد. هدف سئوال كه در واقع مهمترين و اصليترين قسمت طراحي هر نوع آزمون و از جمله اين گونه سئوالات است، اندازهگيري يكي از بازدههاي يادگيري در مورد موضوع مطرح شده و در ارتباط مستقيم با رشته تخصصي ميباشد. در حقيقت سئوال بدون هدف مدون ارزش آموزشي چنداني ندارد[8-5].
2. هر سوال بايد يك موضوع مهم یا یک هدف آموزشی را اندازه بگیرد.
3. بیشتر از یک مسئله یا یک موضوع در هر سوال قرار ندهید. اگر بيش از يك موضوع در سئوال مطرح شود نه تنها سئوال را پيچيده ميكند بلكه اگر داوطلب در پاسخگويي به سئوال موفق نباشد معلوم نيست كه كداميك از مطالب را ندانسته و علت عدم موفقيت او چه بوده است.
4. پايه و گزينههاي سئوالات را کاملا روشن و واضح بنویسید و از عبارات و کلمات قابل فهم داوطلبان استفاده کنید. از کاربرد عبارات و كلمات مبهم و دشوار خودداري شود.
5. پاسخ (گزينهها) مختصر و كوتاه باشد و از تكرار مطالب خودداري گردد.
6. مطالب اصلی سوال را بطور کامل در تنه سوال بنویسید.
7. تنه سئوال حتی الامکان باید کوتاه نوشته شود و از آوردن اطلاعات اضافی اجتناب شود.
8. از به کار بردن اشارههای دستوری نامربوط و غیره در تنه سوال خودداری کنید. اشاراتی از قبیل زمان افعال، مفرد و جمع بودن آنها را در سوالها نباید بکار برد، آنگونه که داوطلب با توجه به این اشارات گزینه درست را انتخاب کند. تنه سئوال نباید به گزینه درست شباهت داشته باشد و تداعی ایجاد کند. اگر بین تنه سئوال وگزینه انحرافی شباهت ظاهری وجود داشته باشد، اشکالی ندارد. مثلاً اگر تنه سئوال طوری نوشته شود که پاسخ الزاماً جمع باشد و در میان پاسخهای پیشنهادی نیز تنها یک پاسخ جمع و سه پاسخ مفرد باشد، بدیهی است که تنه سئوال پاسخ را نشان خواهد داد.
9. تنه سئوال بايد به تنهايي با معنا بوده و مستقيما در رابطه با هدف سئوال باشد. بدين معني كه اگر آزمون شونده با كاغذي روي گزينهها را بپوشاند قادر به پاسخگويي سئوال باشد.
10. همه گزینههای یک سئوال باید متجانس و به موضوع واحدی مربوط باشد.
11. سوال را طوری بنویسید که پاسخ درست تنها پاسخ درست و یا قطعاً درستترین پاسخ باشد.
12. برای اندازه گیری فرایندهای پیچیده ذهنی از موقعیتها و مطالب تازه و بدیع استفاده کنید.
13. گزينههاي انحرافي (ساير گزينهها) طوري نوشته شود كه توجه داوطلبان بي اطلاع از موضوع را به خود جلب كند و يا شامل اشتباهات معمول و متداول باشند.
14. گزینههای هر سوال را طوری بنویسید که از نظر دستوری و جمله بندی به نحو درست مکمل متن سوال باشند.
15. در سوالات منفی کلمات منفی را برجسته جلوه دهید یا زیر آن خط بکشید تا به داوطلب کمک کند متوجه منفی بودن سوال باشد. پیشنهاد میشود تنه سئوالات به صورت مثبت نوشته شود.
16. از نوشتن سوالهایی که متن آنها منفی و گزینهها هم منفی هستند، یعنی منفی مضاعف، احتراز کنید زیرا خواندن آنها داوطلب را گیج میکند.
17. تا حد امكان از كاربرد عبارتهايي مانند “همه آنچه در بالا گفته شد”، ” تمامي موارد فوق”، “هيچكدام از موارد بالا”، “هیچکدام از اینها”، ” هر سه مورد”، “الف وب” و مشابه آنها در گزینهها خودداري شود.
18. از بکار بردن اشارات نامناسب دستوری مانند “هرگز”، “همیشه”، “به ندرت”، “اغلب”، “معمولاً”، “فقط” و… در گزینهها (که تا حدود زیادی اشاره به نادرست بودن آنها دارند) تا حد امکان خودداری کنید.
19. سوالها را مستقل از یکدیگر بنویسید. پاسخ یک سئوال نباید شرط لازم برای پاسخ دادن به سئوال دیگر باشد.
20. از طرح سوالهای گمراه کننده بپرهیزید زیرا اغلب داوطلبان مطلعتر که اطلاعات وسیعتری دارند به وسیله این گونه سوالها گمراه میشوند.
21. طول گزینه درست را در سوالهای مختلف تغییر دهید. گزینههای طویل میتوانند موجب فریب یا ترغیب داوطلب به انتخاب این نوع گزینه گردد.
22. محل گزینه درست را در در میان گزینههای انحرافی به طور تصادفی انتخاب کنید.
23. در سوالهایی که تنه آنها جمله ناتمام است، جای خالی را در قسمت آخر جمله قرار دهید.
24. دو گزينه كاملا متضاد كه يكي از آنها گزينه صحيح است در يك سئوال بكار برده نشود.
25. از بکار بردن شاخصهایی که پاسخ صحیح را آشکار میسازند اجتناب شود. (شاخصهایی که پاسخ صحیح را آشکار میسازند زیادند اما رایجترین آنها عبارتند از:
الف)بلندتر بودن طول پاسخ صحیح نسبت به پاسخهای غلط.
ب)آشنایی بیشتر فراگیران با پاسخ صحیح نسبت به پاسخ غلط.
ج) قرار گرفتن پاسخ صحیح در یک موقعیت معین، در چند سوال متوالی.
بزرگترين خطر براي روايي بودن آزمونهاي چند گزينهاي، انتخاب گزينه بصورت شانسي توسط داوطلب باهوش ولي كم سواد است[9]. براي مقابله با اين آفت، اولين و بهترين ترفند استفاده از قواعد Writing Item Errors يا سياهه ميلمن است كه باعث ميشود كه سرنخ ناخواسته به دست داوطلب باهوش ندهيم. بيشترين نقايص در طراحي سئوالات چند گزينهاي در این موضوع نهفته است[13-10].
9-فهرست وارسي Millman براي بررسي كيفي سؤالات
1. هر سؤال به يك مسئله اصلي بر اساس بودجه آزمون پرداخته است؟
2. هر سؤال واضح و تا حد امكان كوتاه است؟
3. تنه سؤال منفي نيست و چنانچه ناگريز به صورت منفي آمده است نشانة منفي به شيوهاي برجسته شده است؟
5. با پوشاندن گزينهها، تنه سؤال را به تنهايي ميتوان فهميد يا كامل كرد؟
6. چنانچه بيش از يك جواب صحيح داشته باشد از تركيباتي چون، بهترين استفاده شده است؟
7. جاي خالي نه در آغاز بلكه در بخشهاي پاياني تنه سؤال آمده است؟
8. هر گزينه يك نكته را مورد سؤال قرار ميدهد؟
9. در تنه سؤال و گزينهها از نظر دستور زبان مسئلهاي وجود ندارد و تلفيق هر گزينه و تنه سؤال صورت زباني پذيرفتهاي را ارئه ميكند؟
10. از تكراركليات در پاية سؤال خودداري شده است؟
11.گزينههاي انحرافي براي آزمودنيهاي كم اطلاع جالب است؟
12. از نظر طول و پيچيدگي و نكات كاربردي گزينهها تناسب دارند و كلمات مشترك در كليه گزينهها به تنه سؤال انتقال يافته است؟
13. تنه سؤال و گزينهها از نظر محتواي موضوعي و صورت تناسب دارند؟
14. تعدادگزينهها در هر يك از سؤالات يكسان (2، 3، 4، 5 یا 6) است؟
15. از به كار بردن عين واژة كتاب درسي خودداري شده است؟
16. در هرگزينه به مفهومي متفاوت با گزينههاي ديگر اشاره شده است؟
17. از به كار بردن قيدهاي مطلق ( هميشه، هرگز، فقط ….) خودداري شده است؟
18. اصطلاح يا مفهومي كه بايد تعريف شود در تنه سوال آمده و گزينهها مشخصههاي آن را كامل ميكنند؟
19. توزيع پاسخهاي صحيح بين گزينههاي مختلف از هيچ الگوي خاصي پيروي نميكند و صرفاً تصادفي است؟
20. براي هر بخش آزمون دستور كار روشن است؟
21. در هر بخش آزمون، آرايش كليه گزينهها در يك راستا (عمودي / افقي با فاصله مناسب) است؟
22. هر سؤال مستقل از بقيه است؟
23. از كاربرد همه /هيچ يك از موارد بالا يا هم الف هم ب و مانند آن خودداري شده است؟
24. تنه سؤال و گزينههاي مربوطه در يك صفحه قرار گرفته است؟
25. گزينههاي انحرافي متضاد پاسخ صحيح به آساني قابل حذف نيستند؟
26. واژههاي مشابه يا راهنمايي كننده در تنه سؤال و در هيچ يك از گزينههاي مشترك نيست؟
27. در تنه سؤال پاسخ صحيح سؤالي ديگر نيامده است؟
10- تاكسونومي یا رده بندی(Taxonomy): سطوح ارزشیابی داوطلب در حیطه شناختی(سطح دانش بكار رفته در سؤال)
سؤالات از نظر سطح شناختي بلوم (Cognition Bloom Levels) الزاماً بايد در تاكسونومي I، II و III طرح شده باشند. سه سطح از سطوح شش گانه بلوم قابليت كاربرد در سؤالات چند گزينهاي(MCQ) را دارند:
الف)تاكسونومي I (Recall): سؤالات مبتني بر حافظه و دانش سطحي. (دانش، یادآوری مطالب)
مثال: شايعترين تظاهر بيماري X كدام است؟
ب)تاكسونومي(Comprehension) II: سؤالات مبتني بر فهم و درك مطالب. (قدرت ترکیب دادهها، درک مطلب، تفسیر مطلب، آنالیز مطلب، تشخیص)
مثال: وقتي در سؤال يك Caseمطرح شده و تشخيص مورد پرسش قرار گيرد، تاكسونومي سؤال IIخواهد بود.
ج)تاكسونوميIII (Application of Knowledge): سؤالات مبتني بر كاربرد دانش. (ارزشیابی، قضاوت، حل مسئله، قدرت و توان پیش بینی، قدرت تصمیم گیری در تنظیم برنامهها، قدرت در ارائه راه حلهای عملی)
مثال: وقتي در سؤال يك Caseمطرح شده و درمان مورد پرسش قرار گيرد كه در اين صورت پاسخ دهنده بايد ابتدا محتملترين تشخيص را يافته و سپس درمان مناسب را پيدا كند، تاكسونومي سؤال IIIخواهد بود.
به عنوان يك قاعده كلي نبايد سوالات مبتني بر حافظه (تاكسونوميI) بيش از 50 %سوالات امتحان را شامل شود.
11-جمع بندي
طراحي سوالات چند گزينهاي كاري سهل و در عين حال بسيار دشوار است[4و7و8و14-19]. شناخت انواع سوالات و قدرت احقاق اهداف آزمون منطبق با برنامه آموزشي (Curriculum) از مهمترين عناصر موفقيت در تهيه آزمون چند گزينهاي روا (Valid) ميباشد. بعد از طراحي سوال كار به پايان نرسيده و بايد وارسيهايي بر روي آن انجام پذيرد كه براي استاندارسازي اين نوع سوالات الزامي است. استفاده از فهرست وارسي ميلمن ما را در اين مهم ياري ميرساند.
12-پيشنهادات
1. امتحانات چند گزينهاي بعنوان رايجترين و اصليترين آزمون تراكمي (Summative) و براساس معيار (Criterion – based) مورد استفاده قرار گرفته است؛ بنابراين از اهميت ويژهاي برخوردار است.
2. كليد طراحي يك سوال خوب در نظر گرفتن هدف ارزيابي است كه با آن سوال محقق ميشود. بدون داشتن هدف نميدانيم به كجا ميرويم. بنابراين به هدف سوال بسيار فكر كنيم و سپس آن را به نگارش درآوريم.
3. طراحي سوال خوب وقت فراواني ميخواهد تا تمام جنبههاي آن مورد مداقه كافي قرار گيرد. سوالات را شتابزده طراحي نكنيم.
4. سوالات با تاكسونومي بالاتر، از اين نظر كه عمق بيشتري از اهداف آموزشي حيطه شناختي را مورد بررسي قرار مي دهد امتياز بيشتري دارند. پر واضح است كه سوالات با سطوح (تاكسونومي) بالاتر در بطن خود سطوح پايينتر شناختي را در بر ميگيرد.
5. استاندارد يا بهينهسازي آزمون چند گزينهاي نيازمند كار گروهي فعال ميباشد. هيأت ممتحنه نيز براي تحقق اين آرمان سازماندهي شدهاند.
6. به نظرات همكاران خود و همچنين مشاوران طراحي سوالات ارج نهيم. هيچ عيبي براي يك آزمون بالاتر از اين نيست كه سوالات آن اشكالي آشكار در طراحي داشته و بعبارتي ديگر غير استاندارد باشد [10].
7. با الگو گرفتن از سؤالات موفق در آزمونهاي پيشين و استفاده از آنها به صورت قالب سؤال، طراحي مناسبتري خواهم داشت.
8. سعی بفرمایید سئوالها به گونهای طرح شوند که بتوانند علاوه بر سنجش محفوظات، قدرت درک و تجربه و تحلیل اطلاعات افراد را هم ارزیابی کنند.
9. سعی بفرمایید موضوعهای مورد سئوال متنوع باشند و جنبههای مختلفی از اطلاعات داوطلبان را بسنجد.
10. عبارت سئوال و یا گزینه را واژه به واژه از روی متن منبع امتحانی ننویسید.
11. توجه داشته باشید که هیچیک از سئوالات، راهنمایی یا توضیحی برای سئوال دیگر فراهم نکند.
12. از ایجاد تداعیهای ظاهری بپرهیزید.
13. حتی الاامکان از طرح مسائل اضافهای که نقشی در کیفیت و سلامت سئوال ندارند بپرهیزید.
13-منابع و مراجع
1.کدیور، پروین، روانشانسی تربیتی، تهران، سازمان مطالعه و تدوین کتب علوم انسانی دانشگاه ها(سمت)، 1379.
2. ثرندایک، رابرت، الیزابت هیگن، مترجم: خسرو مهندسی، احمد آرام، فخری امین، زهره سرمدی، تهران، اندازه گیری و سنجش در روانشناسی و تعلیم و تربیت، اندیشه، فرانکلین، ۱۳۴۳.
3. McCoubrie P. Improving the fairness of multiple-choice questions: a literature review. Med Teach2004
Dec;26(8):709-12.
4. Vyas R, Supe A. Multiple choice questions: a literature review on the optimal number of options. Natl Med J India2008 May-Jun;21(3-130).
5. Schultheis NM. Writing cognitive educational objectives and multiple-choice test questions. Am J Health Syst Pharm1998 Nov 15 401-2397(22)55.
6. Collins J. Education techniques for lifelong learning: writing multiple-choice questions for continuing medical education activities and self-assessment modules. Radiographics2006 Mar-Apr;26(2):543-51.
7. Cox KR. How did you guess? Or, what do multiple-choice questions measure? Med J Aust1976 Jun 5;1(23):884-6.
8. Ferland JJ, Dorval J, Levasseur L. Measuring higher cognitive levels by multiple choice questions: a myth? Med Educ1987 Mar;21(2):109-13.
9. Koeslag JH, Melzer CW, Schach SR. Penalties in multiple-choice and true-false questions. S Afr Med J1983 Jan1;63(1):20-2.
10. Tarrant M Knierim A, Hayes SK, Ware J. The frequency of item writing flaws in multiple-choice questions used in high stakes nursing assessments. Nurse Educ Pract2006 Dec;6(6):354-63.
11. Tarrant M, Ware J. Impact of item-writing flaws in multiple-choice questions on student achievement in high-stakes nursing assessments. Med Educ2008 Feb;42(2):198-206.
12. Ware J, Vik T. Quality assurance of item writing: During the introduction of multiple choice questions in medicine for high stakes examinations. Med Teach2008 Sep 29:1-6.
13. Whitley TW. Some common flaws in multiple choice exam questions. Nurs Outlook1979 Jul;27(7):466-9.
14. Veloski JJ, Rabinowitz HK, Robeson MR. A solution to the cueing effects of multiple choice questions: the Un-Q format. Med Educ1993 Jul;27(4):371-5.
15. Buzzard AJ, Bandaranayake RC. Comparison of the performance of visual and verbal multiple-choice questions. Aust N Z J Surg1991 Aug;61(8):614-8.
16. Considine J, Botti M, Thomas S. Design, format, validity and reliability of multiple choice questions for use in nursing research and education. Collegian2005 Jan;12(1):19-24.
17. Melzer CW, Schach SR, Koeslag JH. Misconceptions and miscarriages in multiple choice questions. S Afr Med J1976 Apr 3;50(15):583-7.
18. Palmer EJ, Devitt PG. Assessment of higher order cognitive skills in undergraduate education: modified essay or multiple choice questions? Research paper. BMC Med Educ2007;7:49.
19. Schuwirth LW, van der Vleuten CP, Donkers HH. A closer look at cueing effects in multiple-choice questions. Med Educ1996 Jan;30(1):44-9.