نظارت و ارزشیابی حلقه‌ی آخر فعالیت‌‌های آموزشی

نویسنده: مهدی رحمانی

چکیده
در پایان هر دوره آموزشی باید در فکر، احساسات، نگرش‌ها و اعمال علم‌آموزان بر حسب هدف‌های آن دوره تغییراتی به وجود آید که آن را تغییر رفتار می‌نامند. ابزار یا وسیله‌ای که برای سنجش پیشرفت تحصیلی در موقعیت‌های آموزشی و تدریس به کار می‌رود آزمون یا امتحان نام دارد. آزمون چند گزینه‌ای متداولترین آزمون عینی است که هم در سنجش توانایی‌های مختلف و هم در سنجش یادگیری در زمینه‌های گوناگون تحصیلی مورد استفاده واقع می‌شود. آزمون چند گزینه‌ای هم از لحاظ یکنواختی سئوال‌ها، هم از لحاظ حساسیت کم در مقابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامه‌ها بهترین نوع آزمون‌های عینی است. در متن حاضر این نوع آزمون و طرز تهیه آن مورد بحث قرار خواهد گرفت و موارد استفاده آن در سنجش انواع مختلف بازده‌های یادگیری معرفی می‌شود.

«طراحي سؤال علم نيست بلكه مجموعه‌اي از قواعد است مبتني بر تجربه و خرد استادان و ممتحنين.»
يان بروموت (1970)

کلمات کلیدی: یادگیری و آموزش، حیطه شناختی، هدفهای تربیتی، آزمون، آزمون‌های چند گزینه‌ای (MCQ).

گردآورنده: مهدی رحمانی(competition@nano.ir-09190424205)

1-مقدمه
براساس روانشناسی یادگیری و آموزشی، نظارت و ارزشیابی حلقه آخر فعالیت‌های آموزشی و تکمیل کننده انجام آموزش محسوب می‌شود و عمدتاً با هدف اصلاح و بهبود فرایند آموزش صورت می‌گیرد. اساساً اطلاق مفهوم “آموزش” به یک فعالیت، منوط به انجام ارزشیابی است. به این ترتیب نظارت و ارزشیابی آموزشی یکی از مهمترین وظایف هر آموزش دهنده است و جزء لاینفکی از اجزاء یک برنامه آموزشی تلقی می‌شود. ابزار یا وسیله‌ای که برای سنجش پیشرفت تحصیلی در موقعیت‌های آموزشی و تدریس به کار می‌رود آزمون یا امتحان نام دارد.
طرح سوالات آزمون، فرایندی است که نیاز به دقت و توجه خاص در رابطه با علم‌آموزان،کتاب و مواد درسی(منبع آزمون) و شرایط و نوع امتحان دارد؛ زیرا موضوعات و سرفصل‌های درسی و آموزشی با هم متفاوتند و علم‌آموزان نیز از استعداد، درجه یادگیری، سطح دانش و اطلاعات و شرایط روحی یکسان برخوردار نیستند. بنابر این باید اصول و مقرراتی را در تنظیم سوال امتحانی رعایت نمود تا علم‌آموزان با استعداد وکم استعداد، در شرایط کاملاً مساوی قرار نگیرند و برای علم‌آموزان ضعیف نیز این فرصت را ایجاد کرد تا بتوانند به تعدادی از سوالات طرح شده متناسب با استعداد خویش جواب داده و نمره‌ای که مانع از افت گردد، کسب نماید که این خود باعث ایجاد حس اعتماد به نفس و افزایش علاقه‌مندی برای مطالعه و تلاش بیشتر در امتحانات بعدی او خواهد شد. توجه داشته باشید كه اهداف آموزشی و آزمون باید با یكدیگر همخوانی داشته باشند و در طراحی آزمون باید بیان روشن و دقیقی از اهداف آموزش و تدریس در اختیار داشته باشیم. آزمون چند گزینه‌ای متداولترین آزمون عینی است که هم در سنجش توانایی‌های مختلف و هم در سنجش یادگیری در زمینه‌های گوناگون تحصیلی مورد استفاده واقع می‌شود. آزمون چند گزینه‌ای هم از لحاظ یکنواختی سئوال‌ها، هم از لحاظ حساسیت کم در مقابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامه‌ها بهترین نوع آزمون‌های عینی است. ما در متن حاضر این نوع آزمون و طرز تهیه آن را مورد بحث قرار می‌دهیم و موارد استفاده آن را در سنجش انواع مختلف بازده‌های یادگیری معرفی می‌کنیم. در مقاله مروري پيش‌رو پس از تعريف اين نوع آزمون و ويژگيهاي آن به معرفي انواع آن پرداخته و سپس تلاش بر آن خواهد بود تا راهكاري استاندارد سازي اين سئوالات ارائه گردد.

2-طبقه بندی هدفهای تربیتی[1و 2]
به طوری که می‌دانیم در پایان هر دوره آموزشی باید در فکر، احساسات، نگرش‌ها و اعمال علم‌آموزان بر حسب هدف‌های آن دوره تغییراتی به وجود آید که آن را تغییر رفتار می‌نامند. منظور از طبقه بندی هدف‌های تربیتی آن است که معلوم بداریم این تغییر رفتار در چه زمینه‌ها و در چه سطحی صورت می‌گیرد. به طور کلی هدف‌های تربیتی را می‌توان در سه حیطه مختلف تحت عناوین حیطه شناختی، حیطه عاطفی یا انفعالی و حیطه روانی-حرکتی طبقه بندی کرد.

2-1-حیطه شناختی
شامل تمامی رفتارهایی است که با توانایی‌های ذهنی و مهارت‌های عقلانی مانند بازشناسی، یادآوری، بیان مطالب آموخته شده، تعبیر و تفسیر مطالب، قضاوت در مورد امور و پدیده‌ها، استدلال و مانند آنها مربوطند. وقتی که علم‌آموز معنای یک لغت را از میان چند کلمه مختلف تشخیص می‌دهد، قطعه شعری را از حفظ می‌خواند، مفهوم یک بیت را به صورت نثر می‌نویسد، یک مسئله ریاضی را حل می‌کند و در مورد یک متن ادبی اظهار نظر می‌کند، رفتار وی در هر یک از این موارد جزو حیطه شناختی محسوب می‌شود.

2-2-حیطه عاطفی یا انفعالی
به رغبت‌ها، نگرش‌ها، اعتقادات و نظام ارزشها مربوط است. علم‌آموزی را در نظر بگیرید که بر اثر گذراندن یک دوره آموزشی در ادبیات فارسی نسبت به متون ادبی علاقمند می‌شود، یا از مطالعه تاریخ جنگ جهانی دوم نسبت به جنگ و تبعیض نژادی نگرش منفی پیدا می‌کند و یا با خواندن شرح زندگی پیامبر اسلام و ائمه اطهار اعتقاداتش نسبت به دین مبین اسلام راسخ‌تر می‌شود. تمامی این رفتارها در حیطه انفعالی یا عاطفی قرار دارند.

2-3-حیطه روانی-حرکتی
شامل آن دسته از رفتارهایی است که با مهارت‌های عقلی و اعمال بدنی هر دو مربوطند. توانایی و مهارت علم‌آموز در اموری مانند ماشین نویسی، نقشه کشی، نقاشی کردن، سیم کشی، پرش با نیزه و به طور کلی تمامی مهارت‌های مربوط به انجام کارهای عملی و فنی جزو حیطه روانی-حرکتی به شمار می‌روند. باید توجه داشت رفتارهای آموخته شده که در هر یک از حیطه‌های مذکور قرار می‌گیرند در عین حال با دو حیطه دیگر در ارتباطند و نمی‌توان گفت که یک توانایی یا مهارت آموخته شده صرفاً به یک حیطه مربوط است. به عنوان مثال علم آموزی که از عهده ساختن یک رادیو برمی‌آید، باید اولاً اصول و مفاهیم آن قسمت از فیزیک را که در ساختن رادیو به کار می‌رود آموخته باشد(شناختی)، و نسبت به این کار علاقمند شده باشد(عاطفی)، زیرا علاقمندی شرط تداوم کوشش در هر زمینه است، تا سرانجام بتواند رادیوئی بسازد(روانی-حرکتی).

3-هدف‌های تربیتی در حیطه شناختی(طبقه¬بندی بلوم)
روش¬های متعددی برای طبقه¬بندی دانش و مهارت¬های مورد اندازه¬گیری در سؤالات وجود دارد. یکی از مفیدترین این روش¬ها توسط بلوم ارائه شده است. همانگونه که در شکل (1) مشاهده می‌شود، بلوم 6 سطح از حیطه¬های شناختی (یادگیری) را از ساده تا پیچیده مرتب کرده است. بلوم بیان می¬کند در هر سطح باید یک مفهوم سؤال شود. حیطه یادگیری هدف‌هایی را شامل می‌شود که با یادآوري یا بازشناسی، دانش و رشد توانائی‌ها و مهارت‌های ذهنی سر و کار دارد. این حوزه مهم‌ترین زمینه‌ی کار برنامه‌ریزان آموزشی و جریان ارزشیابی را تشکیل می‌دهد.
هدفهای تربیتی در حیطه شناختی را می‌توان از ساده‌ترین توانایی‌های ذهنی تا پیچیده‌ترین مهارت‌های عقلی، به ترتیب به شش طبقه، تقسیم بندی کرد: دانش، فهمیدن(فراگیری)، کاربرد، تجزیه و تحلیل، ترکیب و ارزشیابی. حیطه شناختی به دو بخش اصلی دانش و توانائی‌ها و مهارت‌های ذهنی تقسیم شده است:


شکل(1): طبقه بندی بلوم برای حیطه‌های شناختی

1.    دانش
دانش، بازشناسی و یادآوری آموخته‌ها، مانند مفاهیم، اصطلاحات، قواعد و اصول از مطالب جزئی تا کلی را شامل می‌شود. کسب دانش و گسترش اطلاعات و آگاهی، یکی از متداول‌ترین و مهمترین هدف‌های آموزشی به شمار می‌رود. افعالی که در این سطح به کار می¬روند عبارتند از: تعریف کنید، لیست کنید، بیان کنید، مشخص کنید، طبقه¬بندی کنید و نام ببرید. چه¬ کسی؟ کی؟ کجا؟ چه؟
رفتارهای زیر عموماً در قلمرو دانش قرار دارند. علم‌آموز می‌تواند: معنای لغتی را که آموخته است بیان کند. بخش‌های مختلف یک نقشه جغرافیایی را مشخص کند. یک آزمایش علمی را شرح دهد. قطعه شعری را از حفظ بخواند. یک اصطلاح یا قاعده علمی را تعریف کند.
دانش از سه طبقه تشکیل می‌شود:

الف- دانش امور جزئی
1-دانش اصطلاحات: تعریف اصطلاحات علمی و فنی.
2-دانش واقعیت‌های مشخص: بیان خواص فیزیکی نانولوله¬های کربنی.
مثال: اصطلاحات زیر را تعریف کنید: 1- خاصیت فوتوکاتالیستی 2- خاصیت گسیل میدانی.

ب- دانش راه‌ها و وسائل برخورداري با امور جزئی
1-دانش امور قراردادي: توضیح قواعد.
2-دانش روال‌ها و توالی‌ها: توضیح تأثیرات یک عامل بر روابط پدیده‌ها- بیان تأثیرات عوامل بر یک عامل.
3-دانش طبقه¬بندی‌ها و طبقات: گفتن نقش و هدف یک رشته علمی- بیان اشکال مختلف یک پدیده.
4-دانش ملاک‌ها: بیان ملاک‌های مورد استفاده درتعیین ارزش یک مورد خاص- بیان ملاک‌های طبقه بندي علوم.
5-دانش روش‌ها یا روش شناسی: نامبردن روش‌های مناسب بررسی مسائل- بیان روش‌های مورد استفاده دانشمندان براي پاسخ به سؤال‌ها درباره یک موضوع خاص.

ج- دانش امور کلی و انتزاعی یک علم
1-دانش اصل¬ها و تعمیم¬ها: بیان اصول مهم در یک موضوع- بیان قوانین علمی یک موضوع.
2-دانش نظریه‌ها و ساخت¬ها: بیان اصول و نظریه‌ها- توضیح نظریه‌های مهم از یک موضوع خاص.
2.    توانائی‌ها و مهارت‌های ذهنی
فعالیت‌ها و مهارت‌های ذهنی از پنج طبقه تشکیل شده‌اند: فهمیدن(فراگیری)، کاربرد، تجزیه و تحلیل، ترکیب و ارزشیابی.

الف- فهمیدن(فراگیری)
فراگیری یا فهمیدن، عبارت است از درک و دریافت معنا و مفهوم ظاهری و مستتر در یک مطلب و بیان آن با عبارات و جملاتی که خود علم‌آموز می‌سازد. بنابراین فهم و بیان اصول و واقعیات، تفسیر مطالب کلامی، تفسیر جداول، نمودارها و فرمول‌های ریاضی، ترجمه مطالب، بسط و پیش بینی و تعمیم اصول و قواعد، جزو فراگیری می‌باشند. فهمیدن یعنی درك مطالب، که فرد از آن طریق درمی¬¬یابد که هدف اصلی مطلب مورد نظر چیست. مرحله بالاتر از دانش است؛ زیرا در دانش از داوطلب خواسته می‌شود مطالبی را که آموخته، بدون دخل و تصرف زیاد در آن به یاد آورد؛ اما در این طبقه، داوطلب علاوه بر حفظ، باید مطالب را بفهمد. در سطح فهمیدن، داوطلب ملزم به تشریح و تفسیر معانی اصول است. افعالی که در این سطح به کار می¬روند عبارتند از: تشریح کنید، پیش¬بینی کنید، تفسیر کنید، استنباط کنید، خلاصه کنید و ترجمه کنید.
مثال: تفاوت¬های میکروسکوپ الکترونی عبوری و روبشی را در نوع تصویرگیری شرح دهید.
این طبقه شامل سه خرده طبقه می‌شود:

1.    ترجمه
انتقال معنی از شکلی به شکل دیگر، ترجمه از یک سطح انتزاعی به سطحی دیگر، بیان یک مطلب پیچیده به زبان ساده، ترجمه از یک نمادي به شکل دیگر، توانایی خواندن علائم مخصوص یک علم، ترجمه از یک شکل کلامی به شکل دیگر، برگردان مطلب از زبان خارجی به فارسی.

2.    تفسیر
توضیح مطالب از طریق معنی کردن با دادن مثال‌ها یا خلاصه آن‌ها، توانایی تفسیر انواع داده‌ها، توانایی درك و بیان اندیشه اصلی یک اثر یا یک مطلب به طورخلاصه.
مثال: جابه¬جایی رامان در طیف¬های رامان ترکیبات را تفسیر کنید.

3.    برون¬یابی
بسط دادن اطلاعات و تعمیم نتایج یک تحقیق یا نمونه‌ای از یک گروه به کل گروه، شکل دیگر برون¬یابی، درون¬‌یابی است که شامل پر کردن فواصل موجود در یک رشته اطلاعات است.

سؤالاتی که در دو سطح سختی دانش و فهم نوشته می¬شوند تنها توانایی یادآوری و تشریح حقایق داوطلب را مورد آزمایش قرار می¬دهند نه توانایی حل مسئله.

ب- کاربستن(کاربرد)
کاربستن عبارت است از توانایی کاربرد و استفاده از آموخته‌های پیشین، اصول علمی فرضیه¬ها، قضایا و دیگر مفاهیم انتزاعی در وضعیت مناسب، و موقعیت‌های نوین و حل مسائل جدید و یا استفاده از مطالب و مفاهیم نظری در موارد و موقعیت‌های عملی زندگی بدون این ¬که هیچگونه راه حلی ارائه شود. در سطح کارگیری، داوطلب ملزم به استفاده از مفاهیم و اصول در حل مسائل است. رسیدن به این سطح از توانایی مستلزم فراگیری روشها، مفاهیم، نظریه ها، اصول و قواعد است. این حیطه فراتر از فهمیدن است. افعالی که در این سطح به کار می¬روند عبارتند از: اعمال کنید، حل کنید، نشان دهید، اصلاح کنید، محاسبه کنید و اثبات کنید.

ج- تحلیل
تحلیل یعنی تقسیم مطالب کلی به اجزاء تشکیل دهنده آن، تعیین اجزاء و کشف و بیان روابط بین قسمت‌های مختلف یک مطلب و نحوه سازمان بندی آنها و شناخت اصول حاکم بر ساخت آن مطلب. در سطح تحلیل، داوطلب ملزم به شکستن ارتباط بین اجزاء یا عناصر تشکیل¬دهنده آن به گونه¬ای است که سلسله مراتب نسبی اندیشه¬ها یا اعمال به صورت روشنی نشان داده شود. افعالی که در این سطح به کار می¬روند عبارتند از: متمایز کنید، مقایسه کنید، تشخیص دهید و ارتباط دهید. این طبقه از سه خرده طبقه زیر تشکیل می‌شود:

1.    تحلیل عناصر
توانایی تشخیص واقعیت‌ها از فرضیه‌ها، توانایی تشخیص فرض‌های بیان نشده در یک مطلب خواندنی.
2.    تحلیل روابط
توانایی تشخیص روابط علت و معلول از سایر روابط، توانایی تشخیص بیانات مربوط از بیانات نامربوط در یک بحث.
3.    تحلیل روابط سازمانی
توانایی تشخیص نقطه نظرها یا تعصب‌های نویسنده، توانایی تشخیص فنون مورد استفاده در مطالب ترغیبی.

سؤالاتی که در دو سطح سختی کارگیری و تحلیل نوشته می¬شوند مهارت داوطلب برای حل مسئله را مورد آزمایش قرار می¬دهد (تقاضایی افزون بر یادآوری و تشریح حقایق و مفاهیم).

د-ترکیب(آفرینندگی)
ترکیب یعنی توانایی پیوند دادن اجزاء به منظور تهیه یک صورت و یا هیئت کلی، ابداع و ساختن یک طرح نوین با استفاده از دانسته‌های پیشین و خلق یک اثر علمی، ادبی، فنی، هنری و یا اجتماعی تازه. ترکیب، پهلوی هم گذاشتن عناصر و اجزاء برای ایجاد یک کل است. در سطح ترکیب، داوطلب ملزم به استفاده از جزئیات و دست‌یابی به موضوع است. افعالی که در این سطح به کار می¬روند عبارتند از: طراحی کنید، بسازید، گسترش دهید، فرموله کنید، تصور کنید، تولید کنید، تغییر دهید و بنویسید.
مثال: راکتوری برای تولید آزمایشگاهی نانوذرات فلزی طراحی کنید. برای این کار به چه وسایلی نیاز دارید؟

ه- ارزشیابی(سنجش)
ارزشیابی عبارت است از داوری آگاهانه درباره ارزش کارها، اندیشه ها، راه حل‌ها، روش‌ها و غیره برای منظوری معین و بر اساس ملاکی مشخص. ارزشیابی پیچیده‌ترین سطح توانایی عقلی است. کسانی که به این محله از مهارت عقلی می‌رسند توانایی‌های مربوط به تمامی سطوح پیشین را در حیطه شناختی کسب کرده‌اند. در سطح ارزشیابی، داوطلب ملزم به داوری در مورد ارزش مطالب بر پایه اصول معین شده است. افعالی که در این سطح به کار می¬روند عبارتند از: تخمین بزنید، ارزیابی کنید، قضاوت کنید و تعیین کنید کدام بهتر است. داوري درباره‌ی ارزش مطالب و موضوعات براي مقاصد معین. این طبقه از دو خرده طبقه زیر تشکیل شده :
1.    داوري بر اساس شواهد درونی: توانایی کاربرد ملاک‌های داده شده براي قضاوت درباره یک اثر.
2.    توانایی نشان دادن اشتباهات منطقی یک بحث.
مثال: عوامل تأثیر گذار بر پهنای پیک پراش¬سنجی اشعه ایکس را مورد ارزیابی قرار دهید.

سؤالاتی که در دو سطح سختی ترکیب و ارزشیابی نوشته می¬شوند بیش¬ترین مقدار تلاش داوطلب را می¬طلبد. این نوع سؤالات همچنین وقتگیرترین سؤالات برای پاسخ¬دهی هستند.
سطح یادگیری داوطلبان در هر یک از طبقات شش‌گانه حیطه شناختی و نیز در حیطه عاطفی و روانی-حرکتی را می‌توان بر حسب مورد از طریق امتحانات کتبی، شفاهی، عملی و مشاهده مستقیم رفتار مورد ارزشیابی قرار داد. سؤالات باید بر اساس سطوح یادگیری شناختی، عاطفی و روانی – حرکتی طراحی شود به خصوص در بخش حیطه‌ی شناختی، به طبقات دانش، درک و فهم، کاربرد، تجزیه و تحلیل، ترکیب و ارزشیابی توجه شود؛ به گونه‌ای که تعداد سؤالات در هر یک از سطوح متناسب با اهداف رفتاری و بودجه بندی آزمون باشد.

4-شاخص‌های آزمون[2]
خصوصیت تمام اندازه‌گیری‌ها این است که خطا در آنها وجود دارد. برای اینکه مقدار خطای آزمون‌ها کم شود چند ویژگی زیر را باید دارا باشند:

4-1-پايايي ((Reliability
پايايي به معناي تكرار پذيري نتايج است. اين مفهوم در آزمون بدين معناست كه اگر آزمون با همان شركت كنندگان و شرايط تكرار شود افرادي كه در آزمون اول نمرات بالاتري گرفته‌اند در تكرار آزمون نيز نمرات بالاتري را به خود اختصاص داده باشند و در مجموع نمرات افراد تا حدود زيادي ثابت بماند. به عبارت ديگر براي آنكه آزمون پايا باشد نمرات شركت‌كنندگان در دو بار اجراي آزمون بايد با يكديگر همبستگي مثبت داشته باشند. طبيعي است هر چه اين همبستگي قوي‌تر باشد آزمون پايايي بيشتري دارد .از انجا كه آزمون‌هاي مختلف براي مقاصد مختلف تهيه می‌شوند اعتبارهاي مختلفي وجود دارد و بسته به اين كه آزمون براي چه هدفي درست شده است اعتبار آن را با توجه به آن هدف معين مي‌كنند.

4-1-1-عوامل مؤثر بر پايايي آزمون
1.    تعداد سؤالات: هرچه تعداد سؤالات بيشتر باشد پايايي بالاتر خواهد بود.
2.     كيفيت سؤالات: در تعداد سؤالات برابر، آزموني كه كيفيت سؤالات آن بهتر باشد پايايي بيشتري خواهد داشت.
3.    نوع متغير مورد اندازه گيري: پايايي آزمون‌هايي كه متغير ساده‌اي مثل حفظ بودن جدول ضرب را می‌سنجد بيشتر از پايايي آزمون‌هايي است كه متغيرهاي پيچيده‌اي را مي‌سنجد.
4.    تفاوت سطح علمي داوطلبان.
5.    شرايط اجراي آزمون.

4-2-روايي یا اعتبار (Validity)
آزمونی اعتبار دارد که هدف آموزش را بسنجد. چیزی را که می‌خواهیم بسنجیم را بسنجد. مثلاً وقتی قرار است سواد دانشجو را بسنجیم ابتکار او را نسنجد. روايي در آزمون به اين معني است كه آزمون بتواند همان خصوصيتي را بسنجد كه به منظور سنجش آن طراحي شده است. بعنوان مثال اگر قرار باشد در آزمون مهارت‌ها و دانش فرد در حيطة خاصی سنجيده شود، در صورتي آزمون Valid خواهد بود كه واقعاً فردي كه در عمل دانش و مهارت بيشتري دارد در امتحان موفق‌تر از ديگراني باشد كه در كل يا در بعضي از زمينه‌هاي حيطه مورد سنجش از مهارت و دانش كافي برخوردار نيستند. با اين تعريف مشخص مي‌شود كه اگر هدف آزمون سنجش قابليت‌هاي عملی فرد باشد طرح سؤالات تئوريك و غير كاربردي از روايي آزمون مي‌كاهد و يا اگر آزمون به گونه‌اي باشد كه فرد با قابليت‌هاي ديگري غير از دانش مثل هوش يا منطق تست زدن موفق به پاسخ‌دهي به سؤالات شود آن آزمون از روايي كافي برخوردار نیست. همچنين آزمون بايد حتي المقدور همه مباحثي كه بايد مورد سؤال قرار گيرد را پوشش دهد و از مباحثي كه در حيطه اهداف آزمون نيست پرهيز كند.

4-3-عینی باشد
آزمونی از عینیت برخودار است که اگر دو مصحح آنرا تصحیح نمایند، یک نتیجه بدست آید.

4-4-عملی باشد
آزمونی که برگزار می‌شود باید در مدت زمان مناسبی اجرا شده و نمره گذاری آن نیز به آسانی صورت گیرد و تفسیر نتایج آن هیچ ابهامی نداشته باشد.

4-5-برای داوطلب قابل پیش بینی باشد
هدف آموزش و ارزیابی باید یکسان باشد. چنانچه اهداف آموزش در ابتدای دوره به درستی تعیین شده و داوطلبان از آن مطلع باشند، در این صورت داوطلبان می‌توانند سئوالات امتحانی را پیش بینی کنند. اگر بعد از اجرای آزمون داوطلبان بگویند (ما انتظار چنین سئوالاتی را نداشتیم) شیوه ارزشیابی سئوال برانگیز است.

4-6-عادلانه باشد
منصفانه باشد و فراگیر را گمراه نکند.

5- سطح ارزشیابی سؤال (آسان، متوسط، دشوار)
1.    سؤالی دشوار محسوب می‌گردد که تا 25 درصد داوطلبان بتوانند به آن پاسخ دهند.
2.    اگر 26 تا 50 درصد داوطلبان بتوانند به آن پاسخ دهند، متوسط محسوب می‌شود.
3.    اگر از 51 تا 75 درصد داوطلبان بتوانند به سؤالی پاسخ صحیح دهند، متوسط پایین محسوب می‌گردد.
4.    هرگاه بیش از 75 درصد داوطلبان بتوانند به آن پاسخ صحیح دهند، سؤال آسان است.

6-دسته بندی انواع آزمون‌ها
6-1-آزمون‌های شفاهی
در این آزمون ابتدا پرسش کننده، پرسش‌ها را به صورت شفاهی مطرح می‌کند و سپس پاسخ‌های ارزشیابی شونده را یادداشت می‌کند. پرسش و پاسخ هر دو به صورت شفاهی مطرح می‌شوند.

6-2-آزمون‌های کتبی
تهیه این دسته آزمون‌ها که از متداول‌ترین آزمون‌های پیشرفت تحصیلی محسوب می‌شود با آنکه به نظر ساده می‌آید مستلزم دقت، تجربه و رعایت نکات چندی است که در مورد آنها توضیح داده خواهد شد.

6-2-1-آزمون‌های گسترده پاسخ
این آزمون برای ارزشیابی برخی ازانواع تغییرات رفتاری ارزش زیادی دارد. ارزشیابی شونده در پاسخ دادن به سئوال‌ها، محدودیت چندانی ندارد و آزاد است تا هر طور مایل است پاسخ خود را بپروراند.

6-2-2-آزمون‌های محدود پاسخ
آزمون‌های محدود پاسخ در واقع حد واسط بین آزمون‌های گسترده پاسخ و آزمون‌های گزیده پاسخ هستند و همانطور که از عنوان آن برمی‌آید پاسخی بسیار کوتاه و مختصر، در حد یک جمله دارد. به عبارت دیگر، می‌توان یک سئوال گسترده پاسخ را به چند سئوال محدود پاسخ تجزیه کرد. اما باید در نظر داشت که هر یک از این آزمون‌ها برای منظور و مقاصد ویژه‌ای به کار می‌روند. آزمون‌های محدود پاسخ معمولاً برای ارزشیابی و دستیابی به اهداف پایین‌تر سطح شناختی مناسب‌ترند و ارزشیابی توانایی‌های بالاتر شناختی به وسیله این گونه سئوال‌ها دشوار است. آزمون‌های محدود پاسخ بصورت یک جمله استفهامی هستند و داوطلب باید پاسخ کوتاهی به آن بدهد. این نوع سئوال را می‌توان بصورت سئوالات کامل کردنی نیز مطرح نمود.

6-2-3-آزمون‌های گزیده پاسخ(عینی)
در سئوال‌های گزیده پاسخ، ارزشیابی شونده باید جواب سئوال را از بین گزینه‌هایی که در اختیار او گذاشته شده انتخاب نماید. این نوع آزمون‌ها به علت اینکه در تصحیح پاسخ‌ها، نظر شخصی تصحیح کننده دخالتی ندارد و این کار به صورت عینی (غیر ذهنی) انجام می‌شود به آزمون‌های عینی شناخته می‌شوند. سئوال‌های عینی به ویژه چند گزینه‌ای را می‌توان برای ارزشیابی بسیاری از اهداف آموزشی به کار برد و به شرط رعایت اصول و قواعد تهیه آن، نتایج قابل اعتمادتری را انتظار داشت. (سئوال‌هایی که بیش از دو گزینه در اختیار فراگیران می‌گذارند سئوال‌های چند گزینه‌ای نامیده می‌شوند). یک سئوال گزیده پاسخ، از یک پرسش و تعداد معدودی گزینه تشکیل می‌شود. بر حسب اینکه گزینه‌ها چه تعدادی باشند، شکل‌های متفاوتی از قبیل: صحیح/غلط (دو گزینه‌ای) یا چهار گزینه‌ای به خود می‌گیرد.

7-آزمون‌های چند گزینه‌ای-Multiple Choice Question  MCQ))
آزمون چند گزینه‌ای متداولترین آزمون عینی است که هم در سنجش توانایی‌های مختلف و هم در سنجش یادگیری در زمینه‌های گوناگون تحصیلی مورد استفاده واقع می‌شود. آزمون چند گزینه‌ای هم از لحاظ یکنواختی سئوال‌ها، هم از لحاظ حساسیت کم در مقابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامه‌ها بهترین نوع آزمون‌های عینی است. اين آزمون از حيث روايي، پايايي، عينيت و عملي بودن يكي از بهترين انواع آزمون‌ها مي‌باشد. طراحي سئوالات چند گزينه‌اي شايد به نظر آسان بيايد ولي طراحي آزمون استاندارد كاري بسيار دشوار است.

7-1-تعریف آزمون چند گزینه‌ای
آزمون چند گزینه‌ای شامل تعدادی سئوال است که هر یک از آنها از یک قسمت اصلی و تعدادی گزینه (پاسخ) تشکیل می‌شود و داوطلب گزینه صحیح (پاسخ سئوال) را از میان گزینه‌های پیشنهادی که در اختيار او قرار داده شده انتخاب می‌کند [3]. هر سئوال چند گزينه‌اي شامل يك تنه (Stem) و چند گزينه (Choice or branch) است. تعداد گزینه‌های سئوال‌های چند گزینه‌ای (گزینه درست و گزینه انحرافی) از 2 تا 5 متغیر است[4]. در گزينه‌ها يك گزينه كليد و بقيه گزينه‌ها انحرافي (Distractor) مي‌باشند. علت بحث بر سر تعداد گزينه‌ها اين است كه طراحي گزينه‌هاي انحرافي خوب و استاندارد كاري واقعاً دشوار است. و شايد نتوان بيش از دو يا حداكثر چهار گزينه انحرافي خوب طراحي نمود[4]. از لحاظ نظری هرچه تعداد گزینه‌ها بیشتر باشد امکان حدس زدن کمتر است اما به سبب اینکه پیدا کردن بیش از سه پاسخ انحرافی کار دشواری است آزمونهای چهارگزینه‌ای که در آنها امکان حدس زدن جواب درست یک در چهار است شهرت بیشتری کسب کرده‌اند.

7-2-قسمت‌های مختلف سئوال چند گزینه‌ای
هر سئوال چند گزینه‌ای شامل قسمت‌های اصلی زیر است:

1.    قسمت اصلی یا تنه سئوال(Stem)
این بخش سئوال متن اصلی سئوال را تشکیل می‌دهد و در برگیرنده مسئله یا موضوعی است که سئوال باید آن را اندازه‌گیری کند.

2.    گزینه درست یا پاسخ سئوال(Key)
یکی از گزینه‌های پیشنهادی پاسخ درست سئوال است که آزمون شونده باید آن را برگزیند. به این گزینه، گزینه کلید گفته می‌شود.

3.    گزینه‌های انحرافی(Distracters)
به غیر از گزینه درست سئوال، تعدادی گزینه دیگر نیز برای هر سئوال تهیه می‌شود که به آن گزینه‌های انحرافی می‌گویند. نقش گزینه‌های انحرافی منحرف کردن آزمون شوندگانی است که پاسخ درست سئوال را نمی‌دانند.

متن اصلی یا تنه سئوال را یک جمله استفهامی یا یک جمله ناتمام تشکیل می‌دهد و گزینه پیشنهادی جواب جمله استفهامی یا تکمیل کننده جمله ناقص هستند. متخصصان آزمون‌سازی پیشنهاد می‌كنند که آزمون ساز تازه کار بهتر است کوشش کند تا متن سئوال‌های خود را در قالب جمله‌های استفهامی طرح کند زیرا به این شکل هدف سئوال به طور آشکارتری بیان می‌شود اما چنانچه طرح سئوال در قالب جمله استفهامی خیلی طولانی‌تر از طرح آن به صورت عبارت ناتمام باشد بهتر است از همان شکل جمله ناتمام استفاده کرد اما باید سعی نمود که تمام گزینه‌های پیشنهادی تکمیل کننده جمله ناتمام باشند.

7-3-انواع سئوال‌های چند گزينه‌اي
سئوالات چند گزينه‌اي شامل انواعي است كه بصورت خلاصه عبارتند از:
1.    نوع تنها گزینه درست(The only correct answer)
این سئوال ساده ترین نوع سئوال‌های چند گزینه‌ای است در این نوع سئوال تنها یکی از گزینه‌ها درست است و بقیه گزینه‌ها کاملاً غلط هستند.
2.    نوع بهترین گزینه(one best answer)
در این نوع سئوال همه گزینه‌ها درست هستند اما یکی از آنها از همه درست‌تر یا بهتر است. طراحی این نوع سوال بسیار دشوار است.
3.    نوع منفی
در این نوع سئوال تنه سئوال به صورت منفی بیان می‌شود و همه گزینه‌ها بجز یکی از آنها درست هستند.
4.    نوع کلاسیک
گزینه‌های کلاسیک شامل:
الف- گزینه درست(Key Answer)
ب- گزینه موجه نما(Foil)
ج- گزینه انحرافی(Distractor)
د- گزینه گمراه ساز(Mislead)

مثال : عکس عمل تقسیم کدام است ؟
الف- ضرب (درست)
ب- جمع (موجه نما)
ج- تفریق (انحرافی)
د- جذر (گمراه ساز به علت خطوط علایم)

یکی از مشکلات تهیه سئوال‌های چند گزینه‌ای این است که بعضی اوقات تهیه تعدادی گزینه انحرافی غلط که به ظاهر درست جلو کنند بسیار دشوار است. در این گونه مواقع، چنانچه تهیه گزینه‌های درست آسان‌تر باشد می‌توان از نوع سئوال‌های منفی که در آن همه گزینه‌ها بجز یکی از آنها درست است استفاده کرد.

8-قواعد تهیه سوال‌های چند گزینه‌ای (شاخص‌هاي Millman)
جهت تضمين روايي ساختار سؤالات چند گزينه‌ای، اصول ميلمن در مورد ساختار ساقه  (Stem)و گزينه‌ها(Options)  تدوين شده، كه رعايت آنها در انواع آزمون‌هاي چهارگزینه‌ای مورد توافق كليه صاحبنظران مي‌باشد:
1.    هر سوال بايد داراي يك هدف آموزشی مشخص و واضح باشد. هدف سئوال كه در واقع مهمترين و اصلي‌ترين قسمت طراحي هر نوع آزمون و از جمله اين گونه سئوالات است، اندازه‌گيري يكي از بازده‌هاي يادگيري در مورد موضوع مطرح شده و در ارتباط مستقيم با رشته تخصصي مي‌باشد. در حقيقت سئوال بدون هدف مدون ارزش آموزشي چنداني ندارد[8-5].
2.    هر سوال بايد يك موضوع مهم یا یک هدف آموزشی را اندازه بگیرد.
3.    بیشتر از یک مسئله یا یک موضوع در هر سوال قرار ندهید. اگر بيش از يك موضوع در سئوال مطرح شود نه تنها سئوال را پيچيده مي‌كند بلكه اگر داوطلب در پاسخگويي به سئوال موفق نباشد معلوم نيست كه كداميك از مطالب را ندانسته و علت عدم موفقيت او چه بوده است.
4.    پايه و گزينه‌هاي سئوالات را کاملا روشن و واضح بنویسید و از عبارات و کلمات قابل فهم داوطلبان استفاده کنید. از کاربرد عبارات و كلمات مبهم و دشوار خودداري شود.
5.    پاسخ (گزينه‌ها) مختصر و كوتاه باشد و از تكرار مطالب خودداري گردد.
6.    مطالب اصلی سوال را بطور کامل در تنه سوال بنویسید.
7.    تنه سئوال حتی الامکان باید کوتاه نوشته شود و از آوردن اطلاعات اضافی اجتناب شود.
8.    از به کار بردن اشاره‌های دستوری نامربوط و غیره در تنه سوال خودداری کنید. اشاراتی از قبیل زمان افعال، مفرد و جمع بودن آنها را در سوال‌ها نباید بکار برد، آنگونه که داوطلب با توجه به این اشارات گزینه درست را انتخاب کند. تنه سئوال نباید به گزینه درست شباهت داشته باشد و تداعی ایجاد کند. اگر بین تنه سئوال وگزینه انحرافی شباهت ظاهری وجود داشته باشد، اشکالی ندارد. مثلاً اگر تنه سئوال طوری نوشته شود که پاسخ الزاماً جمع باشد و در میان پاسخ‌های پیشنهادی نیز تنها یک پاسخ جمع و سه پاسخ مفرد باشد، بدیهی است که تنه سئوال پاسخ را نشان خواهد داد.
9.    تنه سئوال بايد به تنهايي با معنا بوده و مستقيما در رابطه با هدف سئوال باشد. بدين معني كه اگر آزمون شونده با كاغذي روي گزينه‌ها را بپوشاند قادر به پاسخگويي سئوال باشد.
10.    همه گزینه‌های یک سئوال باید متجانس و به موضوع واحدی مربوط باشد.
11.    سوال را طوری بنویسید که پاسخ درست تنها پاسخ درست و یا قطعاً درست‌ترین پاسخ باشد.
12.    برای اندازه گیری فرایندهای پیچیده ذهنی از موقعیت‌ها و مطالب تازه و بدیع استفاده کنید.
13.    گزينه‌هاي انحرافي (ساير گزينه‌ها) طوري نوشته شود كه توجه داوطلبان بي اطلاع از موضوع را به خود جلب كند و يا شامل اشتباهات معمول و متداول باشند.
14.    گزینه‌های هر سوال را طوری بنویسید که از نظر دستوری و جمله بندی به نحو درست مکمل متن سوال باشند.
15.    در سوالات منفی کلمات منفی را برجسته جلوه دهید یا زیر آن خط بکشید تا به داوطلب کمک کند متوجه منفی بودن سوال باشد. پیشنهاد می‌شود تنه سئوالات به صورت مثبت نوشته شود.
16.    از نوشتن سوال‌هایی که متن آنها منفی و گزینه‌ها هم منفی هستند، یعنی منفی مضاعف، احتراز کنید زیرا خواندن آنها داوطلب را گیج می‌کند.
17.    تا حد امكان از كاربرد عبارت‌هايي مانند “همه آنچه در بالا گفته شد”، ” تمامي موارد فوق”، “هيچكدام از موارد بالا”، “هیچکدام از این‌ها”، ” هر سه مورد”، “الف وب” و مشابه آنها در گزینه‌ها خودداري شود.
18.    از بکار بردن اشارات نامناسب دستوری مانند “هرگز”، “همیشه”، “به ندرت”، “اغلب”، “معمولاً”،  “فقط” و… در گزینه‌ها (که تا حدود زیادی اشاره به نادرست بودن آنها دارند) تا حد امکان خودداری کنید.
19.    سوال‌ها را مستقل از یکدیگر بنویسید. پاسخ یک سئوال نباید شرط لازم برای پاسخ دادن به سئوال دیگر باشد.
20.    از طرح سوال‌های گمراه کننده بپرهیزید زیرا اغلب داوطلبان مطلع‌تر که اطلاعات وسیع‌تری دارند به وسیله این گونه سوال‌ها گمراه می‌شوند.
21.    طول گزینه درست را در سوال‌های مختلف تغییر دهید. گزینه‌های طویل می‌توانند موجب فریب یا ترغیب داوطلب به انتخاب این نوع گزینه گردد.
22.    محل گزینه درست را در در میان گزینه‌های انحرافی به طور تصادفی انتخاب کنید.
23.    در سوال‌هایی که تنه آنها جمله ناتمام است، جای خالی را در قسمت آخر جمله قرار دهید.
24.    دو گزينه كاملا متضاد كه يكي از آنها گزينه صحيح است در يك سئوال بكار برده نشود.
25.    از بکار بردن شاخص‌هایی که پاسخ صحیح را آشکار می‌سازند اجتناب شود. (شاخص‌هایی که پاسخ صحیح را آشکار می‌سازند زیادند اما رایج‌ترین آنها عبارتند از:
الف)بلندتر بودن طول پاسخ صحیح نسبت به پاسخ‌های غلط.
ب)آشنایی بیشتر فراگیران با پاسخ صحیح نسبت به پاسخ غلط.
ج) قرار گرفتن پاسخ صحیح در یک موقعیت معین، در چند سوال متوالی.

بزرگترين خطر براي روايي بودن آزمون‌هاي چند گزينه‌اي، انتخاب گزينه بصورت شانسي توسط داوطلب باهوش ولي كم سواد است[9]. براي مقابله با اين آفت، اولين و بهترين ترفند استفاده از قواعد Writing Item Errors يا سياهه ميلمن است كه باعث مي‌شود كه سرنخ ناخواسته به دست داوطلب باهوش ندهيم. بيشترين نقايص در طراحي سئوالات چند گزينه‌اي در این موضوع نهفته است[13-10].

9-فهرست وارسي Millman براي بررسي كيفي سؤالات
1. هر سؤال به يك مسئله اصلي بر اساس بودجه آزمون پرداخته است؟
2. هر سؤال واضح و تا حد امكان كوتاه است؟
3. تنه سؤال منفي نيست و چنانچه ناگريز به صورت منفي آمده است نشانة منفي به شيوه‌اي برجسته شده است؟
5. با پوشاندن گزينه‌ها، تنه سؤال را به تنهايي مي‌توان فهميد يا كامل كرد؟
6. چنانچه بيش از يك جواب صحيح داشته باشد از تركيباتي چون، بهترين استفاده شده است؟
7. جاي خالي نه در آغاز بلكه در بخش‌هاي پاياني تنه سؤال آمده است؟
8. هر گزينه يك نكته را مورد سؤال قرار مي‌دهد؟
9. در تنه سؤال و گزينه‌ها از نظر دستور زبان مسئله‌اي وجود ندارد و تلفيق هر گزينه و تنه سؤال صورت زباني پذيرفته‌اي را ارئه مي‌كند؟
10. از تكراركليات در پاية سؤال خودداري شده است؟
11.گزينه‌هاي انحرافي براي آزمودني‌هاي كم اطلاع جالب است؟
12. از نظر طول و پيچيدگي و نكات كاربردي گزينه‌ها تناسب دارند و كلمات مشترك در كليه گزينه‌ها به تنه سؤال انتقال يافته است؟
13. تنه سؤال و گزينه‌ها از نظر محتواي موضوعي و صورت تناسب دارند؟
14. تعدادگزينه‌ها در هر يك از سؤالات يكسان (2، 3، 4، 5 یا 6) است؟
15. از به كار بردن عين واژة كتاب درسي خودداري شده است؟
16. در هرگزينه به مفهومي متفاوت با گزينه‌هاي ديگر اشاره شده است؟
17. از به كار بردن قيدهاي مطلق ( هميشه، هرگز، فقط ….) خودداري شده است؟
18. اصطلاح يا مفهومي كه بايد تعريف شود در تنه سوال آمده و گزينه‌ها مشخصه‌هاي آن را كامل مي‌كنند؟
19. توزيع پاسخ‌هاي صحيح بين گزينه‌هاي مختلف از هيچ الگوي خاصي پيروي نمي‌كند و صرفاً تصادفي است؟
20. براي هر بخش آزمون دستور كار روشن است؟
21. در هر بخش آزمون، آرايش كليه گزينه‌ها در يك راستا (عمودي / افقي با فاصله مناسب) است؟
22. هر سؤال مستقل از بقيه است؟
23. از كاربرد همه /هيچ يك از موارد بالا يا هم الف هم ب و مانند آن خودداري شده است؟
24. تنه سؤال و گزينه‌هاي مربوطه در يك صفحه قرار گرفته است؟
25. گزينه‌هاي انحرافي متضاد پاسخ صحيح به آساني قابل حذف نيستند؟
26. واژه‌هاي مشابه يا راهنمايي كننده در تنه سؤال و در هيچ يك از گزينه‌هاي مشترك نيست؟
27. در تنه سؤال پاسخ صحيح سؤالي ديگر نيامده است؟

10- تاكسونومي یا رده بندی(Taxonomy): سطوح ارزشیابی داوطلب در حیطه شناختی(سطح دانش بكار رفته در سؤال)
سؤالات از نظر سطح شناختي بلوم (Cognition Bloom Levels) الزاماً بايد در تاكسونومي I، II و III طرح شده باشند. سه سطح از سطوح شش گانه بلوم قابليت كاربرد در سؤالات چند گزينه‌اي(MCQ) را دارند:

الف)تاكسونومي I (Recall): سؤالات مبتني بر حافظه و دانش سطحي. (دانش، یادآوری مطالب)
مثال: شايعترين تظاهر بيماري  X كدام است؟
ب)تاكسونومي(Comprehension) II: سؤالات مبتني بر فهم و درك مطالب. (قدرت ترکیب داده‌ها، درک مطلب، تفسیر مطلب، آنالیز مطلب، تشخیص)
مثال: وقتي در سؤال يك  Caseمطرح شده و تشخيص مورد پرسش قرار گيرد، تاكسونومي سؤال  IIخواهد بود.
ج)تاكسونوميIII (Application of Knowledge): سؤالات مبتني بر كاربرد دانش. (ارزشیابی، قضاوت، حل مسئله، قدرت و توان پیش بینی، قدرت تصمیم گیری در تنظیم برنامه‌ها، قدرت در ارائه راه حل‌های عملی)
مثال: وقتي در سؤال يك  Caseمطرح شده و درمان مورد پرسش قرار گيرد كه در اين صورت پاسخ دهنده بايد ابتدا محتمل‌ترين تشخيص را يافته و سپس درمان مناسب را پيدا كند، تاكسونومي سؤال  IIIخواهد بود.
به عنوان يك قاعده كلي نبايد سوالات مبتني بر حافظه (تاكسونوميI) بيش از  50 %سوالات امتحان را شامل شود.

11-جمع بندي
طراحي سوالات چند گزينه‌اي كاري سهل و در عين حال بسيار دشوار است[4و7و8و14-19]. شناخت انواع سوالات و قدرت احقاق اهداف آزمون منطبق با برنامه آموزشي (Curriculum) از مهمترين عناصر موفقيت در تهيه آزمون چند گزينه‌اي روا (Valid) مي‌باشد. بعد از طراحي سوال كار به پايان نرسيده و بايد وارسي‌هايي بر روي آن انجام پذيرد كه براي استاندارسازي اين نوع سوالات الزامي است. استفاده از فهرست وارسي ميلمن ما را در اين مهم ياري مي‌رساند.

12-پيشنهادات
1. امتحانات چند گزينه‌اي بعنوان رايج‌ترين و اصلي‌ترين آزمون تراكمي (Summative) و براساس معيار (Criterion – based) مورد استفاده قرار گرفته است؛ بنابراين از اهميت ويژه‌اي برخوردار است.
2. كليد طراحي يك سوال خوب در نظر گرفتن هدف ارزيابي است كه با آن سوال محقق مي‌شود. بدون داشتن هدف نميدانيم به كجا ميرويم. بنابراين به هدف سوال بسيار فكر كنيم و سپس آن را به نگارش درآوريم.
3. طراحي سوال خوب وقت فراواني مي‌خواهد تا تمام جنبه‌هاي آن مورد مداقه كافي قرار گيرد. سوالات را شتابزده طراحي نكنيم.
4. سوالات با تاكسونومي بالاتر، از اين نظر كه عمق بيشتري از اهداف آموزشي حيطه شناختي را مورد بررسي قرار مي دهد امتياز بيشتري دارند. پر واضح است كه سوالات با سطوح (تاكسونومي) بالاتر در بطن خود سطوح پايين‌تر شناختي را در بر مي‌گيرد.
5. استاندارد يا بهينه‌سازي آزمون چند گزينه‌اي نيازمند كار گروهي فعال مي‌باشد. هيأت ممتحنه نيز براي تحقق اين آرمان سازماندهي شده‌اند.
6. به نظرات همكاران خود و همچنين مشاوران طراحي سوالات ارج نهيم. هيچ عيبي براي يك آزمون بالاتر از اين نيست كه سوالات آن اشكالي آشكار در طراحي داشته و بعبارتي ديگر غير استاندارد باشد [10].
7. با الگو گرفتن از سؤالات موفق در آزمون‌هاي پيشين و استفاده از آنها به صورت قالب سؤال، طراحي مناسب‌تري خواهم داشت.
8. سعی بفرمایید سئوال‌ها به گونه‌ای طرح شوند که بتوانند علاوه بر سنجش محفوظات، قدرت درک و تجربه و تحلیل اطلاعات افراد را هم ارزیابی کنند.
9. سعی بفرمایید موضوع‌های مورد سئوال متنوع باشند و جنبه‌های مختلفی از اطلاعات داوطلبان را بسنجد.
10. عبارت سئوال و یا گزینه را واژه به واژه از روی متن منبع امتحانی ننویسید.
11. توجه داشته باشید که هیچیک از سئوالات، راهنمایی یا توضیحی برای سئوال دیگر فراهم نکند.
12. از ایجاد تداعی‌های ظاهری بپرهیزید.
13. حتی الاامکان از طرح مسائل اضافه‌ای که نقشی در کیفیت و سلامت سئوال ندارند بپرهیزید.

13-منابع و مراجع
1.کدیور، پروین، روانشانسی تربیتی، تهران، سازمان مطالعه و تدوین کتب علوم انسانی دانشگاه ها(سمت)، 1379.
2. ثرندایک، رابرت، الیزابت هیگن، مترجم: خسرو مهندسی، احمد آرام، فخری امین، زهره سرمدی، تهران، اندازه گیری و سنجش در روانشناسی و تعلیم و تربیت، اندیشه، فرانکلین، ۱۳۴۳.

3. McCoubrie P. Improving the fairness of multiple-choice questions: a literature review. Med Teach2004
Dec;26(8):709-12.
4. Vyas R, Supe A. Multiple choice questions: a literature review on the optimal number of options. Natl Med J India2008 May-Jun;21(3-130).
5. Schultheis NM. Writing cognitive educational objectives and multiple-choice test questions. Am J Health Syst Pharm1998 Nov 15 401-2397(22)55.
6. Collins J. Education techniques for lifelong learning: writing multiple-choice questions for continuing medical education activities and self-assessment modules. Radiographics2006 Mar-Apr;26(2):543-51.
7. Cox KR. How did you guess? Or, what do multiple-choice questions measure? Med J Aust1976 Jun 5;1(23):884-6.
8. Ferland JJ, Dorval J, Levasseur L. Measuring higher cognitive levels by multiple choice questions: a myth? Med Educ1987 Mar;21(2):109-13.
9. Koeslag JH, Melzer CW, Schach SR. Penalties in multiple-choice and true-false questions. S Afr Med J1983 Jan1;63(1):20-2.
10. Tarrant M Knierim A, Hayes SK, Ware J. The frequency of item writing flaws in multiple-choice questions used in high stakes nursing assessments. Nurse Educ Pract2006 Dec;6(6):354-63.
11. Tarrant M, Ware J. Impact of item-writing flaws in multiple-choice questions on student achievement in high-stakes nursing assessments. Med Educ2008 Feb;42(2):198-206.
12. Ware J, Vik T. Quality assurance of item writing: During the introduction of multiple choice questions in medicine for high stakes examinations. Med Teach2008 Sep 29:1-6.
13. Whitley TW. Some common flaws in multiple choice exam questions. Nurs Outlook1979 Jul;27(7):466-9.
14. Veloski JJ, Rabinowitz HK, Robeson MR. A solution to the cueing effects of multiple choice questions: the Un-Q format. Med Educ1993 Jul;27(4):371-5.
15. Buzzard AJ, Bandaranayake RC. Comparison of the performance of visual and verbal multiple-choice questions. Aust N Z J Surg1991 Aug;61(8):614-8.
16. Considine J, Botti M, Thomas S. Design, format, validity and reliability of multiple choice questions for use in nursing research and education. Collegian2005 Jan;12(1):19-24.
17. Melzer CW, Schach SR, Koeslag JH. Misconceptions and miscarriages in multiple choice questions. S Afr Med J1976 Apr 3;50(15):583-7.
18. Palmer EJ, Devitt PG. Assessment of higher order cognitive skills in undergraduate education: modified essay or multiple choice questions? Research paper. BMC Med Educ2007;7:49.
19. Schuwirth LW, van der Vleuten CP, Donkers HH. A closer look at cueing effects in multiple-choice questions. Med Educ1996 Jan;30(1):44-9.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *