نحو بناء اختبار للكفاءة اللغوية في اللغة العربية للناطقين بغيرها

نحو بناء اختبار للكفاءة اللغوية في اللغة العربية للناطقين بغيرها إعداد أ.د/محمد عبد الرؤف الشيخ أستاذ مناهج وطرق تعليم اللغة العربية للناطقين بغيرها رئيس قسم المناهج وعميد كلية التربية جامعة […]

نحو بناء اختبار للكفاءة اللغوية في اللغة العربية للناطقين بغيرها
إعداد
أ.د/محمد عبد الرؤف الشيخ
أستاذ مناهج وطرق تعليم اللغة العربية للناطقين بغيرها
رئيس قسم المناهج وعميد كلية التربية جامعة طنطا السابق
تعرض الورقة الحالية لكيفية بناء اختبارات الكفاءة اللغوية والخطوات التي يجب إتباعها عند بناء هذه الاختبارات .وقبل عرض تلك الخطوات تعرض الورقة لأنواع الاختبارات اللغوية  حتى يمكن التفريق بين تلك الأنواع وبيان موقع اختبارات الكفاءة منها.
ففي كل الأنظمة التعليمية تلعب الاختبارات دورا مهما وضروريا فالبعض منها تعبر عن الأهداف  التربوية من خلال الاختبارات ومن ثم نضع البرامج والمواد التعليمية , والبعض الآخر يركز على المواد التعليمية أو البرامج أولا ثم يكون هذا مدخلا لإيجاد نماذج تقويمية , وبين هذين النظامين نظام ثالث حيث توازي عملية بناء البرامج – الخطوط العامة للبرامج – مع بناء الاختبارات .
لعل السؤال الذي يطرح نفسه الآن هو :
•    كيف نتحقق من اكتساب المتعلمين لمهارات اللغة العربية ؟
والإجابة على هذا السؤال بالطبع هي تقويم أداء الطالب لتلك المهارات بأداة صادقة وثابتة وموضوعية وهي الاختبارات الموضوعية , وبالتالي فلابد من عرض اختبارات اللغة العربية وكيفية تقويم مهاراتها , ذلك لأن عملية الاختبار عملية صعبة وحساسة جدا وتحتاج إلى إعداد جيد , فضلا عن ذلك فإن التقويم عنصر مهم من عناصر المنهج لأنه يوقفنا على أوجه القصور والنقص , ومن ثم يتم إعداد البرامج وتطويرها في ضوء ما أسفرت عنه نتيجة التقويم , كما يوقفنا التقويم أيضا على مدى تحقق الأهداف التربوية التي نريد تحقيقها .
وهناك خمسة مستويات للمهارات اللغوية الأربع (الاستماع ,القراءة,الكتابة , التحدث ) هذه المستويات .
هي الأصوات , المفردات , السياق , القواعد , والتركيبات , وأخيرا معدل السرعة والطلاقة . ولذلك هناك مدخلان لاعداد الاختبارات هما :
1-    اختبارات المهارات المنفصلة .
2-اختبار المهارات المتكاملة .واختبارات الكفاءة يناسبها هذا المدخل.
وتتعدد أنواع الاختبارات اللغوية وذلك على النحو التالي:
‌أ –    اختبارات الاستعداد اللغوي : الاستعداد اللغوي هو مقدرة المتعلم أو قابليته لتعلم لغة ما أو اكتساب أنواع من المعلومات أو المهارات أو الكفايات اللغوية اللازمة لمهمة ما مرتبطة بالنمو اللغوي أو تعتمد على القدرة اللغوية.
‌ب –    اختبارات الاتجاهات والميول نحو تكلم اللغة العربية : الاتجاه اللغوي هو حالة من الاستعداد لدى الفرد تدفعه إلى تعلم اللغة وما يحيط بها من ظروف , مثل اتجاه المتعلم نحو معلم اللغة العربية , وحصته اللغة العربية وبرامج تعلم اللغة العربية وغيرها مما يرتبط باللغة العربية وأهميتها .
‌ج –    اختبارات الذكاء اللغوي : بظهور نظرية الذكاء المتعدد لجاروز والتي قسم فيها الذكاء إلى سبعة أنواع مثل الذكاء المكاني والذكاء الاجتماعي والذكاء الحركي  ومنها الذكاء اللغوي ،أصبح الذكاء اللغوي سمة مستقلة تختص باللغة , وهي قدرة الفرد مع استخدام اللغة استخداما خاصا يختلف عن غيره من الناس . فبعض الناس لديه القدرة على استخدام الألفاظ اللغوية بطريقة معينة تتسم بالوزن والقافية مكونا  منها شعرا مقفى . وبعضهم يستخدم نفس الألفاظ ولكن بطريقة أخرى فيها أحداث وزمان ومكان وعقدة وصل مكونا منها قصة نثرية , وهناك آخرون يستخدمون نفس الألفاظ ولكن بترتيب آخر على هيئة حوار وصراع.
‌د –    الاختبارات التحصيلية: وهي تقيس مدى ما حصله الطالب في برنامج تعليمي معين،فهي مرتبطة بمنهج وبرنامج محدد، وغالبا ما يحفظ الطلاب هذا البرنامج للنجاح في اختيار التحصيل وكثيرا ما يفشل في الآداء اللغوي في المواقف الحياتية.
‌ه –    اختبارات التقدم: وهي تقيس مدى تقدم الطالب في دراسة برنامج معين.
‌و –    اختبارات الكفاءة اللغوية: وهي أهم تلك الاختبارات ،وتقيس المهارات اللازمة للتمكن من الآداء اللغوي تحدث واستماعا وقراءة وكتابة وفق قواعد الصحة اللغوية والأساليب البلاغية،دون التقيد ببرنامج تعليمي محدد،مثل اختبارات “التويفل” واختبارات ال”IGSCE ” الانجليزية العالمية.
وسوف نقتصر في الورقة الحالية على هذا النوع من الاختبارات،ونوضح خطوات بنائها على النحو التالي:
خطوات بناء اختبارات الكفاءة اللغوية فب اللغة العربية للناطقين بغيرها:
أولا: تخطيط الاختيار
ثانيا: مفردات الاختيار والتعليمات  .
ثالثا: مراجعة مادة الاختبار .
رابعا:عرض الاختبار على المحكمين .
خامسا: إجراء الاختبار القبلي وتحليل نتائجه .
سادسا: تركيب الصورة النهائية للاختبار .
سابعا: إصدار الاختبار في صورته النهائية .
ثامنا: تطبيق الاختبار وتحليل النتائج .
اولا : تخطيط التيار:-
الاختبار الفعال يتطلب تخطيطا واعيا. والخطوات التالية تبين طريقة إعداد تخطيط الاختبار بالنسبة لاختبار الكفاءة العامة كما ذكرتها كتب بناء الاختبارات في اللغات الأجنبية
الخطوة الأولى  :  تحديد موضوعات البرنامج العام.
في إعداد اختبارات التحصيل ربما يؤسس واضع الاختبار أهداف الاختبار مباشرة على البرنامج , هذه الأهداف يكون قد وضعها المدرس أو القسم الذي يتبعه وفي بعض الأحوال الأخرى يكون الأهداف متصدق طرق ومواد البرنامج أما في الاختبارات الكفاءة العامة فان واضع الاختبار يؤسس أهداف الاختبار على الأهداف العامة .
الخطوة الثانية : تقسيم الاهداف العامة الي مكوناتها :-
فالأهداف التي حددناها في الخطوة الأولي واسعة جدا وتتسم بالعمومية , ولذلك فعلينا أن تقسمها إلي مكوناتها النوعية , ثم نحدد أي من تلك المكونات تقييمها في الاختبار النهائي (الاستماع , القراءة , الكلام , الكتابة) ومستويات تلك المهارات وهي الأصوات , والمفردات , والسياق , والقواعد , ومعدل السرعة والطلاقة , ونركز القول هنا على اختبارات المدخل التكاملي لبناء الاختبارات , حيث أن مستوى معدل السرعة والطلاقة هو أعلى مستويات الأداء وبالتالي فهو يتضمن المستويات الأخرى وهى الأصوات والمفردات والسياق والقواعد .
الخطوة الثالثة : عمل التصميم العام للاختبار :
في الخطوتين السابقتين وضعنا الأهداف العامة والمهارات بمكوناتها الفرعية بتفصيلات كافية ويمكننا ذلك من أن نقرر التصميم العام الاختبار النهائي وفي هذه الخطوة هناك عاملان في غاية الأهمية يجب وضعهما في الاعتبار وهما :
أ‌)    الوقت المعد للاختبار .
ب‌)    درجة السرعة التي نود وضعها في الاختبار .
ولنفترض ساعتين كحد أقصى كموعد للاختبار النهائي , ففي الـ 20 دقيقة يجب أن تحتفظ بعشر دقائق على الأقل الإجراء التطبيق وتنظيم التلاميذ في صفوف وتوزيع مواد الاختبار التعليمات العامة , وجمع الاختبار بعد التطبيق , وبذلك نكون قد تركنا 110 دقيقة للاختبار الحقيقي فسرعة الأداء جانب مهم وأكيد في الاختبارات الكفاءة اللغوية .
ويمكن أن يخصص أربعة أجزاء للاختبار , جزء لاختبار الاستماع , وجزء لاختبار التركيبات النحوية , وجزء للمفردات والقراءة , وجزء لاختبار التحدث , ثم يلي ذلك تحديد نوع وعدد المفردات الخاصة بكل الاختبار مع الأخذ في الاعتبار الزمن المخصص للاختبار ككل ومن ثم يتكون الاختبار من أربعة أقسام هي :
    القسم الأول : لاختبار الاستماع .
    القسم الثاني : لاختبار الكفاية والتركيب النحوية .
    القسم الثالث : لاختبار القراءة والمفردات .
    القسم الرابع : لاختبار التحدث .
والشكل التالي يوضح التخطيط العام لبناء الاختبار .
شكل رقم (5) التخطيط العام لبناء الاختبار
القسم     نوع المفردات     عدد المفردات    الوقت المسموح به
1- الاستماع     اختبار من متعد
2- الكتابة والتركيبات النحوية     اختبار من متعد
3- القراءة والمفردات     اختبار من متعد
4- التحدث
أما بالنسبة للمكونات التي يقيسها الاختبار , فالشكل التالي يوضح تلك المكونات .
شكل (6) يوضح المكونات التي يقيسها اختبار الكفاءة
المكونات     الاستماع    الحديث    القراءة    الكتابة
الأصوات    –    –    –    –
المفردات    –    –    –    –
السياق    –    –    –    –
القواعد    –    –    –    –
معدل السرعة والطلاقة     –    –    –    –
والخطوة التالية من تصميم الاختبار هي اختبار المشكلات التي تقوم عليها مفردات الاختبار , وكما ذكرنا من قبل فان محتوي اختبار التحصيل يجب أن يعكس بشكل مباشر محتوي البرنامج , أما اختبار الكفاءة العامة فيجب أن يعكس بشكل مباشر الأهداف العامة من تعليم اللغة المستهدفة , ومن ثم فان الإجراء التالي هو إعداد قائمة بنقاط الاستماع والتركيبات النحوية والكتابية , والمفردات المعجمية التي عولجت في كتب تعليم اللغة العربية كلغة أجنبية وعمل ملاحظات حول المفردات التي تكرر كثيرا وذلك من خلال قوائم المفردات , وتختار المفردات في ضوء المعايير التالية .
1)    المواقف العامة التي تواجه الأجنبي عند استعماله اللغة العربية للاتصال بأبنائها .
2)    القواعد الأساسية اللازمة للأجنبي لكي يتمكن من الاتصال بكفاءة بمتحدثي اللغة العربية .
3)    المفردات التي تمثل اكبر نفعا بالنسبة للمتعلمين والتي تتكرر كثيرا في أحاديثهم وكتاباتهم وقراءاتهم والتي نصت عليها قوائم المفردات .
ثانيا : إعداد مفردات الاختبار والتعليمات :
لإعداد مفردات الاختبار يمكن الاستعانة بمصادر كثيرة لاختبار تلك المفردات في ضوء أهداف تعليم اللغة العربية كلغة أجنبية وهذه المصادر هي :
1) كتب تعليم اللغة العربية كلغة أجنبية ومنها على سبيل المثال :
أ- العربية للناشئين ’ منهج متكامل لغير الناطقين بالعربية (كتاب التلميذ) الجزء حتى الخامس , المملكة العربية السعودية , وزارة المعارف , ط1 , 1403هـ – 1983م .
ب- العربية للناشئين , منهج متكامل لغير الناطقين بالعربية (كتاب المعلم) المملكة العربية السعودية .
ج- الكتاب الأساسي لتعليم العربية لغير الناطقين بها , الجزء الرابع , معهد اللغة العربية , وحدة البحوث والمناهج , جامعة أم القرى . مكة المكرمة , 1406هـ – 1986م .
د- الكتاب الأساسي لتعليم اللغة العربية . تونس , المنطقة العربية للتربية والثقافة والعلوم .
2) قوائم المفردات مثل قائمة :
جامعة أم القرى , معهد اللغة العربية , وحدة البحوث والمناهج , قائمة المفردات الشائعة .
3) المجلات والصحف العربية مثل :
صحيفة الأهرام , الأخبار القاهرية , ومجلة تخر ساعة وروز اليوسف ونصف الدنيا وغيرها .

4) الإذاعات والتليفزيون العربية مثل :
مقتطفات من النشرات الإخبارية , والمسلسلات والمباريات الرياضية وغيرها .
وبعد اختبار المفردات من المصادر السابقة يراعى أن تكون المفردات أكثر من المطلوب للصورة النهائية وذلك لان المراجعة النهائية لتلك المفردات ربما تكشف عن عيوب في بعض المفردات والتي لم يظهر في وقت الكتابة , كما أن بعض المفردات يمكن أن تحذف بعد الاختبار القبلي وذلك لعدم حصولها على النسبة الإحصائية المطلوبة والتي ذكرتها كتب الإحصاء , وحيث انه ليس من الممكن التنبؤ بدقة بعدد المفردات التي ستحذف والتي سنحل محل المفردات بعد الاختبار القبلي , فيقترح في مثل هذه الحالات أن نبدأ بوضع ما لا يقل من 30 : 40 % من للمفردات أكثر مما تتطلبه الصورة النهائية للاختبار .
–    مثال ذلك : إذا كانت الصورة النهائية للاختبار تحتوى على 100 مفردة , فانه من المفيد اختبار 130 – 140 مفردة حتى إذا حذفت مفردات أصبح لدبنا مفردات كافية لبناء ما تم عملة لكل اختبار على حدة .وفيما يلي عرض لكل مهارة من مهارات اللغة العربية وكيفية بناء اختبار لقياس كفاءة الطالب فيها , وسنقتصر هنا على نوع اختبارات من متعدد نظرا لشيوعها وصعوبة إعدادها .
أ) اختبار الاستماع :
يتم ترتيب مفردات الاختبار التي تم جمعها من المصادر السابقة لبناء اختبار السماع بحيث تمثل ثلاثة أجزاء على النحو التالي :
•    الجزء الأول :
ويتكون من مجموعة أسئلة عبارة عن جمل قصيرة هذه الجمل قد تكون جملا خيرية أو جملا استفهامية يتلوها سؤال حول تلك الجملة . وكل من الجملة والسؤال مسجلة على الشريط , أما البدائل الأربعة فمكتوبة في كراسة الأسئلة . وهذا الجزء يقيس فهم المتعلم للجمل القصيرة وهذه الجمل تقيس أيضا فهم المتعلم لكل من السؤال عن الزمن , فهم العبارة , العدد والأسماء المضافة , الوقت , والمقارنة , الأرقام , والحالة التي يكون عليها المتحدث .
يستمع المتعلمون إلى السؤال ثم تترك فترة زمنية كافية لقراءة البدائل من جانب المن\تعلمين تسمى وقفة , ويتم حساب هذه الوقفات عن طريق تطبيق الاختبار في صورته المبدئية على عينة من المتعلمين . ويترك لهم الوقت مفتوحا للإجابة ثم يحسب مجموع الأزمنة التي قضاها المتعلمون وتقسم على عددهم ويكون الناتج هو زمن الوقفة المناسبة .
وقد ذكرت بعض كتب الاختبارات أن فترة 12 ثانية كافية لان يستجيب المتعلم للسؤال , هذا ويراعى في ضبط المواد اللغوية المختارة لاختبار الاستماع ما يلي : –
1) السياق :-
يراعى أن يكون السياق محددا تماما لا أكثر ولا اقل من المطلوب بحيث لا يعطى الطالب دليلا على الإجابة . كما يراعى أن يكون مزيلا للغموض بدرجة كافية , على سبيل المثال : إذا كان السياق عن الطقس ثم سألنا المتعلم عن مقدار درجة الحرارة فانه سيدرك أن النص يتحدث عن الطقس ومن ثم لا نستطيع سؤاله عن مضمون العبارة .
2) طول الفقرات :
ليست هناك فضيلة في استخدام المفردات الطويلة أو حتى المواد الكاملة أو المقال كطول امثل في قطع الفهم , ففي الواقع غالبا ما تكون الفقرات طويلة بدرجة غير معقول وربما تكون اختبارات في ذاكرة أكثر منها اختبارات للفهم , وربما تستخدم الفقرات الطويلة في اختبارات اللغة الأم ولكنها ليست جيدة في اختبارات اللغة الأجنبية . ففي الواقع تكون الفقرات الطويلة مضيعة للوقت لأنها تتطلب تكرار المادة التي تظهر الصعوبات للطلاب , وليس هناك طول أمثلة في قطع الفهم ولكن بوجه عام يجب أن تكون طويلة بدرجة تجعلها تحتوى على المشكلات اللغوية المراد اختبارها .
وعلى ذلك يمكن القول انه يجب في فقرات اختبار الاستماع , ألا تكون طويلة بحيث تكون مضيعة للوقت أو قصيرة بحيث لا تظهر المشكلة اللغوية التي يراد اختبارها , واختيار الفقرات التي يتناسب طولها مع طولها مع المشكلات التي يراد اختبارها .
3) المحتوى :
يراعى في المحتوى ألا يكون مألوفا بالنسبة لبعض المتعلمين بحيث لا يحتاجون إلى سماع المحتوى للإجابة على السؤال لان ذلك يفسد نتائج الاختبار بمعنى أن تكون المتعلمين بالاختبار واحدة .
4) الاختبارات (البدائل) Choices
استخدام البدائل أو الاختبارات في الاختبار اللغة الأجنبية وخاصة فهم الاستماع حساس للغاية وعلى ذلك يراعى أن تكون الاختبارات Choices بسيطة وقصيرة بقدر المستطاع وكذلك متساوية في الطول والقصر حتى لا تكون أحداها مميزة عن الأخرى أو تدل على الإجابة الصحيحة .
5) ترتيبات خاصة للمفردات :
بعض التربويين يرون ضرورة وضع ترتيب خاص من اجل الحصول على معلومات تشخيصية , فيرى انه على الرغم من أن الدرجات التي نحصل عليها من اختبار فهم الاستماع يجب أن تظهر أولا في فهم مهارات الاستماع المتكامل فانه من الممكن أن ترتب مفردات الاختبار بطريقة ما بحيث ترتبط الدرجات بكل عنصر من عناصر اللغة وتسجل الدرجات منفصلة كل عنصر على حدة , وهكذا نستطيع الحصول على درجات جزئية Scores لأجزاء الأصوات , والتشديد والتنغيم والتركيبات النحوية والوحدات المعجمية , وتمكننا من اختبار العنصر أكثر وضوحا , والشكل البسيط للترتيب هو أن تظهر العناصر في شكل دائري بنفس الترتيب داخل كل دائرة (62 : 24) .
فعلي سبيل المثال إذا كانت الدائرة الأولى لهذا الترتيب هي :-
1- الأصوات .    2- التشديد .
3- النبر .    4- التركيبات النحوية .
5- المفردات .
كل الدوائر تأخذ نفس الترتيب وتكون المفردات الخاصة بالأصوات هي 1 , 6 , 11 , 16 , وهكذا المفردات الخاصة بالتشديد هي 2 , 7 , 12 وهكذا . وهذا الترتيب يتطلب أن نعطى كل عنصر من العناصر نفس الوزن في الدرجات الكلية لفهم الاستماع .
على أن البعض الآخر يرى أن الترتيب العشوائي للمفردات يكون أكثر قناعة من النوع السابق .
•    تسجيل الاختبار :
يمكن الاستعانة بعدد من الناطقين باللغة الأصلية : لتسجيل عبارات الاختبار وذلك عن طريق فني متخصص في أعمال التسجيل , ويمكن أن يتم ذلك داخل استديو الجامعة حتى يكون الصوت واضحا والوقفات بين الأسئلة مضبوطة ترتبط الدرجات بكل عناصر اللغة وتسجل الدرجات منفصلة كل عنصر على حدة , وهكذا نستطيع الحصول على درجات جزئية Scores لأجزاء الأصوات , والتشديد والتنغيم والتركيبات النحوية والوحدات المعجمية وتمكننا من اختبار العنصر أكثر وضوحا , والشكل البسيط للترتيب هو أن تظهر العناصر في شكل دائري الترتيب داخل دائرة (62 : 24 ) .
فعلي سبيل المثال إذا كانت الدائرة الأولى لهذا الترتيب هي :-
ب) اختبار الكتابة والتركيبات النحوية :
هناك فرق جوهري بين اختبار النحو التقليدي للمتحدثين الأصليين للغة العربية , واختبار التركيبات النحوية المناسبة للطلاب الأجانب , ذلك لأنه من المفروض أن المتحدث الأصلي للغة يكون متمكنا من النظام النحوي على نحو واسع يمكنه من تبقى الحديث الشكلي غير الرسمي Informal discorerse  فاختبار النحو Grammar Test على الأقل في الجامعات على سبيل المثال يركز في العادة على موضوعات وأساليب مناسبة لأكثر من العربية الرسمية المكتوبة , وعلى الجانب الأخر تكو اختبارات التركيبات النحوية Structure Tests للطلاب الأجانب حسب أغراضهم , وتختبر مدى التحكم في النماذج النحوية الأساسية Basic Grammatical patterns للغة المنطوقة Spoken language وهذه الاختبارات لا تصلح للمتحدثين الأصليين للغة العربية ولكن تصلح فقط للطلاب الأجانب في المستوى المتقدم من تعليم اللغة , كما أنها تكون أفضل أيضا عند استخدامها لاختبارات قدرة الكتابة (62 : 24 ) .
•    ب- 1-  تحديد محتوى الاختبار :-
في الاختبارات التحصيلية يراعى أن تكون الأسئلة مأخوذة من البرنامج الذي درسه الطالب , أما في اختبارات الكفاءة العامة فان عملية اختيار مفردات الاختبار تكون صعبة للغاية , ويرى التربويون أن أفضل مدخل لإعداد مفردات اختبار الكتابة والتركيبات النحوية هو فحص عدد من السياقات المعيارية المعدة للطلاب في نفس مستوى الاختبار المستهدف وعمل قائمة بالتركيبات الاختيارية , كما يمكن أن يستخدم واضح الاختبار حكمه الخاصة وخبرته إذا كان واضع الاختبار مدرسا للغة الأجنبية , وعلى ذلك يمكن لواضع الاختبار القيام بمراجعة كتب تعليم اللغة العربية لغير الناطقين بها وعمل قائمة بالقواعد الأساسية التي تدرس من خلال دروس الكتب المذكورة والمهمة للأجانب والتي تستخدم في الأحاديث اليومية , ويبنى عليها مفردات الاختبار .
•    ب – 2- انواع المفردات :-
هناك أنواع كثيرة لمفردات اختبار الكتاب والتركيب النحوية من نوع الاختيار من متعدد منها اختبارات التكملة والجمل الاختيارية وترجمة الجمل ,وترتيب الكلمات ,وقد سبق الحديث عنها في الفصل السابق وسنخصص الحديث هنا عن مفردات التكملة نظرا لأنها أحد الأنواع الأكثر شيوعا في اختبارات الاختيار من متعدد,كما أنها اقتصادية ويكون أداء الطالب أكثر فعالية عند استخدام هذا النوع . وهذا النوع عبارة عن سياق كلمة محذوفة ومتبوعة بأربعة اختيارات وعلى الطالب أن يختار الإجابة الصحيحة من بين الإجابات الأربع المذكورة في كراسة الأسئلة ( 62 : 24 ) .
ويجب أن يراعى واضع الاختبار  التقاط التالية عند كتابة مفردات
الاختبار :
1) أن يكون الجزء الأول من الجملة استجابة طبيعية للجزء الثاني
2) أن تكون المشتتات DISTRACTOR قاطعة ومحدودة وتبتعد عن الإقليمية أي ألا تكون لهجة إقليم معين بل عامة وللتأكيد من ذلك يتم عرض الإخبار على مجموعة من المتخصصين كما سيتم ذكره .
3) أن تكون لغة المفردات مناسبة لمستوى الطلاب .
4) إلا توحي المشتتات بالإجابة الصحيحة .
5) أن تكون المشتتات متساوية في الطول بقدر المستطاع .
-) اختبار القراءة و المفردات:
يتكون من جزأين :الأول اختبار المفردات. الثاني اختبار الفهم المرائي .
-1) اختبار المفردات :
عملية اختيار المفردات سهلة نسبيا وخاصة في اختبارات التحصيل فيمكن اختيارها من الكتب التي تدرس داخل الفصل مباشر , أما في اختبارات الكفاءة في عملية الاختيار تكون صعبة ومعقدة ومن ثم فيجبان يأخذ واضع الاختبار في اختيار المفردات ما يلي:-
إن تكون من المفردات التي يحتاج إليها الطلاب في الفهم وخاصة في قراءتهم , ففي المستوى  المتقدم ترتبط الكلمات المختارة بالمعجم الخاص بالكلمات المكتوبة ,والكلمات التي يحتاج إليها الطلاب في فهم الصحف والدوريات وكتب الأدب والكتب الدراسية وعلي الرغم من أنه يمكن باستخدام القاموس في اختيار مفردات الاختبار فأنه من المناسب والمفيد استخدام قوائم المفردات المهنية علي أساس تكرار العبارات المعجمية والتي تحدث في عينة حقيقية للغة, ويمكن استخدام قائمة  مكة للمفردات الشائعة إلي جانب بعض الكلمات من الكتب التي تدرس للأجانب كما ذكر من قبل إلي جانب القائمة التي أعدها مكتب التربية العربي لدول الخليج,وقائمة المنظمة العربية للتربية والثقافة والعلوم إدارة التربية عن المفردات  الخاصة SPECIALIZED VOCABULARY وهي المفردات الخاصة بأفراد مهن معينة مثل العلماء والزراعيين أو العمال أو المدرسين……………….الخ نظرا لأن الاختيار يهدف إلي قياس الكفاءة العامة والقدرة علي الاتصال بأبناء العربية
ج-1-2-اختيار نوع مفردات الاختبار:
هناك أنواع كثيرة من المفردات ذكرت في الفصل الساق وهي التحديدات والتكملة أو الشرح,والتفسير والصور ونخصص القول هنا علي نوع الشرح وهو عبارة عن اتحاد بين النوع الأول والثاني وهما التحديدات والتكملة وفي هذا النوع يتم وضع الكلمة في سياق ثم وضع خط تحت تلك الكلمة وإعطاء معان متعددة (أربعة معان) ويطلب من الطالب اختيار المعني المناسب للكلمة الموضوع أسفلها خط, وميزة هذا النوع أنه يختبر المفردات في مواقف لغوية حيةReal life
Situation ويراعى في وضع المفردات ما يأتي :-
1)    التعبير عن المفردات بكلمات بسيطة يمكن فهمها من جانب الطلاب .
2)    أن تكون البدائل في نفس مستوي الصعوبة أي متساوية في صعوبتها
3)    أن تكون متساوية في الطول فلا تكون هناك إجابة تجذب أكثر لأنها تبدو متشابهة للأخرى في نفس السؤال
4)    أن تكون خاليه من المشكلات الهجائية العربية
ج-2) اختبار الفهم القرائي:-
تبنى القراءة حول التركيبات النحوية والعبارات القاموسية (أو السياقية) التي يحتاج إليها المتعلمون عند الاتصال شفوي.(62:-48-51) والشكل العام لا اختبار القراءة هو أن يتكون هذا الاختبار من عدد من القطع الصغيرة لأساليب مختلف للقطع وكل منها متنوع بسلسلة من الاختيار من متعدد لقطع الفهم عن طريق الاختيار الجيد للقطع واختيار المفردات التي تقيس الفهم بعناية, ولا يقتصر في تلك القطع على  اختبار  فهم المتعلم للمعنى السطحي للقطعة ولكن يختبر فهمة أيضا في كشف عرض الكاتب واتجاهاته
ج-2-1-اختيار قطع  الاختبار :SELECTION  OF  EHE  TEST  PASSGES
يمكن اختيار الاختبار من الاختبار من الصحف والمجلات العربية ,بالإضافة إلى كتب تعليم اللغة العربية لغير الناطقين بها ,بالإضافة إلى ما ذكرته  كتب الاختيار في اللغات الأجنبية ,ويراعى في القطع المختارة ما يلي:-
ج-1-1) الطول :
يتم اختيار أنواع مختلفة من المواد يراعى فيها أن تكون مختصره ومحتواها كاف لكي يثمر عن عدد من مفردات الفهم للاختبار القبلي .
ج-1-2) موضوع المادة : Subject matter
يشير الغرض النوعي للاختبار إلى موضوع المادة للقطع المختارة , فعلى سبيل المثال في اختبارات الطلاب الأجانب الذين يريدون الالتحاق بالجامعات الأمريكية , فيجب أن يعكس الاختبار أنواعا مختلفة من المواد القرائية مخصصة للبرامج الجامعية الأساسية وتكون الكتابات عن أخبار مثل السير وتاريخ حياة الإنسانية Geographies  وقطع النثر Prose  والقصص الأسطورية Fiction  ودوائر المعارف والمواد الغير تكتيكية Nontachnical في العلوم الاجتماعية والطبيعية  ( 62 : 60 – 61 )
وفى الاختبارات التي تهدف إلى قياس  الكفاءة الاتصالية للطلاب الأجانب فتشتمل على قطع متعددة في موضوعات عامة ليست متخصصة مثل المشكلة السكانية والمعلومات العامة , كما يراعى أن تكون القطع المقتبسة واضحة وتامة المعنى عندما تؤخذ من السياق , وألا تعكس معلومات خاصة بفئة معينة من الطلاب يكون لديهم ألفة بتلك المواد , وألا تعكس معلومات عالمية لأنه في مثل تلك الحالات يستطيع الطلاب الإجابة على الأسئلة دون أن يعيروا اهتماما للقطعة .

ج-2-1-3) أسلوب ومعالجة المادة : Style and treatment of subject
يجب أن يحتوي الاختبار على أنواع وأساليب مختلفة ويراعى في اختيار الفقرات أن تكون مباشرة وواضحة , وأن تكون مرتبة زمنيا مع سلسلة الأحداث , وأن تفرق أو تقارن بين اثنين من الشخصيات أو الموضوعات أو الأحداث , وتظهر وجهة نظر الكاتب الشخصية .

ج-2-1-4- اللغـــة :-
وتكون اللغة في مستوى لغة الفقرات بألا تكون صعبة جداً بحيث لا يستطيع التلاميذ فهمها , وألا تكون سهلة جداً بحيث تفشل في التفريق بين التلاميذ في المستويات المختلفة من الكفاءة .
ج-2-1-5) مفردات الاختبار :
وعند وضع الأسئلة يراعى واضع الاختبار في المفردات ما يلي :-
–    أن تكون مفرداتها ومعانيها سهلة بقدر الإمكان  لأن المشكلة الحقيقية هي ترجمة القطعة وليس السؤال الذي يسأل عنه .
–    أن تظهر مقدمة السؤال المشكلة – أي أن يكون واضحاً نوع المعلومات المطلوبة .
الإجابة الصحيحة المختارة يجب أن تشارك في ترجمة القطعة وليست مجرد مباراة للكلمات مختارة على نفس الكلمات الموجودة بالقطعة .
– أن يكون من الصعب على المتعلم أن يجيب على السؤال إجابة صحيحة بالمعرفة الخارجية أو الإلمام ببعض الاختبارات لأنها تبدو مع الأخرى .
ج-3- اختيار المشتتات :
يمكن تطبيق الاختبار على مجموعة من الطلاب الذين يدرسون اللغة العربية ويطلب منهم الإجابة على أسئلة المقياس وبدون أن توضع بدائل كإجابات للأسئلة وذلك لاستخدام الإجابات الخاطئة التي يضعها الطلاب كمشتتات لأسئلة المقياس , بالإضافة إلى ذلك يمكن أن يقوم واضع الاختبار بإعداد بعض المشتتات لاستخدامها لنفس الغرض .
ج- 4- كتابة التعليمات :
بعد كتابة مفردات المقياس وتقسيمها على النحو الذي تم توضيحه يصبح من الواجب كتابة التعليمات الخاصة بالمقياس , فالهدف من التعليمات هو السماح للممتحنين أن يبدأوا الإجابة على درجة متساوية من الاستعداد , فإذا كانت لغة التعليمات صعبة أو مربكة , فإن واضع الاختبار لن يتأكد عما إذا كان الأداء الضعيف من جانب المتعلم يشير إلى كفاءة ضعيفة في مساحة المهارات التي تقاس , فإذا كانت التوضيحات أو التفسيرات المعطاة في التعليمات غير وافية بالغرض فإن الاختبار سوف يكون جزءا من اختبارات الذكاء بدلا من اختبارات الكفاءة , كما يؤدي إلى قلب الحقائق ,فربما تحكم على طالب ما بأنه فاشل في حين أنه على العكس من ذلك ( 62 : 102 ) .
ومن أجل ذلك يراعى في كتابة التعليمات أن تكون مختصرة وبسيطة لكي يفهمها الطلاب وخالية من اللبس والغموض , ومزودة بأمثلة للتأكد من أن الطالب حتى ولو كان بطئ التعلم أو قليل المهارة قد فهم نوع المشكلة . ويمكن وضع تعليمات عامة بالنسبة للمقياس ككل مزودة بمثال يوضح نوع المشكلة , ثم تعليمات خاصة بكل اختبار على حدة يوضح المشكلة المطلوب الإجابة عليها .
ثالثا :  مراجعة المفردات :
بعد كتابة المفردات يجب أن توضح جانبا لعدة أيام قبل مراجعتها بواسطة كاتب الاختبار . ولنفترض أنه مطمئن إلى المواد التي وضعها , ولكن يجب أن تعطى على الأقل لأحد الزملاء في نفس الميدان ولديه خبره باللغة لمراجعتها ( 62 : 103 ) . ويطلب منه أن يضع علامة (    ) أمام المفردات التي يكون مقتنعا بها , وكذلك التعليقات حول المفردات التي تكون بها عيوب أو غير مقتنع بها , ثم يقوم بإجراء التعديلات التي يراها واجبة .
وفي ضوء ما سبق يكون المقياس قد أصبح في صورته الأولية وتجرى له حساب الصدق والثبات .
رابعا : عرض المقياس على المحكمين :
يرى ستانلي Stanley ( 87 : 356 ) أن التحكيم يكون ضروريا وذلك لتحديد دقة المحتوى Accuracy of content  والمفردات , كما يجب أن تبنى المفردات بعد نقد وتمحيص من جانب المتخصصين في الموضوع المراد قياسه وعلى ذلك فبعد التصحيحات السابق ذكرها يتم عرض الصورة الأولية للمقياس على خمسة من المحكمين وذلك بهدف :
1-    التأكد من سلامة المفردات والاختيارات .
2-    مناسبة المقياس لطلاب وللمستوى الدراسي الذي يدرسونه .
3-    مناسبة الزمن المتروك بين كل سؤال في اختبار الاستماع .
4-    مستوى صعوبة المفردات والكلمات المستخدمة في القطع والأسئلة .
خامسا : الاختبار القبلي :
الاختبار المقننة تنقسم إلى مواد تختبر قبليا ذلك لكي نقول أن جميع المفردات قد اختبرت على عدد لا بأس به من المفحوصين من نفس نوع المفحوصين الذين يصمم الاختبار من أجلهم , وتكون المفردات التي حصلت على القبول من جانب العمليات الإحصائية هي فقط  التي يجب تضمينها في الصورة النهائية للاختبار , والمفردات التي تحظى بالقبول إحصائيا هي المفردات التي تفي بمطلبين هما :
1)    إذا كانت ذات مستويات مناسبة من الصعوبة . أي ليست جدا ولا سهلة جدا بالنسبة للمجتمع الذي طبق عليه الاختبار .
2)    أذا ميزت بين الطلاب الذين يمتلكون المهارات والقدرات اللغوية التي تقاس بين أولئك الذين يفتقدون تلك المهارات والقدرات .
بالإضافة إلى ما سبق فإنه الاختبار القبلي يعطي مصمم الاختبار الفرصة لاختبار التعليمات وضبط وحساب الوقت الذي يحتاجه الممتحن للإجابة على مفردات الاختبار , فإذا كانت التعليمات غير واضحة بالنسبة للممتحنين , فإن ذلك سوف يلاحظ بالتأكيد في وقت إجراء الاختبار القبلي . وبناء على ذلك توضع التعليمات في الصورة النهائية , فإذا كان عدد كبير من الممتحنين لا يستطيع الإجابة على مفرداتها في الوقت والسرعة المتوقعة فإن مصمم الاختبار يمكنه تقليل المفردات أو تخفيضها أو يزيد الوقت المسموح به في الصورة النهائية للاختبار (62 : 104 ) .
هناك نقطة أخرى مهمة في الدراسة القبلية وهي ضرورة السماح بوقت كاف للجميع لمحاولة الإجابة على كل مفردة من مفردات الاختبار لأنه إذا لم يصل جميع الممتحنين إلى نهاية الاختبار فسوف يكون لدينا معلومات غير كافية عن المفردات الأخيرة في الاختبار القبلي والتي لم يستطع بعض الممتحنين الإجابة عليها ومن ثم فيمكن ترك الوقت مفتوحا لجميع التلاميذ ,ومن ثم يمكن القيام بالإجراءات التالية :
1-    تطبيق الدراسة القبلية على عدد معقول من الطلاب ( 15 – 20 طالب ) , وهذا العدد يعتبر مقبولا بالنسبة للدراسة القبلية حيث ذكرت بعض الدراسات أن الدراسة القبلية يمكن تطبيقها على 2-3 مفحوصين  ( 103 : 100 ) , ومن النادر زيادتها عن عشرين  مفحوصا .
2-    وفي أثناء التطبيقات يترك الوقت مفتوحا لجميع الطلاب ويتم بدء الاختبار في وقت محدد وعندما ينتهي أحد الممتحنين من الإجابة على كل اختبار على حدة يقوم مصمم الاختبار بتسجيل الوقت الذي استغرقه المفحوص , أما في الاختبار الاستماع فيكون الوقت محددا نظرا لأن الاختبار يكون مسجلا والفترة المتروكة بين كل سؤال وآخر حددتها الدراسات العملية وتقدر الاختبارات بحوالي 14ثانية .
وبعد تطبيق الاختبار فبليا تجري الخطوات الآتية :
1-    تحليل المفردات :
بعد جمع كراسات الإجابة يتم تحليل المفردات ونتائج الدراسة القبلية لحساب كل مما يلي تمهيدا لتجميع الصورة النهائية للمقياس وحساب الوقت وتحليل المفردات لحساب كل مما يلي .

1-1    الوقت المخصص للمقياس :
يتم حساب الوقت الذي استغرقه جميع الطلاب , تم حساب متوسط ذلك الوقت بالنسبة لكل اختبار على حدة ثم للمقياس الكلي .
مثال : إذا كان مجموع الأزمنة التي قضاها الطلاب في الإجابة على الاختبار هو 600 دقيقة كان عدد الطلاب 20 طالبا :
فإن زمن الاختبار =     = 30 دقيقة
1-2- فعالية المفردات :
يتم تحليل المفردات لتحديد فعاليتها فيما يتعلق بالنقطتين التاليتين :
1-2-1- تحديد صعوبة المفردات :
أول خطوة هي تحديد مستوى الصعوبة لكل مفردة من مفردات الاختبار , وهناك تكتيكات قد صممت لهذا الغرض وأكثر الطرق اتفاقا وتحظى بالاقتناع هي ببساطة التأكد من النسبة المئوية للعينة التي أجابت على كل مفردة إجابة صحيحة (62 : 105 ) , ومن ثم فيمكن استخدام المعادلة الآتية لحساب معاملات الصعوبة .
عدد الإجابات الخاطئة
عدد الإجابات الصحيحة + الخاطئة

معامل الصعوبة =

ومن ثم نسقط من حساب المفردات الأسئلة التي تركها الطلاب ولم يجيبوا عليها , وقد ذكرت كتب الإحصاء لاختبارات اللغات الأجنبية أن المفردات التي تحصل على نسبة أقل من 30% كمعامل صعوبة لابد أن نحذف من الاختبار ويحل محلها مفردات أخرى . أي أن المفردة التي يجيب عليها أكثر من 70% من العينة يجب حذفها ,  أما المفردات الأخرى التي حصلت على النسبة المطلوبة فتبقى لكي تفي بالمطلب الثاني وهو معامل التميزية Discrimination (62: 105)
ويمكن تفريغ البيانات في جدول كالتالي :
رقم المفرد     عدد الإجابات الصحيحة     عدد الإجابات الخاطئة     عدد الإجابات المتروكة     معامل الصعوبة

1 – 2-2-  تحديد معاملات التميزية للمعلومات :
الخطوة الثانية هي تحديد كيفية تمييز كل مفردة بين التلاميذ ذوي المستويات الرفيعة وذوى المستويات المنخفضة . فيجب أن تساعد كل مفردة من مفردات الاختبار على فصل المتعلمين ذوي الكفاءة العالية عن أولئك الذين لديهم نقص في المهارات أو التعلم . والطريقة العامة لحساب معاملات التميزية للمفردات هي افتراض أن كفاءة الممتحنين في مجموع الاختبار سوف تعطي مؤشر جيداً ومعتدلا عن مستواه في الكفاءة . ومن ثم تشمل الطريقة على تصحيح الاختبار ككل بالنسبة الــ 25 %  من أفراد العينة الحاصلين على أعلى الدرجات , وفصل الـــ 25 %  من أفراد العينة الحاصلين على أقل الدرجات , وتكون المفردات المميزة هي تلك المفردات التي أجيب  عليها إجابة صحيحة من قبل المجموعة العليا ( الحاصلون على أعلى الدرجات ) أكثر من المجموعة السفلى ( الحاصلون على أقل الدرجات ) ( 62 : 105 )
–    ومن ثم يمكن القيام بإجراء الخطوات التالية
–     تصحيح إجابات الطلاب .
–    فصل أعلى 25 % من الإجابات وكذلك أقل 25 % منها .
–    طرح عدد أفراد المجموعة السفلى التي أجابت المفردة الواحدة إجابة صحيحة من عدد أفراد المجموعة العليا التي أجابت على المفردة الواحدة إجابة صحيحة
رقم المفرد     عدد الإجابات الصحيحة في المجموعة العليا      عدد الإجابات الصحيحة في المجموعة السفلى     الفرق بين المجموعتين     معامل التميزية

مثال : لنفترض أن عدد أفراد العينة التي أجرى عليها الاختبار القبلي عشرون تلميذا فمن ثم يتم فصل عدد 5 كراسات في كل من المجموعتين وهي التي تمثل 25 % من أفراد العينة .
ولنفترض أن المفردة رقم (1) لاختبار الاستماع قد أجاب عليها 5 أفراد من المجموعة العليا وثلاثة أفراد من المجموعة السفلى فيكون معامل تمييزية تلك المفردة هو :
=
معامل التمييزية لتلك المفردة = 40 %
ويمكن تفريغ البيانات الخاصة بمعاملات التمييزية في جدول كالتالي :

رقم المفردة    اسم الاختبار
17    التركيبات النحوية
المفردة : أكمل الجملة الآتية بالكلمة المناسبة .
أ- المجدان         ب- المجدين        جـ – المجدون         د- المجدة  .

الاختيارات    المجموعة العليا    المجموعة المتوسطة    المجموعة السفلى    معامل الصعوبة 0.32    معامل التمييزية 0.40
أ
ب
ج
د    4
1
3
–    –
5
2
–    1
2
2

وبعد الانتهاء من حساب معاملات الصعوبة والتمييزية للمفردات يبقى خطوة مهمة وهي بيان فعالية المشتتات Destructors efficiency وهي البدائل الأربعة لكل مفردة الاختبار وهي النقطة التالية :
2-3- حساب فعالية المشتتات :    Destructors efficiency
من الخطوات المهمة في تحليل المفردات من نوع الاختيار من متعدد والمرغوب فيها بدرجه كبيرة هي فحص وظيفية المشتتات بالنسبة لكل مفردة من مفردات الاختبار فإذا كانت المفردة تحتوي على أحد المشتتات الذي لم يجذب أي تلميذ ولا حتى الطالب الضعيف في اختياره كإجابة صحيحة , فإنه يكون غير وظيفي , وبالتالي يزيد من فرص التخمين بالنسبة للمشتتات الثلاثة الباقية , وعلى ذلك فيجب التخلص من مثل هذه المشتتات واستبدالها بأخرى تكون أكثر قرباً للإجابة الصحيحة .
الشكل التالي يوضح طريقة تسجيل بيانات تحليل المفردات .
الاختبار القبلي  اسم الاختبار: إذا كان القياس يحتوي على أكثر من (اختبار) رقم المفردة : 17

المفردة : ( تكتب هنا المفردة ) .
الاختيارات    المجموعة العليا    المجموعة المتوسطة    المجموعة السفلى    معامل الصعوبة
معامل التمييزية
أ
ب
ج
د    4
–    1
0.32
0.40
مثال: لنفترض أننا نقوم بحساب فعالية المشتتات لأحد الاختبارات الذي يحتوي على 20 مفردة  من نوع الاختيار من متعدد وهي المفردة رقم 17 , فيكون حسابها كالتالي :
وبالنظر للشكل السابق نجد أن المفردة رقم ( 17 ) في اختبار التركيبات النحوية على سبيل المثال لم يختر أحد الطلاب المشتت رقم (د) كإجابة صحيحة ومن ثم يصبح أمام  الطلاب ثلاثة بدائل وليس أربعة مما يزيد من فرصة التخمين بالنسبة للبدائل الثلاثة الباقية , وعلى ذلك يقوم مصمم الاختبار بحذف المشتت (د) وهو كلمة ” ( المجدة ) واستبدالها بكلمة أخرى , وهكذا في بقية الاختبارات .
سادسا : جمع الصورة النهائية :
وفي ضوء نتائج تحليل المفردات التي تم شرحها في هذا الفصل يقوم مصمم الاختبار بتجميع الصورة النهائية للمقياس .
هذا ويراعى في جمع الصورة النهائية ما يلي :
1)    أن مكان الإجابة لا يشكل آية نماذج يمكن ملاحظتها , على سبيل المثال إذا كان اختبار الاستماع يتكون من ثلاثين مفردة فمن المفروض أن تكون الإجابات موزعة على البدائل الأربعة ( أ , ب , جــ , د )  بالتساوي فتكون الإجابة الصحيحة ” أ ” مكررة سبع مرات أو ثمان مرات وهكذا بالنسبة للبدائل الثلاثة الباقية فلا توضع الإجابات بشكل يتم اكتشافه
من قبل التلاميذ كأن تكون الإجابة رقم 1 مثلا ( أ ) ورقم 2 (ب ) ورقم 3 (ج) ورقم 4 (د) ثم رقم 5 (أ) وهكذا بل توضع بصورة عشوائية حتى لا تتكشف الإجابات ومن ثم لا تشير الإجابة عن تمكن الطالب من القدرات اللغوية .
2)    أن يعبر كل اختبار عن الوقت الذي تم التوصل إليه لكل اختبار على حدة بالطريقة التي تم شرحها في حساب زمن الاختبارات .
سابعا : كتابة النهائية للاختبار :Reproducing the Test
يقوم مصمم الاختبار بإعادة كتابة الاختبارات تمهيدا لتطبيقه على عينة البحث ويراعى عند كتابة الاختبارات ما يلي :
1-    أن تكون الكتابة واضحة بقدر المستطاع والبنط المستخدم في الكتابة مناسب , وذلك لأن الكتابة الرديئة سوف تؤثر على الطلاب .
2-    أن تكون مواد الاختبار ذات مسافات كافية لتعطي أكبر درجة من الوضوح في القراءة Readability وقد يراعى في ذلك أن تكون الإجابات في عمودين حتى تكون أكثر وضوحا .
3-    عدم كتابة السؤال في صحيفة وبقيته في الصفحة التالية حتى لا يعوق تفكير الطلاب أثناء الإجابة .
4-    كتابة عبارة “بقية الأسئلة على الصفحة التالية ” نهاية الصفحة في كل اختبار حتى يعرف الطلاب أن الاختبار لم ينته وعبارة “نهاية الاختبار ” بعد كل نهاية اختبار لكي يعرف التلاميذ أن الاختبار قد انتهى ولا يستمرون في الإجابة على أسئلة الاختبار التالي .
5-    إذا كان الاختبار يتكون من أجزاء فيقوم المصمم بكتابة تعليمات كل جزء على حدة لتوضيح نوع الإجابة المطلوبة على هذا الجزء .
6-    استخدام غلاف خارجي Cover Sheat  لكراسة الأسئلة لكي تمنع الطلاب من النظر إلى أسئلة الاختبار قبل بدء التطبيق الفعلي له .
7-    كتابة تعليمات الاختبار بحيث توضح ما يلي :
‌أ-    نوع مفردات الاختبار .
‌ب-    تنبيه الطالب أن هناك كراسة إجابة منفصلة إذا كانت هناك كراسة إجابة منفصلة .
‌ج-    طريقة الإجابة على الاختبارات .
‌د-    مثال يوضح كيفية الإجابة على مفردات الاختبارات .
‌ه-    كيفية تغيير إجابة إذا أراد الطالب تغيير إجابته .
‌و-    معلومات تفيد إذا كان هناك عقاب بخصم درجات على استخدام التخمين أم لا.
8-    يتم تدبيس صفحات كراسة الأسئلة معا بإحكام لكي لا تكون الصفحات الأخيرة منفصلة عن بقية الصفحات عند تصفحها من قبل التلاميذ مع مراعاة أن تكون الدبابيس في مكان بحيث تسمح بتصفح الكراسة بسهولة وبمساحة كافية بحيث تقرأ المفردات المجاورة للدبابيس بسهولة .
استخدام كراسة إجابة منفصلة :
ينصح دائما باستخدام كراسة إجابة منفصلة في اختبارات الاختيار من متعدد نظرا لأن استخدام مثل هذه الكراسة في اختبارات الاختيار من متعدد عملية اقتصادية أكثر من كتابة الإجابة في كراسة الأسئلة نفسها ليس فقط لأن كراسة الأسئلة ستستخدم مرة ثانية ولكن أيضا ستوفر وقتا كبيرا في عملية حساب الدرجات ولكي يتلاقى مصمم الاختبار العيوب التي ذكرها كتب الاختبارات عن كراسة الإجابة المنفصلة من أن الطالب ربما لا يفهم كيفية استخدام هذه الكراسة للممتحنين قبل بدء الإجابة , أما فيما يختص بإمكانية أن يفقد الطالب مكان الإجابة في كراسة الإجابة ومن يسجل إجابته على خطوط خافتة فيمكن استخدام الحروف لترقيم الإجابات بدلا من الأرقام وعلى يكون من السهل على الطالب أن يعلم على الإجابة رقم 3 مثلا 3- د بدلا من 3-4 والتي من الممكن في الحالة الأخيرة أن تكتب معكوسة .
بعد إجراء كل ما سبق يصبح المقياس جاهزا للتطبيق ويصبح في صورته النهائية .
ثامنا : تطبيق المقياس وتحليل النتائج :
بعد كتابة الاختبار يصبح الاختبار جاهزا للتطبيق على العينة المستهدفة أو المجتمع الأصلي في حالة التقنين ويتم التطبيق للحصول على الدرجات الخام ومعاملتها إحصائيا للحصول على الدرجات المعيارية لحساب صعوبة المقياس وصدقه وثباته ومعاييره وعلى ذلك فسوف يتناول النقاط التالية .
1-    وصف العينة .
2-    إجراءات تطبيق الاختبار .
3-    تحليل البيانات .
4-    صدق المقياس .
5-    ثبات المقياس .
6-    معايير الأداء اللغوي مع المقياس .
وفيما يلي وصف بتلك الخطوات :
1) وصف العينة :
في ضوء الهدف من المقياس يتم اختبار عينة الدراسة وفق القواعد المتبعة في اختيار العينات سواء أكانت عينة عشوائية أم طبقية أم مقصودة حسب عدد الدارسين والمراكز التعليمية المتوفرة 2 .

2) تطبيق المقياس :
بعد أن يصبح المقياس في صورته النهائية كما تم توضيحه في الخطوات السابقة يقوم مصمم الاختبار بتطبيقه على عينة من الدارسين . وحيث إن التطبيق الصحيح والتام للمقياس هو ذلك التطبيق الذي يسمح لجميع الممتحنين أن يؤدوا الامتحان بأقصى ما تسمح به قدراتهم تحت ظروف مماثلة للجميع ,كما أن التطبيق السهل والمرن للمقياس يعتمد في جزء كبير منه على الإعداد الكامل له فلابد من مراعاة النقاط التالية عند التطبيق .
أ‌)    اختيار حجرة التطبيق :
يجب أن يدار الاختبار في حجرة جيدة الإضاءة وهادئة وتقع في مكان بعيد عن الضوضاء الخارجية , واسعة بحيث توضع المقاعد على مسافات معقولة ويمكن رؤية الطلاب بوضوح , كما يتم تطبيق اختبار الاستماع في معمل اللغات حيث يكون الصوت واضحا وكل تلميذ مستقل عن الآخر كما يراعى ألا يصطحب أي طالب أدوات معه سوى القلم الرصاص والممحاة .
كما يراعى أيضا أن تشتمل حجرة التطبيق على ساعة حائط كبيرة تكون واضحة لجميع التلاميذ وحتى يبدأ جميع التلاميذ في زمن واحد وينتهوا في زمن واحد وإخبار التلاميذ بالوقت المتبقي من آن لآخر .
ب‌)    توزيع مواد المقياس :
بعد جلوس الطلاب في أماكنهم وبعد أن يسود الهدوء الكامل وبمساعدة أحد المدرسين يقوم مصمم الاختبار بتوزيع مواد المقياس وهي كراسة الأسئلة وكراسة الإجابة وأقلام رصاص لمن ليس معهم أقلام وينبه الطلاب إلى عدم فتح كراسات الإجابة أةو الأسئلة إلا بعد إخبارهم بذلك .
جـ ) إرشاد الطلاب بكيفية ملء كراسة الإجابة :
بعد توزيع مواد المقياس يتم شرح كيفية ملء الجزء الخاص بالبيانات الشخصية مثل الاسم والجنس والسن وغيرها . وبعد التأكد من أن جميع الطلاب قد ملأوا بياناتهم وفهموا المطلوب تماما يتم شرح كيفية الإجابة ووضع العلامات في كراسة الإجابة عن طريق شرح الأمثلة التي تم عرضها في مقدمة كل اختبار وكذلك المثال العام الموجود في كراسة الأسئلة , وينصح بالاستماع إلى أسئلة الطلاب والإجابة عليها حتى يتم التأكد من أن الجميع قد فهم كيفية الإجابة على أسئلة المقياس .
د) اعطاء التعليمات :
بعد فهم الطلاب كيفية الإجابة ووضع العلامات في كراسة الإجابة المنفصلة يتم قراءة التعليمات العامة للمقياس ككل بصوت واضح والإجابة على أسئلة الطلاب ثم توضيح المثال المحلول مع مراعاة ألا تشتمل الأمثلة على أسئلة موجود بالمقياس , ويتم تقسيم فترة التطبيق إلى فترتين تشتمل الفترة الأولى على اختبار الاستماع واختبار الكتابة والتركيبات النحوية , ثم فترة راحة حوالي 15 دقيقة ثم الفترة الأخيرة وهي لتطبيق اختبار القراءة والمفردات .
هـ ) إدارة الاختبار (التطبيق ) :
بعد التأكد من أن الطلاب قد فهموا جميع التعليمات يطلب منهم أن يستعدوا للإجابة وأن يلتزموا الهدوء , ثم يطلب منهم البدء في الإجابة , أما في اختبار الاستماع فيطلب منهم وضع السماعات على الأذن والاتصالات جيدا لكي يبدأ تشغيل الشريط . وبعد التأكد من أن الجميع مستعدون يطلب منهم البدء في الإجابة على أسئلة الاختبار .وأثناء إجراء الاختبار يمر مصمم الاختبار بهدوء وسط الطلاب حتى يتأكد من أن الجميع يجيب بالطريقة الصحيحة التي تم شرحها .

و) جمع الاختبار :
بعد انتهاء اختبار الاستماع يطلب من التلاميذ التوقف عن الإجابة على هذا الاختبار والبدء في الإجابة على أسئلة اختبار التركيبات النحوية ,وعندما ينتهي أحد الطلاب من الإجابة قبل الوقت المحدد تؤخذ كراسته ويطلب منه الانصراف والانتظار خارج الحجرة لحين حلول موعد اختبار القراءة . وهكذا حتى ينتهي جميع الطلاب . أما الطلاب الذين لم ينتهوا في الوقت المحدد , فعند انتهاء الوقت يطلب منهم التوقف عن الإجابة وتسليم كراساتهم . وبعد فترة الراحة يتم تطبيق اختبار القراءة وإتباع نفس الإجراءات التي تم شرحها .
ز) تصحيح الإجابات :
بعد الانتهاء من تطبيق المقياس على العينة يقوم مصمم الاختبار بتصحيح الاختبارات مستخدما في ذلك مفتاح التصحيح ويراعى أن توزع الإجابات على البدائل الأربعة بالتساوي   كما سبق توضيحه وينصح باستخدام مفتاح التصحيح من نوع البلاستيك الشفاف يتم تسويد رقم ورقة الإجابة يمكنه مشاهدة العلامات التي قام الطالب بوضعها لتدل على الإجابة الصحيحة فيقوم المصحح بعد الإجابات الصحيحة فقط وتكون هي درجة الطالب على الاختبار , ثم جمع درجات الاختبارات الثلاثة فتكون هي درجة الطالب الكلية على المقياس , ويتم رصد درجات كل طالب على حدة مع ذكر جنسه وجنسيته وسنه وعدد السنوات التي قضاها في تعلم اللغة العربية والمكان الذي درس فيه ونوع اللغة العامية أو الفصحى إذا كانت ستؤخذ كمتغيرات في البحث على الدرجات الخام لأفراد العينة والتي يتم تحليلها ومعالجتها إحصائيا على النحو التالي .
3 – تحليل البيانات :
يقصد بتحليل البيانات هنا تحليل مفردات المقياس وذلك لحساب صعوبة وسهولة تلك المفردات عن طريق حساب متوسطاتها وانحرافاتها المعيارية وتباينها , وكذلك حساب صدق وثبات المفردات وحساب صدق وثبات المقياس ككل .
وهكذا تتأثر عملية اختيار المفردات بمعاملات الصعوبة والصدق والثبات وبالزمن المحدد للاختيار وتباين المفردات وخصائصها الإحصائية ولكل ناحية من هذه النواحي أهميتها في بناء الاختبار النهائي .
ومن أجل ذلك يقوم مصمم الاختبار بالآتي :
‌أ )     حساب صعوبة وسهولة المفردات :
وبعد الحصول على الدرجات الخام وقد تم شرحها سلفا ,يتم حساب المتوسط والانحراف المعياري والتباين للمفردات وذلك لكل مفردة من مفردات المقياس حتى يمكن مقارنة أداء كل مفحوص بالنسبة للمتوسط الكلي للإفراد وعلي نفس المفردة وكذلك المتوسط العام لمجموع الدرجات علي كل اختبار علي حدة وعلي المقياس الكلي وذلك بهدف مقارنة متوسط كل مفحوص بمجموع المفحوصين علي المقياس ، كما يتم حساب النسبة المئوية percentile وذلك بهدف تحويل الدرجات الخام إلي نسب مئوية أو درجات معيارية standard
Scores  من اجل إظهار علي وجه التقريب إلي اي مدى يكون متوسط كل مفحوص بالنسبة للمتوسط فمن المعروف أن الدرجات الخام ذات معني محدود جدا ،فبدون أية معلومات أخري لا نستطيع القول إذا كانت الدرجة الخام علي سبيل المثال 70 من100 درجة يمكن إن تمثل أداء منخفضا أو مرتفعا ، ومن ثم فلابد من أن يكون لدينا عدة طرق لتفسير الدرجات الخام فيما يختص بالأداء العام لعينة البحث .

ويمكن أجراء تحليل بيانات صعوبة وسهولة المفردات في جدول كالتالي :
جدول يوضح تسجيل بيانات صعوبة وسهولة المفردات
رقم المفردة     المتوسط     الوسيط     الانحراف المعياري     التباين

1    0.66    1    0.48    0.23

    مجموع الطلاب 80
    المتوسط 0.66
    الوسيط 1
    الانحراف المعياري 0.48
    التباين 0.23
ففي الجدول السابق كانت العينة التي طبق عليها الاختبار 80 طالبا، وكانت النهاية العظمى للاختبار 30 درجة ،وقام مصمم الاختبار بحساب المتوسط والوسيط والانحراف المعياري لأحدى مفردات الاختبار كما هي موضحة بالجدول السابق . وتعتبر اكبر الأسئلة تمييزا للفروق الفردية بين الطلاب هي التي …………………..هذه القيمة ، وان اقلها تمييزا للفروق الفردية هي الأسئلة الصعبة والأسئلة السهلة ويعتبر التربويون نسبة 0.25صعوبة هو5% من الطلاب الإجابة عليه يعتبر اختبار جيد وكذلك الحال بالنسبة لكل مفردة على حده(معامل السهولة عكس معامل الصعوبة أي أن معامل السهولة : إلى معامل الصعوبة = 1)
    المتوسط
    المتوسط 15
    التباين 2485
وتعتبر أقل الأسئلة تمييز للفروق القائمة بين مستويات النشاط الذي يقيسه الاختبار هي الأسئلة السهلة والأسئلة الصعبة وأن أكبر هذه الأسئلة تمييزا لتلك الفروق هي التي تصل إلى النصف أي 0.5أو تقترب من هذه القيمة حيث إن التباين يدل على مدى اقتراب وابتعاد الفروق الفردية التي يقيسها السؤال ويصل التباين إلى نهايته العظمى عندما يساوي 0.5 وبذلك يصبح معامل الصعوبة مساويا أيضا 0.5 .
فإذا كان التباين بين المفردات يتراوح بين 0.25 , 0.20 أي أن غالبية أسئلة اختبار تدور حول السهولة المتوسطة يصبح هذا الاختبار وسيلة قوية للتمييز الدقيق بين مستويات النشاط الذي يقيسه . وهكذا في بقية الاختبارات .

ب ) حساب التوزيعات التكرارية والنسبة المئوية للدرجات :
يتم حساب التوزيع التكراري والنسب المئوية لدرجات الاختبارات المكونة للمقياس ما بهدف تحويل الدرجات الخام إلى نسب مئوية أو درجات معيارية Standard scores  من أجل إظهار – على وجه التقريب – إلى أي مدى يكون متوسط كل مفحوص بالنسبة للمتوسط (فوق وأقل من المتوسط ) .
فإذا كان الوسيط يساوي المتوسط تقريبا فهذا يعني أن درجات الاختبار تميل إلى التجمع المتطابق Cluster حول النقطة المتوسطة . والعكس صحيح .
وبعد حساب التوزيع التكراري لدرجات كل اختبار على حدة يتم حساب التوزيع التكراري لدرجات المقياس ككل . ويمكن تحليل نتائج هذه الخطوة في جدول كالتالي :

جدول يوضح التوزيع التكراري لدرجات الاختبار
الدرجة    التكرار    النسبة المئوية    التكرار المتجمع
7    1    1.2    1.2
8    2    2.5    3.7

جـ )الاتساق الداخلي للمفردات :
يذكر فؤاد البهي (30: 222) أن المشتغلين بالقياس أدركوا أهمية مفردات المقياس في صياغة وبناء الاختبار النهائي , ومن ثم ازدادت الأبحاث المتصلة بتحليل تلك المفردات حتى أربت على الآلاف , وتطورت بسرعة غريبة لتساير بذلك مطالب ميادين القياس .
وللمفردات أهميتها القصوى في بناء وصياغة الصورة النهائية للاختبار وذلك لاعتماد المقاييس الإحصائية لذلك الاختبار على المقاييس الإحصائية لمفرداته وأجزاءه . وفي مقدور مصمم الاختبار أن يتحكم إلى حد كبير في متوسط الاختبار وانحرافه المعياري وتباينه والتوزيع التكراري لدرجاته وتباينه وصدقه وذلك باختيار الأسئلة أو المفردات اختيار يخضع لمدى الصعوبة المناسبة للمختبرين ويخضع أيضا لمستوى الصدق والثبات المحتمل لذلك الاختبار لضبط الزمن المناسب لكل سؤال وللاختبار كله وللصفات الإحصائية الأخرى للمفردات كتباين السؤال ومعامل تميزه للفروق الفردية القائمة في مستويات القدرة أو النشاط الذي يقاس .
وعلى ذلك فهناك إجراءات مهمة لابد من إجرائها على مفردات الاختبار وهي :
‌أ )     صدق المفردات .
‌ب )     ثبات المفردات .
‌ج )     الاتساق الداخلي للاختبارات الفرعية .
أ ) صدق المفردات :
يعتمد صدق الاختبار اعتمادا مباشرا على صدق مفرداته , وذلك لأن أي زيادة في صدق الاختبار . ويقاس صدق المفردات بحساب معاملات ارتباطها بالميزان , وقد يكون الميزان داخليا أو خارجيا والميزان الداخلي هو الاختبار الذي يشتمل على تلك المفردات , والميزان الخارجي هو الذي نقيس به الاختبار نفسه ويسمى الصدق الداخلي أحيانا بالتجانس الداخلي للاختبار (30:223) , لأنه يقيس مدى تماسك المفردات باختبارها , ويمكن حساب معاملات الارتباط بالميزان الداخلي عن طريق حساب معامل الارتباط بين كل مفردة والاختبار الذي تقيسه تلك المفردات بطريقة الارتباط الثنائي الأصيل كالتالي :
جدول يوضح معامل ارتباط (سيبرمان ) لمفردات أحد الاختبارات
رقم المفردة    الارتباط    الدلالة الإحصائية
معامل الارتباط    مستوى الدلالة
1    0.24    0.02    (دالة)
8    0.11    0.13    غير دالة
بفي الجدول السابق يتم حذف المفردة رقم 8 من الاختبار لأنها لا ترتبط ببقية المفردات , أما المفردة رقم 1 فيتم الإبقاء عليها لارتباطها ببقية مفردات الاختبار .
ب) ثبات المفردات :
يعتمد ثبات الاختبار اعتمادا مباشرا على ثبات مفرداته . كما اعتمد صدقه صدق مفرداته , ويمكن حساب ثبات مفردات الاختبار باستخدام طريقة الاحتمال المتوالي لأنها الطريقة التي تصلح لحساب ثبات المفردات التي تعتمد إجاباتها على اختيار إجابة واحدة من إجابتين أو من عدة إجابات محتملة وذلك باستخدام المعادلة الآتية :
معامل الثبات =   (ل –  )2
حيث يدل الرمز (ن) على عدد الاحتمالات الاختيارية للسؤال .
ويدل الرمز (ل) على الاحتمال المتوالي أي على أكبر تكرار نسبي لأي احتمال اختياري من الاحتمالات التي يحتوي عليها السؤال .
مثال : لحساب معامل ثبات السؤال الثالث من اختبار الاستماع على سبيل المثال على فرض أن الاختبار طبق على ثمانين طالبا فيكون كالتالي .
شكل يوضح طريقة حساب ثبات المقياس بطريقة الاحتمال المتوالي
الاحتمالات الاختيارية    تكرار الاستجابات    التكرار النسبي
أ
ب
جـ
د    10
11
48
11    0.125
0.138
0.6
0.138
المجموع    80    1.000
وهكذا نجد أن الاحتمال المنوالي لمثالنا هذا يساوي 0.6 لأنه أعلى تكرار نسبي
ل = 0.6
عدد الاحتمالات الاختبارية في المقياس يساوي 4 (أ , ب , ج , د)  .
ن = 4
معامل الثبات =   (0.6 –  )2
معامل الثبات =   (0.6 – 0.25)2
=    × (0.35)2 = 0.47
وللكشف عن الدلالة الإحصائية لمعامل الثبات لهذه المفردة يكشف عن الدلالة الإحصائية للفروق (0.6- 0.25)2 وفق الخطوات التالية :
1- تحسب قيمة ل1 ,ل2 كما يلي
ل1= جـ 1 –   , ل2 =2جـ 1 –
حيث (ب) النسبة الأولى وهي في هذا المثال (0.6 ) ,جـ النسبة الثابتة أو القيمة الثابتة وهي في هذا المثال (0.25) .
ل1= 2جـ 1 –  = 1.772
ل2 = 2جـ 1 –   = 1.047
2- تحسب قيمة هـ س كما يلي :
هـ س = ل1 – ل2
=  10772-  1.047- 0.725
3-    يكشف عن قيمة (هـ س) من الجدول تحت مستوى دلالة عدد بدلالة عدد الأفراد (ن) للنسبة الأولى , وفي هذا المثال نجد أن (ن) = 80
هـ س عند 0.01= 0.407
4-    تحسب قيمة هـ ص كما يلي
هـ ص = هـ جـ
= 0.407 ×0.50 = 0.204
5-     تقارن قيمة (هـ س ) بقيمة (هـ ص )
فإذا كان هـ س > هص كان الفرق بين النسبتين دال إحصائيا  .
    معامل ثبات المفردة دال إحصائيا
    هـ س = 0.725
    هـ ص=0.204
    هـ س >هـ ص
    الفرق بين النسبتين دال إحصائيا تحت مستوى دلالة 0.01 .
    معامل ثبات المفردة دال إحصائيا .
وهكذا يتم حساب بقية مفردات الاختبار .
جـ) الاتساق الداخلي للاختبارات الفرعية :
لحساب الاتساق الداخلي بين الاختبارات الفرعية المكونة للمقياس الكلي , يتم حساب معامل الارتباط بين درجات كل اختبار فرعي والمجموع الكلي لدرجات المقياس .
ويمكن وصفها في جدول كالتالي :
جدول يوضح الاتساق الداخلي للاختبارات الفرعية بالمقياس
الاختبارات الفرعية     معامل الارتباط بين الاختبار الفرعي والمقياس الكلي     مستوى الدلالة     الدلالة الإحصائية
1-    اختبار الاستماع
2-    اختبار الكتابة والتركيبات النحوية
3-    اختبار القراءة والمفردات .
5)    ثبات المقياس :
تعتمد صحة المقياس على مدى ثبات نتائجه , وصدقها 27 فالمقياس الثابت يعطي نفس النتائج إذا قاس نفس الشيء مرات متتالية تحت نفس الظروف وتعتمد جميع طرق حساب ثبات الاختبارات اعتمادا مباشرا على فكرة معاملات الارتباط , فيمكن تطبيق المقياس مرة أخرى في حساب معامل الارتباط في التطبيق الأول بالثاني وهو ما يسمى إعادة التطبيق . كما يمكن إيجاد الثبات أيضا …….. النصفية واستخدام معامل سيبرمان براون المتساوي أو غير المتساوي أو معادلة جوتمان للتجزئة النصفية .
وقد ذكر ديفز Davis أن معامل الثبات 0.75 غير كاف (30: 237) في حين اعتبر مانال Mannall نسبة الـ 0.75 كحد أدنى للحكم على ثبات الاختبار (75: 1975 ).

6)    صدق المقياس :
يعرف جوليان Julian الصدق بأنه عملية فحص دقة التنبؤ أو الاستدلال الذي يتم عن طريق درجة الاختبار . والاختبار الصادق يقيس ما وضع لقياسه , وهناك نوعان من الصدق (87: 156).
‌أ-    الصدق الوصفي : ويعتمد على الدراسة التمهيدية للاختبار لمعرفة مدى صلاحيته للتجربة .
‌ب-    الصدق الإحصائي : ويعتمد على تحليل النتائج للاختبار بعد تجربته .
ولحساب صدق المقياس فيتم عرض المقياس على مجموعة من المحكمين المتخصصين في مجال تعليم اللغة العربية للأجانب فإذا حظي المقياس على قبول المحكمين فعندئذ يمكن القول أن المقياس يتمتع بالصدق الوصفي أو ما يسمى بصدق المحتوى .
أما صدق الإحصائي فيتم بعدة طرق منها :

أ‌)    الصدق الذاتي :
والصدق الذاتي هو صدق الدرجات التجريبية للاختبار بالنسبة للدرجات الحقيقية التي خلصت من شوائب أخطاء القياس وبذلك تصبح الدرجات الحقيقية ولحساب ذلك نفترض أن لدينا الجدول التالي .

جدول يوضح طريقة حساب صدق المقياس بطريقة المقارنة الطرفية
فئــات الدرجات     منتصف الفئة     تكرار المستوى الميزاني الضعيف
تكرار المستوى الميزاني الضعيف
×منتصفات الفئات    تكرار المستوى
الميزاني
القوى    تكرار المستوى
الميزاني
القوى× منتصفات الفئات
89-86
85-82
81-78
77-74
73-70
69-66
65-62
61-58
57-54
53-50
49-46    87.5
83.5
79.5
75.571
50
67.5
63.5
59.5
55.5
51.5
47.5    صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
14
13    صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
771
617.5    1
2
3
2
7
4
5
10
صفر
صفر
صفر    87.5
167
238.5
75.5
357.5
270
381
397.5
555
صفر
صفر
5:42
41:38    43.5
39.5    9
3    398.5
118.5    صفر
صفر    صفر
صفر
مج=39    مج=1848.5
م1=1848.5
39
= 47.38
ع1=4.16    مج=41    مج=
2429.5
م2=2429
41
=59.26
ع2= 9.08
ومن الجدول السابق يتضح ما يلي :
–    متوسط درجات أفراد المستوى الميزاني الضعيف = 47.38
–    متوسط درجات أفراد المستوى الميزاني القوي = 59.26
ولحساب الدلالة الإحصائية للفرق القائم بين هذين المتوسطين نحسب أولا الخطأ المعياري لكل متوسط وذلك بحساب الانحراف المعياري لدرجات كل مستوى من هذين المستويين , ثم نستعين على حساب الفرق بالنسبة الحرجة عن طريق المعادلة التالية :
النسبة الحرجة =
وتحسب الأخطاء المعيارية للمتوسطات من المعادلات التالية :
ع م1 =              ع م2 =
الانحراف المعياري لدرجات المستوى الضعيف ع1 = 4.16
الخطأ المعياري لمتوسط درجات هذا المستوى  =   =0.67
الخطأ المعياري لمتوسط درجات المستوى الميزاني القوي ع2 = 9.08
الخطأ المعياري لمتوسط درجات هذا المستوى  =   =1.42
59.26- 47.38

(0.67)2 +(1.42)2

النسبة المخرجة  =

هذه النسبة تزيد على 2.58 درجة معيارية أو على 3درجات معيارية .
الفرق القائم بين المتوسطين له دلالة إحصائية أكيدة ولا يرجع إلى الصدفة .
أي أن درجات المقياس تميز تميزا واضحا بين المستويات الضعيفة والقوية للميزان ويمكن القول بناء على ذلك أن المقياس يتمتع بنسبة صدق عالية .

6-    حساب معاملات سهولة المقياس :
يذكر فؤاد البهي أن الأبحاث بدأت تشير إلى ضرورة التوصل إلى معامل إحصائي دقيق لقياس سهولة الاختبارات , وخاصة أن التكوين التكاملي لبعض الاختبارات قد يرجع في جوهره إلى مستويات صعوبتها (30 : 242 نقلا عن فؤاد البهي ) .
ويمكن حساب هذا المعامل بقسيمة مجموع الدرجات التي حصل عليها الأفراد في اختبار ما على المجموع الكلي للدرجات باعتبار أن جميع الأفراد حصلوا أيضا على النهاية العظمى للاختبار .
فإذا كان لدينا مقياس مكون من ثلاثة اختبارات تتكون جميعها من 100 مفردة مقسمة كما يأتي :
    اختبار الاستماع 30 مفردة .
    اختبار الكتابة والتركيبات النحوية 35 مفردة .
    اختبار القراءة والمفردات 35 مفردة .
ولكل مفردة من المفردات السابقة درجة واحدة ترصد للطالب إذا أجاب عليها إجابة صحيحة , صفر إذا أخطأ في الإجابة عليها , فيمكن حساب معامل سهولة لاختبارات
الثلاث , ثم جمعها وقسمتها على 3 ( عدد الاختبارات ) للحصول على معامل سهولة المقياس الكلي كما يوضحه الجدول التالي على افتراض أن الاختبارات طبقت على عينة مكونة من 80 فردا .
جدول يوضح معاملات سهولة المقياس :
الاختبارات الفرعية     مجموع الدرجات التي حصل عليها الطلاب     مجموع درجات الاختبار      معامل السهولة
اختبار الاستماع     1222    2400    0.51
الكتابة والتركيبات النحوية     1711    2800    0.61
القراءة والمفردات     1555    2800    0.55
المقياس الكلي     4488    8000    0.56
ومن الجدول السابق يتضح أن أعلى معامل سهولة هو61ر يليه 56ر ثم 55ر يليه 51ر .
أي أن أصعب الاختبارات هو اختبار الاستماع يليه اختبار القراءة والمفردات يليه اختبار الكتابة والتركيبات النحوية , كما يتضح من الجدول أن المقياس الكلى بلغ معامل سهولته 56ر أي معامل الصعوبة 44ر  .
المقياس الحالي سهولته أعلى من المتوسط .
7) معايير الآداء اللغوي على المقياس :
اتخذت بعض اختبارات الكفاءة اللغوية في اللغة الإنجليزية كلغة أجنبية مثل اختبارات الــ ELTS  واختبارات الـــ TOEFL معايير للأداء , وتراوحت في اختبارات الــ ELTS بين 9 درجات كحد أعلى ودرجه واحده كحد أدنى , أما في اختبارات الــ TOEFL فقد تراوحت المعايير بين 900 درجة و 100 درجة , واتخذت تلك الاختبارات وصفا دقيقا لكل م درجات الأداء اللغوي . فعلى سبيل المثال اتخذت الــ ELTS المعايير الآتية :

جدول يوضح معايير الأداء اللغوي على اختبارات ELTS .
الدرجة    وصف الأداء اللغوي
9

8

7

6

5

4

3
خبير في الاستخدام اللغوي , ومستعد تماما للقيام بالأداء اللغوي الدقيق والمطابق للمواقف اللغوية مع الطلاقة والفهم في استخدام اللغة
الاستخدام اللغوي جيدا جدا , ومستعد تماما للقيام بالأداء اللغوي , ولكن في بعض الأحيان يكون الأداء غير مطابق للمواقف اللغوية بدرجة بسيطة جداً , مع إمكانية عدم فهم بعض المواقف اللغوية غير المألوفة .
الاستخدام اللغوي جيد , ويكون المتعلم مستعدا للقيام بالأداء اللغوي الدقيق , ولكن في بعض الأحيان يكون الأداء اللغوي غير مناسب للمواقف اللغوية , وفي أحيان أخرى يكون هناك عدم فهم لبعض المواقف اللغوية غير المألوفة .
الاستخدام اللغوي متقن ( كفء) , وبوجه عام يكون المتعلم مجيدا للغة ,ولكن أحيانا يكون هناك عدم فهم وضعف في الطلاقة اللغوية في مواقف الاتصال .
الاستخدام اللغوي متوسط , ويكون الأداء اللغوي غير كامل , ويستطيع المتعلم فهم ” المعنى الكلى” في معظم المواقف اللغوية , ولكن هناك عدم فهم وضعف في الطلاقة اللغوية في مواقف الاتصال .
الاستخدام اللغوي محدود , والكفاءة الوظيفية الأساسية محدودة بالنسبة للمواقف اللغوية المألوفة , ولكن يمكن أن يكون هناك اتصال فيما يختص بالمشكلات الشائعة الاستخدام .
الاستخدام اللغوي محدود جدا , ويكون المتعلم تحت مستوى الكفاءة الوظيفية ومع ذلك يمكنه إيصال المعنى العام , ويفهم بعض المواقف البسيطة , ويكون هناك تكرار وتقطع أثناء عملية الاتصال .
الاستخدام اللغوي متقطع وغير متواصل , وليس هناك احتمال للاتصال ولكن يستطيع المتعلم فهم بعض الكلمات المفردة وإيصالها للآخرين مع بعض القطع البسيطة .
غير مستخدم للغة وغير قادرعلى استخدامها ولا يستطيع البرهنة على الكفاءة اللغوي
ويمكن حساب معايير الأداء على الاختبار المقترح بمقارنته بالاختبارات الأخرى عن طريق استخدام المتوسط العام للمقياس والانحراف المعياري , وبذلك يمكن التوصل إلى معايير أداء المقياس . فلو فرض أن المقياس الذي قمنا ببنائه متوسطه العام هو 30ر56 درجة
والانحراف المعياري = 64ر11 فإن معايير الأداء يمكن أن تكون كالتالي : (على اعتبار أن الدرجة الهائية على المقياس 100 درجة ) .
الدرجة     وصف الأداء اللغوي
100

89

78

67

56

45

23

12فأقل    خبير الاستخدام اللغوي , ومستعد للقيام بالأداء اللغوي الدقيق والمطابق للمواقف اللغوية مع الطلاقة في الفهم واستخدام اللغة العربية .
الاستخدام اللغوي جيدا جدا , ويكون المتعلم مستعدا للقيام بالأداء اللغوي مع عدم فهم بعض المواقف اللغوية غير المألوفة بدرجة بسيطة جدا .
الاستخدام اللغوي جيد , ويكون المتعلم مستعدا للقيام بالأداء اللغوي الدقيق مع عدم فهم بعض المواقف غير المألوفة وبعض المواقف الاتصالية .
الاستخدام اللغوي متقن مع وجود ضعف في الطلاقة اللغوية في بعض مواقف الاتصال .
الاستخدام اللغوي متوسط , ويكون الأداء اللغوي غير كامل , ولكن يستطيع المتعلم فهم المواقف اللغوية العامة , مع ضعف في الطلاقة اللغوية .
الاستخدام اللغوي محدود بالنسبة للمواقف اللغوية المألوفة , ويستطيع المتعلم التعبير عن الاحتياجات الشائعة الاستخدام .
الاستخدام اللغوي غير متواصل , واحتمال عدم الاتصال مع معرفة المتعلم لبعض الكلمات المغردة والقدرة على إيصالها للآخرين .
غير مستخدم اللغة , وغير قادر على استخدامها .

نحو بناء اختبار للكفاءة اللغوية في اللغة العربية للناطقين بغيرها
إعداد
أ.د/محمد عبد الرؤف الشيخ
أستاذ مناهج وطرق تعليم اللغة العربية للناطقين بغيرها
رئيس قسم المناهج وعميد كلية التربية جامعة طنطا السابق

نحو بناء اختبار للكفاءة اللغوية في اللغة العربية للناطقين بغيرها
إعداد
أ.د/محمد عبد الرؤف الشيخ
أستاذ مناهج وطرق تعليم اللغة العربية للناطقين بغيرها
رئيس قسم المناهج وعميد كلية التربية جامعة طنطا السابق
تعرض الورقة الحالية لكيفية بناء اختبارات الكفاءة اللغوية والخطوات التي يجب إتباعها عند بناء هذه الاختبارات .وقبل عرض تلك الخطوات تعرض الورقة لأنواع الاختبارات اللغوية  حتى يمكن التفريق بين تلك الأنواع وبيان موقع اختبارات الكفاءة منها.
ففي كل الأنظمة التعليمية تلعب الاختبارات دورا مهما وضروريا فالبعض منها تعبر عن الأهداف  التربوية من خلال الاختبارات ومن ثم نضع البرامج والمواد التعليمية , والبعض الآخر يركز على المواد التعليمية أو البرامج أولا ثم يكون هذا مدخلا لإيجاد نماذج تقويمية , وبين هذين النظامين نظام ثالث حيث توازي عملية بناء البرامج – الخطوط العامة للبرامج – مع بناء الاختبارات .
لعل السؤال الذي يطرح نفسه الآن هو :
•    كيف نتحقق من اكتساب المتعلمين لمهارات اللغة العربية ؟
والإجابة على هذا السؤال بالطبع هي تقويم أداء الطالب لتلك المهارات بأداة صادقة وثابتة وموضوعية وهي الاختبارات الموضوعية , وبالتالي فلابد من عرض اختبارات اللغة العربية وكيفية تقويم مهاراتها , ذلك لأن عملية الاختبار عملية صعبة وحساسة جدا وتحتاج إلى إعداد جيد , فضلا عن ذلك فإن التقويم عنصر مهم من عناصر المنهج لأنه يوقفنا على أوجه القصور والنقص , ومن ثم يتم إعداد البرامج وتطويرها في ضوء ما أسفرت عنه نتيجة التقويم , كما يوقفنا التقويم أيضا على مدى تحقق الأهداف التربوية التي نريد تحقيقها .
وهناك خمسة مستويات للمهارات اللغوية الأربع (الاستماع ,القراءة,الكتابة , التحدث ) هذه المستويات .
هي الأصوات , المفردات , السياق , القواعد , والتركيبات , وأخيرا معدل السرعة والطلاقة . ولذلك هناك مدخلان لاعداد الاختبارات هما :
1-    اختبارات المهارات المنفصلة .
2-اختبار المهارات المتكاملة .واختبارات الكفاءة يناسبها هذا المدخل.
وتتعدد أنواع الاختبارات اللغوية وذلك على النحو التالي:
‌أ –    اختبارات الاستعداد اللغوي : الاستعداد اللغوي هو مقدرة المتعلم أو قابليته لتعلم لغة ما أو اكتساب أنواع من المعلومات أو المهارات أو الكفايات اللغوية اللازمة لمهمة ما مرتبطة بالنمو اللغوي أو تعتمد على القدرة اللغوية.
‌ب –    اختبارات الاتجاهات والميول نحو تكلم اللغة العربية : الاتجاه اللغوي هو حالة من الاستعداد لدى الفرد تدفعه إلى تعلم اللغة وما يحيط بها من ظروف , مثل اتجاه المتعلم نحو معلم اللغة العربية , وحصته اللغة العربية وبرامج تعلم اللغة العربية وغيرها مما يرتبط باللغة العربية وأهميتها .
‌ج –    اختبارات الذكاء اللغوي : بظهور نظرية الذكاء المتعدد لجاروز والتي قسم فيها الذكاء إلى سبعة أنواع مثل الذكاء المكاني والذكاء الاجتماعي والذكاء الحركي  ومنها الذكاء اللغوي ،أصبح الذكاء اللغوي سمة مستقلة تختص باللغة , وهي قدرة الفرد مع استخدام اللغة استخداما خاصا يختلف عن غيره من الناس . فبعض الناس لديه القدرة على استخدام الألفاظ اللغوية بطريقة معينة تتسم بالوزن والقافية مكونا  منها شعرا مقفى . وبعضهم يستخدم نفس الألفاظ ولكن بطريقة أخرى فيها أحداث وزمان ومكان وعقدة وصل مكونا منها قصة نثرية , وهناك آخرون يستخدمون نفس الألفاظ ولكن بترتيب آخر على هيئة حوار وصراع.
‌د –    الاختبارات التحصيلية: وهي تقيس مدى ما حصله الطالب في برنامج تعليمي معين،فهي مرتبطة بمنهج وبرنامج محدد، وغالبا ما يحفظ الطلاب هذا البرنامج للنجاح في اختيار التحصيل وكثيرا ما يفشل في الآداء اللغوي في المواقف الحياتية.
‌ه –    اختبارات التقدم: وهي تقيس مدى تقدم الطالب في دراسة برنامج معين.
‌و –    اختبارات الكفاءة اللغوية: وهي أهم تلك الاختبارات ،وتقيس المهارات اللازمة للتمكن من الآداء اللغوي تحدث واستماعا وقراءة وكتابة وفق قواعد الصحة اللغوية والأساليب البلاغية،دون التقيد ببرنامج تعليمي محدد،مثل اختبارات “التويفل” واختبارات ال”IGSCE ” الانجليزية العالمية.
وسوف نقتصر في الورقة الحالية على هذا النوع من الاختبارات،ونوضح خطوات بنائها على النحو التالي:
خطوات بناء اختبارات الكفاءة اللغوية فب اللغة العربية للناطقين بغيرها:
أولا: تخطيط الاختيار
ثانيا: مفردات الاختيار والتعليمات  .
ثالثا: مراجعة مادة الاختبار .
رابعا:عرض الاختبار على المحكمين .
خامسا: إجراء الاختبار القبلي وتحليل نتائجه .
سادسا: تركيب الصورة النهائية للاختبار .
سابعا: إصدار الاختبار في صورته النهائية .
ثامنا: تطبيق الاختبار وتحليل النتائج .
اولا : تخطيط التيار:-
الاختبار الفعال يتطلب تخطيطا واعيا. والخطوات التالية تبين طريقة إعداد تخطيط الاختبار بالنسبة لاختبار الكفاءة العامة كما ذكرتها كتب بناء الاختبارات في اللغات الأجنبية
الخطوة الأولى  :  تحديد موضوعات البرنامج العام.
في إعداد اختبارات التحصيل ربما يؤسس واضع الاختبار أهداف الاختبار مباشرة على البرنامج , هذه الأهداف يكون قد وضعها المدرس أو القسم الذي يتبعه وفي بعض الأحوال الأخرى يكون الأهداف متصدق طرق ومواد البرنامج أما في الاختبارات الكفاءة العامة فان واضع الاختبار يؤسس أهداف الاختبار على الأهداف العامة .
الخطوة الثانية : تقسيم الاهداف العامة الي مكوناتها :-
فالأهداف التي حددناها في الخطوة الأولي واسعة جدا وتتسم بالعمومية , ولذلك فعلينا أن تقسمها إلي مكوناتها النوعية , ثم نحدد أي من تلك المكونات تقييمها في الاختبار النهائي (الاستماع , القراءة , الكلام , الكتابة) ومستويات تلك المهارات وهي الأصوات , والمفردات , والسياق , والقواعد , ومعدل السرعة والطلاقة , ونركز القول هنا على اختبارات المدخل التكاملي لبناء الاختبارات , حيث أن مستوى معدل السرعة والطلاقة هو أعلى مستويات الأداء وبالتالي فهو يتضمن المستويات الأخرى وهى الأصوات والمفردات والسياق والقواعد .
الخطوة الثالثة : عمل التصميم العام للاختبار :
في الخطوتين السابقتين وضعنا الأهداف العامة والمهارات بمكوناتها الفرعية بتفصيلات كافية ويمكننا ذلك من أن نقرر التصميم العام الاختبار النهائي وفي هذه الخطوة هناك عاملان في غاية الأهمية يجب وضعهما في الاعتبار وهما :
أ‌)    الوقت المعد للاختبار .
ب‌)    درجة السرعة التي نود وضعها في الاختبار .
ولنفترض ساعتين كحد أقصى كموعد للاختبار النهائي , ففي الـ 20 دقيقة يجب أن تحتفظ بعشر دقائق على الأقل الإجراء التطبيق وتنظيم التلاميذ في صفوف وتوزيع مواد الاختبار التعليمات العامة , وجمع الاختبار بعد التطبيق , وبذلك نكون قد تركنا 110 دقيقة للاختبار الحقيقي فسرعة الأداء جانب مهم وأكيد في الاختبارات الكفاءة اللغوية .
ويمكن أن يخصص أربعة أجزاء للاختبار , جزء لاختبار الاستماع , وجزء لاختبار التركيبات النحوية , وجزء للمفردات والقراءة , وجزء لاختبار التحدث , ثم يلي ذلك تحديد نوع وعدد المفردات الخاصة بكل الاختبار مع الأخذ في الاعتبار الزمن المخصص للاختبار ككل ومن ثم يتكون الاختبار من أربعة أقسام هي :
    القسم الأول : لاختبار الاستماع .
    القسم الثاني : لاختبار الكفاية والتركيب النحوية .
    القسم الثالث : لاختبار القراءة والمفردات .
    القسم الرابع : لاختبار التحدث .
والشكل التالي يوضح التخطيط العام لبناء الاختبار .
شكل رقم (5) التخطيط العام لبناء الاختبار
القسم     نوع المفردات     عدد المفردات    الوقت المسموح به
1- الاستماع     اختبار من متعد
2- الكتابة والتركيبات النحوية     اختبار من متعد
3- القراءة والمفردات     اختبار من متعد
4- التحدث
أما بالنسبة للمكونات التي يقيسها الاختبار , فالشكل التالي يوضح تلك المكونات .
شكل (6) يوضح المكونات التي يقيسها اختبار الكفاءة
المكونات     الاستماع    الحديث    القراءة    الكتابة
الأصوات    –    –    –    –
المفردات    –    –    –    –
السياق    –    –    –    –
القواعد    –    –    –    –
معدل السرعة والطلاقة     –    –    –    –
والخطوة التالية من تصميم الاختبار هي اختبار المشكلات التي تقوم عليها مفردات الاختبار , وكما ذكرنا من قبل فان محتوي اختبار التحصيل يجب أن يعكس بشكل مباشر محتوي البرنامج , أما اختبار الكفاءة العامة فيجب أن يعكس بشكل مباشر الأهداف العامة من تعليم اللغة المستهدفة , ومن ثم فان الإجراء التالي هو إعداد قائمة بنقاط الاستماع والتركيبات النحوية والكتابية , والمفردات المعجمية التي عولجت في كتب تعليم اللغة العربية كلغة أجنبية وعمل ملاحظات حول المفردات التي تكرر كثيرا وذلك من خلال قوائم المفردات , وتختار المفردات في ضوء المعايير التالية .
1)    المواقف العامة التي تواجه الأجنبي عند استعماله اللغة العربية للاتصال بأبنائها .
2)    القواعد الأساسية اللازمة للأجنبي لكي يتمكن من الاتصال بكفاءة بمتحدثي اللغة العربية .
3)    المفردات التي تمثل اكبر نفعا بالنسبة للمتعلمين والتي تتكرر كثيرا في أحاديثهم وكتاباتهم وقراءاتهم والتي نصت عليها قوائم المفردات .
ثانيا : إعداد مفردات الاختبار والتعليمات :
لإعداد مفردات الاختبار يمكن الاستعانة بمصادر كثيرة لاختبار تلك المفردات في ضوء أهداف تعليم اللغة العربية كلغة أجنبية وهذه المصادر هي :
1) كتب تعليم اللغة العربية كلغة أجنبية ومنها على سبيل المثال :
أ- العربية للناشئين ’ منهج متكامل لغير الناطقين بالعربية (كتاب التلميذ) الجزء حتى الخامس , المملكة العربية السعودية , وزارة المعارف , ط1 , 1403هـ – 1983م .
ب- العربية للناشئين , منهج متكامل لغير الناطقين بالعربية (كتاب المعلم) المملكة العربية السعودية .
ج- الكتاب الأساسي لتعليم العربية لغير الناطقين بها , الجزء الرابع , معهد اللغة العربية , وحدة البحوث والمناهج , جامعة أم القرى . مكة المكرمة , 1406هـ – 1986م .
د- الكتاب الأساسي لتعليم اللغة العربية . تونس , المنطقة العربية للتربية والثقافة والعلوم .
2) قوائم المفردات مثل قائمة :
جامعة أم القرى , معهد اللغة العربية , وحدة البحوث والمناهج , قائمة المفردات الشائعة .
3) المجلات والصحف العربية مثل :
صحيفة الأهرام , الأخبار القاهرية , ومجلة تخر ساعة وروز اليوسف ونصف الدنيا وغيرها .

4) الإذاعات والتليفزيون العربية مثل :
مقتطفات من النشرات الإخبارية , والمسلسلات والمباريات الرياضية وغيرها .
وبعد اختبار المفردات من المصادر السابقة يراعى أن تكون المفردات أكثر من المطلوب للصورة النهائية وذلك لان المراجعة النهائية لتلك المفردات ربما تكشف عن عيوب في بعض المفردات والتي لم يظهر في وقت الكتابة , كما أن بعض المفردات يمكن أن تحذف بعد الاختبار القبلي وذلك لعدم حصولها على النسبة الإحصائية المطلوبة والتي ذكرتها كتب الإحصاء , وحيث انه ليس من الممكن التنبؤ بدقة بعدد المفردات التي ستحذف والتي سنحل محل المفردات بعد الاختبار القبلي , فيقترح في مثل هذه الحالات أن نبدأ بوضع ما لا يقل من 30 : 40 % من للمفردات أكثر مما تتطلبه الصورة النهائية للاختبار .
–    مثال ذلك : إذا كانت الصورة النهائية للاختبار تحتوى على 100 مفردة , فانه من المفيد اختبار 130 – 140 مفردة حتى إذا حذفت مفردات أصبح لدبنا مفردات كافية لبناء ما تم عملة لكل اختبار على حدة .وفيما يلي عرض لكل مهارة من مهارات اللغة العربية وكيفية بناء اختبار لقياس كفاءة الطالب فيها , وسنقتصر هنا على نوع اختبارات من متعدد نظرا لشيوعها وصعوبة إعدادها .
أ) اختبار الاستماع :
يتم ترتيب مفردات الاختبار التي تم جمعها من المصادر السابقة لبناء اختبار السماع بحيث تمثل ثلاثة أجزاء على النحو التالي :
•    الجزء الأول :
ويتكون من مجموعة أسئلة عبارة عن جمل قصيرة هذه الجمل قد تكون جملا خيرية أو جملا استفهامية يتلوها سؤال حول تلك الجملة . وكل من الجملة والسؤال مسجلة على الشريط , أما البدائل الأربعة فمكتوبة في كراسة الأسئلة . وهذا الجزء يقيس فهم المتعلم للجمل القصيرة وهذه الجمل تقيس أيضا فهم المتعلم لكل من السؤال عن الزمن , فهم العبارة , العدد والأسماء المضافة , الوقت , والمقارنة , الأرقام , والحالة التي يكون عليها المتحدث .
يستمع المتعلمون إلى السؤال ثم تترك فترة زمنية كافية لقراءة البدائل من جانب المن\تعلمين تسمى وقفة , ويتم حساب هذه الوقفات عن طريق تطبيق الاختبار في صورته المبدئية على عينة من المتعلمين . ويترك لهم الوقت مفتوحا للإجابة ثم يحسب مجموع الأزمنة التي قضاها المتعلمون وتقسم على عددهم ويكون الناتج هو زمن الوقفة المناسبة .
وقد ذكرت بعض كتب الاختبارات أن فترة 12 ثانية كافية لان يستجيب المتعلم للسؤال , هذا ويراعى في ضبط المواد اللغوية المختارة لاختبار الاستماع ما يلي : –
1) السياق :-
يراعى أن يكون السياق محددا تماما لا أكثر ولا اقل من المطلوب بحيث لا يعطى الطالب دليلا على الإجابة . كما يراعى أن يكون مزيلا للغموض بدرجة كافية , على سبيل المثال : إذا كان السياق عن الطقس ثم سألنا المتعلم عن مقدار درجة الحرارة فانه سيدرك أن النص يتحدث عن الطقس ومن ثم لا نستطيع سؤاله عن مضمون العبارة .
2) طول الفقرات :
ليست هناك فضيلة في استخدام المفردات الطويلة أو حتى المواد الكاملة أو المقال كطول امثل في قطع الفهم , ففي الواقع غالبا ما تكون الفقرات طويلة بدرجة غير معقول وربما تكون اختبارات في ذاكرة أكثر منها اختبارات للفهم , وربما تستخدم الفقرات الطويلة في اختبارات اللغة الأم ولكنها ليست جيدة في اختبارات اللغة الأجنبية . ففي الواقع تكون الفقرات الطويلة مضيعة للوقت لأنها تتطلب تكرار المادة التي تظهر الصعوبات للطلاب , وليس هناك طول أمثلة في قطع الفهم ولكن بوجه عام يجب أن تكون طويلة بدرجة تجعلها تحتوى على المشكلات اللغوية المراد اختبارها .
وعلى ذلك يمكن القول انه يجب في فقرات اختبار الاستماع , ألا تكون طويلة بحيث تكون مضيعة للوقت أو قصيرة بحيث لا تظهر المشكلة اللغوية التي يراد اختبارها , واختيار الفقرات التي يتناسب طولها مع طولها مع المشكلات التي يراد اختبارها .
3) المحتوى :
يراعى في المحتوى ألا يكون مألوفا بالنسبة لبعض المتعلمين بحيث لا يحتاجون إلى سماع المحتوى للإجابة على السؤال لان ذلك يفسد نتائج الاختبار بمعنى أن تكون المتعلمين بالاختبار واحدة .
4) الاختبارات (البدائل) Choices
استخدام البدائل أو الاختبارات في الاختبار اللغة الأجنبية وخاصة فهم الاستماع حساس للغاية وعلى ذلك يراعى أن تكون الاختبارات Choices بسيطة وقصيرة بقدر المستطاع وكذلك متساوية في الطول والقصر حتى لا تكون أحداها مميزة عن الأخرى أو تدل على الإجابة الصحيحة .
5) ترتيبات خاصة للمفردات :
بعض التربويين يرون ضرورة وضع ترتيب خاص من اجل الحصول على معلومات تشخيصية , فيرى انه على الرغم من أن الدرجات التي نحصل عليها من اختبار فهم الاستماع يجب أن تظهر أولا في فهم مهارات الاستماع المتكامل فانه من الممكن أن ترتب مفردات الاختبار بطريقة ما بحيث ترتبط الدرجات بكل عنصر من عناصر اللغة وتسجل الدرجات منفصلة كل عنصر على حدة , وهكذا نستطيع الحصول على درجات جزئية Scores لأجزاء الأصوات , والتشديد والتنغيم والتركيبات النحوية والوحدات المعجمية , وتمكننا من اختبار العنصر أكثر وضوحا , والشكل البسيط للترتيب هو أن تظهر العناصر في شكل دائري بنفس الترتيب داخل كل دائرة (62 : 24) .
فعلي سبيل المثال إذا كانت الدائرة الأولى لهذا الترتيب هي :-
1- الأصوات .    2- التشديد .
3- النبر .    4- التركيبات النحوية .
5- المفردات .
كل الدوائر تأخذ نفس الترتيب وتكون المفردات الخاصة بالأصوات هي 1 , 6 , 11 , 16 , وهكذا المفردات الخاصة بالتشديد هي 2 , 7 , 12 وهكذا . وهذا الترتيب يتطلب أن نعطى كل عنصر من العناصر نفس الوزن في الدرجات الكلية لفهم الاستماع .
على أن البعض الآخر يرى أن الترتيب العشوائي للمفردات يكون أكثر قناعة من النوع السابق .
•    تسجيل الاختبار :
يمكن الاستعانة بعدد من الناطقين باللغة الأصلية : لتسجيل عبارات الاختبار وذلك عن طريق فني متخصص في أعمال التسجيل , ويمكن أن يتم ذلك داخل استديو الجامعة حتى يكون الصوت واضحا والوقفات بين الأسئلة مضبوطة ترتبط الدرجات بكل عناصر اللغة وتسجل الدرجات منفصلة كل عنصر على حدة , وهكذا نستطيع الحصول على درجات جزئية Scores لأجزاء الأصوات , والتشديد والتنغيم والتركيبات النحوية والوحدات المعجمية وتمكننا من اختبار العنصر أكثر وضوحا , والشكل البسيط للترتيب هو أن تظهر العناصر في شكل دائري الترتيب داخل دائرة (62 : 24 ) .
فعلي سبيل المثال إذا كانت الدائرة الأولى لهذا الترتيب هي :-
ب) اختبار الكتابة والتركيبات النحوية :
هناك فرق جوهري بين اختبار النحو التقليدي للمتحدثين الأصليين للغة العربية , واختبار التركيبات النحوية المناسبة للطلاب الأجانب , ذلك لأنه من المفروض أن المتحدث الأصلي للغة يكون متمكنا من النظام النحوي على نحو واسع يمكنه من تبقى الحديث الشكلي غير الرسمي Informal discorerse  فاختبار النحو Grammar Test على الأقل في الجامعات على سبيل المثال يركز في العادة على موضوعات وأساليب مناسبة لأكثر من العربية الرسمية المكتوبة , وعلى الجانب الأخر تكو اختبارات التركيبات النحوية Structure Tests للطلاب الأجانب حسب أغراضهم , وتختبر مدى التحكم في النماذج النحوية الأساسية Basic Grammatical patterns للغة المنطوقة Spoken language وهذه الاختبارات لا تصلح للمتحدثين الأصليين للغة العربية ولكن تصلح فقط للطلاب الأجانب في المستوى المتقدم من تعليم اللغة , كما أنها تكون أفضل أيضا عند استخدامها لاختبارات قدرة الكتابة (62 : 24 ) .
•    ب- 1-  تحديد محتوى الاختبار :-
في الاختبارات التحصيلية يراعى أن تكون الأسئلة مأخوذة من البرنامج الذي درسه الطالب , أما في اختبارات الكفاءة العامة فان عملية اختيار مفردات الاختبار تكون صعبة للغاية , ويرى التربويون أن أفضل مدخل لإعداد مفردات اختبار الكتابة والتركيبات النحوية هو فحص عدد من السياقات المعيارية المعدة للطلاب في نفس مستوى الاختبار المستهدف وعمل قائمة بالتركيبات الاختيارية , كما يمكن أن يستخدم واضح الاختبار حكمه الخاصة وخبرته إذا كان واضع الاختبار مدرسا للغة الأجنبية , وعلى ذلك يمكن لواضع الاختبار القيام بمراجعة كتب تعليم اللغة العربية لغير الناطقين بها وعمل قائمة بالقواعد الأساسية التي تدرس من خلال دروس الكتب المذكورة والمهمة للأجانب والتي تستخدم في الأحاديث اليومية , ويبنى عليها مفردات الاختبار .
•    ب – 2- انواع المفردات :-
هناك أنواع كثيرة لمفردات اختبار الكتاب والتركيب النحوية من نوع الاختيار من متعدد منها اختبارات التكملة والجمل الاختيارية وترجمة الجمل ,وترتيب الكلمات ,وقد سبق الحديث عنها في الفصل السابق وسنخصص الحديث هنا عن مفردات التكملة نظرا لأنها أحد الأنواع الأكثر شيوعا في اختبارات الاختيار من متعدد,كما أنها اقتصادية ويكون أداء الطالب أكثر فعالية عند استخدام هذا النوع . وهذا النوع عبارة عن سياق كلمة محذوفة ومتبوعة بأربعة اختيارات وعلى الطالب أن يختار الإجابة الصحيحة من بين الإجابات الأربع المذكورة في كراسة الأسئلة ( 62 : 24 ) .
ويجب أن يراعى واضع الاختبار  التقاط التالية عند كتابة مفردات
الاختبار :
1) أن يكون الجزء الأول من الجملة استجابة طبيعية للجزء الثاني
2) أن تكون المشتتات DISTRACTOR قاطعة ومحدودة وتبتعد عن الإقليمية أي ألا تكون لهجة إقليم معين بل عامة وللتأكيد من ذلك يتم عرض الإخبار على مجموعة من المتخصصين كما سيتم ذكره .
3) أن تكون لغة المفردات مناسبة لمستوى الطلاب .
4) إلا توحي المشتتات بالإجابة الصحيحة .
5) أن تكون المشتتات متساوية في الطول بقدر المستطاع .
-) اختبار القراءة و المفردات:
يتكون من جزأين :الأول اختبار المفردات. الثاني اختبار الفهم المرائي .
-1) اختبار المفردات :
عملية اختيار المفردات سهلة نسبيا وخاصة في اختبارات التحصيل فيمكن اختيارها من الكتب التي تدرس داخل الفصل مباشر , أما في اختبارات الكفاءة في عملية الاختيار تكون صعبة ومعقدة ومن ثم فيجبان يأخذ واضع الاختبار في اختيار المفردات ما يلي:-
إن تكون من المفردات التي يحتاج إليها الطلاب في الفهم وخاصة في قراءتهم , ففي المستوى  المتقدم ترتبط الكلمات المختارة بالمعجم الخاص بالكلمات المكتوبة ,والكلمات التي يحتاج إليها الطلاب في فهم الصحف والدوريات وكتب الأدب والكتب الدراسية وعلي الرغم من أنه يمكن باستخدام القاموس في اختيار مفردات الاختبار فأنه من المناسب والمفيد استخدام قوائم المفردات المهنية علي أساس تكرار العبارات المعجمية والتي تحدث في عينة حقيقية للغة, ويمكن استخدام قائمة  مكة للمفردات الشائعة إلي جانب بعض الكلمات من الكتب التي تدرس للأجانب كما ذكر من قبل إلي جانب القائمة التي أعدها مكتب التربية العربي لدول الخليج,وقائمة المنظمة العربية للتربية والثقافة والعلوم إدارة التربية عن المفردات  الخاصة SPECIALIZED VOCABULARY وهي المفردات الخاصة بأفراد مهن معينة مثل العلماء والزراعيين أو العمال أو المدرسين……………….الخ نظرا لأن الاختيار يهدف إلي قياس الكفاءة العامة والقدرة علي الاتصال بأبناء العربية
ج-1-2-اختيار نوع مفردات الاختبار:
هناك أنواع كثيرة من المفردات ذكرت في الفصل الساق وهي التحديدات والتكملة أو الشرح,والتفسير والصور ونخصص القول هنا علي نوع الشرح وهو عبارة عن اتحاد بين النوع الأول والثاني وهما التحديدات والتكملة وفي هذا النوع يتم وضع الكلمة في سياق ثم وضع خط تحت تلك الكلمة وإعطاء معان متعددة (أربعة معان) ويطلب من الطالب اختيار المعني المناسب للكلمة الموضوع أسفلها خط, وميزة هذا النوع أنه يختبر المفردات في مواقف لغوية حيةReal life
Situation ويراعى في وضع المفردات ما يأتي :-
1)    التعبير عن المفردات بكلمات بسيطة يمكن فهمها من جانب الطلاب .
2)    أن تكون البدائل في نفس مستوي الصعوبة أي متساوية في صعوبتها
3)    أن تكون متساوية في الطول فلا تكون هناك إجابة تجذب أكثر لأنها تبدو متشابهة للأخرى في نفس السؤال
4)    أن تكون خاليه من المشكلات الهجائية العربية
ج-2) اختبار الفهم القرائي:-
تبنى القراءة حول التركيبات النحوية والعبارات القاموسية (أو السياقية) التي يحتاج إليها المتعلمون عند الاتصال شفوي.(62:-48-51) والشكل العام لا اختبار القراءة هو أن يتكون هذا الاختبار من عدد من القطع الصغيرة لأساليب مختلف للقطع وكل منها متنوع بسلسلة من الاختيار من متعدد لقطع الفهم عن طريق الاختيار الجيد للقطع واختيار المفردات التي تقيس الفهم بعناية, ولا يقتصر في تلك القطع على  اختبار  فهم المتعلم للمعنى السطحي للقطعة ولكن يختبر فهمة أيضا في كشف عرض الكاتب واتجاهاته
ج-2-1-اختيار قطع  الاختبار :SELECTION  OF  EHE  TEST  PASSGES
يمكن اختيار الاختبار من الاختبار من الصحف والمجلات العربية ,بالإضافة إلى كتب تعليم اللغة العربية لغير الناطقين بها ,بالإضافة إلى ما ذكرته  كتب الاختيار في اللغات الأجنبية ,ويراعى في القطع المختارة ما يلي:-
ج-1-1) الطول :
يتم اختيار أنواع مختلفة من المواد يراعى فيها أن تكون مختصره ومحتواها كاف لكي يثمر عن عدد من مفردات الفهم للاختبار القبلي .
ج-1-2) موضوع المادة : Subject matter
يشير الغرض النوعي للاختبار إلى موضوع المادة للقطع المختارة , فعلى سبيل المثال في اختبارات الطلاب الأجانب الذين يريدون الالتحاق بالجامعات الأمريكية , فيجب أن يعكس الاختبار أنواعا مختلفة من المواد القرائية مخصصة للبرامج الجامعية الأساسية وتكون الكتابات عن أخبار مثل السير وتاريخ حياة الإنسانية Geographies  وقطع النثر Prose  والقصص الأسطورية Fiction  ودوائر المعارف والمواد الغير تكتيكية Nontachnical في العلوم الاجتماعية والطبيعية  ( 62 : 60 – 61 )
وفى الاختبارات التي تهدف إلى قياس  الكفاءة الاتصالية للطلاب الأجانب فتشتمل على قطع متعددة في موضوعات عامة ليست متخصصة مثل المشكلة السكانية والمعلومات العامة , كما يراعى أن تكون القطع المقتبسة واضحة وتامة المعنى عندما تؤخذ من السياق , وألا تعكس معلومات خاصة بفئة معينة من الطلاب يكون لديهم ألفة بتلك المواد , وألا تعكس معلومات عالمية لأنه في مثل تلك الحالات يستطيع الطلاب الإجابة على الأسئلة دون أن يعيروا اهتماما للقطعة .

ج-2-1-3) أسلوب ومعالجة المادة : Style and treatment of subject
يجب أن يحتوي الاختبار على أنواع وأساليب مختلفة ويراعى في اختيار الفقرات أن تكون مباشرة وواضحة , وأن تكون مرتبة زمنيا مع سلسلة الأحداث , وأن تفرق أو تقارن بين اثنين من الشخصيات أو الموضوعات أو الأحداث , وتظهر وجهة نظر الكاتب الشخصية .

ج-2-1-4- اللغـــة :-
وتكون اللغة في مستوى لغة الفقرات بألا تكون صعبة جداً بحيث لا يستطيع التلاميذ فهمها , وألا تكون سهلة جداً بحيث تفشل في التفريق بين التلاميذ في المستويات المختلفة من الكفاءة .
ج-2-1-5) مفردات الاختبار :
وعند وضع الأسئلة يراعى واضع الاختبار في المفردات ما يلي :-
–    أن تكون مفرداتها ومعانيها سهلة بقدر الإمكان  لأن المشكلة الحقيقية هي ترجمة القطعة وليس السؤال الذي يسأل عنه .
–    أن تظهر مقدمة السؤال المشكلة – أي أن يكون واضحاً نوع المعلومات المطلوبة .
الإجابة الصحيحة المختارة يجب أن تشارك في ترجمة القطعة وليست مجرد مباراة للكلمات مختارة على نفس الكلمات الموجودة بالقطعة .
– أن يكون من الصعب على المتعلم أن يجيب على السؤال إجابة صحيحة بالمعرفة الخارجية أو الإلمام ببعض الاختبارات لأنها تبدو مع الأخرى .
ج-3- اختيار المشتتات :
يمكن تطبيق الاختبار على مجموعة من الطلاب الذين يدرسون اللغة العربية ويطلب منهم الإجابة على أسئلة المقياس وبدون أن توضع بدائل كإجابات للأسئلة وذلك لاستخدام الإجابات الخاطئة التي يضعها الطلاب كمشتتات لأسئلة المقياس , بالإضافة إلى ذلك يمكن أن يقوم واضع الاختبار بإعداد بعض المشتتات لاستخدامها لنفس الغرض .
ج- 4- كتابة التعليمات :
بعد كتابة مفردات المقياس وتقسيمها على النحو الذي تم توضيحه يصبح من الواجب كتابة التعليمات الخاصة بالمقياس , فالهدف من التعليمات هو السماح للممتحنين أن يبدأوا الإجابة على درجة متساوية من الاستعداد , فإذا كانت لغة التعليمات صعبة أو مربكة , فإن واضع الاختبار لن يتأكد عما إذا كان الأداء الضعيف من جانب المتعلم يشير إلى كفاءة ضعيفة في مساحة المهارات التي تقاس , فإذا كانت التوضيحات أو التفسيرات المعطاة في التعليمات غير وافية بالغرض فإن الاختبار سوف يكون جزءا من اختبارات الذكاء بدلا من اختبارات الكفاءة , كما يؤدي إلى قلب الحقائق ,فربما تحكم على طالب ما بأنه فاشل في حين أنه على العكس من ذلك ( 62 : 102 ) .
ومن أجل ذلك يراعى في كتابة التعليمات أن تكون مختصرة وبسيطة لكي يفهمها الطلاب وخالية من اللبس والغموض , ومزودة بأمثلة للتأكد من أن الطالب حتى ولو كان بطئ التعلم أو قليل المهارة قد فهم نوع المشكلة . ويمكن وضع تعليمات عامة بالنسبة للمقياس ككل مزودة بمثال يوضح نوع المشكلة , ثم تعليمات خاصة بكل اختبار على حدة يوضح المشكلة المطلوب الإجابة عليها .
ثالثا :  مراجعة المفردات :
بعد كتابة المفردات يجب أن توضح جانبا لعدة أيام قبل مراجعتها بواسطة كاتب الاختبار . ولنفترض أنه مطمئن إلى المواد التي وضعها , ولكن يجب أن تعطى على الأقل لأحد الزملاء في نفس الميدان ولديه خبره باللغة لمراجعتها ( 62 : 103 ) . ويطلب منه أن يضع علامة (    ) أمام المفردات التي يكون مقتنعا بها , وكذلك التعليقات حول المفردات التي تكون بها عيوب أو غير مقتنع بها , ثم يقوم بإجراء التعديلات التي يراها واجبة .
وفي ضوء ما سبق يكون المقياس قد أصبح في صورته الأولية وتجرى له حساب الصدق والثبات .
رابعا : عرض المقياس على المحكمين :
يرى ستانلي Stanley ( 87 : 356 ) أن التحكيم يكون ضروريا وذلك لتحديد دقة المحتوى Accuracy of content  والمفردات , كما يجب أن تبنى المفردات بعد نقد وتمحيص من جانب المتخصصين في الموضوع المراد قياسه وعلى ذلك فبعد التصحيحات السابق ذكرها يتم عرض الصورة الأولية للمقياس على خمسة من المحكمين وذلك بهدف :
1-    التأكد من سلامة المفردات والاختيارات .
2-    مناسبة المقياس لطلاب وللمستوى الدراسي الذي يدرسونه .
3-    مناسبة الزمن المتروك بين كل سؤال في اختبار الاستماع .
4-    مستوى صعوبة المفردات والكلمات المستخدمة في القطع والأسئلة .
خامسا : الاختبار القبلي :
الاختبار المقننة تنقسم إلى مواد تختبر قبليا ذلك لكي نقول أن جميع المفردات قد اختبرت على عدد لا بأس به من المفحوصين من نفس نوع المفحوصين الذين يصمم الاختبار من أجلهم , وتكون المفردات التي حصلت على القبول من جانب العمليات الإحصائية هي فقط  التي يجب تضمينها في الصورة النهائية للاختبار , والمفردات التي تحظى بالقبول إحصائيا هي المفردات التي تفي بمطلبين هما :
1)    إذا كانت ذات مستويات مناسبة من الصعوبة . أي ليست جدا ولا سهلة جدا بالنسبة للمجتمع الذي طبق عليه الاختبار .
2)    أذا ميزت بين الطلاب الذين يمتلكون المهارات والقدرات اللغوية التي تقاس بين أولئك الذين يفتقدون تلك المهارات والقدرات .
بالإضافة إلى ما سبق فإنه الاختبار القبلي يعطي مصمم الاختبار الفرصة لاختبار التعليمات وضبط وحساب الوقت الذي يحتاجه الممتحن للإجابة على مفردات الاختبار , فإذا كانت التعليمات غير واضحة بالنسبة للممتحنين , فإن ذلك سوف يلاحظ بالتأكيد في وقت إجراء الاختبار القبلي . وبناء على ذلك توضع التعليمات في الصورة النهائية , فإذا كان عدد كبير من الممتحنين لا يستطيع الإجابة على مفرداتها في الوقت والسرعة المتوقعة فإن مصمم الاختبار يمكنه تقليل المفردات أو تخفيضها أو يزيد الوقت المسموح به في الصورة النهائية للاختبار (62 : 104 ) .
هناك نقطة أخرى مهمة في الدراسة القبلية وهي ضرورة السماح بوقت كاف للجميع لمحاولة الإجابة على كل مفردة من مفردات الاختبار لأنه إذا لم يصل جميع الممتحنين إلى نهاية الاختبار فسوف يكون لدينا معلومات غير كافية عن المفردات الأخيرة في الاختبار القبلي والتي لم يستطع بعض الممتحنين الإجابة عليها ومن ثم فيمكن ترك الوقت مفتوحا لجميع التلاميذ ,ومن ثم يمكن القيام بالإجراءات التالية :
1-    تطبيق الدراسة القبلية على عدد معقول من الطلاب ( 15 – 20 طالب ) , وهذا العدد يعتبر مقبولا بالنسبة للدراسة القبلية حيث ذكرت بعض الدراسات أن الدراسة القبلية يمكن تطبيقها على 2-3 مفحوصين  ( 103 : 100 ) , ومن النادر زيادتها عن عشرين  مفحوصا .
2-    وفي أثناء التطبيقات يترك الوقت مفتوحا لجميع الطلاب ويتم بدء الاختبار في وقت محدد وعندما ينتهي أحد الممتحنين من الإجابة على كل اختبار على حدة يقوم مصمم الاختبار بتسجيل الوقت الذي استغرقه المفحوص , أما في الاختبار الاستماع فيكون الوقت محددا نظرا لأن الاختبار يكون مسجلا والفترة المتروكة بين كل سؤال وآخر حددتها الدراسات العملية وتقدر الاختبارات بحوالي 14ثانية .
وبعد تطبيق الاختبار فبليا تجري الخطوات الآتية :
1-    تحليل المفردات :
بعد جمع كراسات الإجابة يتم تحليل المفردات ونتائج الدراسة القبلية لحساب كل مما يلي تمهيدا لتجميع الصورة النهائية للمقياس وحساب الوقت وتحليل المفردات لحساب كل مما يلي .

1-1    الوقت المخصص للمقياس :
يتم حساب الوقت الذي استغرقه جميع الطلاب , تم حساب متوسط ذلك الوقت بالنسبة لكل اختبار على حدة ثم للمقياس الكلي .
مثال : إذا كان مجموع الأزمنة التي قضاها الطلاب في الإجابة على الاختبار هو 600 دقيقة كان عدد الطلاب 20 طالبا :
فإن زمن الاختبار =     = 30 دقيقة
1-2- فعالية المفردات :
يتم تحليل المفردات لتحديد فعاليتها فيما يتعلق بالنقطتين التاليتين :
1-2-1- تحديد صعوبة المفردات :
أول خطوة هي تحديد مستوى الصعوبة لكل مفردة من مفردات الاختبار , وهناك تكتيكات قد صممت لهذا الغرض وأكثر الطرق اتفاقا وتحظى بالاقتناع هي ببساطة التأكد من النسبة المئوية للعينة التي أجابت على كل مفردة إجابة صحيحة (62 : 105 ) , ومن ثم فيمكن استخدام المعادلة الآتية لحساب معاملات الصعوبة .
عدد الإجابات الخاطئة
عدد الإجابات الصحيحة + الخاطئة

معامل الصعوبة =

ومن ثم نسقط من حساب المفردات الأسئلة التي تركها الطلاب ولم يجيبوا عليها , وقد ذكرت كتب الإحصاء لاختبارات اللغات الأجنبية أن المفردات التي تحصل على نسبة أقل من 30% كمعامل صعوبة لابد أن نحذف من الاختبار ويحل محلها مفردات أخرى . أي أن المفردة التي يجيب عليها أكثر من 70% من العينة يجب حذفها ,  أما المفردات الأخرى التي حصلت على النسبة المطلوبة فتبقى لكي تفي بالمطلب الثاني وهو معامل التميزية Discrimination (62: 105)
ويمكن تفريغ البيانات في جدول كالتالي :
رقم المفرد     عدد الإجابات الصحيحة     عدد الإجابات الخاطئة     عدد الإجابات المتروكة     معامل الصعوبة

1 – 2-2-  تحديد معاملات التميزية للمعلومات :
الخطوة الثانية هي تحديد كيفية تمييز كل مفردة بين التلاميذ ذوي المستويات الرفيعة وذوى المستويات المنخفضة . فيجب أن تساعد كل مفردة من مفردات الاختبار على فصل المتعلمين ذوي الكفاءة العالية عن أولئك الذين لديهم نقص في المهارات أو التعلم . والطريقة العامة لحساب معاملات التميزية للمفردات هي افتراض أن كفاءة الممتحنين في مجموع الاختبار سوف تعطي مؤشر جيداً ومعتدلا عن مستواه في الكفاءة . ومن ثم تشمل الطريقة على تصحيح الاختبار ككل بالنسبة الــ 25 %  من أفراد العينة الحاصلين على أعلى الدرجات , وفصل الـــ 25 %  من أفراد العينة الحاصلين على أقل الدرجات , وتكون المفردات المميزة هي تلك المفردات التي أجيب  عليها إجابة صحيحة من قبل المجموعة العليا ( الحاصلون على أعلى الدرجات ) أكثر من المجموعة السفلى ( الحاصلون على أقل الدرجات ) ( 62 : 105 )
–    ومن ثم يمكن القيام بإجراء الخطوات التالية
–     تصحيح إجابات الطلاب .
–    فصل أعلى 25 % من الإجابات وكذلك أقل 25 % منها .
–    طرح عدد أفراد المجموعة السفلى التي أجابت المفردة الواحدة إجابة صحيحة من عدد أفراد المجموعة العليا التي أجابت على المفردة الواحدة إجابة صحيحة
رقم المفرد     عدد الإجابات الصحيحة في المجموعة العليا      عدد الإجابات الصحيحة في المجموعة السفلى     الفرق بين المجموعتين     معامل التميزية

مثال : لنفترض أن عدد أفراد العينة التي أجرى عليها الاختبار القبلي عشرون تلميذا فمن ثم يتم فصل عدد 5 كراسات في كل من المجموعتين وهي التي تمثل 25 % من أفراد العينة .
ولنفترض أن المفردة رقم (1) لاختبار الاستماع قد أجاب عليها 5 أفراد من المجموعة العليا وثلاثة أفراد من المجموعة السفلى فيكون معامل تمييزية تلك المفردة هو :
=
معامل التمييزية لتلك المفردة = 40 %
ويمكن تفريغ البيانات الخاصة بمعاملات التمييزية في جدول كالتالي :

رقم المفردة    اسم الاختبار
17    التركيبات النحوية
المفردة : أكمل الجملة الآتية بالكلمة المناسبة .
أ- المجدان         ب- المجدين        جـ – المجدون         د- المجدة  .

الاختيارات    المجموعة العليا    المجموعة المتوسطة    المجموعة السفلى    معامل الصعوبة 0.32    معامل التمييزية 0.40
أ
ب
ج
د    4
1
3
–    –
5
2
–    1
2
2

وبعد الانتهاء من حساب معاملات الصعوبة والتمييزية للمفردات يبقى خطوة مهمة وهي بيان فعالية المشتتات Destructors efficiency وهي البدائل الأربعة لكل مفردة الاختبار وهي النقطة التالية :
2-3- حساب فعالية المشتتات :    Destructors efficiency
من الخطوات المهمة في تحليل المفردات من نوع الاختيار من متعدد والمرغوب فيها بدرجه كبيرة هي فحص وظيفية المشتتات بالنسبة لكل مفردة من مفردات الاختبار فإذا كانت المفردة تحتوي على أحد المشتتات الذي لم يجذب أي تلميذ ولا حتى الطالب الضعيف في اختياره كإجابة صحيحة , فإنه يكون غير وظيفي , وبالتالي يزيد من فرص التخمين بالنسبة للمشتتات الثلاثة الباقية , وعلى ذلك فيجب التخلص من مثل هذه المشتتات واستبدالها بأخرى تكون أكثر قرباً للإجابة الصحيحة .
الشكل التالي يوضح طريقة تسجيل بيانات تحليل المفردات .
الاختبار القبلي  اسم الاختبار: إذا كان القياس يحتوي على أكثر من (اختبار) رقم المفردة : 17

المفردة : ( تكتب هنا المفردة ) .
الاختيارات    المجموعة العليا    المجموعة المتوسطة    المجموعة السفلى    معامل الصعوبة
معامل التمييزية
أ
ب
ج
د    4
–    1
0.32
0.40
مثال: لنفترض أننا نقوم بحساب فعالية المشتتات لأحد الاختبارات الذي يحتوي على 20 مفردة  من نوع الاختيار من متعدد وهي المفردة رقم 17 , فيكون حسابها كالتالي :
وبالنظر للشكل السابق نجد أن المفردة رقم ( 17 ) في اختبار التركيبات النحوية على سبيل المثال لم يختر أحد الطلاب المشتت رقم (د) كإجابة صحيحة ومن ثم يصبح أمام  الطلاب ثلاثة بدائل وليس أربعة مما يزيد من فرصة التخمين بالنسبة للبدائل الثلاثة الباقية , وعلى ذلك يقوم مصمم الاختبار بحذف المشتت (د) وهو كلمة ” ( المجدة ) واستبدالها بكلمة أخرى , وهكذا في بقية الاختبارات .
سادسا : جمع الصورة النهائية :
وفي ضوء نتائج تحليل المفردات التي تم شرحها في هذا الفصل يقوم مصمم الاختبار بتجميع الصورة النهائية للمقياس .
هذا ويراعى في جمع الصورة النهائية ما يلي :
1)    أن مكان الإجابة لا يشكل آية نماذج يمكن ملاحظتها , على سبيل المثال إذا كان اختبار الاستماع يتكون من ثلاثين مفردة فمن المفروض أن تكون الإجابات موزعة على البدائل الأربعة ( أ , ب , جــ , د )  بالتساوي فتكون الإجابة الصحيحة ” أ ” مكررة سبع مرات أو ثمان مرات وهكذا بالنسبة للبدائل الثلاثة الباقية فلا توضع الإجابات بشكل يتم اكتشافه
من قبل التلاميذ كأن تكون الإجابة رقم 1 مثلا ( أ ) ورقم 2 (ب ) ورقم 3 (ج) ورقم 4 (د) ثم رقم 5 (أ) وهكذا بل توضع بصورة عشوائية حتى لا تتكشف الإجابات ومن ثم لا تشير الإجابة عن تمكن الطالب من القدرات اللغوية .
2)    أن يعبر كل اختبار عن الوقت الذي تم التوصل إليه لكل اختبار على حدة بالطريقة التي تم شرحها في حساب زمن الاختبارات .
سابعا : كتابة النهائية للاختبار :Reproducing the Test
يقوم مصمم الاختبار بإعادة كتابة الاختبارات تمهيدا لتطبيقه على عينة البحث ويراعى عند كتابة الاختبارات ما يلي :
1-    أن تكون الكتابة واضحة بقدر المستطاع والبنط المستخدم في الكتابة مناسب , وذلك لأن الكتابة الرديئة سوف تؤثر على الطلاب .
2-    أن تكون مواد الاختبار ذات مسافات كافية لتعطي أكبر درجة من الوضوح في القراءة Readability وقد يراعى في ذلك أن تكون الإجابات في عمودين حتى تكون أكثر وضوحا .
3-    عدم كتابة السؤال في صحيفة وبقيته في الصفحة التالية حتى لا يعوق تفكير الطلاب أثناء الإجابة .
4-    كتابة عبارة “بقية الأسئلة على الصفحة التالية ” نهاية الصفحة في كل اختبار حتى يعرف الطلاب أن الاختبار لم ينته وعبارة “نهاية الاختبار ” بعد كل نهاية اختبار لكي يعرف التلاميذ أن الاختبار قد انتهى ولا يستمرون في الإجابة على أسئلة الاختبار التالي .
5-    إذا كان الاختبار يتكون من أجزاء فيقوم المصمم بكتابة تعليمات كل جزء على حدة لتوضيح نوع الإجابة المطلوبة على هذا الجزء .
6-    استخدام غلاف خارجي Cover Sheat  لكراسة الأسئلة لكي تمنع الطلاب من النظر إلى أسئلة الاختبار قبل بدء التطبيق الفعلي له .
7-    كتابة تعليمات الاختبار بحيث توضح ما يلي :
‌أ-    نوع مفردات الاختبار .
‌ب-    تنبيه الطالب أن هناك كراسة إجابة منفصلة إذا كانت هناك كراسة إجابة منفصلة .
‌ج-    طريقة الإجابة على الاختبارات .
‌د-    مثال يوضح كيفية الإجابة على مفردات الاختبارات .
‌ه-    كيفية تغيير إجابة إذا أراد الطالب تغيير إجابته .
‌و-    معلومات تفيد إذا كان هناك عقاب بخصم درجات على استخدام التخمين أم لا.
8-    يتم تدبيس صفحات كراسة الأسئلة معا بإحكام لكي لا تكون الصفحات الأخيرة منفصلة عن بقية الصفحات عند تصفحها من قبل التلاميذ مع مراعاة أن تكون الدبابيس في مكان بحيث تسمح بتصفح الكراسة بسهولة وبمساحة كافية بحيث تقرأ المفردات المجاورة للدبابيس بسهولة .
استخدام كراسة إجابة منفصلة :
ينصح دائما باستخدام كراسة إجابة منفصلة في اختبارات الاختيار من متعدد نظرا لأن استخدام مثل هذه الكراسة في اختبارات الاختيار من متعدد عملية اقتصادية أكثر من كتابة الإجابة في كراسة الأسئلة نفسها ليس فقط لأن كراسة الأسئلة ستستخدم مرة ثانية ولكن أيضا ستوفر وقتا كبيرا في عملية حساب الدرجات ولكي يتلاقى مصمم الاختبار العيوب التي ذكرها كتب الاختبارات عن كراسة الإجابة المنفصلة من أن الطالب ربما لا يفهم كيفية استخدام هذه الكراسة للممتحنين قبل بدء الإجابة , أما فيما يختص بإمكانية أن يفقد الطالب مكان الإجابة في كراسة الإجابة ومن يسجل إجابته على خطوط خافتة فيمكن استخدام الحروف لترقيم الإجابات بدلا من الأرقام وعلى يكون من السهل على الطالب أن يعلم على الإجابة رقم 3 مثلا 3- د بدلا من 3-4 والتي من الممكن في الحالة الأخيرة أن تكتب معكوسة .
بعد إجراء كل ما سبق يصبح المقياس جاهزا للتطبيق ويصبح في صورته النهائية .
ثامنا : تطبيق المقياس وتحليل النتائج :
بعد كتابة الاختبار يصبح الاختبار جاهزا للتطبيق على العينة المستهدفة أو المجتمع الأصلي في حالة التقنين ويتم التطبيق للحصول على الدرجات الخام ومعاملتها إحصائيا للحصول على الدرجات المعيارية لحساب صعوبة المقياس وصدقه وثباته ومعاييره وعلى ذلك فسوف يتناول النقاط التالية .
1-    وصف العينة .
2-    إجراءات تطبيق الاختبار .
3-    تحليل البيانات .
4-    صدق المقياس .
5-    ثبات المقياس .
6-    معايير الأداء اللغوي مع المقياس .
وفيما يلي وصف بتلك الخطوات :
1) وصف العينة :
في ضوء الهدف من المقياس يتم اختبار عينة الدراسة وفق القواعد المتبعة في اختيار العينات سواء أكانت عينة عشوائية أم طبقية أم مقصودة حسب عدد الدارسين والمراكز التعليمية المتوفرة 2 .

2) تطبيق المقياس :
بعد أن يصبح المقياس في صورته النهائية كما تم توضيحه في الخطوات السابقة يقوم مصمم الاختبار بتطبيقه على عينة من الدارسين . وحيث إن التطبيق الصحيح والتام للمقياس هو ذلك التطبيق الذي يسمح لجميع الممتحنين أن يؤدوا الامتحان بأقصى ما تسمح به قدراتهم تحت ظروف مماثلة للجميع ,كما أن التطبيق السهل والمرن للمقياس يعتمد في جزء كبير منه على الإعداد الكامل له فلابد من مراعاة النقاط التالية عند التطبيق .
أ‌)    اختيار حجرة التطبيق :
يجب أن يدار الاختبار في حجرة جيدة الإضاءة وهادئة وتقع في مكان بعيد عن الضوضاء الخارجية , واسعة بحيث توضع المقاعد على مسافات معقولة ويمكن رؤية الطلاب بوضوح , كما يتم تطبيق اختبار الاستماع في معمل اللغات حيث يكون الصوت واضحا وكل تلميذ مستقل عن الآخر كما يراعى ألا يصطحب أي طالب أدوات معه سوى القلم الرصاص والممحاة .
كما يراعى أيضا أن تشتمل حجرة التطبيق على ساعة حائط كبيرة تكون واضحة لجميع التلاميذ وحتى يبدأ جميع التلاميذ في زمن واحد وينتهوا في زمن واحد وإخبار التلاميذ بالوقت المتبقي من آن لآخر .
ب‌)    توزيع مواد المقياس :
بعد جلوس الطلاب في أماكنهم وبعد أن يسود الهدوء الكامل وبمساعدة أحد المدرسين يقوم مصمم الاختبار بتوزيع مواد المقياس وهي كراسة الأسئلة وكراسة الإجابة وأقلام رصاص لمن ليس معهم أقلام وينبه الطلاب إلى عدم فتح كراسات الإجابة أةو الأسئلة إلا بعد إخبارهم بذلك .
جـ ) إرشاد الطلاب بكيفية ملء كراسة الإجابة :
بعد توزيع مواد المقياس يتم شرح كيفية ملء الجزء الخاص بالبيانات الشخصية مثل الاسم والجنس والسن وغيرها . وبعد التأكد من أن جميع الطلاب قد ملأوا بياناتهم وفهموا المطلوب تماما يتم شرح كيفية الإجابة ووضع العلامات في كراسة الإجابة عن طريق شرح الأمثلة التي تم عرضها في مقدمة كل اختبار وكذلك المثال العام الموجود في كراسة الأسئلة , وينصح بالاستماع إلى أسئلة الطلاب والإجابة عليها حتى يتم التأكد من أن الجميع قد فهم كيفية الإجابة على أسئلة المقياس .
د) اعطاء التعليمات :
بعد فهم الطلاب كيفية الإجابة ووضع العلامات في كراسة الإجابة المنفصلة يتم قراءة التعليمات العامة للمقياس ككل بصوت واضح والإجابة على أسئلة الطلاب ثم توضيح المثال المحلول مع مراعاة ألا تشتمل الأمثلة على أسئلة موجود بالمقياس , ويتم تقسيم فترة التطبيق إلى فترتين تشتمل الفترة الأولى على اختبار الاستماع واختبار الكتابة والتركيبات النحوية , ثم فترة راحة حوالي 15 دقيقة ثم الفترة الأخيرة وهي لتطبيق اختبار القراءة والمفردات .
هـ ) إدارة الاختبار (التطبيق ) :
بعد التأكد من أن الطلاب قد فهموا جميع التعليمات يطلب منهم أن يستعدوا للإجابة وأن يلتزموا الهدوء , ثم يطلب منهم البدء في الإجابة , أما في اختبار الاستماع فيطلب منهم وضع السماعات على الأذن والاتصالات جيدا لكي يبدأ تشغيل الشريط . وبعد التأكد من أن الجميع مستعدون يطلب منهم البدء في الإجابة على أسئلة الاختبار .وأثناء إجراء الاختبار يمر مصمم الاختبار بهدوء وسط الطلاب حتى يتأكد من أن الجميع يجيب بالطريقة الصحيحة التي تم شرحها .

و) جمع الاختبار :
بعد انتهاء اختبار الاستماع يطلب من التلاميذ التوقف عن الإجابة على هذا الاختبار والبدء في الإجابة على أسئلة اختبار التركيبات النحوية ,وعندما ينتهي أحد الطلاب من الإجابة قبل الوقت المحدد تؤخذ كراسته ويطلب منه الانصراف والانتظار خارج الحجرة لحين حلول موعد اختبار القراءة . وهكذا حتى ينتهي جميع الطلاب . أما الطلاب الذين لم ينتهوا في الوقت المحدد , فعند انتهاء الوقت يطلب منهم التوقف عن الإجابة وتسليم كراساتهم . وبعد فترة الراحة يتم تطبيق اختبار القراءة وإتباع نفس الإجراءات التي تم شرحها .
ز) تصحيح الإجابات :
بعد الانتهاء من تطبيق المقياس على العينة يقوم مصمم الاختبار بتصحيح الاختبارات مستخدما في ذلك مفتاح التصحيح ويراعى أن توزع الإجابات على البدائل الأربعة بالتساوي   كما سبق توضيحه وينصح باستخدام مفتاح التصحيح من نوع البلاستيك الشفاف يتم تسويد رقم ورقة الإجابة يمكنه مشاهدة العلامات التي قام الطالب بوضعها لتدل على الإجابة الصحيحة فيقوم المصحح بعد الإجابات الصحيحة فقط وتكون هي درجة الطالب على الاختبار , ثم جمع درجات الاختبارات الثلاثة فتكون هي درجة الطالب الكلية على المقياس , ويتم رصد درجات كل طالب على حدة مع ذكر جنسه وجنسيته وسنه وعدد السنوات التي قضاها في تعلم اللغة العربية والمكان الذي درس فيه ونوع اللغة العامية أو الفصحى إذا كانت ستؤخذ كمتغيرات في البحث على الدرجات الخام لأفراد العينة والتي يتم تحليلها ومعالجتها إحصائيا على النحو التالي .
3 – تحليل البيانات :
يقصد بتحليل البيانات هنا تحليل مفردات المقياس وذلك لحساب صعوبة وسهولة تلك المفردات عن طريق حساب متوسطاتها وانحرافاتها المعيارية وتباينها , وكذلك حساب صدق وثبات المفردات وحساب صدق وثبات المقياس ككل .
وهكذا تتأثر عملية اختيار المفردات بمعاملات الصعوبة والصدق والثبات وبالزمن المحدد للاختيار وتباين المفردات وخصائصها الإحصائية ولكل ناحية من هذه النواحي أهميتها في بناء الاختبار النهائي .
ومن أجل ذلك يقوم مصمم الاختبار بالآتي :
‌أ )     حساب صعوبة وسهولة المفردات :
وبعد الحصول على الدرجات الخام وقد تم شرحها سلفا ,يتم حساب المتوسط والانحراف المعياري والتباين للمفردات وذلك لكل مفردة من مفردات المقياس حتى يمكن مقارنة أداء كل مفحوص بالنسبة للمتوسط الكلي للإفراد وعلي نفس المفردة وكذلك المتوسط العام لمجموع الدرجات علي كل اختبار علي حدة وعلي المقياس الكلي وذلك بهدف مقارنة متوسط كل مفحوص بمجموع المفحوصين علي المقياس ، كما يتم حساب النسبة المئوية percentile وذلك بهدف تحويل الدرجات الخام إلي نسب مئوية أو درجات معيارية standard
Scores  من اجل إظهار علي وجه التقريب إلي اي مدى يكون متوسط كل مفحوص بالنسبة للمتوسط فمن المعروف أن الدرجات الخام ذات معني محدود جدا ،فبدون أية معلومات أخري لا نستطيع القول إذا كانت الدرجة الخام علي سبيل المثال 70 من100 درجة يمكن إن تمثل أداء منخفضا أو مرتفعا ، ومن ثم فلابد من أن يكون لدينا عدة طرق لتفسير الدرجات الخام فيما يختص بالأداء العام لعينة البحث .

ويمكن أجراء تحليل بيانات صعوبة وسهولة المفردات في جدول كالتالي :
جدول يوضح تسجيل بيانات صعوبة وسهولة المفردات
رقم المفردة     المتوسط     الوسيط     الانحراف المعياري     التباين

1    0.66    1    0.48    0.23

    مجموع الطلاب 80
    المتوسط 0.66
    الوسيط 1
    الانحراف المعياري 0.48
    التباين 0.23
ففي الجدول السابق كانت العينة التي طبق عليها الاختبار 80 طالبا، وكانت النهاية العظمى للاختبار 30 درجة ،وقام مصمم الاختبار بحساب المتوسط والوسيط والانحراف المعياري لأحدى مفردات الاختبار كما هي موضحة بالجدول السابق . وتعتبر اكبر الأسئلة تمييزا للفروق الفردية بين الطلاب هي التي …………………..هذه القيمة ، وان اقلها تمييزا للفروق الفردية هي الأسئلة الصعبة والأسئلة السهلة ويعتبر التربويون نسبة 0.25صعوبة هو5% من الطلاب الإجابة عليه يعتبر اختبار جيد وكذلك الحال بالنسبة لكل مفردة على حده(معامل السهولة عكس معامل الصعوبة أي أن معامل السهولة : إلى معامل الصعوبة = 1)
    المتوسط
    المتوسط 15
    التباين 2485
وتعتبر أقل الأسئلة تمييز للفروق القائمة بين مستويات النشاط الذي يقيسه الاختبار هي الأسئلة السهلة والأسئلة الصعبة وأن أكبر هذه الأسئلة تمييزا لتلك الفروق هي التي تصل إلى النصف أي 0.5أو تقترب من هذه القيمة حيث إن التباين يدل على مدى اقتراب وابتعاد الفروق الفردية التي يقيسها السؤال ويصل التباين إلى نهايته العظمى عندما يساوي 0.5 وبذلك يصبح معامل الصعوبة مساويا أيضا 0.5 .
فإذا كان التباين بين المفردات يتراوح بين 0.25 , 0.20 أي أن غالبية أسئلة اختبار تدور حول السهولة المتوسطة يصبح هذا الاختبار وسيلة قوية للتمييز الدقيق بين مستويات النشاط الذي يقيسه . وهكذا في بقية الاختبارات .

ب ) حساب التوزيعات التكرارية والنسبة المئوية للدرجات :
يتم حساب التوزيع التكراري والنسب المئوية لدرجات الاختبارات المكونة للمقياس ما بهدف تحويل الدرجات الخام إلى نسب مئوية أو درجات معيارية Standard scores  من أجل إظهار – على وجه التقريب – إلى أي مدى يكون متوسط كل مفحوص بالنسبة للمتوسط (فوق وأقل من المتوسط ) .
فإذا كان الوسيط يساوي المتوسط تقريبا فهذا يعني أن درجات الاختبار تميل إلى التجمع المتطابق Cluster حول النقطة المتوسطة . والعكس صحيح .
وبعد حساب التوزيع التكراري لدرجات كل اختبار على حدة يتم حساب التوزيع التكراري لدرجات المقياس ككل . ويمكن تحليل نتائج هذه الخطوة في جدول كالتالي :

جدول يوضح التوزيع التكراري لدرجات الاختبار
الدرجة    التكرار    النسبة المئوية    التكرار المتجمع
7    1    1.2    1.2
8    2    2.5    3.7

جـ )الاتساق الداخلي للمفردات :
يذكر فؤاد البهي (30: 222) أن المشتغلين بالقياس أدركوا أهمية مفردات المقياس في صياغة وبناء الاختبار النهائي , ومن ثم ازدادت الأبحاث المتصلة بتحليل تلك المفردات حتى أربت على الآلاف , وتطورت بسرعة غريبة لتساير بذلك مطالب ميادين القياس .
وللمفردات أهميتها القصوى في بناء وصياغة الصورة النهائية للاختبار وذلك لاعتماد المقاييس الإحصائية لذلك الاختبار على المقاييس الإحصائية لمفرداته وأجزاءه . وفي مقدور مصمم الاختبار أن يتحكم إلى حد كبير في متوسط الاختبار وانحرافه المعياري وتباينه والتوزيع التكراري لدرجاته وتباينه وصدقه وذلك باختيار الأسئلة أو المفردات اختيار يخضع لمدى الصعوبة المناسبة للمختبرين ويخضع أيضا لمستوى الصدق والثبات المحتمل لذلك الاختبار لضبط الزمن المناسب لكل سؤال وللاختبار كله وللصفات الإحصائية الأخرى للمفردات كتباين السؤال ومعامل تميزه للفروق الفردية القائمة في مستويات القدرة أو النشاط الذي يقاس .
وعلى ذلك فهناك إجراءات مهمة لابد من إجرائها على مفردات الاختبار وهي :
‌أ )     صدق المفردات .
‌ب )     ثبات المفردات .
‌ج )     الاتساق الداخلي للاختبارات الفرعية .
أ ) صدق المفردات :
يعتمد صدق الاختبار اعتمادا مباشرا على صدق مفرداته , وذلك لأن أي زيادة في صدق الاختبار . ويقاس صدق المفردات بحساب معاملات ارتباطها بالميزان , وقد يكون الميزان داخليا أو خارجيا والميزان الداخلي هو الاختبار الذي يشتمل على تلك المفردات , والميزان الخارجي هو الذي نقيس به الاختبار نفسه ويسمى الصدق الداخلي أحيانا بالتجانس الداخلي للاختبار (30:223) , لأنه يقيس مدى تماسك المفردات باختبارها , ويمكن حساب معاملات الارتباط بالميزان الداخلي عن طريق حساب معامل الارتباط بين كل مفردة والاختبار الذي تقيسه تلك المفردات بطريقة الارتباط الثنائي الأصيل كالتالي :
جدول يوضح معامل ارتباط (سيبرمان ) لمفردات أحد الاختبارات
رقم المفردة    الارتباط    الدلالة الإحصائية
معامل الارتباط    مستوى الدلالة
1    0.24    0.02    (دالة)
8    0.11    0.13    غير دالة
بفي الجدول السابق يتم حذف المفردة رقم 8 من الاختبار لأنها لا ترتبط ببقية المفردات , أما المفردة رقم 1 فيتم الإبقاء عليها لارتباطها ببقية مفردات الاختبار .
ب) ثبات المفردات :
يعتمد ثبات الاختبار اعتمادا مباشرا على ثبات مفرداته . كما اعتمد صدقه صدق مفرداته , ويمكن حساب ثبات مفردات الاختبار باستخدام طريقة الاحتمال المتوالي لأنها الطريقة التي تصلح لحساب ثبات المفردات التي تعتمد إجاباتها على اختيار إجابة واحدة من إجابتين أو من عدة إجابات محتملة وذلك باستخدام المعادلة الآتية :
معامل الثبات =   (ل –  )2
حيث يدل الرمز (ن) على عدد الاحتمالات الاختيارية للسؤال .
ويدل الرمز (ل) على الاحتمال المتوالي أي على أكبر تكرار نسبي لأي احتمال اختياري من الاحتمالات التي يحتوي عليها السؤال .
مثال : لحساب معامل ثبات السؤال الثالث من اختبار الاستماع على سبيل المثال على فرض أن الاختبار طبق على ثمانين طالبا فيكون كالتالي .
شكل يوضح طريقة حساب ثبات المقياس بطريقة الاحتمال المتوالي
الاحتمالات الاختيارية    تكرار الاستجابات    التكرار النسبي
أ
ب
جـ
د    10
11
48
11    0.125
0.138
0.6
0.138
المجموع    80    1.000
وهكذا نجد أن الاحتمال المنوالي لمثالنا هذا يساوي 0.6 لأنه أعلى تكرار نسبي
ل = 0.6
عدد الاحتمالات الاختبارية في المقياس يساوي 4 (أ , ب , ج , د)  .
ن = 4
معامل الثبات =   (0.6 –  )2
معامل الثبات =   (0.6 – 0.25)2
=    × (0.35)2 = 0.47
وللكشف عن الدلالة الإحصائية لمعامل الثبات لهذه المفردة يكشف عن الدلالة الإحصائية للفروق (0.6- 0.25)2 وفق الخطوات التالية :
1- تحسب قيمة ل1 ,ل2 كما يلي
ل1= جـ 1 –   , ل2 =2جـ 1 –
حيث (ب) النسبة الأولى وهي في هذا المثال (0.6 ) ,جـ النسبة الثابتة أو القيمة الثابتة وهي في هذا المثال (0.25) .
ل1= 2جـ 1 –  = 1.772
ل2 = 2جـ 1 –   = 1.047
2- تحسب قيمة هـ س كما يلي :
هـ س = ل1 – ل2
=  10772-  1.047- 0.725
3-    يكشف عن قيمة (هـ س) من الجدول تحت مستوى دلالة عدد بدلالة عدد الأفراد (ن) للنسبة الأولى , وفي هذا المثال نجد أن (ن) = 80
هـ س عند 0.01= 0.407
4-    تحسب قيمة هـ ص كما يلي
هـ ص = هـ جـ
= 0.407 ×0.50 = 0.204
5-     تقارن قيمة (هـ س ) بقيمة (هـ ص )
فإذا كان هـ س > هص كان الفرق بين النسبتين دال إحصائيا  .
    معامل ثبات المفردة دال إحصائيا
    هـ س = 0.725
    هـ ص=0.204
    هـ س >هـ ص
    الفرق بين النسبتين دال إحصائيا تحت مستوى دلالة 0.01 .
    معامل ثبات المفردة دال إحصائيا .
وهكذا يتم حساب بقية مفردات الاختبار .
جـ) الاتساق الداخلي للاختبارات الفرعية :
لحساب الاتساق الداخلي بين الاختبارات الفرعية المكونة للمقياس الكلي , يتم حساب معامل الارتباط بين درجات كل اختبار فرعي والمجموع الكلي لدرجات المقياس .
ويمكن وصفها في جدول كالتالي :
جدول يوضح الاتساق الداخلي للاختبارات الفرعية بالمقياس
الاختبارات الفرعية     معامل الارتباط بين الاختبار الفرعي والمقياس الكلي     مستوى الدلالة     الدلالة الإحصائية
1-    اختبار الاستماع
2-    اختبار الكتابة والتركيبات النحوية
3-    اختبار القراءة والمفردات .
5)    ثبات المقياس :
تعتمد صحة المقياس على مدى ثبات نتائجه , وصدقها 27 فالمقياس الثابت يعطي نفس النتائج إذا قاس نفس الشيء مرات متتالية تحت نفس الظروف وتعتمد جميع طرق حساب ثبات الاختبارات اعتمادا مباشرا على فكرة معاملات الارتباط , فيمكن تطبيق المقياس مرة أخرى في حساب معامل الارتباط في التطبيق الأول بالثاني وهو ما يسمى إعادة التطبيق . كما يمكن إيجاد الثبات أيضا …….. النصفية واستخدام معامل سيبرمان براون المتساوي أو غير المتساوي أو معادلة جوتمان للتجزئة النصفية .
وقد ذكر ديفز Davis أن معامل الثبات 0.75 غير كاف (30: 237) في حين اعتبر مانال Mannall نسبة الـ 0.75 كحد أدنى للحكم على ثبات الاختبار (75: 1975 ).

6)    صدق المقياس :
يعرف جوليان Julian الصدق بأنه عملية فحص دقة التنبؤ أو الاستدلال الذي يتم عن طريق درجة الاختبار . والاختبار الصادق يقيس ما وضع لقياسه , وهناك نوعان من الصدق (87: 156).
‌أ-    الصدق الوصفي : ويعتمد على الدراسة التمهيدية للاختبار لمعرفة مدى صلاحيته للتجربة .
‌ب-    الصدق الإحصائي : ويعتمد على تحليل النتائج للاختبار بعد تجربته .
ولحساب صدق المقياس فيتم عرض المقياس على مجموعة من المحكمين المتخصصين في مجال تعليم اللغة العربية للأجانب فإذا حظي المقياس على قبول المحكمين فعندئذ يمكن القول أن المقياس يتمتع بالصدق الوصفي أو ما يسمى بصدق المحتوى .
أما صدق الإحصائي فيتم بعدة طرق منها :

أ‌)    الصدق الذاتي :
والصدق الذاتي هو صدق الدرجات التجريبية للاختبار بالنسبة للدرجات الحقيقية التي خلصت من شوائب أخطاء القياس وبذلك تصبح الدرجات الحقيقية ولحساب ذلك نفترض أن لدينا الجدول التالي .

جدول يوضح طريقة حساب صدق المقياس بطريقة المقارنة الطرفية
فئــات الدرجات     منتصف الفئة     تكرار المستوى الميزاني الضعيف
تكرار المستوى الميزاني الضعيف
×منتصفات الفئات    تكرار المستوى
الميزاني
القوى    تكرار المستوى
الميزاني
القوى× منتصفات الفئات
89-86
85-82
81-78
77-74
73-70
69-66
65-62
61-58
57-54
53-50
49-46    87.5
83.5
79.5
75.571
50
67.5
63.5
59.5
55.5
51.5
47.5    صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
14
13    صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
صفر
771
617.5    1
2
3
2
7
4
5
10
صفر
صفر
صفر    87.5
167
238.5
75.5
357.5
270
381
397.5
555
صفر
صفر
5:42
41:38    43.5
39.5    9
3    398.5
118.5    صفر
صفر    صفر
صفر
مج=39    مج=1848.5
م1=1848.5
39
= 47.38
ع1=4.16    مج=41    مج=
2429.5
م2=2429
41
=59.26
ع2= 9.08
ومن الجدول السابق يتضح ما يلي :
–    متوسط درجات أفراد المستوى الميزاني الضعيف = 47.38
–    متوسط درجات أفراد المستوى الميزاني القوي = 59.26
ولحساب الدلالة الإحصائية للفرق القائم بين هذين المتوسطين نحسب أولا الخطأ المعياري لكل متوسط وذلك بحساب الانحراف المعياري لدرجات كل مستوى من هذين المستويين , ثم نستعين على حساب الفرق بالنسبة الحرجة عن طريق المعادلة التالية :
النسبة الحرجة =
وتحسب الأخطاء المعيارية للمتوسطات من المعادلات التالية :
ع م1 =              ع م2 =
الانحراف المعياري لدرجات المستوى الضعيف ع1 = 4.16
الخطأ المعياري لمتوسط درجات هذا المستوى  =   =0.67
الخطأ المعياري لمتوسط درجات المستوى الميزاني القوي ع2 = 9.08
الخطأ المعياري لمتوسط درجات هذا المستوى  =   =1.42
59.26- 47.38

(0.67)2 +(1.42)2

النسبة المخرجة  =

هذه النسبة تزيد على 2.58 درجة معيارية أو على 3درجات معيارية .
الفرق القائم بين المتوسطين له دلالة إحصائية أكيدة ولا يرجع إلى الصدفة .
أي أن درجات المقياس تميز تميزا واضحا بين المستويات الضعيفة والقوية للميزان ويمكن القول بناء على ذلك أن المقياس يتمتع بنسبة صدق عالية .

6-    حساب معاملات سهولة المقياس :
يذكر فؤاد البهي أن الأبحاث بدأت تشير إلى ضرورة التوصل إلى معامل إحصائي دقيق لقياس سهولة الاختبارات , وخاصة أن التكوين التكاملي لبعض الاختبارات قد يرجع في جوهره إلى مستويات صعوبتها (30 : 242 نقلا عن فؤاد البهي ) .
ويمكن حساب هذا المعامل بقسيمة مجموع الدرجات التي حصل عليها الأفراد في اختبار ما على المجموع الكلي للدرجات باعتبار أن جميع الأفراد حصلوا أيضا على النهاية العظمى للاختبار .
فإذا كان لدينا مقياس مكون من ثلاثة اختبارات تتكون جميعها من 100 مفردة مقسمة كما يأتي :
    اختبار الاستماع 30 مفردة .
    اختبار الكتابة والتركيبات النحوية 35 مفردة .
    اختبار القراءة والمفردات 35 مفردة .
ولكل مفردة من المفردات السابقة درجة واحدة ترصد للطالب إذا أجاب عليها إجابة صحيحة , صفر إذا أخطأ في الإجابة عليها , فيمكن حساب معامل سهولة لاختبارات
الثلاث , ثم جمعها وقسمتها على 3 ( عدد الاختبارات ) للحصول على معامل سهولة المقياس الكلي كما يوضحه الجدول التالي على افتراض أن الاختبارات طبقت على عينة مكونة من 80 فردا .
جدول يوضح معاملات سهولة المقياس :
الاختبارات الفرعية     مجموع الدرجات التي حصل عليها الطلاب     مجموع درجات الاختبار      معامل السهولة
اختبار الاستماع     1222    2400    0.51
الكتابة والتركيبات النحوية     1711    2800    0.61
القراءة والمفردات     1555    2800    0.55
المقياس الكلي     4488    8000    0.56
ومن الجدول السابق يتضح أن أعلى معامل سهولة هو61ر يليه 56ر ثم 55ر يليه 51ر .
أي أن أصعب الاختبارات هو اختبار الاستماع يليه اختبار القراءة والمفردات يليه اختبار الكتابة والتركيبات النحوية , كما يتضح من الجدول أن المقياس الكلى بلغ معامل سهولته 56ر أي معامل الصعوبة 44ر  .
المقياس الحالي سهولته أعلى من المتوسط .
7) معايير الآداء اللغوي على المقياس :
اتخذت بعض اختبارات الكفاءة اللغوية في اللغة الإنجليزية كلغة أجنبية مثل اختبارات الــ ELTS  واختبارات الـــ TOEFL معايير للأداء , وتراوحت في اختبارات الــ ELTS بين 9 درجات كحد أعلى ودرجه واحده كحد أدنى , أما في اختبارات الــ TOEFL فقد تراوحت المعايير بين 900 درجة و 100 درجة , واتخذت تلك الاختبارات وصفا دقيقا لكل م درجات الأداء اللغوي . فعلى سبيل المثال اتخذت الــ ELTS المعايير الآتية :

جدول يوضح معايير الأداء اللغوي على اختبارات ELTS .
الدرجة    وصف الأداء اللغوي
9

8

7

6

5

4

3
خبير في الاستخدام اللغوي , ومستعد تماما للقيام بالأداء اللغوي الدقيق والمطابق للمواقف اللغوية مع الطلاقة والفهم في استخدام اللغة
الاستخدام اللغوي جيدا جدا , ومستعد تماما للقيام بالأداء اللغوي , ولكن في بعض الأحيان يكون الأداء غير مطابق للمواقف اللغوية بدرجة بسيطة جداً , مع إمكانية عدم فهم بعض المواقف اللغوية غير المألوفة .
الاستخدام اللغوي جيد , ويكون المتعلم مستعدا للقيام بالأداء اللغوي الدقيق , ولكن في بعض الأحيان يكون الأداء اللغوي غير مناسب للمواقف اللغوية , وفي أحيان أخرى يكون هناك عدم فهم لبعض المواقف اللغوية غير المألوفة .
الاستخدام اللغوي متقن ( كفء) , وبوجه عام يكون المتعلم مجيدا للغة ,ولكن أحيانا يكون هناك عدم فهم وضعف في الطلاقة اللغوية في مواقف الاتصال .
الاستخدام اللغوي متوسط , ويكون الأداء اللغوي غير كامل , ويستطيع المتعلم فهم ” المعنى الكلى” في معظم المواقف اللغوية , ولكن هناك عدم فهم وضعف في الطلاقة اللغوية في مواقف الاتصال .
الاستخدام اللغوي محدود , والكفاءة الوظيفية الأساسية محدودة بالنسبة للمواقف اللغوية المألوفة , ولكن يمكن أن يكون هناك اتصال فيما يختص بالمشكلات الشائعة الاستخدام .
الاستخدام اللغوي محدود جدا , ويكون المتعلم تحت مستوى الكفاءة الوظيفية ومع ذلك يمكنه إيصال المعنى العام , ويفهم بعض المواقف البسيطة , ويكون هناك تكرار وتقطع أثناء عملية الاتصال .
الاستخدام اللغوي متقطع وغير متواصل , وليس هناك احتمال للاتصال ولكن يستطيع المتعلم فهم بعض الكلمات المفردة وإيصالها للآخرين مع بعض القطع البسيطة .
غير مستخدم للغة وغير قادرعلى استخدامها ولا يستطيع البرهنة على الكفاءة اللغوي
ويمكن حساب معايير الأداء على الاختبار المقترح بمقارنته بالاختبارات الأخرى عن طريق استخدام المتوسط العام للمقياس والانحراف المعياري , وبذلك يمكن التوصل إلى معايير أداء المقياس . فلو فرض أن المقياس الذي قمنا ببنائه متوسطه العام هو 30ر56 درجة
والانحراف المعياري = 64ر11 فإن معايير الأداء يمكن أن تكون كالتالي : (على اعتبار أن الدرجة الهائية على المقياس 100 درجة ) .
الدرجة     وصف الأداء اللغوي
100

89

78

67

56

45

23

12فأقل    خبير الاستخدام اللغوي , ومستعد للقيام بالأداء اللغوي الدقيق والمطابق للمواقف اللغوية مع الطلاقة في الفهم واستخدام اللغة العربية .
الاستخدام اللغوي جيدا جدا , ويكون المتعلم مستعدا للقيام بالأداء اللغوي مع عدم فهم بعض المواقف اللغوية غير المألوفة بدرجة بسيطة جدا .
الاستخدام اللغوي جيد , ويكون المتعلم مستعدا للقيام بالأداء اللغوي الدقيق مع عدم فهم بعض المواقف غير المألوفة وبعض المواقف الاتصالية .
الاستخدام اللغوي متقن مع وجود ضعف في الطلاقة اللغوية في بعض مواقف الاتصال .
الاستخدام اللغوي متوسط , ويكون الأداء اللغوي غير كامل , ولكن يستطيع المتعلم فهم المواقف اللغوية العامة , مع ضعف في الطلاقة اللغوية .
الاستخدام اللغوي محدود بالنسبة للمواقف اللغوية المألوفة , ويستطيع المتعلم التعبير عن الاحتياجات الشائعة الاستخدام .
الاستخدام اللغوي غير متواصل , واحتمال عدم الاتصال مع معرفة المتعلم لبعض الكلمات المغردة والقدرة على إيصالها للآخرين .
غير مستخدم اللغة , وغير قادر على استخدامها .