Taʼlim sohasidagi islohotlar, avvalo, yosh avlodga davr talablariga mos keladigan, shaxsga yoʻnaltirilgan kompetensiyaviy bilimlar berish va ayni vaqtda, mazkur bilimlarni baholashning aniq, obyektiv hamda shaffof shakllarini yoʻlga qoʻyishni nazarda tutadi. Bunda taʼlim muassasalarida joriy bilimlarni baholash tizimini takomillashtirish, uning xolis va haqqoniy boʻlishini taʼminlash, taʼlim sifatini oshirishning muhim omillaridan biridir.
Maktabda olingan bilimlar bahosi bilan oliy taʼlim muassasalariga kirish imtihonida olgan ballarning oʻzaro bogʻliqligini hamda oliy taʼlim muassasalariga qabul imtihonlarining adolatli oʻtishini taʼminlash muhim. Qayd etish joizki, Oʻzbekiston Respublikasi Prezidentining 2017-yil 16-noyabrdagi “Respublika oliy taʼlim muassasalari bakalavriatiga kirish test sinovlarini oʻtkazish tartibini takomillashtirish toʻgʻrisida”gi qaroriga muvofiq, oliy taʼlim muassasalarining bakalavriatiga oʻqishga qabul qilishda test sinovlarini ochiq va oshkora oʻtkazish hamda bilimli yoshlarni oʻqishga kirishini taʼminlash maqsadida Vazirlar Mahkamasining 2018-yil 3-apreldagi 261-son qarori qabul qilindi. Ushbu hujjatda test sinovlarini tashkil qilish va oʻtkazish tartibi belgilab berildi. Test sinovi natijalarini hisoblash va eʼlon qilish Oʻzbekiston Respublikasi taʼlim muassasalariga oʻqishga qabul qilish Davlat komissiyasi tomonidan tasdiqlangan fanlar majmuasiga kiritilgan fanlar ketma-ketligi boʻyicha baholash mezoni (tanlangan mutaxassislik fanlariga koʻra: 3,1; 2,1 va 1,1) asosida amalga oshiriladi. Kelajakda test sinovlari natijalarini hisoblashda zamonaviy test nazariyalarining qoʻllanilishini inobatga olgan holda, test sinovlari natijalarining tahlili Rash modeli orqali amalga oshiriladi.
Shu bilan birga, taʼlim sifatini yaxshilash talabalar bilimini xolis va haqqoniy baholashga bevosita bogʻliq. Bu borada Bilim va malakalarni baholash agentligi Germaniya, Angliya, Yaponiya, AQSH kabi mamlakatlarning tajribalariga tayanilmoqda. Xususan, Amerika Qoʻshma Shtatlarining ETS (Educational Testing Center), Niderlandiyaning Cito (Central Institute of Test Development) va Buyuk Britaniyaning Kembridj (Cambridge Assessment international education) xalqaro baholash tashkilotlari bilan test topshiriqlari bazalarini yaratish, maʼlumotlarni bir joyda saqlash, qayta ishlash va tahlil qilish usullari boʻyicha tajriba almashgani ham bejiz emas. Mazkur davlatlar tajribasida yillar davomida turli xil baholash tizimlari sinovdan oʻtkazilgan va shundan kelib chiqib, yagona standart baholash tizimiga oʻtilgan. Bu baholash tizimida shaffoflikni taʼminlash maqsadida asosiy pedagogik oʻlchov vositasi boʻlgan testdan foydalaniladi. Masalan, Kembridj xalqaro baholash tashkilotida test topshiriqlarini shakllantirish, qayta ishlash va tahlil qilish jarayoni 1-rasmda keltirilgan sxema asosida amalga oshiriladi.
1-rasm. Kembridj xalqaro baholash tashkilotida test topshiriqlarini yaratish boʻyicha shakllangan tizim sxemasi[1]
[1] (Sarah Sharratt, Mathematics Item Writing Writer Training Course At Uzbekistan State Testing Center, 13-24 January, 2021.)
Oʻrganishlar va xalqaro tajribadan kelib chiqib, Bilim va malakalarni baholash agentligida test topshiriqlarini yaratish boʻyicha 2-rasmda koʻrsatilgan tizim shakllantirilgan. Test topshiriqlari keltirilgan sxemaga koʻra, fanlar va taʼlim tillari kesimida fan mutaxassislari tomonidan davlat taʼlim standarti asosida yaratilgan oʻquv dasturlari doirasida shakllantiriladi.
2-rasm. Test topshiriqlarini yaratish boʻyicha shakllangan tizim sxemasi
Mazkur sxemaning har bir bosqichi alohida mustaqil jarayon hisoblanadi. Sinov testlari dastlabki aprobatsiyaga nisbatan pedagogik oʻlchov koʻrsatkichlarining belgilangan maqsad tomon qanday oʻzgarganligini nazorat qilish uchun oʻtkazilishi mumkin. Asosiy maqsad test sinovi natijalari ishonchli va valid boʻlishidir. Shu oʻrinda ishonchlilik va validlik faqat taʼlim muassasalariga oʻqishga kirish testlari natijalariga emas, balki har qanday imtihon natijalariga — talaba va talabgorlarning joriy, oraliq va yakuniy imtihonlariga ham tegishli ekanligini taʼkidlab oʻtish lozim.
Aytish kerakki, test topshiriqlarining sifati va uni olish jarayonining shaffof tashkil qilinishi bilimlarni obyektiv va adolatli baholash uchun yetarli emas. Test natijalarini tahlil qilish va baholashda xalqaro tajribada amalga oshirilgan ilmiy ishlar natijalarini joriy qilish muhim. Shu maqsadda test texnologiyalarini rivojlantirish, pedagogik oʻlchov vositalarini takomillashtirish boʻyicha Bilim va malakalarni baholash agentligida bir qator ishlar amalga oshirilmoqda. Bunga misol tariqasida xom ball (tanlangan mutaxassislik fanlariga koʻra: 3,1; 2,1 va 1,1 ball) bilan baholashdan bosqichma-bosqich haqiqiy ball bilan baholash usuliga (Rash modeli asosida) oʻtilayotganligini, kalibrovkalangan test bazalarining yaratilayotganligini, test topshiriqlarining sifati mutaxassislar tomonidan xalqaro tajriba hamda ilmiy tahlillar asosida qayta koʻzdan kechirilib, mukammallashtirilayotganligini koʻrsatishimiz mumkin.
Bundan tashqari, joriy baholash tizimini takomillashtirish boʻyicha bir qator ijobiy qadamlar tashlandi. Xususan, 2020-yil 17-sentyabr kuni Oʻzbekiston Respublikasi Vazirlar Mahkamasining “Test tizimini takomillashtirishga qaratilgan qoʻshimcha chora-tadbirlar toʻgʻrisida”gi 562-son qarori qabul qilindi. Mazkur meʼyoriy hujjat asosida mamlakatimizda pedagogik oʻlchovlar sohasida yetakchi xalqaro tashkilotlar bilan hamkorlikni yoʻlga qoʻyish, respublikamizda pedagogik oʻlchovlar boʻyicha ilmiy maktab yaratish maqsadida Bilimni baholash agentligi huzurida “Ilmiy-oʻquv amaliy markazi” davlat muassasasi tashkil etildi. Bu taʼlim jarayonida pedagogik oʻlchovlar nazariyasi va amaliyoti talablari asosida bilimlarni baholashda yuzaga kelayotgan muammolarni tadqiq qilish va bartaraf etish zarurati bilan bogʻliq edi.
Test ballari shkalalarini tenglashtirish — har xil test variantlaridan olingan ballarni bitta shkalaga oʻtkazish uchun amalga oshiriladigan statistik jarayondir. Ilmiy adabiyotlarda bu jarayon qisqacha “tenglashtirish” (equating) tarzida keltiriladi. Klassik hamda zamonaviy test nazariyalari yordamida tenglashtirish jarayonini amalga oshirish mumkin. Tenglashtirish “ulash” (linking) degan jarayonga tegishlidir. Ulash deganda, turli xil test natijalarini (istalgan vaqtda turli guruhlarda olingan) bogʻlashni tushunish kerak. Tenglashtirishda qatʼiy talablar qoʻyiladi: har xil testlarda baholash ekvivalentligi, ulanayotgan sinaluvchilar bosh toʻplamining ekvivalentligi, dizayn ekvivalentligi va konstrukt bir xilligi.
Tenglashtirishdan tashqari, “kalibrovkalash” (calibration) va “meʼyorda saqlash” (moderation) ham ulash jarayoniga tegishlidir. Kalibrovkalashda talab quyidagicha: tenglashtirishdagi kabi har xil testlarda bir xil konstrukt joriy qilindi, lekin ularning dizayn yoki qiyinlik darajasi har xil boʻlishi mumkin. Meʼyorda saqlashda har xil konstruktlar oʻlchanadi.
Albatta, ayni bir variantni 2 ta guruh yechganda, qobiliyat darajalari bitta shkalada boʻladi. Lekin 2 ta test topshiruvchiga 30 ta test topshirigʻidan iborat boʻlgan ikki xil qiyinlikdagi, yaʼni biri qiyin va ikkinchisi nisbatan oson boʻlgan test varianti berilsa va har ikkala test topshiruvchi 20 tadan savolga toʻgʻri javob bergan boʻlsa, ularning qobiliyat darajasi bir xil deb xulosa chiqarish mumkinmi? Bunday holatlarni hisobga olish maqsadida zamonaviy test nazariyasida tenglashtirish jarayoni turli xil variantlar yechilganda olingan ballarni bitta shkalaga keltirish orqali amalga oshiriladi. Bunda ikkita test natijasi toʻgʻridan-toʻgʻri taqqoslanishi yoki ikkala variant ham xuddi bitta yaxlit testdan olingan natija kabi qaralishi mumkin. Testlar parallel boʻlmaganda, tenglashtirish jarayoni “bogʻlash” (linking) deb ataladi. Bu har xil testlar bilan baholangan qobiliyatlarni baholash natijasida aniqlangan ikkita shkalani tenglashtirishdir.
Tenglashtirish katta oʻlchovdagi testlar uchun ham muhim hisoblanadi. Har yili yangi testlar yaratiladi, deyarli hamma standart testlar bir nechta variantlardan iborat boʻladi va ular qiyinligi boʻyicha nisbatan farq qiladi. Bunday hollarda standartni saqlab qolish uchun tenglashtirish jarayoni amalga oshiriladi. Bunda ballarni test topshiriqlari qiyinligiga qarab moslashtirish va bitta shkaladagi ballarni eʼlon qilish nazarda tutiladi.
Ikki xil tenglashtirish zarurati paydo boʻlishi mumkin. Birinchisi — har xil qobiliyatli guruhlardan (masalan, turli bosqichdagi sinflardan) olinadigan test natijalariga koʻra aniqlangan qobiliyat darajalarini bitta shkalaga keltirish. Ikkinchisi esa bir xil qobiliyatli guruhlardan (masalan, bitta sinfdan 2 ta chorakda olingan test natijalarini tenglashtirish asosida) olingan har xil testlar vositasida aniqlangan qobiliyat darajalarini bir xil shkalaga keltirish.
Yuqoridagilardan kelib chiqib aytishimiz mumkinki, tenglashtirishda asosan umumiy qobiliyat va umumiy element metodlari ishlatiladi. Umumiy qobiliyat usulida umumiy guruhdan bir necha marta test olinadi. Umumiy element usulida kesishadigan elementlarga ega boʻlgan variantlar turli xil guruhlarga beriladi.
Bilimlarni xom ball bilan baholash sinaluvchilarning variantda nechta test topshirigʻiga toʻgʻri javob berishiga bogʻliq boʻlib qoladi, bu esa qobiliyatlarning yaxshi farqlanmasligi va bir xil ball olgan sinaluvchilarning qobiliyatlari aniq ajralmay qolishi, variantdagi test topshiriqlarining qiyinlik darajasi bilan bogʻliq savollar paydo boʻlishiga olib kelishi mumkin.
Bilim va malakalarni baholash agentligi huzurida tashkil etilgan Ilmiy-oʻquv amaliy markazida test sinovlarining natijalarini tahlil qilish uchun foydalanilgan klassik test nazariyasidan tashqari, rivojlangan davlatlarda amaliyotga keng joriy qilinayotgan zamonaviy test nazariyasi ham qoʻllanila boshladi.
Rash modeli asosida baholashda test topshiriqlarining qiyinlik darajalari hisobga olinadi. Bunda qobiliyatlarni aniqlashda sinaluvchilar variantdagi test topshiriqlariga yuz foiz javob berishlari shart emas. Chunki ularning qobiliyati umumiy sinaluvchilar orasida egallagan oʻrni bilan baholanadi. Rash modeli AQSH, Janubiy Koreya, Buyuk Britaniya, Germaniya kabi davlatlarning xalqaro baholash tashkilotlarida qoʻllaniladi. Oʻzbekiston Respublikasida Prezident maktablari uchun qabul test sinovlarida hamda Bilimni baholash agentligining chet tilini bilish darajasini aniqlash boʻyicha milliy test tizimida amaliyotda qoʻllanilmoqda.
Umumiy gʻoyani tushunish uchun 3-rasmda chet tilini bilish darajasini aniqlashga qaratilgan milliy test tizimidagi ballar taqsimoti boʻyicha baholash mezonlari keltirilgan.
3-rasm. Chet tilini bilish darajasini aniqlashga qaratilgan milliy test tizimidagi ballar taqsimoti boʻyicha baholash mezoni
Milliy test tizimida Rash modeli asosida baholashni joriy qilish kalibrovkalangan test topshiriqlari bazasini yaratish va sinaluvchilarning qobiliyat darajalarini nisbatan aniqroq baholash imkonini beradi. Bunda sinaluvchilarga taqdim etilgan test topshiriqlarining qiyinlik darajasi muhim indikator vazifasini bajaradi.
Milliy test tizimidagi boshqa umumtaʼlim fanlardan ballar taqsimoti boʻyicha 3-rasmda koʻrsatilgan baholash mezoni tavsiya qilinadi.
3-rasm. Milliy test tizimida tavsiya qilinayotgan ballar taqsimoti boʻyicha baholash
Bu rasmda koordinata oʻqidagi sonlar turli qobiliyatli sinaluvchilarning ballarini: koʻk rang — eng yuqori, yashil rang — yuqori, sariq rang — oʻrta, qizil rang — quyi qobiliyat darajalarini bildiradi. Bunda musbat ishorali harflar shu qobiliyat darajasi ichida sinaluvchi qobiliyatining nisbatan yuqoriroq ekanligini bildiradi.
Xalqaro tajribada bilimlarni qobiliyat darajalari boʻyicha baholash intuitiv baholashga nisbatan ustun hisoblanadi. Baholash bu usulda amalga oshirilsa, maksimal ball, test topshiriqlari qiyinlik darajalarini standartlashtirish, qobiliyat darajalarini bir xil shkalaga keltirish, kalibrovkalangan test topshiriqlari bazasini yaratish kabi bir qator muammolar oʻz-oʻzidan hal boʻladi. Milliy test tizimida oʻtkazilayotgan sinovlar natijalarining ilmiy tahlillari ham ushbu tizimning respublika oliy taʼlim muassasalari bakalavriatiga qabul testlariga nisbatan bilimlarning aniqroq va standart baholanayotganligini koʻrsatmoqda.
Foydalanilgan adabiyotlar:
- Crocker, L. and Algina, J. (1986) Introduction to Classical and Modern Test Theory. Harcourt, New York, 527.
- Yu, Chong Ho and Osborn-Popp, Sharon E. (2005) «Test Equating by Common Items and Common Subjects: Concepts and Applications,» Practical Assessment, Research, and Evaluation: Vol. 10, Article 4.
- Baker, Frank (2001). The Basics of Item Response Theory, ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD.
- Hambleton, R.K.,Swaminathan, H.,& Rogers, H.J. (1991), Fundamentals of item response theory. Newbury Park, CA: Sage.
- М.Дж.Эрмаматов, Замонавий тест назарияси асослари. Услубий қўлланма. –Т., 2020. – 68 б.
- Kolen, M. J., & Brennan, R. L. (1995). Test equating. New York: Springer.
- Han, K.T. (2009). IRTEQ: Windows application that implements IRT scaling and equating [computer program]. Applied Psychological Measurement, 33(6), 491-493.
- Ivailo Parchev (2004), A visual visual guide to item response theory, Friedrich-Schiller-Universitat, Jena.
Mirshod ERMAMATOV,
Bilim va malakalarni baholash agentligi huzuridagi Ilmiy-oʻquv amaliy markazi Pedagogik oʻlchovlarni rivojlantirish ilmiy-tadqiqot boʻlimi boshligʻi, katta ilmiy xodim, fizika-matematika fanlari nomzodi;
Asror NORMURODOV,
Bilim va malakalarni baholash agentligi huzuridagi Ilmiy-oʻquv amaliy markazi Pedagogik oʻlchovlarni rivojlantirish ilmiy-tadqiqot boʻlimi bosh mutaxassisi, fizika-matematika fanlari boʻyicha falsafa doktori (PhD)