Навчально-методичний посібник This project has been funded with support




Сторінка4/7
Дата конвертації30.11.2016
Розмір2.8 Kb.
ТипНавчально-методичний посібник
1   2   3   4   5   6   7
Тема 4. Тестові технології – об’єктивний спосіб визначення
результатів навчання
Тестові технології – інструмент здійснення педагогічного контролю. Практика педагогічного оцінювання доводить, що на сучасному етапі тести не є прерогативою виключно професіоналів
- вчителі, викладачі вищої школи розуміють незаперечну користь в отриманні незалежної, об’єктивної інформації про рівень навчальних досягнень.
Історична довідка
Теорія і практика тестування в сучасному його розумінні мають вже більш ніж сторічну історію. Початок зародження тестології відносять до кінця XIX століття, коли психологи почали досліджувати індивідуальні відмінності фізичних, фізіологічних і психічних особливостей людини.
Одним з перших, хто почав використовувати тестові технології для вимірювання індивідуальних особливостей, став англійський біолог Френсіс Гальтон. Він займався питанням спадковості, при цьому розробив ряд методик для визначення зорової, слухової і тактильної чутливості, а також для визначення м’язової сили, швидкості реакції та ін. Щоб зібрати якомога

53
більше емпіричних даних, Гальтон обстежив безліч установ у системі освіти з метою отримати систематичні вимірювання антропометричних характеристик учнів. У 1884 році він організував антропометричну лабораторію на Всесвітній виставці в Лондоні, де кожен бажаючий за невелику плату міг виміряти свої фізичні можливості за 17-ма показниками: зріст, вага, сила кисті, сила удару, розрізнення кольору, гострота зору та ін. Таким чином вдалося накопичити перші систематичні дані по індивідуальним особливостям простих психофізичних функцій.
А.Н.Майоров [19] таким чином сформулював три принципи тестування, виділених Ф.Гальтоном (ці висновки зберегли актуальність і в наш час):
1) застосування серії однакових випробувань до великої кількості досліджуваних;
2) необхідність накопичення та обробки статистичних результатів;
3) встановлення еталонів оцінки.
Найважливішим внеском Гальтона в розвиток тестології є розробка і використання методів математичної статистики для обробки отриманих даних. Він розробив методику порівняння двох рядів змінних, увівши для оцінки цього співвідношення особливу величину – коефіцієнт кореляції.
Ідеї Ф. Гальтона активно розвиває американський психолог
Джеймс Мак-Кін Кеттелла (1860 - 1944), який деякий час працював у лабораторії Гальтона. У 1890 році виходить стаття
Кеттелла «Розумові тести і виміри», де описується серія тестів для визначення індивідуально-психологічних якостей і обґрунто- вується ефективність використання статистичної обробки результатів. Згодом американський психолог розробив близько п’ятдесяти наборів завдань, які називалися «розумовими тестами»: практично ж це були тести сенсорного розрізнення та швидкості реакції, які, на думку Кеттелла, можна було використовувати для вимірювання інтелекту. Незважаючи на те, що тести Кеттела дозволяли оцінити тільки елементарні психофізичні процеси і реакції людини і не зачіпали вищих психічних функцій людського мозку, його ідеї використання тестування і статистичного аналізу зіграли велику роль у становленні теорії і практики тестування.
Кеттелла розглядав тестування як науковий метод і висував ряд

54
вимог до проведення тестування, щоб результати були наближені до об’єктивних. Він сформулював такі принципи:
- створення однакових умов для всіх піддослідних;
- обмеження часу тестування (1 година);
- використання однакових інструкцій і чітке розуміння піддослідними завдань, заропонованих для виконання;
- експеримент повинен проводитися без глядачів;
- результати тестування повинні оброблятися за допомогою статистичних методів аналізу (знаходиться мінімальний, максимальний і середній результати, розраховується середнє арифметичне і середнє відхилення).
Новий етап у розвитку тестології пов’язаний з діяльністю французького психолога Альфреда Біне (1857 - 1911). Він розробляє оригінальні методики вимірювання інтелекту. Критично сприйнявши досягнення своїх попередників Ф.Гальтона і
Дж.Кеттелла (Біне насамперед не влаштовували спроби оцінити рівень інтелекту через вимір елементарних психічних процесів),
Біне йде шляхом вимірювання складних інтелектуальних функцій.
Робота в Комісії з вивчення методів навчання розумово відсталих дітей з 1904 року дала можливість Біне реалізувати свої ідеї на практиці. Спільно з Теодором Симоном Біне створює тестові завдання, спрямовані на диференціацію дітей на здібних до навчання, але ледачих або відстаючих, і на дітей розумово відсталих.
Шкала Біне-Симона (шкала 1905 року) складалася з 30 завдань, які були розташовані за зростанням складності. Рівень складності був визначений за результатами обстеження 50 нормальних дітей віком від 3 до 11 років і невеликого числа розумово відсталих дітей. Тести були розраховані на оцінку здатності до судження, розуміння і міркування, які, на думку Біне,
і є основними компонентами інтелекту. Ймовірність успішного виконання визначалася зростаючою складністю завдань тесту і збільшувалася в залежності від віку учасника випробування.
У 1908 році з’являється новий, перероблений варіант шкали: збільшується кількість завдань, виключаються невдалі завдання, розширюється вибірка стандартизації. Біне і Симон визначають нову мету шкали: не тільки диференціація дітей на нормальних і розумово відсталих, але і виділення серед нормальних дітей різних

55
вікових рівнів інтелектуального розвитку. Групування тестів за віковими рівнями дозволило визначити норми для дітей різних вікових категорій. Третій варіант шкали Біне-Симона (1911) містив незначні зміни завдань, вікові рамки шкали були розширені до 15 років. Найголовнішим на цьому етапі роботи стала спроба стандартизувати шкалу і визначити її валідність.
Тести Біне-Симона привернули увагу психологів різних країн. Вони активно перекладалися і адаптувалися. В Америці з’явилося багато перероблених варіантів тестів Біне-Симона.
Одним з вдалих варіантів визнаний тест, розроблений Левіс
Мадисон Терменом (Стренфордська шкала інтелекту Біне).У цьому варіанті був вперше використаний коефіцієнт
інтелектуальності – показник розумового розвитку (IQ).
На початку виникнення і становлення тест як інструмент вимірювання використовувався тільки в рамках експерименту, був призначений виключно для індивідуального вимірювання. Групові тести вперше з’явилися в США в 1917 році, коли Америка вступила в першу світову війну і виникла необхідність швидко визначити інтелектуальний рівень великої кількості призовників, що вступали до лав армії. З цією метою використовувалися тести
інтелекту Артура Синтон Отіса. Тести Отіса включали два види:
«альфа» – вербальний тест для англомовних і «бета» – невербальний, розрахований на неписьменних і новобранців
іноземного походження. Після закінчення першої світової війни після деякої переробки ці тести стали повсюдно використовуватися як групові тести інтелекту в освітніх установи, серед дорослого населення.
На початку ХХ століття також виникає ідея використання тестування для вимірювання рівня навчальних досягнень.
Американський психолог В. А. Макколл пропонує розділити тести на психологічні (визначення рівня розумового розвитку) і педагогічні (вимірювання успішності учнів з предметів за певний період навчання). Метою педагогічного тестування, на думку
Макколла, має бути виділення і об’єднання учнів за близькими показниками рівня навчальних досягнень.
Засновником педагогічних вимірювань вважається американський психолог Едуард Лі Торндайк, який створив перший педагогічний тест (ability tests). Перші тести навчальних

56
досягнень представляли собою тести на розв’язання арифметичних завдань, правопис, оцінку почерку, міркування. У 1904 році
Торндайк узагальнив свої висновки по використанню тестових методів у педагогіці в книзі «Вступ до теорії психології та соціальних вимірювань».
У 1915 р. американець Р. М. Йеркс пропонує нову систему підрахунку результатів тестування. Він вводить бальну систему (за правильно виконане завдання виконавець тесту отримує певну кількість балів) замість вікових часток, які використовувалися А.
Біне. Отримана кількість балів потім переводилося в коефіцієнт обдарованості або успішності відповідно до розроблених стандартів.
В 10-20 рр. XX-го століття тестування виходить за рамки наукового експерименту і перетворюється на масове явище. Для систематизації робіт з розробки та використання тестів створюються спеціальні організації і служби державного рівня. У
1926 р. Рада коледжів (США) прийняла тест SAT і затвердила набори завдань для професійної оцінки діяльності педагогів. У
1947 р. створюється в США Служба тестування в освіті
(Educational Testing Service), яка є і науково-дослідним центром і організацією, яка контролює проведення тестування на всіх рівнях освіти в країні. До 1961 року тільки в США було створено 2126 стандартизованих тестів.
Інтеграційні процеси сучасної цивілізації дали поштовх до розвитку нових напрямів педагогічного тестування. Виникла ідея міжнародного порівняльного дослідження з метою оцінки якості освіти різних країн з міжнародним контекстом. Проведення міжнародних досліджень надає країнам можливість всебічно оцінити ефективність своїх освітніх систем, порівняти підготовку учнів з міжнародними стандартами. Пошуку нових, більш ефективних систем викладання сприяють міжнародні порівняльні дослідження.
Провідна роль у проведення подібних досліджень належить
Міжнародній асоціації з оцінки навчальних досягнень (IEA –
International Association for the Educational Achievement) – незалежній організації, яка об’єднує наукові центри понад 50 країн
і проводить порівняльні дослідження з оцінки ефективності освітніх систем країн світу, що здійснюють різну політику в галузі

57
освіти. Перші дослідження IEA проводилися спільно з ЮНЕСКО.
За 35 років існування, починаючи з 1959 року, IEA проведено понад 15 досліджень. У багатьох країнах світу результати досліджень IEA дали поштовх або стали основою для проведення реформ в освіті.
У другій половині ХХ століття розробляється більш досконала модель аналізу отриманих результатів – сучасна теорія тестів (IRT). У цей період теорія тестів з описової науки, націленої на збирання і систематизацію фактичного матеріалу, починає перетворюватися в науку про співвідношення, про закони функціонування та оцінювання поведінки піддослідних. Г. Раш пропонує ввести співвідношення двох параметрів (тета – рівень підготовленості і бета – складності завдання) як різницю тета та бета. Він же запропонував математичну модель (ймовірність правильної відповіді випробуваного і латентна змінна його навченості пов’язані функцією), яка дозволяє визначити ймовірність правильної відповіді випробуваного. Цю модель Раша прийнято називати однопараметричною, пізніше А. Бернбаум розвинув ідеї Раша і вивів двох- і трьох параметричні моделі.
Паралельно розроблялися комп’ютерні програми для обробки тестових результатів за допомогою моделей IRT.
У середині 70-х рр. ХХ століття розроблені нові критерії, що пред’являються до тесту як способу оцінки якості:

адаптивність систем тестування до якості висновків піддослідних;

об’єктивність педагогічних вимірювань;

економія ресурсів і часу перевірок;

можливість застосування різних форм пред’явлення тестових завдань.
За часів Радянського Союзу з 20-рр. ХХ століття розробкою тестів та практикою їх використання займалися С.Г. Геллерштейн,
П.П. Блонський, А.П. Болтунов, М.С.Бернштейн, Л.С. Виготський,
Г.І. Залкінд та ін. У книзі С. М. Василейського «Введение в теорию и технику психологического, педологического и психотехнического исследования» (1927) викладено основні теоретичні та практичні принципи створення та використання

58
тестів. В роботі також були висвітлені питання статистичної обробки результатів.
Під керівництвом П. П. Блонського в педагогічному кабінеті
Академії комуністичного виховання здійснювалася перевірка шкали Біне-Симона, створення шкільних тестів і побудова стандартів. Але в середині 30-х років розвиток тестології припиняється. Постанова ЦК ВКП(б) «Про педологічні перекручення в системі
Наркомосу»
(1936) забороняє використання тестів у педагогічній практиці радянської школи.
Тестология як наука також припиняє своє існування в країні на довгі роки.
Тільки в 60-ті роки в дидактику повертаються тести через систему програмованого навчання.
У 1970-1980 рр. традиційна система контролю знань почала зазнавати значної критики. У колишньому Радянському Союзі розвиток дидактичної тестології пов’язаний з роботами Н.Ф.
Тализіної по програмованому навчанню і В.П. Беспалько з проблем педагогічної технології.
В.П.Беспалько ([6]) відзначав, що традиційні методи контролю ефективні при безпосередньому спілкуванні вчителя та учня на уроці для оцінювання конкретних завдань, але «для оцінки якості знань ці методи контролю не годяться, тому що необхідні діагностичність, точність і відтворюваність результатів в них не закладено». Тому необхідні спеціальні розробки тестових матеріалів, орієнтованих на розв’язання певних навчальних задач.
Теорія та практика створення тестових завдань
Тест (від англ. Test – випробування, перевірка) – стандартизоване, коротке, обмежене в часі випробування, призначене для встановлення кількісних і якісних індивідуальних особливостей.
Існують різні точки зору щодо поняття «тест».
Наведемо визначення тесту Майорова А.Н. [20] як
інструменту педагогічного вимірювання :
Тест – це інструмент, що складається з кваліметрично вивіреної системи тестових завдань, стандартизованої процедури проведення і заздалегідь спроектованої технології обробки і аналізу результатів, призначений для вимірювання якостей і

59
властивостей особи, зміна яких можлива в процесі систематичного навчання.
Інша точка зору, викладена в роботах Аванесова В.С., який припускає розрізнення тесту як методу і тесту як інструменту:
«Педагогічний тест визначається як система паралельних завдань зростаючої складності, специфічної форми, яка дозволяє якісно та ефективно виміряти рівень і структуру підготовленості випробуваних. Тест як метод і тестові результати потребують такої
інтерпретації результатів, яка адекватна меті тестування» [3].
Термін «тест» (за Аванесовим) може використовуватися для позначення:
- методу педагогічного вимірювання,
-
інструменту педагогічного вимірювання.
Тому тест треба розглядати як єдність: 1) методу; 2) результатів, отриманих певним методом; та 3) інтерпретованих результатів, отриманих певним методом.
Тест як метод передбачає технологію вимірювання, яка включає в себе розробку системи тестових завдань із заданими якісними та кількісними характеристиками для об’єктивного і надійного оцінювання навчальних досягнень досліджуваних, стандартизовану процедуру проведення тестування, методи статистичної обробки, аналізу та інтерпретації отриманих результатів.
«Тест як інструмент вимірювання визначається як система завдань (у більшості випадків зростаючої складності) специфічної форми, що дозволяє якісно оцінити структуру й ефективно виміряти рівень знань, умінь і навичок учнів» - Аванесов В.С. .
«Специфічна форма» завдань виявляється в тому, що «завдання тесту сформульовані у вигляді тверджень, які, в залежності від відповідей, перетворюються на істинні або хибні висловлювання.
Це їх основна відмінність від запитань і завдань, які не бувають
істинними чи хибними, дуже багатослівні і невизначені за формою, тому є нетехнологічними»[3]. Форма логічного твердження дозволяє при мінімумі засобів (слів і лексичних конструкцій) домогтися максимальної ясності суті, не породжуючи багатослівність у відповідях. Але це не означає, що умову тестового завдання не можна сформулювати у вигляді питань. Не варто абсолютизувати форму логічного висловлювання

60

і використовувати її у визначенні тестових завдань, як це представлено у В.С. Аванесова.
Слово «тест» в першому значенні має науковий аспект і використовується вченими-тестологами, які знають про етапи розробки та застосування тесту, а також про теоретичне обґрунтування обраних способів перевірки та обробки отриманих результатів відповідно до класичної теорії тестів або сучасної теорії тестів.
Друге значення частіше виникає в практичній області: у безпосередніх розробників конкретних тестів та у виконавців тестів. Частіше використовується саме друге значення. Але при цьому треба пам’ятати, що тест як інструмент вимірювання є частиною наукового методу вимірювання і відповідно повинен відповідати ряду вимог щодо його розробки, використання та оцінювання результатів, які визначаються науковими підходами.
Відмінності тесту від інших форм контролю:
1.
Зміст тесту піддається чіткому плануванню. На стадії розробки тесту проходить відбір змісту, який необхідно перевірити, планується форма завдань, їх кількість і розташування. Змістовий план тесту аналізується експертами.
2.
Форма завдань. У тестах форма завдань стандартизована – за формою пред’явлення та за формою запису відповідей.
3.
Наявність
статистичних
характеристик
тестових завдань. Заздалегідь відомо, яка складність пропонованого завдання, чи буде воно однаково виконуватися слабкими і сильними піддослідними чи ні (здатність диференціювати) і ін.
4.
Наявність спеціальних шкал, які співвіднесені зі стандартизованими нормами, для підведення результатів тестування.
5.
Наявність оцінок точності вимірювання (помилки вимірювання). За допомогою статистичних методів ми можемо оцінити помилку вимірювання, а за результатами оцінки прийняти або не прийняти результати тестування.

61

Класифікація педагогічних тестів
У вітчизняній і зарубіжній тестології пропонуються різні класифікації педагогічних тестів в залежності від обраного критерію: цілі тестування, форми пред’явлення тесту, зміст, підхід до розробки тесту.
Так у посібнику Самилкіної Н.Н. запропонована наступна класифікація за цілями та змістом [21]:
• тести особистості – для оцінки емоційно-вольових якостей
індивідуума;
• тести інтелекту – для аналізу рівня розвитку пізнавальних процесів і функцій мислення;
• тести здібностей – для оцінки можливостей освоєння різноманітних видів діяльності;
• тести досягнень, за допомогою яких оцінюють розвиток знань, умінь, навичок після навчання.
За цілями використання: (класифікація запропонована
Норманом Е.Гронлундом [8], її ж дотримуються Звонников В.И.,
Челишкова М.Б., Майоров А.М.)[11] :
вхідне тестування забезпечує перевірку знань і умінь на початку навчання;
формуюче та діагностичне тестування передбачає контроль за формуванням нових знань і умінь в процесі навчання;
тематичне, підсумкове, рубіжне тестування забезпечує визначення підсумкових досягнень;
оцінка залишкових знань.
Вхідне тестування проводиться на початку навчання або наступного його етапу, для того щоб визначити ступінь володіння необхідними (базовими) знаннями та вміннями для вивчення пропонованої дисципліни, тобто вхідне тестування дає змогу виявити готовність до засвоєння нових знань. За допомогою вхідного тестування також визначають ступінь володіння новим матеріалом до початку його вивчення.
Використання вхідного тестування тісно пов’язане з підвищенням ефективності навчального процесу. Аналіз його результатів допомагає викладачеві вибрати правильну навчальну стратегію роботи на новому етапі. Вхідне тестування дає змогу визначити, чи є слабкі учні, для яких новий матеріал давати ще

62
рано, відповідно для них необхідно забезпечити повторення базових знань і усунення прогалин, перш ніж приступити до подальшого навчання. Це допомогає уникнути хронічного відставання учнів. Щоб визначити готовність учнів до нового етапу, пропонуються попередні тести (претести), які націлені на перевірку базових (необхідних) знань і умінь.
Для сильних учнів, які ймовірно вже мають деякі знання з дисципліни, що тільки буде вивчатися, пропонується також вхідний тест (претест). Але його зміст вже базується на новому матеріалі. Аналіз результатів цього тестування допомагає викладачеві визначити, як він буде працювати з сильними учнями.
Якщо тест виконаний добре, то їх слід перевести на більш високий рівень навчання, а якщо ні, то освоєння нового матеріалу і для сильних учнів буде проходити за планом. Таким чином, вхідне тестування допомагає педагогу вибрати найбільш ефективну стратегію навчання, при цьому враховуються індивідуальні особливості учнів.
Поточний контроль за формуванням нових знань і умінь в процесі навчання можна проводити, використовуючи формуюче
та діагностичне тестування.
Формуючий тест використовується для визначення якості засвоєння матеріалу за окремим розділом або темою. Завдання, включені в тест, націлені на перевірку досліджуваного або щойно вивченого матеріалу або теми. Він виконує функцію зворотного зв’язку між викладачем і студентом. Якщо більшість тестованих не справляється з формуючим тестом, то необхідне додаткове повторення, деталізація і закріплення матеріалу. Якщо невелика частина учнів не справилась з тестом, то освоєння нових тем та розділів дисципліни триває за планом, а з відстаючими проводиться індивідуальна робота. Формуючий тест сприяє своєчасному виявленню та усуненню прогалин у процесі навчання.
На відміну від традиційних засобів контролю формуюче тестування ефективніше, оскільки економить час і зусилля викладача.
Формуючий тест може бути представлений в комп’ютерному варіанті, що дозволяє учням самостійно контролювати свої знання та вміння. Формуючий тест часто супроводжується конкретними рекомендаціями для виправлення

63
допущених помилок і навчальними модулями для кожної одиниці матеріалу. Навчальні модулі можуть містити визначення, правила, формули, алгоритми виконання завдань, фактичний матеріал, приклади.
Діагностичний тест, який використовується в поточному контролі, спрямований на виявлення причин допущених помилок, на з’ясування, чому виникли ті чи інші прогалини в знаннях учнів, систематичні помилки. Діагностичний тест складається із завдань, на певну конкретну область змісту, такі завдання відрізняються
граничною деталізацією, це допомагає відстежити, на якому етапі виникають помилки. Діагностичний тест проводиться після формуючого, коли виявлені систематичні помилки, стійкі прогалини. Аналіз результатів діагностичного тесту допомагає встановити причини помилок і шляхи їх усунення.
Наприклад, учень не виконав завдання формуючого тесту:
«Обчислити значення виразу


». У діагностичному тесті це завдання розбивається на підзавдання, з метою визначення дії, яку учень не зміг виконати:

– не вміє підносити до степеня;

– не вміє додавати;

– не вміє добувати корінь;


– не вміє виконувати ділення.
Підсумкове тестування проводиться після закінчення навчання і служить для оцінки результатів навчання, тобто визначає його ефективність: наскільки реальні результати збігаються з очікуваними, запланованими, наскільки вони відповідають стандарту. Підсумковий тест охоплює досить широку область змісту вивченої теми, розділу, дисципліни, етапу навчання. У підсумковий тест включаються завдання на перевірку знань найважливіших елементів змісту, сформованість необхідних навичок.
За засобами пред’явлення педагогічні тести поділяються на
- бланкові, в яких учасники тестування позначають або вписують вірні відповіді на бланку;

64

- комп’ютерні – завдання висвічуються на моніторі комп’ютера (окремий вид комп’ютерних тестів – адаптивні тести)
- предметні, де необхідно виконувати дії з конкретними матеріальними об’єктами, результативність таких тестів залежить від швидкості та коректності виконання дій;
- апаратурні, які використовують пристрої для вивчення особливостей уваги,сприйняття, пам’яті, мислення;
Переваги комп’ютерного тестування в швидкості обробки та економії паперу. Але є і деякі недоліки. Комп’ютерне тестування може провокувати випадкові помилки (якщо тестований погано володіє комп’ютером), а неможливість виправити допущену помилку може понизити результат.
За ступенем однорідності задач розрізняють: гомогенні тести, призначені для контролю знань і вмінь з одного предмету або дисципліни; гетерогенні тести, призначені для вимірювання рівня підготовленості з кількох навчальних предметів.
Гетерогенні тести можуть бути двох видів: полідисциплінарні і міждисциплінарні. Полідисциплінарні тести призначені для перевірки знань з кількох дисциплін і при цьому в основний тест включають субтести (наприклад, система завдань з математики і фізики). Ці субтести можуть розглядатися як окремі тести з різних дисциплін. Основна складність у застосуванні таких тестів полягає в системі підрахунку балів за результатами частин тесту. Міждисциплінарні тести містять завдання, які спрямовані на перевірку узагальнених, інтегрованих знань і умінь в суміжних дисциплінах
(математика-фізика, хімія-біологія,
історія- культурологія).
За процедурою створення виділяють:
- стандартизовані тести;
- нестандартизовані тести.
Стандартизація – послідовність процедур по плануванню, проведенню, оцінюванню та виставленню балів.
Мета стандартизації – забезпечити всім учасникам тестування рівні умови. Це важлива процедура, коли результати тестування планується використовувати для порівняння окремих людей або груп (тобто при в нормо-орієнтованих тестах).

65

В процесі освітньої діяльності чимало завдань оцінювання можуть бути здійснені нестандартизованими тестами (зокрема, діагностичний, формуючий, поточний контроль знань на певних етапах навчання). Однак для підсумкової атестації необхідно використовувати тільки стандартизовані тести.


Поділіться з Вашими друзьями:
1   2   3   4   5   6   7


База даних захищена авторським правом ©divovo.in.ua 2017
звернутися до адміністрації

войти | регистрация
    Головна сторінка


загрузить материал