Развитие тестирования в зарубежных странах реферат

Обновлено: 16.05.2024

Глава 3
ИСТОРИЯ РАЗВИТИЯ ТЕСТИРОВАНИЯ
В РОССИИ И ЗА РУБЕЖОМ







Практическое задание: составьте цепочку соответствий: имя учёно-
го и его вклад в развитие теории тестов (на примере развития отече-
ственной или зарубежной тестологии).
Теоретическое задание: проследите этапы внедрения тестирования
за рубежом и в России по материалам гл. 3 «Педагогическое тестиро-
вание (история зарождения тестирования) [5].
План лекции:
3.1. Исторические предпосылки современного тестирования в отече-
ственном образовании.
3.2. Развитие тестирования в зарубежных странах.
3.3. Направления и проблематика современных российских и зару-
бежных исследований по вопросам измерений и тестирования в обра-
зовании.
3.4. Тестирование в психологии и в образовании.
3.1. Исторические предпосылки современного тестирования
в отечественном образовании
История тестов, пришедших на
смену обыденным представлениям педаго-
гов о проверочных средствах, началась в
России, как и в других странах, в конце
XIX – начале XX в. В этот период тесты
широко применялись сторонниками экспе-
риментальной педагогики, которые всяче-
ски пропагандировали их наравне с други-
ми, разрабатывали психометрические ме-
тодики в педологии
9
.

9
Фрадкин Ф.А. Педология: мифы и действительность. М., 1991.
Ключевые понятия

ƒ педология
ƒ тестология
ƒ педагогическое из-
мерение
ƒ классическая тео-
рия тестирования
ƒ современная теория
тестов
История того, что есть, - это исто-
рия того, что было и того, что будет.
Жак Анри Бернарден

Опережающая самостоятельная работа
39

У истоков советской педологии, в рамках которой развивались
тестовые методики, стояли известные ученые того времени: М.Я. Ба-
сов, Л.С. Выготский, А.П. Болтунов,
П.П. Блонский, К.Н. Корнилов, А.П. Не-
чаев, А.Р. Лурия и др., посвятившие ряд
своих работ оценке результатов обуче-
ния и развития детей. До 1917 г. вопро-
сам тестирования уделялось недостаточное внимание. Фактически
свое практическое значение тесты получили после 1925 г., когда была
создана особая тестовая комиссия. Тестовая комиссия существовала
при педагогическом отделе Института методов школьной работы. В
её задачи входила разра-
ботка стандартизированных
тестов для советской шко-
лы. И уже весной 1926 г. в
Москве была выпущена
первая серия тестов для
школьников по природове-
дению, обществоведению,
счёту, решению задач, знанию географической карты, на понимание
чтения и правописание. К этим тестам прилагались инструкции и
личная карточка для учёта прогресса учащегося. Наркомат просвеще-
ния РСФСР финансировал специальные лаборатории по разработке
тестов, по этой теме выпускались книги, публиковались статьи в газе-
тах и журналах. Однако период активной деятельности педологов и
тестологов в советской России оказался коротким. Работа по созда-
нию тестов в начале 30-х гг. была подвергнута критике, тесты были
объявлены вредным методом. В 1936 г. использование тестов было
запрещено
10
.
Многие годы, вплоть до начала 90-х гг. XX в., отношение к тес-
там было негативным. Педагоги-практики вернулись к тестам в период
прекращения массовых политических репрессий. Уже к началу 60-х гг.
XX в. многие учителя, заботящиеся не о формальных показателях, а о

10
О педологических извращениях в системе Наркомпросов. Постановление
ВКП(б). 1936 г.

Педология (от греч. pais – дитя и logos –
слово, наука) – течение в психологии и пе-
дагогике, возникшее на рубеже XIX – XX вв.,
обусловленное проникновением эволюци-
онных идей в педагогику и психологию,
развитием прикладных отраслей психологии
и экспериментальной педагогики.

Как давно стали
востребованы тесты
в России?
40

11
Об утверждении документов по итоговой аттестации и награждению выпуск-
ников. Приказ Минобразования РФ № 88 от 24 февраля 1995 г.
41

12
Об утверждении порядка приема в государственные образовательные учреж-
дения высшего профессионального образования (высшие учебные заведения) Россий-
ской Федерации. Постановление Госкомвуза РФ № 9 от 27 декабря 1995 г.; О централи-
зованном тестировании выпускников общеобразовательных учреждений Российской
Федерации. Приказ Минобразования РФ № 537 от 26 декабря 1996 г.

В чём специфика новой
истории тестов России?
42


альное признание в Рос-
сии. За годы экспери-
мента значительно повы-
силась степень доверия к
результатам
тестирова-
ния со стороны органов
управления образованием,
образовательных учреж-
дений, самих учителей, которые убедились в высокой объективности
и обоснованности баллов ЕГЭ, в их высокой прогностичности при от-
боре абитуриентов вузов. В 2002 г. был открыт Федеральный инсти-
тут педагогических измерений (ФИПИ), приоритетным направлением
деятельности которого является научное, методическое и организаци-
онное сопровождение процесса создания контрольных измеритель-
ных материалов (КИМ) для ЕГЭ, а в последствие и для ГИА. Приме-
нение технических средств в конце ХХ в. оказало большое влияние не
только на методы тестирования (появились компьютерные тесты), но
и на методологию тестирования: были разработаны нетрадиционные
тесты, к которым относятся интегративные, адаптивные тесты и тесты
с критериально-ориентированной интерпретацией результатов.
Подводя итоги развития тестирования в России, необходимо
подчеркнуть, что на сегодняшний день среди ученых-педагогов в на-
шей стране сложилось понимание того, что теория педагогических
измерений – наука, обладающая своей методологией, методами и ап-
паратом, необходимым для разработки качественных педагогиче-
ских тестов. Это подтверждает широкое издание инновационных ра-
бот по педагогическим тестам отечественных ученых и зарубежных
авторов, а также тиражирование сборников контрольно-измеритель-
ных материалов ГИА и ЕГЭ, специальные журналы по тестовой про-
блематике. Таким образом, можно считать, что на данный момент в
России сформировалось сообщество профессионалов – специалистов
по разработке и применению тестов. Сегодня Россия не только прак-
тически свела к минимуму последствия запрещения разработки и ис-
пользования тестов, но и постоянно вносит свой вклад в развитие тес-
тологии.
Тестология (от англ. test – проба, греч. logos –
знание) – междисциплинарная наука о созда-
нии качественных и научно обоснованных
измерительных диагностических методик.
Зарубежные психологи называют эту нау-
ку психометрикой (Psychometrika), а педаго-
ги – педагогическим измерением (Educational
measurement).
43

13
Бине А. По поводу измерения интеллекта. Психологический ежегодник, 1905.
Чья работа считается точкой
отсчета в становлении основных
научных подходов к измерениям
в психологии и образовании?
Что способствовало разви-
тию классической теории пе-
дагогических измерений
и тестирования XX в.?
44


развития теории и практики измерений в образовании стало создание
в 1947 г. в США Службы образовательного тестирования – Education-
al Testing Service (ETS). Сегодня эта организация имеет представи-
тельства практически во всех странах мира. Из числа тестов, создан-
ных ETS, наибольшую известность в связи с расширением программ
международного обмена в обучении приобрел TOEFL, выявляющий
уровни владения различными видами речевой деятельности для обу-
чения в англоязычных странах.
В истории тестов были этапы подъемов и
спадов. В частности в США в конце 60-х гг.
XX в. жестко критиковались педагогические
тесты. Высказывались опасения, что тестирование служит инстру-
ментом подавления инициативы и творчества учащихся, слишком уп-
рощенно трактует такие сложные конструкты, какими являются
учебные умения, необъективно оценивает учебные достижения. При-
водились и другие аргументы против широкого использования тес-
тов. Ученые-тестологи занимались в основном конструктивной науч-
ной критикой традиционных методов разработки тестов, что привело
к построению новой теории – Item Response Theory (IRT), которую
нередко в наши дни называют современной теорией тестов.
Неоспоримые преимущества IRT, такие как возможность про-
гноза надежности измерений, увеличения эффективности тестиро-
вания и получение оценки параметров подготовленности учащихся,
не зависящих от трудности заданий теста, стали широко применяться
на практике с конца 80-х гг. XX в. Это стало возможным благодаря
разработке алгоритмов оценивания параметров испытуемых и зада-
ний на основе математических моделей IRT, создания программного
обеспечения и широкого использования ПК. Сочетание аппарата
классической теории и IRT при разработке тестов открыло новые
возможности повышения качества педагогических измерений и при-
менения тестирования в образовании.
Современный период в истории развития тестов характеризует-
ся интенсивным развитием теории IRT, созданием новых моделей и
методик её применения, внедрением в тестирование компьютерных
технологий, адаптивного тестирования, различных инноваций в об-
Что такое IRT?
46


ласти разработки и применения тестов. В настоящий момент наме-
тился ряд направлений исследований, нацеленных на расширение воз-
можностей педагогических измерений, разработку инновационных
измерителей и повышение качества тестов. К их числу относится соз-
дание новых моделей педагогического измерения, инновационных
форм тестовых заданий для проверки творческих и практико-
ориентированных аспектов подготовленности учащихся, методов ка-
либровки тестовых заданий и методик компьютерного моделирования
тестов, обеспечивающих планируемую точность измерений. Большое
внимание уделяется психолого-педагогическим проблемам тестиро-
вания (проблемам тревожности, мотивации), развитию специальных
процедур для выявления размерности пространства измерений, созда-
нию специальных методик, позволяющих обоснованно использовать
результаты педагогических измерений в управлении качеством обра-
зования.
3.3. Направления и проблематика современных российских
и зарубежных исследований по вопросам измерений
и тестирования в образовании
Период активизации исследований по тестовой проблематике
конца XX – начала XXI в. совпал с началом эксперимента по введе-
нию ЕГЭ и повсеместным созданием в вузах России систем менедж-
мента качества образования. Тогда же появились исследования по
тестам и смежной проблематике В.С. Аванесова, Т.М. Балыхиной,
Н.Ф. Ефремовой, И. И. Легостаева, А.А. Макарова, Е.А. Михайлыче-
ва, В. Г. Наводнова, В. П. Папасюка, В.Ю. Переверзева, И.Д. Рудин-
ского, М.Б. Челышковой и др.
С конца 90-х гг. XX в. вплоть до настоящего времени из года в
год растет число монографий, учебных пособий, статей и методичес-
ких работ по вопросам изме-
рений и тестирования в обра-
зовании. В целом современ-
ные исследования отечествен-
ных учёных по проблемам из-
мерения и тестирования в образовании осуществляются по следую-
щим направлениям:
За счёт чего произошло расши-
рение сферы приложения педа-
гогических измерений в России?
47


¾ разработка научных подходов к совершенствованию содер-
жания измерителей в контексте современных трактовок качества
учебных достижений;
¾ разработка теоретико-методологического и методического
обеспечения процесса конструирования надежных и валидных тестов;
¾ научное обоснование процедур применения тестов;
¾ научное обоснование шкалирования данных тестирования и
их интерпретация для применения результатов педагогических изме-
рений в управлении качеством образования.
Несомненный интерес представляют также анализ и психолого-
педагогическая интерпретация латентных характеристик подгото-
вленности выпускников, развитие моделей содержательной преемст-
венности тестовых материалов для итогового контроля на различных
ступенях обучения (дошкольное, начальное, основное, среднее, выс-
шее), необходимость разработки которых резко возросла в наше вре-
мя в связи с созданием Общероссийской системы оценки качества об-
разования (ОСОКО). Проведение исследований по выделенным на-
правлениям в нашей стране, безусловно, позволит значительно повы-
сить качество используемых в образовании измерителей и тем самым
будет способствовать повышению качества образования.
В современных зарубежных
исследованиях в теории пе-
дагогических измерений к
приоритетным направлениям
исследовательских работ от-
носятся:
¾ развитие методологии сочетания качественных и количест-
венных методов при эвалюации в образовании;
¾ оптимизация методов интеграции данных педагогических из-
мерений, полученных с помощью инновационных форм заданий тес-
тов;
¾ развитие параметрических и непараметрических моделей IRT;
¾ разработка методик, алгоритмов и математико-статистичес-
кого аппарата теории педагогических измерений для создания про-
граммного обеспечения и практического использования новых моде-
лей IRT;
Почему IRT заняла лидирующее
положение в сфере конструиро-
вания и применения педаго-
гических тестов за рубежом?
48


¾ исследования психологических и этических проблем в тести-
ровании;
¾ разработка научно-методических подходов к построению
уровневых шкал в образовании, разработка новых методов выравни-
вания;
¾ развитие специальных процедур и подходов для выявления
размерности пространства измерений и её адекватности поставлен-
ным целям тестирования и т.д.
Многие зарубежные исследования посвящены аппарату и ме-
тодам теории IRT, которая широко используется в практике тести-
рования, а результаты, полученные такими исследователями, как
Ф. Лорд, M. Новик, Е. Самсджим, Д. Вэйс, Б. Райт, Ури и другими,
внедрены в практику разработки и применения тестов.
3.4. Тестирование в психологии и образовании
Взаимодействие психологов и педагогов в области разработки
тестов имеет свои исторические причины и научные предпосылки. В
научном плане оно предопределено
близостью методологий измерений в
эмпирических науках и единством
методик разработки тестов, общно-
стью объекта исследования, тесной
взаимосвязью и частичным пересечением субъектов измерения. Ис-
торические аспекты этого взаимодействия обусловлены особенностя-
ми становления теории педагогических измерений, сложившимися за
рубежом в 20 – 40-е гг. XX в. В то время потребность в стандартизи-
рованных педагогических тестах постоянно увеличивалась, а сообще-
ство тестологов в сфере образования практически еще не сложилось,
поэтому психологи зачастую привлекались к работе над педагогиче-
скими тестами.
В наши дни область совместных работ педагогов и психологов
расширяется. Во многих учебных заведениях в России и за рубежом
работают психологи, создаются специальные службы консультиро-
вания школьников и студентов. В их функции входит не только пси-
хологическая поддержка учащихся в проблемных ситуациях, но и
участие в проведении мониторинга, анкетных опросов и в подготовке
учебного заведения к государственной аттестации. Педагоги, в свою
очередь, проявляют интерес к оцениванию способностей обучающих-
Существует ли взаимо-
связь психологических и
педагогических измерений?
49


ся, когнитивных аспектов подготовленности, психологических осо-
бенностей учащихся в усвоении знаний и нередко выполняют свои
исследования на стыке психодиагностики и измерений в образовании.
Тенденция вхождения психологов в педагогические измерения в
нашей стране наметилась в середине 90-х гг. XX в. В это время воз-
рос интерес к педагогическим тестам и отсутствие тестологов в обра-
зовании ощутилось особенно остро. Образовавшийся кадровый ваку-
ум в значительной степени заполнили психологи. Попутно, сами того
не желая, они привнесли в образовательную среду устойчивые пред-
ставления о тестах как о наборе довольно тривиальных по содержа-
нию заданий, носящих косвенный характер и имеющих форму с вы-
бором ответа.
Несмотря на имеющиеся точки соприкосновения, между педаго-
гическими и психологическими теста-
ми есть существенные различия. Педа-
гогические тесты оценивают результа-
ты усвоения общего для всех обучае-
мых программного курса, а психологи-
ческие отражают индивидуальное восприятие жизненного опыта,
различающегося по социальным и экономическим условиям его при-
обретения. Результаты тестирования в психологии используются в
основном для прогнозирования успешности какой-либо деятельности
в зависимости от оценок личностных характеристик и склонностей
или носят рекомендательный характер при выявлении личностных
проблем. Педагогические тесты в итоговом контроле дают количест-
венные оценки уровня подготовленности обучаемых, которые неред-
ко служат основой для принятия административно-управленческих
решений в образовании, поэтому к качеству результатов педагогиче-
ских измерений и их сопоставимости должны предъявляться повы-
шенные требования, обеспечивающие корректность управленческих
выводов и административных решений.
Внешние различия между тестами в психологии и в образовании
проявляются в формулировках заданий, которые в педагогических
тестах всегда носят прямой, а в психологических тестах, чаще всего,
косвенный характер.
В чём различия между
психологическими и педа-
гогическими тестами?
50

Время зарождения тестологии относят ко второй половине XIX века, когда психологи стали исследовать индивидуальные различия физических, физиологических и психических особенностей человека.

В середине ХIХ века особое внимание исследователей уделялось изучению умственной отсталости, которую в этот период впервые стали рассматривать как болезнь.

Одним из первых, кто начал использовать тестовые стал английский биолог Френсис Гальтон. По мнению Ф.Гальтона, тесты сенсорного различения можно использовать как средство оценки интеллекта человека.

Ф. Гальтон был первым, кто применил оценочные шкалы, анкетирование и технику свободных ассоциаций.

Он сформулировал три принципа тестирования, эти выводы сохраняют актуальность до сих пор:

1) применение серии одинаковых испытаний к большому количеству испытуемых;

2) необходимость накопления и обработки статистических результатов;

3) установление эталонов оценки.

Новый этап в развитии тестологии связан с деятельностью французского психолога Альфреда Бине (1857 - 1911). Он разрабатывает оригинальные методики измерения интеллекта. Совместно с Теодором Симоном А. Бине создает тестовые задания, направленные на дифференциацию детей способных к обучению, но ленивых или отстающих, и на детей умственно отсталых.

Шкала Бине-Симона (шкала 1905 года) состояла из 30 заданий, которые были расположены по возрастанию трудности. Тесты были рассчитаны на оценку способности к суждению, пониманию и рассуждению.

Групповые тесты впервые появились в США в 1917 году и возникла необходимость быстро определить интеллектуальный уровень полутора миллионов вступающих в ряды армии. С этой целью использовались тесты интеллекта Артура Синтона Отиса. Тесты Отиса включали два вида: альфа-вербальный тест для владеющих английским языком и бета-тест – невербальный, рассчитанный на неграмотных и новобранцев иностранного происхождения. В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами.

В середине 70-х гг. ХХ века разработаны новые критерии, предъявляемые к тесту как способу оценки качества:

 адаптивность систем тестирования к качеству выводов испытуемых;

 объективность педагогических измерений;

 экономия ресурсов и времени проверок;

 ограничение места для записи тестируемых заключений;

 возможность применения различных форм предъявления тестовых заданий.

1. 21)История развития системы тестирования в России.

В 1970-1980 гг. резко критиковалась традиционная система контроля знаний. В бывшем Советском Союзе развитие дидактической тестологии связано с работами Н.Ф. Талызиной по программированному обучению и В.П. Беспалько по проблемам педагогической технологии.

Отмечая, что учебные методы контроля пригодны для непосредственного общения учителя со школьниками на уроке по конкретным изучаемым на занятии вопросам, В.П. Беспалько пишет, что для оценки качества знаний эти методы контроля не годятся, так как необходимые диагностичность, точность и воспроизводимость результатов в них не заложены. Аналогичными недостатками страдают и обычные письменные контрольные работы. Поэтому необходима специальная разработка материалов тестов, ориентированных на уровни решения тех или иных учебных задач. Сейчас такой подход разделяется многими педагогами.

в нашей стране появилось несколько центров, в которых профессионально занимаются работой с тестовыми технологиями. Среди наиболее активных следует отметить Центр тестирования Министерства образования Российской Федерации, занимающийся тестированием выпускников общеобразовательных учреждений, Центр тестирования профессионального образования, Центр психологического и профессионального тестирования МГУ и целый ряд других.

Современное педагогическое тестирование имеет свою историю. Первыми тестами можно считать появившиеся в 1864 г. шкалированные книги англичанина Джоржа Фамера и опубликованные в 1894 г. таблицы по проверке орфографических знаний учащихся американца Дж.М. Райса.

Время зарождения тестологии относят ко второй половине XIX века, когда психологи стали исследовать индивидуальные различия физических, физиологических и психических особенностей человека.

Первым учёным, попытавшимся измерить различия между людьми в области элементарных психических процессов, был англичанин Френсис Гальтон (F. Galton; 1882–1911 гг.).

Проводя исследования индивидуальных различий, Ф. Гальтон использовал набор методик на определение зрительной, слуховой, тактильной чувствительности, на мускульную силу и другие характеристики.

Ф. Гальтон был первым, кто применил оценочные шкалы, анкетирование и технику свободных ассоциаций. Он сформулировал три принципа тестирования, эти выводы сохраняют актуальность до сих пор:

1. Применение серии одинаковых испытаний к большому количеству испытуемых.

2. Необходимость накопления и обработки статистических результатов.

3. Установление эталонов оценки.

Важнейшим вкладом Ф. Гальтона в развитие тестологии является разработка и использование методов математической статистики для обработки полученных данных по индивидуальным различиям.

Одинаковость условий для всех испытуемых – принцип положен в основу стандартизации процедуры проведения тестирования; ограничение времени тестирования; одинаковые инструкции и чёткое понимание испытуемыми, что нужно делать – принцип положен в основу стандартизации процедуры проведения тестирования; отсутствие зрителей в лаборатории, в которой проводится эксперимент; располагающее к тестированию оборудование; проведение статистического анализа результатов тестирования – принцип реализован в методах статистического анализа и моделирования. Требования, выделенные Дж. Кеттелом, составляют основу современной тестологии.

Тесты Дж. Кеттелла были типичными среди большого количества серий тестов, разработанных в последнее десятилетие ХIХ века. Такие серии применялись для школьников, студентов и взрослых людей в Америке повсеместно. В основном они были направлены на измерение простых сенсорных и моторных процессов, хотя их авторы заявляли, что тесты предназначены для измерения интеллекта. Первая проверка этих тестов показала их слабую внутреннюю согласованность и то, что их результаты не соответствовали оценке интеллекта испытуемых независимыми экспертами.

Дж. Кеттелл активно пропагандировал новые методы измерения. В течение 1895–1896 гг. в Америке создаются два национальных комитета, с целью организации тестологов в области теоретических исследований и практики создания качественных тестов и их применения.

Новый этап в развитии тестологии связан с деятельностью французского психолога Альфреда Бине (1857–1911 гг.). А. Бине может считаться родоначальником современных тестов, предназначенных для диагностики уровня развития интеллекта. А. Бине ввёл в обиход понятие умственного уровня. Он разработал оригинальные методики измерения интеллекта. Совместно с Теодором Симоном А. Бине создаёт тестовые задания, направленные на дифференциацию детей способных к обучению, но ленивых или отстающих, и на детей умственно отсталых.

Шкала Бине-Симона (шкала 1905 года) состояла из 30 заданий, которые были расположены по возрастанию трудности. Уровень трудности был определён по результатам обследования 50 нормальных детей в возрасте от 3 до 11 лет и небольшого числа слабоумных детей. Тесты были рассчитаны на оценку способности к суждению, пониманию и рассуждению, которые, по мнению А. Бине, и являются основными компонентами интеллекта. Вероятность успешного выполнения определялась возрастающей трудностью заданий теста и увеличивалась в зависимости от возраста испытуемого.

В 1908 году появляется новый переработанный вариант шкалы: увеличивается количество заданий, убираются неудачные задания, расширяется выборка стандартизации. Бине и Симон заявляют и новую цель шкалы: теперь это не только дифференциация детей на нормальных и умственно отсталых, но и выделение среди нормальных детей различных возрастных уровней интеллектуального развития. Группировка тестов по возрастным уровням позволила определить нормы для детей разных возрастных категорий.

Активная работа по созданию, совершенствованию и применению тестов сопровождалась разработкой статистических методов обработки полученных результатов (К. Пирсон, Ч. Спирмен).

В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчёта результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определённое количество баллов) вместо возрастных долей, которые использовались А. Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами.

В. Макколл (американец) разделил тесты на педагогические, основной задачей которых являлось измерение успешности учащихся по школьным дисциплинам за определённый период обучения, а также успешность применения определённых методов преподавания, и на психологические – по определению определённого уровня развития.

В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчёта результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определённое количество баллов) вместо возрастных долей, которые использовались А. Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами.

В начале XX в. разработкой и проверкой тестов занимаются специальные государственные службы.

1900 г. – создание в США Совета по вступительным экзаменам.

1926 г. – принятие советом колледжей теста SAT, который был разработан для квалификационной и профессиональной оценки деятельности педагога.

1947 г. – создание службы тестирования, которая считается наиболее представительным научно-исследовательским центром.

С 1931 г. начинается современный этап развития школьного тестирования. Поиски специалистов направляются на повышение объективности тестов, создание непрерывной системы школьной диагностики, подчиненной единой идее и общим принципам, более совершенных средств предъявления и обработки тестов, накопления и эффективного использования информации.

Наиболее развитые в тестовом отношении страны – Нидерланды, США, Англия, Япония, Дания, Франция, Израиль, Финляндия, Канада, Австралия, Новая Зеландия и др.

В США тесты применяются в двух основных сферах: в образовании и в сфере профотбора-профориентации. Каждый год знания и способности учащихся проверяются там с помощью 47 миллионов тестовых бланков, выпускаемых примерно 400 тестовыми компаниями. Самая крупная – это ETS ( Educational Testing Service). Ежегодной проверкой интеллектуальных способностей и знаний подвергаются практически все студенты высших и учащиеся средних учебных заведений. В США нежелание тестироваться расценивается как слабость и неспособность показать в честной конкуренции свою образованность, тестирование стало там нормой жизни, обязательным элементом систем образования.

Развитие советской педологии

У истоков советской педологии, в рамках которой развивались тестовые методики, стояли известные учёные того времени: М.Я. Басов, Л.С. Выготский, А.П. Болтунов, П.П. Блонский, К.Н. Корнилов, А.П. Нечаев, А.Р. Лурия и др., посвятившие ряд своих работ оценке результатов обучения и развития детей. До 1917 года вопросам тестирования в России уделялось недостаточное внимание. Практическое применение тесты получили после 1925 года, когда была создана тестовая комиссия при педагогическом отделе Института методов школьной работы (в её задачи входила разработка стандартизированных тестов для школы). Весной 1926 года вышли тесты, созданные на основе американских.

Проблемой разработки тестов занимались видные российские психологи и педагоги: П.П. Блонский, М.С. Бернштейн, С.М. Василейский, А.М. Шуберт и др.

Были разработаны тесты для учёта навыков в чтении, счёте и письме; шкала для измерения умственного развития детей; тесты коллективного испытания умственной одарённости; тесты школьной успешности для массовых обследований детей нормальных школ.

Тестология как наука и тестирование как метод измерения также прекращает своё существование в нашей стране на долгие годы.

Более сорока лет наблюдался период застоя в разработке тестов и их применении. Развитие тестологии связано с работами Н.Ф. Талызиной по программированному обучению, В.П. Беспалько по проблемам педагогической технологии, Д.Б. Эльконина и др.

Первое признание тестирования как способа проверки уровня знаний официально появилось в декабре 1988 г., тесты разрешалось использовать в системе повышения квалификации. Затем вышли нормативные документы, разрешающие проводить тестирование в качестве вступительных испытаний, в том числе в техникумах. В 1995 г. тестирование предлагалось использовать уже как способ итоговой аттестации школьников.

Коренные изменения в отношении учителей к тестам произошли в 2001 г. в связи с началом эксперимента по введению единого государственного экзамена, благодаря которому тесты получили официальное признание в России. За годы эксперимента значительно повысилась степень доверия к результатам тестирования со стороны органов управления образованием, образовательных учреждений, самих учителей, которые убедились в высокой объективности и обоснованности баллов ЕГЭ, в их высокой прогностичности при отборе абитуриентов вузов. В 2002 г. был открыт Федеральный институт педагогических измерений (ФИПИ), приоритетным направлением деятельности которого является научное, методическое и организационное сопровождение процесса создания контрольных измерительных материалов (КИМ) для ЕГЭ, а в последствие и для ГИА. Применение технических средств в конце ХХ в. оказало большое влияние не только на методы тестирования (появились компьютерные тесты), но и на методологию тестирования: были разработаны нетрадиционные тесты, к которым относятся интегративные, адаптивные тесты и тесты с критериально-ориентированной интерпретацией результатов.

В настоящее время в нашей стране появилось несколько центров, в которых профессионально занимаются работой с тестовыми технологиями. Среди наиболее активных следует отметить Центр тестирования Министерства образования Российской Федерации, занимающийся тестированием выпускников общеобразовательных учреждений, Центр тестирования профессионального образования, Центр психологического и профессионального тестирования МГУ и целый ряд других.

Вопросы для самоконтроля:

1. Расскажите историю возникновения тестирования за рубежом и в России.

2. Тесты в России в конце XIX первой половины XX вв. Каковы причины запрета применения тестов в России в 20–30-ые годы ХХ века?

3. Исторические предпосылки современного тестирования в отечественном и зарубежном образовании. Обзор современных отечественных и зарубежных исследований по проблемам тестирования в образовании.

Первым этапом применения тестов в мировой практике можно считать период с 80-х гг. XIX в. по 20-е гг. XX в. Это период зарождения и становления тестирования. Теоретические основы тестирования были заложены в середине 80-х гг. XIX в. английским психологом и естествоиспытателем Ф. Гальтоном, который предположил, что с помощью тестов удастся разделить факторы наследственности и влияния среды в психике человека.

Важным вкладом Ф. Гальтона в развитие теории тестов было определение трех основных принципов, которые используются и по сей день:

1) применение серии одинаковых испытаний к большому количеству испытуемых;

2) статистическая обработка результатов;

3) выделение эталонов оценки.

Достаточно длительное время тесты развивались как инструмент индивидуальных измерений. Массовый характер тестирования вызвал необходимость перейти от индивидуальных тестов к групповым. В 1917—1919 гг. в США появились первые групповые тесты. Наибольшее применение нашли тесты Артура Синтона Отиса. Основные принципы, использованные при составлении этих тестов, были систематизированы и впоследствии легли в основу всей методологии групповых тестов.

1. Принцип ограничения во времени, т. е. показатель развития прямо зависит от скорости выполнения заданий испытуемым.

2. Принцип детализированной инструкции как в отношении проведения, так и в отношении подсчета.

3. Введены тесты с выборочным методом формирования ответа с указанием подчеркивать наугад в случае незнания или сомнения.

4. Подбор тестов после тщательной статистической обработки и экспериментальной проверки.

Вторым этапом в развитии тестирования можно считать 20—60-е гг. прошлого столетия. В те годы американец В. А. Макколл разделил тесты на педагогические и психологические по определению умственных способностей. Основной задачей педагогических тестов являлось измерение успешности учащихся по тем или иным школьным дисциплинам за определенный период обучения, а также успешность применения определенных методов преподавания и организации.

Разработка первого педагогического теста принадлежит американскому психологу Эдуарду Ли Торндайку. Он считается основоположником педагогических измерений. Первым педагогическим тестом, вышедшим под его руководством, был тест Стоуна на решение арифметических задач. Именно в США тесты успешности для проверки знаний, навыков и умений учащихся по отдельным предметам нашли особенно широкое распространение.

Разработкой и проверкой тестов занимаются специальные государственные службы. Еще в 1900 г. в США был создан Совет по вступительным экзаменам. В 1926 г. Совет колледжей разрабатывал тесты для квалификационной и профессиональной оценки деятельности педагога. С 1947 г. в США существует Служба тестирования, которая считается наиболее представительным научно-исследовательским центром.

Разработка тестов по иностранному языку была также сосредоточена в США и Великобритании. Первый тест по иностранному языку составил Б. Вуд в 1925 г. Его тесты использовались для проведения выпускных экзаменов в нью-йоркских школах и имели в своей структуре задания на выбор ответа по лексике, грамматике и чтению на французском и испанском языках. В 1929 г. американский психолог В. Хенмон изучил некоторые вопросы технологии составления тестовых заданий тестов успешности. Он разработал тесты для проверки знаний лексики, грамматики, фонетики; умений понимать прочитанное на уровне предложений и абзацев, умений перевода, аудирования, говорения, умения писать сочинения. В. Хенмон разработал также комплексный тест по иностранному языку, который состоял из ряда разделов — субтестов, аналогичных вышеупомянутым изолированным тестам.

Разработка проблемы языкового тестирования прошла несколько этапов. Выделяют переводной, или донаучный, этап, который отождествляется с различными испытаниями в школах писцов Древнего Вавилона и жрецов Древнего Египта; психометрико-структуралистический этап становления тестов под знаком научности (педагогические тесты), который датируется началом XX в. и продолжается до 70-х гг. В 70-е гг. XX в. начинается психолингвистический, а затем, в 90-х гг., коммуникативный этап тестового контроля в обучении иностранным языкам.

В ходе второго и третьего этапов разработки языкового тестирования развивались дискретный и интегративный подходы к тестированию. Дискретный подход отличался от интегративного тем, что при дискретном тестировании проверялось лишь усвоение языкового материала, что не представляло особых трудностей для обработки результатов теста, тогда как в интегративных тестах проверялись различные умения использования языкового материала. Видами интегративных тестов являются клоуз-тест (тест на заполнение пропусков в тексте) и диктант, свидетельствующие лишь об уровне сформированности лингвистической компетенции обучаемых.

Период коммуникативного тестирования связан с разработкой проблемы коммуникативной компетенции. Толчком к пересмотру языкового тестирования послужило развитие модели коммуникативной компетенции, включающей 6 уровней владения иностранным языком, предложенной Советом Европы. Исходя из основной цели обучения иностранным языкам — формирование коммуникативной компетенции, в качестве объектов тестирования стали выделять практические умения. Коммуникативный тест призван выявить степень сформированности коммуникативных умений, т. е. способности тестируемого решать экстралингвистические (практические) задачи вербальными средствами.

В настоящее время заданные Советом Европы уровни владения иностранным языком служат ориентиром для коммуникативных тестов во многих странах.

В России практическое значение тесты получили после 1925 г., когда была создана особая тестовая комиссия. Она существовала при педагогическом отделе Института методов школьной работы. В ее задачи входила разработка тестов для советской школы. И уже весной 1926 г. вышли такие тесты, созданные на основе американских. Были разработаны тесты по природоведению, обществоведению, счету, решению задач, на понимание чтения и проверку умения правописания. К этим тестам прилагались инструкции и личная карточка для учета прогресса учащегося.

Уже в те годы было доказано, что метод тестов позволяет не только охватить отдельные элементарные психические процессы, но может анализировать их совокупности. Кроме того, было замечено, что тестовый учет устраняет случайность, субъективность и приблизительность оценки работы с учащимися.

Если в отечественной науке исследования в области разработки и применения тестов были приостановлены, то в ряде западных стран они продолжали интенсивно развиваться в различных направлениях. В 30—50-е гг. значительное внимание уделялось так называемым прогностическим тестам, назначению тестов в системе образования, видам тестов и их использованию в практической деятельности. Особую актуальность в это время приобретают вопросы, связанные с разработкой тестов педагогами-практиками.

Следующим этапом в развитии тестирования в России является период с начала 60-х гг. до конца 70-х гг. Реформы по преподаванию ряда предметов, развитие программированного обучения дали значительный толчок к дальнейшему совершенствованию тестов.

Наряду с этим широко начинает внедряться тестирование с помощью компьютеров, что стало возможным благодаря достижениям в области автоматики и кибернетики. Возникновение кибернетики способствовало исследованию обратной связи в обучении. В то же время тестологами был взят на вооружение принцип разветвленного программирования, сущность которого состоит в следующем: если испытуемый ответил правильно, то при следующем шаге ему даются более трудные задания, и наоборот. Было замечено, что при таком подходе создаются благоприятные условия для выявления учащимися своих умственных способностей.

В 60-е гг. начинаются первые, после долгого перерыва, исследования отечественных ученых по использованию тестов психолого-педагогической направленности. В основном в этих разработках анализируется многолетний опыт тестирования, накопленный в зарубежных странах.

С начала 80-х гг. начался новый этап в развитии тестирования в России. Для данного периода характерен ряд особенностей. Прежде всего, важным направлением является интенсивное использование компьютеров как в процессе тестирования, так и при обработке полученных результатов. Наряду с этим в ряде западных стран, особенно в США, тестирование становится практически ведущей формой контроля. Такие страны, как Нидерланды, Англия, Япония, Дания, Израиль, Канада, Австралия, развили теорию и практику тестирования, создали службы разработки тестов, занимаются организацией массового тестирования.

В России сегодня также интенсивно развивается теория и практика педагогических измерений. В обучении иностранным языкам это научные исследования коллектива авторов И. А. Рапопорта, Р. Сельг, И. Соттер, которые обобщили зарубежный и отечественный опыт, разработали методологию научного подхода к тестированию, сконструировали тесты и экспериментально их проверили3.

С введением образовательных стандартов, в том числе и по иностранным языкам, появилась необходимость упорядочить и объективизировать средства контроля и оценивания для проверки выполнения требований стандартов к уровню подготовки учащихся. С этой целью проводится эксперимент по массовому тестированию по единым контрольным измерительным материалам (Единый государственный экзамен). Это тесты трех уровней сложности (базовый, повышенный и высокий), которые соотносятся с уровнями владения иностранным языком, определенными в документах Совета Европы, следующим образом: базовый уровень — А2+, повышенный уровень — В1, высокий уровень — В2. Для решения научных проблем теории и практики тестирования создан Федеральный институт педагогических измерений.

Итак, история развития тестирования за рубежом и в России показала, что тесты уровня обученности (тесты успешности) являются важным способом оценки педагогической деятельности, с помощью которого результаты учебного процесса могут быть достаточно объективно, надежно измерены, обработаны, интерпретированы и использованы в педагогической практике.

Читайте также: