Этапы развития тестологии кратко

Обновлено: 03.07.2024

Исходя из вышесказанного, целью данной работы является изучение основ тестологии, выявление и определение основных понятий и принципов этой науки. Для достижения данной цели необходимо решить следующие задачи:
1. Изучить историю развития науки тестологии;
2. Рассмотреть основы конструирования тестов;
3. Проследить этапы разработки теста;
4. Разобрать основные критерии оценки эффективности тестов

Содержание работы

Введе-ние. 3
1. Тестология как нау-ка. 4
1.1. Зарождение и развитие тестологии. 4
1.2. Тестология в России. 6
2. Теоретические и методические основы тестологии. 9
2.1. Разработка тестов. 9
2.2. Критерии оценки эффективности теста. 12
Заключе-ние. 16
Список использованной литерату-ры. 17

Файлы: 1 файл

РЕФЕРАТ.doc

Российский государственный социальный университет

Филиал в г. Чебоксары

Факультет социальной работы

по дисциплине «Методика исследований в

Идеи и принципы тестологии

Выполнила студентка факультета

социальной работы группы ДС-11-09 Иванова Татьяна Викторовна

Проверил к.ф.н., доцент кафедры

социальной работы и социального права

Милюхин Кирилл Владимирович

1. Тестология как наука. . . .4

1.1. Зарождение и развитие тестологии. . . 4

1.2. Тестология в России. . . 6

2. Теоретические и методические основы тестологии. . 9

2.1. Разработка тестов. . . . 9

2.2. Критерии оценки эффективности теста. . 12

Список использованной литературы. . . 17

В социальной работе объектом изучения является конкретная личность или же некоторая сообщность людей. Как правило, сведения о социальной общности приходится получать путем анализа данных об индивидах, ее составляющих. Суммарные сведения об индивидах – их социальные ориентации, мнения, стереотипы мышления – существенные характеристики социального целого. Поэтому, а также потому, что современная наука развивается на междисциплинарной основе, в социальной работе активно используются методики, разработанные в психологии.

Тестология - наука, изучающая возможности оценить различные свойства личности с помощью специально разработанных тестов и методов их интерпретации [2;98]. Тестология появилась на стыке психологии, социологии, педагогики и других, так называемых поведенческих наук, и призвана заниматься вопросами разработки тестов для объективного контроля знаний, умений, навыков и представлений.

Исходя из вышесказанного, целью данной работы является изучение основ тестологии, выявление и определение основных понятий и принципов этой науки. Для достижения данной цели необходимо решить следующие задачи:

1. Изучить историю развития науки тестологии;

2. Рассмотреть основы конструирования тестов;

3. Проследить этапы разработки теста;

4. Разобрать основные критерии оценки эффективности тестов.

1. Тестология как наука

1.1. Зарождение и развитие тестологии

Тестология - междисциплинарная наука о создании качественных и научно обоснованных измерительных диагностических методик [14]. В психологии содержание тестологии во многом совпадает с содержанием дифференциальной психометрики. Но принципы и методы тестологии выходят за рамки психологии. Они широко применяются в других отраслях науки и практики — в педагогике, медицине, технике, менеджменте (профессиональный отбор). В каждой из этих отраслей методы тестологии имеют общие черты, связанные с обеспечением таких свойств тестовых методик, как валидность, надежность, эффективность и т. п. Но есть и определенная специфика, связанная со спецификой предмета тестирования (профессиональные и общеобразовательные знания, комплекс медицинских симптомов и т.п.) и условий сбора эмпирической информации. Так как метод тестов не исчерпывает собой все многообразие методов современной психодиагностики, неправильно отождествлять тестологию с психодиагностикой.

Современная тестология представляет собой вполне зрелую прикладную науку, которая ставит перед исследователями широкий спектр теоретических проблем, предлагает многочисленные математические подходы, модели и методы. Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку испытуемому в соответствии с поставленной целью исследования; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют объективности оценок, не зависящих от субъективных установок лица, проводившего исследование. Обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

Сейчас в тестологии намечаются следующие направления развития:

2. Автоматическая разработка заданий. В ее основе лежит использование искусственного интеллекта. Сейчас некоторые программы уже производят генерацию заданий, например, математический тест GRE® [8;10].

1.2. Тестология в России

Четвертое десятилетие XX века отметилось применением технических средств для подсчета тестовых показателей. По-особому проходило развитие метода тестирования в отечественной педагогике. Практическое значение тесты получили после создания в 1925 году тестовой комиссии при педагогическом отделе Института методов школьной работы, в задачи которой входило разработка стандартизированных тестов для советской школы, их массовое использование в учебных заведениях. С помощью таких тестов, которые создавались на основе американских, можно было проверить знания учащихся по правописанию, счету, решению задач, географии, естествознанию и обществоведению. К тестам прилагались инструкции и личные карточки для учета прогресса учащегося.

Хотя в 30-е годы XX века работа с тестами затормозилась, научное изучение истинных возможностей этого метода не прекращалась; элементы метода тестов успеваемости (без упоминания соответствующего термина) использовались при учете успеваемости учащихся в общеобразовательных школах. Образцы тестовых заданий можно найти в сборниках упражнений и задач, контрольных заданий по различным учебным предметам.

В этот период появилось значительное количество работ, посвященных математическим проблемам педагогических измерений. В них рассматривались вопросы разработки шкал измерения результатов контрольных работ, математических моделей обработки информации в педагогических исследованиях, в частности с использованием ЭВМ, а также вопросы статистики.

Однако использование тестов многими не поддерживалось. Полемика о правильности внедрения тестов периодически велась до середины 70-х гг. и почти полностью была приостановлена до начала 80-х годов XX века. В то время психодиагностика стала отдельной областью исследований и приобрела значение многоотраслевой науки - общей психодиагностики. В настоящее время в психодиагностике использовалась вычислительная техника. В конце XX века, после распада Советского Союза, развитие психологической диагностики, как и других наук, в известной мере приостановилось. Однако в основных психологических центрах (Москва, Санкт-Петербург) определенная работа в области психодиагностики была продолжена [9;12].

На основе вышеизложенного можно сделать следующий вывод. Несмотря на заметное отставание разработки и внедрения тестовых технологий в конце ХХ в., связанных с политикой СССР в 30-х гг., на сегодняшний день в России наблюдается заметное увеличение темпов развития тестологии, что связано с доступностью международного опыта и развитием компьютерной техники. Для дальнейшего развития тестовых технологий в стране основными задачами являются правильность образовательной политики государства, улучшение качества тестов, применение новых технологий в тестировании и разработку не только итоговых, но и обучающих образовательных тестов.

2. Теоретические и методические основы тестологии

2.1. Разработка тестов

Анализ и оценка тестовых заданий начинается после апробации теста на целевой группе. Полученные данные сводятся в таблицу с матричной структурой, в которой задания начинают сортироваться по следующим критериям [15]:

1. Мера трудности задания.

Мера трудности задания дает информацию о степени задействования того параметра изучаемого свойства, которое оно призвано измерять. Иногда говорят, что мера трудности определяет соответствие задания целевой группе. Можно сказать, что данный критерий позволяет судить и об этом.

2. Дифференцирующая способность.

Векслер Виталий Абрамович
Национальный исследовательский Саратовский государственный университет им. Н.Г. Чернышевского
кандидат педагогических наук, доцент кафедры информационных систем и технологий в обучении


Аннотация
В статье рассматриваются основные вехи возникновения тестологии как науки, ее влияние на развитие педагогики.

Wexler Vitaly Abramovich
N.G. Chernyshevsky Saratov State University
Ph.D., assistant professor of information systems and technologies in education


Abstract
The article examines the major milestones voznikonoveniya testology as a science and its influence on the development of pedagogy.

Сегодня считается, что родоначальником тестологии, ученым сделавшим первые попытки измерить различия между людьми в области элементарных психических процессов, стал английский исследователь Френсис Гальтон (1882–1911). В 1884 году им была организована антропометрическая лаборатория на проводившейся тогда Всемирной выставке в Лондоне. В данной лаборатории любой посетитель мог измерить свои физические возможности по разнообразным показателям: рост, сила кисти, острота зрения и др. Таким образом, можно было собрать и проанализировать первые данные по индивидуальным особенностям простых психофизических функций. Ф. Гальтон считал, что тесты сенсорного различения необходимо использовать как средство оценивающее интеллект человека.

Он определил три фундаментальных принципа тестирования:

1) использование серии совершенного одинаковых испытаний к большому количеству испытуемых;

2) необходимость накопления и обработки статистических результатов для анализа полученных результатов;

3) установление эталонов оценки.

Он так же сформулировал ряд необходимых требований:

  • необходимо создавать совершенно одинаковые условия для всех испытуемых;
  • время тестирования ограничено (1 час);
  • для всех диагностируемых используются одинаковые инструкции
  • испытуемые должны четко понимать предлагаемые задачи для выполнения;
  • испытание должно проводиться без зрителей;
  • итоги проведенной диагностики должны обрабатываться с помощью статистических математических методов анализа (определяются минимальный, максимальный и средний показатель, вычисляется математическое ожидание и дисперсия).

Необходимо подчеркнуть, что разработки по созданию, совершенствованию и использование тестов при решении практических задач, сопровождалась исследованиями в областях создания наборов статистических методов обработки и анализа полученных результатов. В этом направлении работали многие ученые, среди них был и Карл Пирсон, создавший в1896 г. фундамент основ теории корреляции. Под влиянием его трудов формируется новая наука – прикладная статистика.

С начала ХХ века определилось и педагогическое направление в развитии тестологии. Американский исследователь В.А. Макколл решил разделить тесты на два вида: Educatinal Test (педагогические или образовательные) и Intelligence Test (психологические или определяющие уровень развития интелекта). Основной задачей педагогических тестов, по его мнению, стало диагностическое измерение успешности проведенного обучения по тем или иным предметам за определенный период, а также эффективность использования в образовательном процессе инновационных методов и технологий. Целью применения педагогических тестов, как считал В. Макколла, стало создание рекомендаций по объединению в группы учащихся, по признаку усваивания одинакового по объему материала и усваивания материала примерно с одинаковой скоростью.

В 1915 году Р.М. Йеркс создал свою серию тестов, главное отличие которой – полное изменение подхода к подсчету результатов проведанного тестирования. Вместо существовавших ранее возрастных долей, которые предложил в своих исследованиях А. Бине, диагностируемый получает за каждый правильно решенный тест заранее строго определенное количество баллов. Таким образом, проведение и подсчет результатов тестирования стало более эффективным.

Первые годы зарождения тестологии были годами поиска, позже тестирование выходит за пределы строго научного эксперимента и обращается в массовое явление, приводящее к полному итоговому осмыслению его роли и места в системе образования. Разрабатываются и внедряются в учебный процесс тесты О. Стоуна по счету, Б. Зекингема для диагностирования правописания, Э. Торндайка тестирующих знания в большинстве школьных общеобразовательных дисциплин. Т. Келли разрабатывает диагностический аппарат позволяющий измерять интересы и наклонности школьников.

Сегодня роль тестирования как важнейшего, универсального инструмента контроля знаний обучающихся стремительно возрастает, происходит массовое, активное внедрение тестов в учебный процесс и создаются прямые предпосылки для создания и развития конструктивной и эффективной системы управления качеством образования.


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

История тестов учебных достижений насчитывает, по мнению В.Кадневского, по крайней мере, несколько тысячелетий 5 . В.Аванесов указывает на факты, свидетельствующие о еще более древнем применении тестов 6 .

По мнению А.Н.Майорова 7 одним из первых ученых, попытавшихся измерить различия между людьми в области элементарных психических процессов, был англичанин Френсис Гальтон (Galton F.; 1882-1911).

Гальтон ввел в теорию тестирования три фундаментальных принципа, используемых и по сей день:

1. Применение серии одинаковых испытаний к большому количеству испытуемых.
2. Статистическая обработка результатов.
3. Выделение эталонов оценки.

Все современные тесты построены на основе статистической теории измерений, а идея эталона оценки лежит в основе определения теста как стандартизованного инструмента.

1. одинаковость условий для всех испытуемых;
2. ограничение времени тестирования приблизительно одним часом;
3. в лаборатории, где проводится эксперимент, не должно быть зрителей;
4. оборудование должно быть хорошим и располагать людей к тестированию;
5. одинаковые инструкции и четкое понимание испытуемыми, что нужно делать;

6. результаты тестирования подвергаются статистическому анализу, находят минимальный, максимальный и средний результат, рассчитывают среднее арифметическое и среднее отклонение.

Эти идеи, выдвинутые Дж.Кеттелом, составляют основу для современной тестологии. Одинаковость условий для всех испытуемых, одинаковые инструкции и четкое их понимание испытуемыми – фундаментальные принципы, положенные в основу стандартизации процедуры проведения тестирования; ограничение времени, в настоящее время, после дополнительных исследований, устанавливается в зависимости от возраста испытуемых и особенностей применяемого инструментария; идеи статистической обработки результатов реализованы в достаточно сложных методах статистического анализа и моделирования 7 .

Большой вклад в развитие тестов интеллекта внес французский психолог Альфред Бине (Binet A., 1857-1911). Совместно с Теодором Симоном (Simon T., 1873-1961) он разработал тест, позволяющий дифференцировать нормальных и умственно отсталых детей.

В 1911-1912 годах американские психологи Л.Термен и Х.Чальдс дополнили тест Бине - Симона четырьмя новыми 8 :

Задание теста формулировалось в графической форме (рис.1.1.1). Изображался круг, обозначавший поле, заросшее густой травой. Где-то в поле лежит мяч, увидеть который можно, только если подойти к нему не более чем на 10 шагов. Испытуемому нужно выбрать варианты таких траекторий передвижения, чтобы время поиска мяча было наименьшим.

Если первоначально развивалось психологическое тестирование, то в последующем, Маккол В.А. предложил различать тесты психологические - тесты умственного развития (Intelligence Test) и педагогические - тесты учебных достижений (Educational Test) 7 .

Основоположником педагогических измерений считается Эдуард Ли Торндайк. Именно Торндайком были созданы первые научно обоснованные педагогические тесты, снабженные нормами.

Большой вклад в развитие теории тестирования внесли Spearman C.E. 9 , Gulliksen H. 10 , Guttman L. 11 Lord F.M. & Novick M. 12 , Kuder G.F. & Richardson M.W. (теория надежности тестов) 13 , Crocker Linda & Algina James 14 (современная классическая теория тестов).

В настоящее время за рубежом и в нашей стране широкое применение находит современная теория тестирования - Item Response Theory (IRT). Однопараметрический вариант IRT предложен Георгом Рашем (G.Rasch) 15 . Развитие IRT основывалось на появлении двух и трехпараметрических моделей - Birnbaum A. 16 . Обширная деятельность по развитию IRT осуществляется Д.Эндричем (D.Andrich) 17 , Б.Райтом (B.Wright) 18


Отмечая справедливость его критики, следует все же признать, что развитие тестологии, дающей в руки педагоги качественный измерительный инструмент, явление нужное и прогрессивное. Правда, это должен быть не единственный измеритель, определяющий ход учебного процесса.

РАЗВИТИЕ ТЕСТОЛОГИИ В РОССИИ

В послевоенные годы, работы в области тестирования начали возрождаться, а в 70-80-х годах прошлого столетия педагогическое тестирование стало усиленно развиваться в рамках технологии программированного обучения.

Важную роль в становлении отечественной тестологии сыграли работы Беспалько В.П. 21, 22 и Талызиной Н.Ф. 23, 24, 25 Согласно В.П.Беспалько процесс обучения должен быть технологичным и диагностичным. Если нет достоверной диагностики, то нет и учебного процесса. Н.Ф.Талызина, рассматривая вопросы управления процессом учения, анализирует проблемы педагогической оправданности применения тестов различного типа.

Работы отечественных и зарубежных тестологов были в основном изолированы от друг от друга. В СССР фундаментальные труды зарубежных тестологов были практически неизвестны.

В этой связи следует отметить трудно переоценимую деятельность В.C.Аванесова по применению и развитию передовых идей и достижений зарубежной тестологии в отечественной теории и практике педагогического тестирования.

Под руководством В.C.Аванесова в 1985 году на базе Московского института стали и сплавов был организован Исследовательский центр по проблемам управления качеством подготовки специалистов. В этом центре началась планомерная переподготовка руководящих работников и преподавателей в системе высшего образования СССР. В Москву на краткосрочные (1 месяц) курсы съезжались преподаватели, доценты, профессора со всех регионов страны - от Дальнего Востока, до Прибалтики и Средней Азии. Именно этот период, видимо следует считать началом широкомасштабного применения современных научных методов в педагогическом тестировании.

Очень важные вопросы стандартизации педагогических тестовых материалов подняты в работе Б.У.Родионова, А.О.Татура 28 . Педагогический тест является измерительным инструментом и это должен быть качественный инструмент, позволяющий получать достоверные результаты. В создании качественных педагогических тестов чрезвычайно велика роль стандартов, которым должны соответствовать педагогические тестовые материалы.

Полный комплекс работ по составлению и использованию тестов школьных достижений представлен в работах А.Н.Майорова 7, 29 . В нашей стране остро стоит проблема подготовки кадров для системы тестирования. А.Н.Майоров отмечает, что существует «миф о том, что для составления тестового инструмента нет необходимости иметь специальные знаний. В последние годы, особенно в связи с введением ЕГЭ, появилось множество книг с описанием тестов по любым школьным предметам. Следует понимать, что это не тесты, а некоторые совокупности сырых заготовок, которые следует еще переработать в задания в тестовой форме, а затем, если удастся – в тестовые задания. Только после этого можно говорить, что создан тест для той или иной предметной области.

Информационные и телекоммуникационные технологии оказывают сильное воздействие, как на организационные формы, так и на обработку результатов тестирования. В работе В.И.Нардюжева и И.В.Нардюжева 33 рассмотрены вопросы построения системы компьютерного тестирования. Программные разработки этих авторов использовались для организации абитуриентского компьютерного тестирования Федеральным центром тестирования Минобразования РФ (ЦТ МО РФ). Прикладные программные средства Tester - для проведения тестирования, Operator - для конфиденциальной передачи результатов тестирования в ЦТ МО РФ, StatInfo - для статистической обработки результатов тестирования, показали себя как надежные и удобные программные продукты.

Применение модели G.Rasch (Раш) к изучению латентных переменных в образовании в социально-экономических системах развивается в работах А.А.Маслака 35 . Следует отметить вклад А.А.Маслака в разработку конструктов, содержащих индикаторные переменные для социально-экономических систем, анализ точности педагогических измерений на основе модели Раша. В качестве эффективного инструмента в исследованиях А.А.Маслака используется программное средство RUMM (Rasch Unidimensional Measurement Model), разработанное под руководством профессора Д.Эндрича 17 .

В монографии В.Ю.Переверзева 36 рассматриваются характеристики критериально-ориентированных тестов и их сравнение с нормативно-ориентированными тестами, описываются методики определения оптимального количества заданий в тесте. В справочном руководстве 37 приводится обширный справочный материал по разработке тестовых заданий, как для бланкового, так и для компьютерного тестирования.

Проблемы использования IRT в учебном процессе вуза исследуются К.Т.Кузовлевой 42 в Дальрыбвтузе. В Тихоокеанском военно-морском институте В.В.Черненко проводит интересные исследования как в области технологии применения тестов достижений, так и в области интерпретации полученных результатов. Работы К.Г.Кречетникова 43, 44 посвящены вопросам организация контроля и корректировочных действий в информационной образовательной среде вуза.

Из приведенного, очень краткого и неполного обзора следует, что тестирование учебных достижений широко используется за рубежом и довольно высокими темпами развивается в России.

Время зарождения тестологии относят ко второй половине XIX века, когда психологи стали исследовать индивидуальные различия физических, физиологических и психических особенностей человека.

В середине ХIХ века особое внимание исследователей уделялось изучению умственной отсталости, которую в этот период впервые стали рассматривать как болезнь.

Одним из первых, кто начал использовать тестовые стал английский биолог Френсис Гальтон. По мнению Ф.Гальтона, тесты сенсорного различения можно использовать как средство оценки интеллекта человека.

Ф. Гальтон был первым, кто применил оценочные шкалы, анкетирование и технику свободных ассоциаций.

Он сформулировал три принципа тестирования, эти выводы сохраняют актуальность до сих пор:

1) применение серии одинаковых испытаний к большому количеству испытуемых;

2) необходимость накопления и обработки статистических результатов;

3) установление эталонов оценки.

Новый этап в развитии тестологии связан с деятельностью французского психолога Альфреда Бине (1857 - 1911). Он разрабатывает оригинальные методики измерения интеллекта. Совместно с Теодором Симоном А. Бине создает тестовые задания, направленные на дифференциацию детей способных к обучению, но ленивых или отстающих, и на детей умственно отсталых.

Шкала Бине-Симона (шкала 1905 года) состояла из 30 заданий, которые были расположены по возрастанию трудности. Тесты были рассчитаны на оценку способности к суждению, пониманию и рассуждению.

Групповые тесты впервые появились в США в 1917 году и возникла необходимость быстро определить интеллектуальный уровень полутора миллионов вступающих в ряды армии. С этой целью использовались тесты интеллекта Артура Синтона Отиса. Тесты Отиса включали два вида: альфа-вербальный тест для владеющих английским языком и бета-тест – невербальный, рассчитанный на неграмотных и новобранцев иностранного происхождения. В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами.

В середине 70-х гг. ХХ века разработаны новые критерии, предъявляемые к тесту как способу оценки качества:

 адаптивность систем тестирования к качеству выводов испытуемых;

 объективность педагогических измерений;

 экономия ресурсов и времени проверок;

 ограничение места для записи тестируемых заключений;

 возможность применения различных форм предъявления тестовых заданий.

1. 21)История развития системы тестирования в России.

В 1970-1980 гг. резко критиковалась традиционная система контроля знаний. В бывшем Советском Союзе развитие дидактической тестологии связано с работами Н.Ф. Талызиной по программированному обучению и В.П. Беспалько по проблемам педагогической технологии.

Отмечая, что учебные методы контроля пригодны для непосредственного общения учителя со школьниками на уроке по конкретным изучаемым на занятии вопросам, В.П. Беспалько пишет, что для оценки качества знаний эти методы контроля не годятся, так как необходимые диагностичность, точность и воспроизводимость результатов в них не заложены. Аналогичными недостатками страдают и обычные письменные контрольные работы. Поэтому необходима специальная разработка материалов тестов, ориентированных на уровни решения тех или иных учебных задач. Сейчас такой подход разделяется многими педагогами.

в нашей стране появилось несколько центров, в которых профессионально занимаются работой с тестовыми технологиями. Среди наиболее активных следует отметить Центр тестирования Министерства образования Российской Федерации, занимающийся тестированием выпускников общеобразовательных учреждений, Центр тестирования профессионального образования, Центр психологического и профессионального тестирования МГУ и целый ряд других.

Читайте также: