Типы шкал измерения в педагогике реферат

Обновлено: 05.07.2024

В процессе измерения участвуют два объекта: измерительный прибор и измеряемый объект. В результате прибор приходит в некоторое состояние, которое в зависимости от вида прибора и измерительной процедуры фиксируется тем или иным способом: положением стрелки на физической приборной шкале, цветом лакмусной бумажки, цифрами на электронном табло, положительным или отрицательным ответом на вопрос социолога и т.д. Затем это состояние прибора отображается в протоколе в виде тех или иных символов - цифр, букв, слов и т.д.
Теория измерений оперирует понятием "эмпирическая система с отношениями" (Е), которая включает в себя множество измеряемых объектов (А) и набор интересующих исследователя отношений между этими объектами ®: E = < A, R >. Например, множество А это множество физических тел, а набор R - отношения между ними по весу, твердости, размерам и т.п. Для записи результатов наблюдений используется "символьная система с отношениями" (N), состоящая из множества символов (М), например, множества всех действительных чисел, и конечного набора отношений (Р) на этих символах : N = < M, P>. Отношения Р выбираются так, чтобы ими было удобно отображать наблюдаемые эмпирические отношения R. Если тело t тяжелее тела q, т.е. если имеет место отношение R(t>q), то цифровая запись веса тел t=5 и q=3 позволяет наглядно увидеть это эмпирическое событие в записи P(5>3). Договоренность использовать именно такое отображение системы E на систему N означает выбор некоторого определенного правила отображения g. Тройка элементов называется "шкалой" (не следует путать с физической приборной шкалой).
Но мы можем договориться и о некотором другом способе отображения w и тогда будем иметь дело с другой шкалой . Например, g рекомендует записывать вес тел в кг., а w - в граммах или тоннах. Цифровая запись в протоколах будет при этом разная, но эмпирическое содержание протоколов будет одинаковым. Это означает, что мы выбрали не любые способы отображений (g, w и т.д.), а только те, которые связаны между собой взаимно однозначными преобразованиями. Т.е. имеется такое преобразование f, с помощью которого по записи в языке g можно точно определить, какой будет запись в языке w (и наоборот) : g = f (w) и w = f'(g). Преобразование f объединяет указанные выше по разному выглядящие шкалы в определенную группу, которая называется "типом шкалы". Зафиксировав допустимое преобразование f, мы тем самым фиксируем конкретный тип шкалы.
В практике научных исследований получили распространение шкалы всего нескольких типов.
Приведем описание шкал основных типов.
1. Абсолютная шкала. Допустимое преобразование для шкал данного типа представляет собой тождество, т.е. если на одном языке в протоколе записано "у", а на другом языке "х", то между ними должно выполняться простое соотношение : у = х. Этот тип шкалы удобен для записи количества элементов в некотором конечном множестве. Если, пересчитав количество яблок, один запишет в протоколе "6", а другой запишет "VI", то нам достаточно знать, что "6" и "VI" означают одно и то же, т.е., что между этими записями существует тождественное отношение: 6 = VI.
2. Шкала отношений. Между разными протоколами, фиксирующими один и тот же эмпирический факт на разных языках, при этом типе шкалы должно выполняться соотношение: у = а*х, где а - любое положительное число. Один и тот же эмпирический смысл имеют протоколы "16 кг.", "16000 г.", "0, 016 т." и т.д. От любой записи можно перейти к любой другой, подобрав соответствующий множитель "a". Этот тип шкалы удобен для измерения весов, длин и т.д. Если нам не известно в каких именно единицах записаны веса тел в разных протоколах, то мы можем полагаться только на отношение весов двух тел: например, тело с весом 10 единиц в два раза тяжелее тела с весом 5 единиц вне зависимости от того, что было взято за единицу - тонна или грамм. Инвариантность отношений отражена в названии шкалы данного типа. Если же в протоколе указана единица веса, то такой протокол отражает свойства тел в абсолютной шкале.
3. Шкала интервалов. Здесь между протоколами y и x допустимы линейные преобразования: y = a*x + b, где а - любое положительное число, а b может быть как положительным, так и отрицательным. Это значит, что в разных протоколах может использоваться разный масштаб единиц (a) и разные начала отсчета (b). Примером шкал этого типа могут быть шкалы для измерения температуры. Если в протоколе указаны градусы, но не говорится в какой шкале (Цельсия, Кельвина и т.д.), то во избежание недоразумений при описании закономерностей можно использовать только отношения интервалов, так как при любых значениях a и b сохраняется равенство:
(y1-y2):(y3-y4) = [(a*x1+b)-(a*x2+b)] : [(a*x3+b)-(a*x4+b)].
Если записи в протоколе сопровождаются информацией о том, какие именно градусы имеются в виду (например, "18 град.С"), то мы имеем дело с протоколом в абсолютной шкале.
4. Шкала порядка. Допустимыми преобразованиями для данного типа шкалы являются все монотонные преобразования, т.е. такие, которые не нарушают порядок следования значений измеряемых величин. Такие протоколы появляются, например, в результате сравнения тел по твердости. Записи "1; 2; 3" и "5,3; 12,5; 109,2" содержат одинаковую информацию о том, что первое тело самое твердое, второе менее твердое, а третье - самое мягкое. И никакой информации о том, во сколько раз одно тверже другого, на сколько единиц оно тверже и т.д. в этих записях нет и полагаться на конкретные значения чисел, на их отношения или разности нельзя.
Разновидностью шкалы порядка является шкала рангов, где используются только числа, идущие подряд от 1 вверх по возрастанию. Если среди m измеряемых объектов одинаковых нет, то ранговое место каждого объекта в протоколе будет указано одним из целых чисел от 1 до m. При одинаковом значении измеряемого свойства у k объектов, занимающих порядковые места с t-го по (t+k)-тое, их ранги будут обозначены одинаковым числом, равным их "среднему" рангу x, где x = (1:k) S(i+t-1), i=1--k.
Такая разновидность шкалы порядка называется "нормированной шкалой рангов".
К типу шкал порядка относится и широко используемая шкала баллов. При этом используются целые числа в ограниченном диапозоне их значений: от 1 до 5 в системе образования, от 0 до 6 или до 10 в спорте и т.д. В любом из этих случаев протокол содержит информацию только о трех эмпирических отношениях: " " и " равно" и "не равно". Следовательно, допустимы любые преобразования, лишь бы в протоколе одинаковые объекты были поименованы одинаковыми символами (числами, буквами, словами), а разные объекты имели бы разные имена. Так фиксируются в протоколах такие характеристики, как собственные имена людей, их национальность, названия населенных пунктов и т.п.
Шкалы первых трех типов содержат более богатую информацию, их показания можно подвергать определенным математическим преобразованиям и потому их часто называют "сильными", "количественными" или "арифметическими". Шкалы порядка и наименований уступают им по информативности и отражают качественные свойства и их обычно называют "слабыми" и "качественными " [2]. Однако, рекомендовать пользоваться только "сильными" шкалами нельзя. Приборы для измерения сильных свойств более дорогие, для измерения многих свойств в сильных шкалах (особенно, в гуманитарных областях) таких приборов еще нет.

Важным элементом педагогических исследований является измерение тех или иных свойств: знаний, умений, способностей, мотивации, качества учебных материалов, степени наглядности и т.д.
Сущность измерений состоит в том, чтобы наблюдаемым переменным (объектам, событиям, явлениям) приписать некоторые значения, чаще всего численные. Такое приписывание производится по определенным правилам. Каждое правило порождает свою измерительную шкалу.

Файлы: 1 файл

ЗМЕРЕНИЯ ПРИ ПРОВЕДЕНИИ.doc

ЗМЕРЕНИЯ ПРИ ПРОВЕДЕНИИ
ПЕДАГОГИЧЕСКИХ ИССЛ ЕДОВАНИЙ

Измерительные шкалы, применяемые при педагогических

Важным элементом педагогических исследований является измерение тех или иных свойств: знаний, умений, способностей, мотивации, качества учебных материалов, степени наглядности и т.д.

Сущность измерений состоит в том, чтобы наблюдаемым переменным (объектам, событиям, явлениям) приписать некоторые значения, чаще всего численные. Такое приписывание производится по определенным правилам. Каждое правило порождает свою измерительную шкалу.

Чаще всего для измерений применяются числовые шкалы. В последнее время, в социологических и педагогических измерениях стали применять лингвистические и многомерные шкалы. Выбор соответствующей шкалы для измерений производится исследователем исходя из целей измерений и особенностей объекта измерений.

Каждой шкале можно дать геометрическое истолкование. Традиционные числовые шкалы можно представить в виде отрезка прямой, на которой в качестве точек отображаются измеряемые величины. Лингвистические шкалы также можно представить в виде отрезка прямой, однако измеряемая величина будет на ней изображаться в виде некоторого одномерного интервала, свойства которого определяются так называемой функцией принадлежности.

Многомерные шкалы представляют собой многомерное (в простейшем случае - двумерное) пространство, на ортогональных координатах которого изображаются в виде точек отдельного свойства (факторы), присущие измеряемому объекту. Совокупность таких точек на координатах задает точку (вектор) в выбранном пространстве. Процедура представления нескольких свойств объекта в виде точек в многомерном пространстве получила название многомерного шкалирования.

Наконец, можно представить многомерные лингвистические шкалы, в которых свойства объекта представляются не в виде точек на отдельных координатах, а в виде интервалов, как это делается в лингвистических шкалах. Тогда свойством измеряемого объекта в многомерном пространстве будет соответствовать некоторая пространственная область, свойства которой будут определяться функциями принадлежности отдельных одномерных интервалов отображенных на координатных осях.

Могут быть использованы и комбинированные шкалы, содержащие как количественные, так и качественные элементы. Одна из таких шкал - знаково-числовая используется в работе для оценивания качества диссертационных работ. При этом за основу выбрана традиционная пятибалльная шкала. Отдельные значения этой шкалы дополняются качественными признаками "+" и "-". Применение такой шкалы позволило разработать нестандартную методику оценивания качества диссертационных работ с использованием теории нечетных множеств. Видимо, для измерения различных величин педагогического характера могут быть предложены и другие комбинированные шкалы.

Рассмотрим основные свойства измерительных шкал.

К традиционным числовым шкалам относятся: номинальная шкала (наименований), ранговая шкала (порядка), интервальная шкала, шкала отношений и абсолютная шкала.

а) Шкала наименований (номинальная)

Построение и использование этой шкалы возможно, если установлен критерий, позволяющий по состоянию измеряемого свойства разделить объекты на несколько классов. При этом каждый объект может попасть только в один класс. Всей совокупности объектов, попавших в один класс, приписывается одно и то же число (или наименование). Совокупности объектов, попавших в другой класс, приписывается другое число и т.д. Важным является то, что числа, которые приписываются соответствующим объектом, обладают только свойствами равенства и различия.

Например, все студенты могут быть разбиты на два класса - участвующие в научных кружках и не участвующие. В данном случае используется шкала наименований с двумя градациями. Студенты могут быть разбиты на классы по критерию времени их обучения в вузе. В данном случае они могут быть отнесены к одному из нескольких классов: обучающиеся на 1 курсе, на 2 курсе и т.д.

Шкала наименований может быть представлена в виде прямой, на которой выбраны несколько произвольных точек, каждая из которых соответствует одному классу.

б) Шкала порядка (ранговая)

Для измерений по шкале порядка необходимо установить критерий, задающий на множестве измеряемых объектов отношения равенства и порядка, применительно к состоянию данного свойства.

Шкала порядка предполагает использование критерия, позволяющего расположить объекты по степени уменьшения (увеличения) измеряемого показателя, если при этом нет возможности определить, на сколько равных единиц по состоянию измеряемого признака один объект отличается от другого. Главное ограничение измерений, выполненных, по шкалам порядка состоит в том, что с числами (баллами, рангами), которые приписаны объектам, нужно обращаться с осторожностью. Методы статистической обработки материала, полученного с помощью таких шкал, ограничены.

Простейшая ранговая шкала имеет две градации. Как правило, результаты измерений по такой шкале обозначаются "1" и "0". "1" соответствует наличию измеряемого свойства, а "0" его отсутствию. Примером применения такой шкалы является оценивание при приеме зачета, когда оценка "зачтено" соответствует наличию знаний или умений, а "не зачтено" - отсутствию их.

Примером измерения по ранговой шкале с несколькими градациями может быть упорядочивание студентов по количеству книг, взятых для изучения в библиотеке.

Вторым примером может быть упорядочение студентов по количеству пропущенных занятий и т.д.

Геометрически ранговая шкала может быть изображена в виде прямой, на которой в виде последовательности точек изображены ранги отдельных измерений. Для удобства меньшим рангом могут приписываться меньшие числа, большим - большие. Часто в качестве рангов выбираются целые вещественные числа. Ранговые шкалы нашли широкое применение в педагогике.

в) Интервальная шкала

Для построения интервальной шкалы необходимо установить критерий, позволяющий определить интервалы между объектами педагогических измерений по состоянию измеряемых свойств, т.е. определить на сколько единиц один объект отличается от другого. Главное ограничение интервальной шкалы состоит в том, что начало отсчета в ней выбирается произвольно. В связи с этим нельзя определить, во сколько раз один объект отличается от другого.

Интервальные шкалы, так же, как и ранговые, нашли применение в педагогических исследованиях. Выставление преподавателем оценок в традиционной 4-х балльной шкале есть не что иное, как использование интервальной шкалы с 4-мя градациями. Впрочем, данную шкалу к интервальной можно отнести лишь условно. К сожалению, знания студентов оцениваются лишь приближенно и утверждать, что разница в объеме знаний между "4" и "5" равна такой же величине, как, например, между "2" и "3", было бы неправомерно. Здесь накладывается ряд случайных факторов: субъективное мнение преподавателя, умение студента изложить материал, содержание задаваемых вопросов и т.д. Тем не менее, когда подсчитывается средний балл за группу - это молчаливо свидетельствует, что данная шкала оценок признается интервальной. Правильно было бы считать, что шкалы данного типа геометрически изображаются в виде числовой оси.

В данной шкале положение нулевой точки не определено. А числовые значения "2", "3", "4", "5" являются не чем иным как данью установившимся традициям. С таким же успехом можно было бы выбрать другую последовательность целых чисел, например 7,8,9,10 и т.д.

Широко используется на практике обозначение оценок не цифрами, а словами "неудовлетворительно", "удовлетворительно", "хорошо", "отлично". Шкала такого типа является лингвистической. Для такой шкалы вычисление среднего балла бессмысленно. Об этом будет сказано ниже.

г) Шкала отношений

Шкала отношений отличается от интервальной тем, что в ней зафиксировано начало отсчета. В связи с этим возникает, возможность определить во сколько раз отличается один объект от другого. В педагогических исследованиях понятие абсолютного нуля, то есть полного отсутствия знаний, умений и навыков, практически не имеет смысла. Поэтому школы отношений в педагогике используются крайне редко.

Геометрически шкала отношений представляет собой числовую ось с зафиксированной нулевой точкой. Отдельным измерениям соответствуют числа на этой оси.

д) Абсолютная шкала

Абсолютной шкалой называется такая, в которой измеряемый объект тождественно преобразуется в числовую систему.

Например, в абсолютной шкале измеряется количество студентов, отсутствующих на занятиях или количество лабораторных макетов, необходимых для проведения занятий и т.д.

Геометрической интерпретацией данной шкалы является числовая ось.

Лингвис тические шкалы

Лингвистические шкалы отличаются от числовых тем, что в качестве переменной, измеряющей то или иное свойство объекта используются не числа, а слова. Эти слова лишь приближенно характеризуют свойства измеряемого объекта. Например, традиционные учебные оценки "отлично", "хорошо", "удовлетворительно" и "плохо" лишь приближенно отражают знания обучающегося. По существу, они являются лингвистическими значениями переменной "знания".

Лингвистические шкалы вошли в употребление относительно недавно и тесно связаны с возникновением теории нечетных величин.

Каждая лингвистическая переменная может принимать знания из некоторого множества, которое называется универсум. Для приведенного выше примера универсум есть числовая ось. На ней выделяются интервалы вблизи чисел 5,4, 3 и 2 (рис.1), соответствующие оценкам "отлично", "хорошо", "удовлетворительно", "неудовлетворительно".

неудов. удовл. хорошо отл ично

Рис.1 Интервалы чисел, относящиеся к значениям лингвистической переменной

Для каждого значения лингвистической переменной устанавливается так называемая функция принадлежности. В связи с тем, что лингвистические переменные носят нечеткий (расплывчатый), характер, значения переменной представляют некоторые множества чисел, каждому из которых приписывается число, указывающее возможность его появления. Совокупность таких чисел и носит название функции принадлежности.

Например, оценка "хорошо" может быть приближенно представлена функцией принадлежности, изображенной на рис.2. Выбор функции принадлежности неоднозначен и зависит от желания исследователя.

Рис.2 Пример функции принадлежности

Функция принадлежности ставит в соответствие каждому численному значению универсального множества (универсуму) число из интервала[0,1], характеризующее степень принадлежности точек универсума к значению "хорошо" (для нашего примера). В нашем случае на интервалах [0,3.3] и[4.7,∞]. Для точки 4, на отрезке [3.3,4.7] принадлежность знаний обучающегося к значению переменной "хорошо" равна ординате функции принадлежности.

Напомним, что функция принадлежности выбирается исследователем и носит субъективный характер.

На практике широко применяются функции принадлежности треугольного и трапециидального вида.

На рисунке 3 представлена в качестве иллюстрации принадлежность значений лингвистической переменной треугольного типа для случая традиционного оценивания знаний.

Шкала интервалов применяется достаточно редко и характеризуется тем, что для нее не существует ни естественного начала отсчета, ни естественной единицы измерения. Примером шкалы интервалов является шкала температур по Цельсию, Реомюру или Фаренгейту. Шкала Цельсия, как известно, была установлена следующим образом: за ноль была принята точка замерзания воды, 100 градусов — точка ее кипения, и… Читать ещё >

  • основные шкалы измерений. критерии оценивания педагогических экспериментов

Шкалы измерений. Основные шкалы измерений. Критерии оценивания педагогических экспериментов ( реферат , курсовая , диплом , контрольная )

Состояние объекта оценивается по тем или иным критериям. В качестве критериев могут выступать: успеваемость учащихся, эффективность управления образовательным учреждением и т. д.

Оценки измеряются в той или иной шкале. Шкала — это правило, на основе которого объектам приписываются числа, отражающие различные свойства этих объектов.

Выделяют шкалы отношений, интервальные шкалы, порядковые (ранговые) шкалы и номинальные шкалы (шкалы наименований).

Рассмотрим свойства четырех основных типов шкал, перечисляя их в порядке убывания мощности.

Шкала отношений — самая мощная шкала. Она позволяет оценивать, во сколько раз один измеряемый объект больше (меньше) другого объекта, принимаемого за эталон, единицу. Для шкал отношений существует естественное начало отсчета (нуль), но нет естественной единицы измерений.

Шкалами отношений измеряются почти все физические величины — время, линейные размеры, площади, объемы, сила тока, и т. д. В педагогических измерениях шкала отношений применяется, например, когда измеряется время выполнения того или иного задания (в секундах, минутах, часах и т. п. ), количество ошибок или число правильно решенных задач. В отдельных случаях, в том числе в исследованиях по трудовому и профессиональному обучению, применяются оценки и в мерах физических величин — величина допускаемых ошибок в миллиметрах при, допустим, токарной обработке деталей, величина силы нажатия учащимся на слесарный инструмент в ньютонах (килограммах), величина электрической активности мышц в милливольтах и т. п.

Порядковая шкала (шкала рангов) — шкала, относительно значений которой уже нельзя говорить ни о том, во сколько раз измеряемая велнчина больше (меньше) другой, ни на сколько она больше (меньше). Такая шкала только упорядочивает объекты, ІІриписывая им те или иные ранги (результатом измерений является нестрогое упорядочение объектов).

Например, так построена шкала твердости минералов Мооса: дан набор 10 эталонных минералов для определения относительной твердости методом царапанья. За 1 принят тальк, за 2 - гипс, за 3 — кальцит и так далее до 10 — алмаз. Любому минералу соответственно однозначно может быть приписана определенная твердость. Если исследуемый минерал, допустим, царапает кварц (7), но не царапает топаз (8) — соответственно его твердость будет равна 7. Аналогично построены шкалы силы ветра Бофорта и землетрясений Рихтера.

Шкалы порядка широко используются в педагогике, психологии, медицине и других науках, не столь точных, как, скажем, физика и химия. В частности, повсеместно распространенная шкала школьных отметок в баллах (пятибалльная, двенадцатибалльная и т. д. ) может быть отнесена к шкале порядка. В школах некоторых стран применяется и другая оценка успеваемости учащихся (как итоговая): порядковое место, которое данный ученик занимает в данном классе (выпуске). Это тоже шкала порядка.

Согласно наи­более распространенному определению, введенному в 1946 г. аме­риканским психологом С.Стивенсом, измерение — это процеду­ра приписывания чисел некоторым характеристикам объектов в соответствии с определенными правилами. Данное опреде­ление — результат формального обобщения опыта количествен­ных измерений, широко применяемых в физике и других есте­ственных науках, однако на протяжении многих лет его брали за основу и в эмпирических науках.

Неоднозначность оценивания в образовании усугубляется ла­тентным (скрытым, исключающим возможность непосредственно­го измерения) характером измеряемых переменных. В силу латентности оцениванию подвергаются не сами характеристики обученности и обучаемости, а их эмпирические референты — наблюдаемые признаки измеряемых характеристик. Выбор по­следних происходит интуитивно, поэтому их соответствие ла­тентным характеристикам нуждается в доказательстве на основе экспертного и статистического анализа эмпирических результа­тов измерения.

Современная теория измерений появилась в 80-х гг. XX в. Она стро­ится на более строгой аксиоматической основе|. В соответ­ствии с новыми представлениями, измерение трактуется как кон­струирование числовой функции, осуществляющей изоморфное отображение некоторой эмпирической структуры в соответствую­щим образом подобранную числовую структуру.

Изоморфизм — важное понятие математики, которое опреде­ляет ряд условий взаимно однозначного отображения двух мно­жеств с сохранением их свойств в процессе такого отображения. Хотя это понятие впервые появилось в высшей алгебре, в наше время оно используется довольно широко, хотя и не вполне стро­го, например в педагогических измерениях. Поскольку эмпири­ческая структура и строящаяся по результатам оценивания число­вая структура (шкала) изоморфны, имея шкалу, можно, не обра­щаясь непосредственно к измеряемым объектам, восстановить все их свойства, характерные для эмпирической структуры.

Компоненты процесса педагогических измерений.Процесс педа­гогических измерений включает:

- выбор предмета измерения (латентных характеристик объек­тов) и их числа;

- выбор эмпирических референтов (наблюдаемых характерис­тик объектов);

- выбор измерительных процедур;

- конструирование и использование измерительных инструмен­тов;

- выбор шкалы (если измеряемая переменная одна) или шкал (если измеряют более одной переменной при многомерных изме­рениях);

- построение отображения результатов измерения на шкалу (шкалы в случае многомерных измерений) по определенным про­цедурам и правилам;

- обработку, анализ и интерпретацию результатов измерения.

В силу неизбежности ошибок измерения оцениваемые характе­ристики объектов могут принимать более или менее точные значе­ния, поэтому эти характеристики принято называть переменными измерения. Любые отклонения от стандартизированных условий из­мерения, обработки, анализа и интерпретации полученных резуль­татов увеличивают ошибки измерения, которые представляют наи­большую опасность в эмпирических науках в силу латентного харак­тера переменных. Поэтому так важен анализ устойчивости и точно­сти (надежности) результатов тестирования, что выгодно отличает тесты от традиционных оценочных средств.

Еще одна характеристика качества результатов тестирования-валидность-отражает адекватность эмпирических результатов по­ставленным целям измерения. В силу многогранности целей анализ валидности должен быть многоаспектным, но в любом случае важное место занимает доказательство адекватности эмпи­рических референтов концептуально выделенной переменной (пе­ременных) измерения (конструктная валидность).

Измерительный инструмент.Измерительный инструмент вклю­чает два компонента. Первый компонент — само измеряю­щее устройство, роль которого в педагогических измерениях чаще всего, но не всегда выполняет тест. В самом обобщенном виде под гестом можно понимать совокупность контрольных заданий в стан­дартизированной форме, обладающих необходимыми системооб­разующими статистическими характеристиками и обеспечиваю­щих обоснованные оценки концептуально выделенной перемен­ной (переменных) измерения с высокой объективностью. Таким образом, в самом определении теста заложены требования к его качеству, отсутствующие в традиционных оценочных средствах.




Второй компонент измерительного инструмента — за­ранее подготовленная шкала, которая служит для фиксации ре­зультатов измерения и на которой откладываются оценки (коли­чественные или качественные) измеряемой переменной. В про­цессе упорядочения оценок каждому элементу совокупности на­блюдаемых эмпирических данных ставится в соответствие опреде­ленный балл, устанавливающий положение наблюдаемого эле­мента на шкале, где можно размещать сырые (первичные) баллы (результаты суммирования оценок по отдельным заданиям теста) или производные баллы, получающиеся в результате преобразо­вания первичных оценок для повышения сопоставимости и удоб­ства интерпретации результатов учащихся.

Шкала с отложенными оценками переменной является целью измерения. При измерениях с высокой надежностью и валидностью она адекватно отображает оцениваемые характеристики и представляет их без существенных искажений. В зависимости от ко­личества оцениваемых характеристик объекта можно говорить об одномерных (одна переменная) или многомерных (более одной пере­менной) измерениях. Соответственно по результатам измерения стро­ится одна шкала или несколько шкал, число которых в последнем случае обычно бывает равно числу переменных измерения.

Обработка и анализ данных измерения.Последний компонент процесса педагогических измерений, включающий обработку, анализ и интерпретацию данных, служит для выявления обеспе­чиваемого качества результатов измерения, коррекции тестов и представления полученных данных в форме, удобной для интер­претации и сравнения. Благодаря сопоставимости тестовых бал­лов, достигаемой в процессе обработки, по результатам педагоги­ческих измерений можно выстраивать качественный анализ ре­зультатов учащихся, проводить мониторинг и принимать обосно­ванные управленческие решения в образовании.

Объективность педагогических измерений. Может ли быть абсолютная объективность?Появление пер­вых стандартизованных тестов в образовании вызвало массовую позитивную реакцию, поскольку первоначально они рассматри­вались как средство получения объективных оценок подготов­ленности обучаемых, преодолевающее субъективизм традицион­ных оценочных средств. По мере развития теории педагогических измерений и накопления опыта применения тестов пришло по­нимание того, что абсолютная объективность — это недостижи­мая характеристика результатов любых, в том числе и педагоги­ческих, измерений в силу существования ошибочных компонен­тов, неизбежно смещающих оценки. Поэтому при использова­нии тестов можно говорить лишь о высокой или низкой объек­тивности, степень проявления которой связана с величиной на­дежности теста.

Сведение всех видов объективности только к процедурной не­допустимо, поскольку при таком подходе не выдвигается никаких требований к качеству теста. В этом случае может создаться впе­чатление, что для получения объективных данных о подготовлен­ности испытуемых достаточно перейти от традиционных экзаме­нов к любым, в том числе некачественным, тестам, устранив вли­яние педагога на оценку тестирования путем автоматизации про­цедуры подсчета баллов испытуемых.

Сырой (первичный, наблюдаемый, индивидуальный) балл по­лучается простым суммированием результатов испытуемого поотдельным заданиям теста. При дихотомической оценке резуль­татов по заданиям (1 или 0) индивидуальный балл равен коли­честву правильно выполненных заданий теста. Истинный балл в классической теории отождествляется с абсолютно объективной оценкой свойств испытуемого, свободной от влияния любых ошибок измерения. В отличие от сырого балла, который меняет­ся в зависимости от теста и способа подсчета результата испыту­емого, истинный балл трактуется как не зависящая от средств измерения константа, характеризующая оцениваемое свойство испытуемого в момент измерения, но меняющаяся в процессе обучения.

Согласно основной аксиоме классической теории тестов, лю­бой наблюдаемый балл равен сумме истинного балла и ошибки измерения. В тех случаях, когда ошибка измерения не превышает выбранных пределов точности измерений, говорят о высокой объективности результатов тестирования, а оценки испытуемых принимают за их истинные баллы. Таким образом, углубленное понимание объективности измерений требует оценивания вели­чины ошибки измерения, на размер которой влияют не только условия проведения тестирования, но и качество теста.

Инвариантная, или специфическая, объективность.Третья трак­товка объективности основана на современной теории конструи­рования тестов — Item Response Theory (IRT). Преимущества IRT, позволяющие оценить подготовленность обучаемых независимо от трудности заданий теста, приводят к достижению так называемой инвариантной объективности измерений, которая предпочтитель­нее объективности, обеспечиваемой классической теорией тестов.

Для достижения специфической объективности необходима подгонка данных тестирования к требованиям моделей теории IRT и длительная серьезная работа над тестом. Поэтому на практике тестологи часто сталкиваются с тем, что эффект инвариантной объективности либо реализуется со слишком большими затрата­ми, либо не реализуется вообще в силу недостаточно высокого качества теста.

Размерность пространства измерений, одномерные и многомерные конструкты, латентные переменные Концептуальные и реальные переменные измерения, конструкты.

Анализ такого соответствия является необходимым этапом оце­нивания валидности измерения. Нередко его пытаются провести априорно, до начала тестирования, экспертным путем, и в ре­зультате, как правило, получают недостоверную информацию. Для корректного оценивания валидности необходим статистический анализ эмпирических данных тестирования, поэтому понять, что же мы на самом деле измеряем, можно лишь после применения теста.

Сложность процедуры установления размерности пространства измерений увеличивает проблемы, связанные с неоднозначной трактовкой многих конструктов в образовании и в других соци­альных науках (рис. 2).

Каждый педагог вкладывает в оценивание учебных достижений свое видение оптимального набора перемен­ных измерения. Неоднозначность трактовки конструкта усугубля­ется по мере продвижения от начальных ступеней образования к более высоким ступеням, когда содержание большинства учеб­ных курсов приобретает междисциплинарный характер.

Операционализации. Операционализация заключается в прида­нии оцениваемым

латентным характеристикам подготовленности учащихся формы, удобной для фиксации определенными прави­лами измерения. При педагогическом измерении в качестве таких характеристик

Латентная переменная А Наблюдаемая переменная В

Рис. 3. Связь между латентной и наблюдаемой переменными

подготовленности обучаемых обычно выступают зна­ния, умения, навыки, компетентности и т.д.

В процессе операционализации происходит выделение набора эмпирических индикаторов, в роли которых выступают задания теста. Количество правильно выполненных заданий, подсчитан­ное и преобразованное по определенным правилам, дает основа­ние для присвоения испытуемому определенного места на шкале переменной измерения.

Гост

ГОСТ

Шкала – это средство, направленное на фиксацию результатов измерения свойств объектов посредством упорядочивания их в конкретную числовую систему, в рамках которой отношение между отдельными результатами выражено в соответствующих числах.

Во время упорядочивания каждому из элементов выборки определяется соответствующий шкальный индекс (балл), который и устанавливает положение исследуемого результата на шкале.

Понятие шкалирования в педагогике

Шкалирование — это операция, направленная на упорядочивание конкретных исходных эмпирических данных посредством перевода их в шкальные оценки.

Шкала предоставляет возможность упорядочить те явления, которые исследуются или наблюдаются, и дать им количественную оценку (квантирование). С помощью шкалирования определяется высшая и низшая ступени исследуемого объекта или явления.

В психолого-педагогических исследованиях общепринятой является классификация шкал, разработанная и предложенная С. Стивенсоном. Данная классификация предусматривает четыре основных метода измерения, которые связаны с разнообразными правилами измерения. Данные методы принято называть измерительными шкалами.

Классификация шкал в педагогике (автор С. Стивенсон):

Качественные дискретные шкалы:

  • шкала наименований (номинальная);
  • шкала порядковая (ранговая).

Качественные непрерывные шкалы:

В педагогических исследованиях шкалы различают по характеру свойств, которые заложены в основу их построения.

К основным свойствам относятся:

Готовые работы на аналогичную тему

  • идентичность шкалы, позволяющая объективно и однозначно соотнести объект с конкретной категорией;
  • транзитивность, способствует осуществлению ранжирования исследуемого объекта в установленном порядке;
  • метричность, обеспечивает единую единицу измерения;
  • наличие абсолютного нуля.

Характеристика шкалы порядка (порядковая, ранговая, ординальная)

Порядковая шкала (шкала порядка, ранговая или ординарная) – это шкала, предназначенная для осуществления измерения или обозначения степени различия определенного признака или свойства у различных объектов наблюдения (исследования). Например:

Для порядковой школы разработаны разные методы и критерии измерения.

Отличительной характеристикой порядковой школы является то, что она состоит из ряда упорядоченных объектов, классов или групп. Произвольная замена признаков в ней не допустима. То есть обязательным является сохранение упорядоченности объектов.

Именно поэтому является некорректным использование в педагогике среднего балла, так как вычисление среднего балла предусматривает сложение значений величины, а операция суммы порядковых шкал не может быть определена корректно. Например, утверждать о том, что уровень знаний учащихся в исследуемом экспериментальном классе, в среднем на 0,8 балла выше, чем в контрольном, будет не корректно, в том случае они были измерены в порядковой шкале.

Разновидности порядкового шкалирования

В настоящее время в педагогике выделено несколько видов порядкового шкалирования:

Читайте также: