Методы обработки данных кратко

Обновлено: 03.07.2024

В математике и статистике разработано множество методов анализа данных, которые применяются в различных сферах человеческой деятельности, в том числе в маркетинге и маркетинговых исследованиях. Условно все методы можно разделить на простые и сложные.

К простым методам относятся описательные(дескриптивные) статистики, задача которых предоставить исследователю первичную информацию об изучаемом объекте или феномене. Как правило, они представляют собой модели одномерной или двумерной классификации объектов, которые можно описать, соответственно, посредством одной или двух переменных (характеристик).

Группа более сложных методов в применении и интерпретации полученных при их помощи результатов, представляет собой модели многомерной классификации объектов. Объекты, описываемые большим количеством переменных, нуждаются в более сложном исследовании.

В арсенале сотрудников агентства находятся обе группы методов, что позволяет решать практически любые задачи.

Важным с точки зрения получения результата является этап выбора метода или отбора нескольких методов, которые должны в наибольшей мере подходить для решения поставленных в исследовании задач. Результат определяется в том числе и набором статистических процедур анализа, которые определят квалифицированные специалисты агентства.

Основные процедуры анализа данных в агентстве DISCOVERY Research Group:

  • одномерные частотные распределения
  • таблицы сопряженности
  • сравнение средних
  • непараметрические тесты
  • факторный анализ
  • кластерный анализ
  • регрессионный анализ (одномерная и многомерная линейная регрессия, нелинейная регрессия, логистическая регрессия)
  • дисперсионный анализ
  • корреляционный анализ
  • дискриминантный анализ
  • многомерное шкалирование
  • временные ряды (Time-series analysis)
  • путевой анализ
  • контент-анализ (1) Традиционный (качественный)
  • контент-анализ (2) Квантитативный (количественный) с применением пакетов программ
  • другие

Обработка и анализ данных проводятся под руководством высокопрофессиональных специалистов агентства.

Обработка данных направлена на решение следующих задач:

1) упорядочивание исходного материала, преобразование множества данных в целостную систему сведений, на основе которой возможно дальнейшее описание и объяснение изучаемых объекта и предмета;

2) обнаружение и ликвидация ошибок, недочетов, пробелов в сведени­ях; 3) выявление скрытых от непосредственного восприятия тенденций, закономерностей и связей; 4) обнаружение новых фактов, которые не ожидались и не были замечены в ходе эмпирического процесса; 5) вы­яснение уровня достоверности, надежности и точности собранных дан­ных и получение на их базе научно обоснованных результатов.

В качественной обработке доминирует синтетическая составляю­щая познания, причем в этом синтезе превалирует компонент объеди­нения и в меньшей степени присутствует компонент обобщения. Обоб­щение — прерогатива следующего этапа исследовательского процес­са— интерпретационного. В фазе качественной обработки данных главное заключается не в раскрытии сущности изучаемого явления, а пока лишь в соответствующем представлении сведений о нем, обеспе­чивающем дальнейшее его теоретическое изучение. Обычно результа­том качественной обработки является интегрированное представление о множестве свойств объекта или множестве объектов в форме класси­фикаций и типологий. Качественная обработка в значительной мере апеллирует к методам логики.

Качественная обработка естественным образом выливается в опи­сание и объяснение изучаемых явлений, что составляет уже следую­щий уровень их изучения, осуществляемый на стадии интерпретации результатов. Количественная же обработка полностью относится к эта­пу обработки данных. [17]

К основным методам количественного анализа (и синтеза) в психологии относятся следующие:

1. Методы первичной обработки данных (табулирование,

построение диаграмм, гистограмм, полигонов и кривых распределения).

2. Методы вторичной обработки данных (вычисление ста-

3. Корреляционный анализ.

4. Дисперсионный анализ.

5. Регрессионный анализ.

6. Факторный анализ.

7. Таксономический (кластерный) анализ.

Выше при освещении этапа обработки данных в психологическом исследовании приводились краткие характеристики всех перечисленных методов кроме двух последних. Восполним этот пробел.

Метод представляет собой математический прием группировки данных в классы (таксоны, кластеры) таким образом, чтобы объекты, входящие в один класс, были более однородны по какому-либо признаку по сравнению с объектами, входящими в другие классы. В итоге появляется возможность определить в той или иной метрике расстояние между изучаемыми объектами и дать упорядоченное описание их взаимоотношений на количественном уровне [123, 226, 375]. В силу недостаточной проработанности критерия эффективности и допустимости кластерных процедур данный метод применяется обычно в сочетании с другими способами количественного анализа данных. С другой стороны, и сам таксономический анализ используется как дополнительная страховка надежности результатов, полученных с использованием других количественных методов, в частности факторного анализа. Суть кластерного анализа позволяет рассматривать его как метод, явно совмещающий количественную обработку данных с их качественным анализом. Поэтому причислить его однозначно к разряду количественных методов, видимо, не правомерно. Но поскольку процедура метода по преимуществу математическая и результаты могут быть представлены численно, то и метод в целом будем относить к категории количественных.

Шкалирование в еще большей степени, чем таксономический анализ, совмещает в себе черты количественного и качественного изучения реальности. Количественный аспект шкалирования состоит в том, что в его процедуру в подавляющем большинстве случаев входят измерение и числовое представление данных. Качественный аспект шкалирования выражается в том, что, во-первых, оно позволяет манипулировать не только количественными данными, но и данными, не имеющими единиц измерения, а во-вторых, включает в себя элементы качественных методов (классификации, типологизации, систематизации).

Еще одной принципиальной особенностью шкалирования, затрудняющей определение его места в общей системе научных методов, является совмещение в нем процедур сбора данных и их обработки. Можно даже говорить о единстве эмпирических и аналитических процедур при шкалировании. Не только в конкретном исследовании трудно указать на последовательность и разнесенность этих процедур (они часто совершаются одновременно и совместно), но и в теоретическом плане не удается обнаружить стадиальную иерархию (невозможно сказать, что первично, а что вторично).

В самом общем смысле шкалирование есть способ познания мира через моделирование реальности с помощью формальных (в первую очередь, числовых) систем. Применяется этот способ практически во всех сферах научного познания (в естественных, точных, гуманитарных, социальных, технических науках) и имеет широкое прикладное значение.

Наиболее строгим определением представляется следующее: шкалирование– это процесс отображения по заданным правилам эмпирических множеств в формальные.Под эмпирическим множеством понимается любая совокупность реальных объектов (людей, животных, явлений, свойств, процессов, событий), находящихся в определенных отношениях друг с другом. Эти отношения могут быть представлены четырьмя типами (эмпирическими операциями): 1) равенство (равно – не равно); 2) ранговый порядок (больше – меньше); 3) равенство интервалов; 4) равенство отношений.

По природе эмпирического множества шкалирование делится на два вида: физическоеи психологическое. Впервом случае шкалированию подвергаются объективные (физические) характеристики объектов, во втором – субъективные (психологические).

Психологи собирают сведения об объекте исследования путем проведения экспериментов.

Обработка полученных данных производится при помощи специальных научных методов.

О видах контент-анализа в психологии вы можете узнать из нашей статьи.

Назначение методов

Каково назначение методов?

Психологические исследования позволяют выявить некоторые общие черты, свойственные популяции людей.

Под популяцией понимается совокупность объектов изучения, которых объединяет какой-то общий признак.

Это могут быть представители одной социальной группы, сообщества, возрастной категории, профессиональной области и т.д.

Для проведения исследования производится выборка, которая должна быть репрезентативной (т.е. максимально точно и достоверно отражать характеристику всей совокупности в целом). Полученные в результате работы психолога результаты подлежат обработке.

Обработка данных , это отдельная область экспериментальной психологии, напрямую связанная с математикой, статистикой.

Любое психологическое исследование состоит из нескольких этапов: разработка программы, проведение процедур, анализ полученных результатов.

Методы математической обработки данных позволяют проверить достоверность начальных гипотез и, соответственно, опровергнуть их или подтвердить. В итоге решаются следующие задачи:

  • систематизируются полученные сведения,
  • выявляются допущенные ошибки, неточности,
  • обнаруживаются скрытые закономерности, связи,
  • определяется достоверность результатов.

Назначение методов обработки

Обработка данных бывает количественной и качественной.

В первом случае изучаются различные параметры объекта исследования, которые подлежат измерению.

Во втором случае речь идет о проникновении в суть проблемы, выявлении глубинных процессов. Оба уровня тесно связаны между собой, поскольку только единство из применения позволяет получить точные результаты.

При этом качественные данные невозможно измерить, единственный способ их математической оценки , выявление частоты встречаемости (например, как часто встречается среди испытуемых холерический тип темперамента).

Количественные же данные можно анализировать при помощи специальных статистических методов, в основе которых лежат математические параметры.

Количественная обработка производится при помощи двух групп методов: первичных, вторичных.

Классификация

Методы статистической обработки , это математические формулы, приемы, количественные расчеты, которые позволяют систематизировать полученные в ходе исследования сведения, выявить имеющиеся закономерности.

Что такое принцип системности в психологии? Читайте об этом здесь.

Первичные

Первичные методы

Первичные методы позволяют установить показатели, отражающие непосредственные результаты исследований.

С их помощью психолог может сформировать свое первое представление об объекте: о его характеристиках, об имеющихся закономерностях и т.д.

Например, если большинство испытуемых демонстрируют во время эксперимента одну и ту же реакцию на какой-либо раздражитель, то количественный показатель по данной реакции будет относиться к моде.

Вторичные анализы

Вторичные анализы: виды

Вторичные методы математико-статистического анализа направлены на более глубокое изучение вопроса.

Они помогают выявлять скрытые закономерности, устанавливать взаимосвязи.

Вторичные методы: корреляционный анализ, регрессионный анализ, факторный анализ и др.

Корреляционный

Между двумя переменными может существовать определенная зависимость. При наличии такой зависимости изменения в одной переменной автоматически стимулируют изменения показателей второй переменной.

Подобная связь присутствует, когда имеются некоторые общие факторы, оказывающее влияние в обоих случаях. Уровень зависимости, существующий между переменными, называется корреляционным коэффициентом. Диапазон его колебаний: от , 1 до +1.

При отрицательном значении показателя специалист делает вывод, что увеличение значений одной переменной приводит к уменьшению значения другой.

Нулевой коэффициент корреляции свидетельствует об отсутствии взаимосвязи между явлениями. Его положительное значение подтверждает, что прямая зависимость между переменными присутствует. Причем чем эта зависимость существеннее, тем ближе показатель приближается к отметке 1.

Регрессионный

Регрессионный анализ

Позволяет выявить зависимость одной случайной переменной от другой или нескольких других случайных переменных.

Первый показатель считается зависимым, остальные показатели , независимые.

Исследователь самостоятельно определяет, какие переменные будут выполнять выбранные роли. Его решение зависит от того, какие задачи ставятся изначально.

Факторный

Суть метода , выявление некоторого фактора, объединяющего большое количество переменных по какому-либо признаку.

Это позволяет сузить массив обрабатываемой информации до оптимальных значений. При помощи факторного анализа все многообразие данных объединяется в несколько ключевых показателей.

Активно используется в психологии при работе с большими объемами информации.

Он позволяет выявить скрытые признаки и закономерности, причины возникновения явлений. Существуют разные типы факторного анализа: перспективный, ретроспективный, прямой, обратный и т.д.

Канонический

Канонический анализ

Позволяет установить зависимость между двумя модулями переменных, которые характеризуют объекты.

Данный способ исследования помогает обобщить информацию и выявить влияние одного фактора на группу переменных.

Например, в сфере педагогики специалист может при помощи данного приема выявить зависимость между успеваемостью детей по нескольким видам дисциплин и уровнем развития у них какого-либо навыка.

Или можно выявить уровень влияния какого-либо внешнего фактора на развитие определенных психологических проблем.

Для чего используется лонгитюдный метод в психологии? Ответ вы найдете на нашем сайте.

Сравнение средних

Нередко при сравнении средних показателей двух серий экспериментов исследователь обнаруживает несовпадение. Это может быть вызвано как совершенными специалистом во время проведения эксперимента ошибками, так и иными причинами.

Например, в рамках исследования уровня знаний студентов университета, группе первокурсников моет быть предложено пройти тест, состоящий из 60 вопросов. Через 5 лет этой же группе студентов, являющихся выпускниками, предлагается вновь пройти тот же самый тест.

То есть и объекты исследования, и предмет исследования, и содержание эксперимента никак не изменяются. Проходит лишь определенный промежуток времени.

Сравнение средних показателей наверняка продемонстрирует явное несовпадение результатов. В данном случае исследователь после анализа данных скорее всего придет к выводу, что средний показатель уровня знаний студентов за время обучения повышается.

Сравнение дисперсий

Сравнение дисперсий - что это такое?

Предыдущий метод не всегда позволяет получить исчерпывающую информацию.

Сравнение средних величин помогает исследователю проследить взаимосвязь между двумя уровнями одного и того же объекта.

В этом случае данные, подтверждающие разные уровни успеваемости, будут свидетельствовать об изменчивости исследуемого показателя.

Частотный

Создание специальных таблиц частот для изучения категориальных переменных.

Возможно применение данного способа обработки данных и в отношении количественных переменных, но в таком случае могут возникнуть сложности при интерпретации результатов.

Обычно данные таблицы частот представляют собой графические изображения в виде гистограмм.

Частотный ряд имеет смысл применять в том случае, когда в исходной выборке присутствует множество схожих значений.

Кластерный

Кластерный метод

Данный способ классификации полученных данных применяется при больших объемах информации.

Все многочисленные объекты исследования разбиваются на группы по схожим признакам.

Подобный многомерный метод актуален для исследований, в которых присутствует большое количество объектов или у незначительного числа объектов выявляется многообразие признаков.

Несомненным преимуществом подхода является тот факт, что объекты могут объединяться в однородные группы не только по одному схожему признаку, но и по совокупности признаков.

Также кластерный анализ в отличие от большинства других статистических методов не налагает никаких ограничений на вид объектов, подлежащих рассмотрению. Соответственно, становится возможным выбор данных произвольного характера.

Дискриминантный

Также используется в многомерных исследованиях при существенном объеме исходных данных. В данном случае изначально определяется перечень нескольких групп, обладающих определенными характеристиками. Каждый объект с учетом свойственных ему признаков соответствует одной из заданных групп.

Дискриминантный подход

Подход помогает решить две ключевые проблемы: выявить четкие различия между классами объектов, классифицировать эти объекты с учетом имеющихся различий.

Помимо вышеперечисленных статистических способов обработки данных существуют и другие приемы, которыми эффективно пользуются специалисты.

Выбор наиболее подходящего метода исследования зависит от задач, которые ставит перед собой психолог, а также от характеристик объектов и их количества.

Таким образом, для интерпретации данных психологических исследований применяются принципы статистического анализа. Классификация методов обработки полученных результатов достаточно обширна ввиду большого количества критериев оценки изучаемых объектов.

Что такое близнецовый метод в психологии? Читайте об этом тут.

Читайте также: