Функциональная и корреляционная зависимость кратко

Обновлено: 05.07.2024

Функциональная зависимость и корреляция

Еще Гиппократ обратил внимание на то, что между телосложением и темпераментом людей, между строением их тела и предрасположенностью к заболеваниям существует определенная взаимосвязь.

В области физической культуры и спорта можно привести много примеров такой взаимосвязи. Например, от уровня силы во многом зависит результат, показанный спортсменом в таких видах спорта, как тяжелая атлетика, пауэрлифтинг, гиревой спорт, метание диска и толкание ядра и т.д. Результат в беге на 100 м во многом зависит от процента содержания в мышцах спортсменов быстрых мышечных волокон (II типа). Доказано, что у выдающихся спринтеров этот показатель превышает 80%. Чтобы определить, насколько сильна взаимосвязь между переменными (признаками) используется корреляционный анализ.

Две случайные величины X и Y могут быть:

  • связаны функциональной зависимостью (жестко, как зависимость переменных в математическом анализе);
  • независимыми;
  • связаны стохастической (вероятностной зависимостью) при которой изменение одной величины влечет изменение распределения другой.

В качестве меры связи между случайными величинами используется коэффициент корреляции. Коэффициент корреляции для генеральной совокупности обозначается ρ. Однако, как правило, он неизвестен. Поэтому он оценивается по экспериментальным данным, представляющим выборку объема n, полученную при совместном измерении двух переменных (признаков) X и Y. Коэффициент корреляции, определяемый по выборочным данным называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции). Его принято обозначать символом r. Наиболее часто в качестве оценок генерального коэффициента корреляции используется коэффициент корреляции Пирсона (r) и коэффициент корреляции Спирмена (rs).

Коэффициент корреляции Пирсона ( r )

Чтобы правильно применять корреляционный анализ в научных исследованиях, нужно учитывать условия применения этого метода.

Условия, при которых возможен расчет коэффициента корреляции Пирсона:

  1. Экспериментальные данные должны быть представлены в только в интервальной шкале или шкале отношений.
  2. Распределение экспериментальных данных подчиняется нормальному закону.
  3. Предполагается линейная зависимость между случайными величинами X и Y.

Коэффициент корреляции Спирмена ( r S)

При расчете коэффициента корреляции Спирмена требования к исходным данным менее строгие, а именно:

  1. Данные могут быть представлены в порядковой, интервальной шкале или шкале отношений.
  2. Допускается любой закон распределения случайных величин X и Y.
  3. Между случайными величинами X и Y должна существовать монотонно-возрастающая или монотонно-убывающая зависимость.

Свойства оценок коэффициентов корреляции

Рассчитанные коэффициенты корреляции могут принимать значения от -1 до +1.

Геометрическая интерпретация коэффициента корреляции

  1. Если коэффициент корреляции равен: r =+1 и r = -1, это означает, что случайные величины X и Y связаны жесткой линейной зависимостью.
  2. Если r ≠ 0, то чем ближе |r| к единице, тем сильнее линейная зависимость случайных величин X и Y.
  3. Если коэффициент корреляции положительный (r > 0) – это означает, что между случайными величинами X и Y существует положительная корреляция (или другими словами положительная корреляционная зависимость). Примером положительной корреляционной зависимости является увеличение результата прыжка в длину с увеличением силы мышц ног (рис.1А).
  4. Eсли коэффициент корреляции отрицательный (r Рис. 1. Геометрическая интерпретация коэффициента корреляции

Значимость коэффициента корреляции

Коэффициент корреляции между случайными величинами X и Y для генеральной совокупности как правило, неизвестен. Однако его можно оценить, рассчитав выборочный коэффициент корреляции (коэффициент корреляции Пирсона или Спирмена). Но при заменяя генеральную совокупность выборкой при оценке коэффициента корреляции допускается ошибка. Поэтому важно оценить значимость (достоверность) рассчитанного коэффициента корреляции.

Например, в эксперименте участвовало 10 человек. Оценивалась взаимосвязь между результатами в беге на 30 м и 100 м. Получен коэффициент корреляции r = 0,611. Чтобы оценить значимость коэффициента корреляции нужно сравнить его с критическим, величина которого зависит от объема выборки и уровня значимости. Если фактическое значение коэффициента корреляции больше, чем критическое, это означает, что коэффициент корреляции достоверен (значим). В нашем случае критическое значение коэффициента корреляции при n= 10 и α = 0,05 составляет r0,05 =0,632 (в таблице 1 это значение выделено жирным шрифтом). Из этого следует, что рассчитанный коэффициент корреляции статистически недостоверен. Приводить его в своих исследованиях нежелательно.

Таблица 1 — Критические значения коэффициента корреляции Пирсона

n 0,05 0,01 0,001
3 0,9969 0,999877 0,99999877
4 0,950 0,9900 0,9990
5 0,878 0,9597 0,99114
6 0,811 0,9172 0,9741
7 0,754 0,875 0,9509
8 0,707 0,834 0,9244
9 0,666 0,798 0,898
10 0,632 0,765 0,872
20 0,444 0,561 0,679
30 0,361 0,463 0,570
40 0,312 0,402 0,501
50 0,279 0,361 0,451

В итоговой таблице необходимо указать объем выборки, чтобы читающий мог оценить значимость (достоверность) вычисленных коэффициентов корреляции. Иногда в публикациях приводятся только значимые коэффициенты корреляции, а вместо незначимых ставится прочерк. В таблице 2 авторы указали, что объем выборки равен n = 32. Критическое значение коэффициента корреляции при n = 32 и a = 0,05 составляет r0,05 = 0,349 (В.С.Иванов, 1990). Следовательно, все коэффициенты корреляции достоверны.

Таблица 2 — Значения коэффициентов корреляции между результатами в скоростно-силовых тестах и результатом в толкании ядра с разгоном n=32, спортивный результат группы варьировал от 12,00 м до 20,50. Критическое значение коэффициента корреляции при n = 32 и a = 0,05 составляет r0,05 = 0,349 (по: Я.Е.Ланка, Ан.А.Шалманов, 1982).

Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаимозависимы и взаимообусловлены. В одних случаях связь (зависимость) между признаками оказывается очень тесной (например, часовая выработка и заработная плата), а в других случаях связь между признаками не обнаруживается или выражается очень слабо (например, пол студентов и их успеваемость). Чем теснее связь между признаками, тем точнее принимаемые решения и легче управление системами.

Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность причинности состоит в порождении одного явления другим. В любой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их изменение, другие — в качестве результатов действия этих факторов (одни представляют собой причину, другие — следствие). Признаки, характеризующие следствие, называются результативными (зависимыми, объясняемыми переменными у), признаки, характеризующие причины — факторными (независимыми, объясняющими переменными х).

Различают два типа зависимости между явлениями и их признаками: функциональную, или жестко детерминированную (например, зависимость выработки продукции на одного рабочего от объема выпущенной продукции и численности рабочих), и статистическую, или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции).

Функциональная зависимость -связь, при которой каждому значению независимой переменной х: соответствует точно определенное значение зависимой переменной у.

Статистическая зависимость-связь, при которой каждому значению независимой переменной х соответствует множество значений зависимой переменной у, причем неизвестно заранее, какое именно значение примет у

Частным случаем статистической зависимости является корреляционная зависимость - связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у.

Например: повышение квалификации работника ведет к росту производительности труда. Это положение подтверждается в массе явлений и не означает, что у двух или более рабочих одного разряда, занятых аналогичным процессом, будет одинаковая производительность труда. Уровни выработки будут различаться, так как у этих рабочих могут быть различными стаж работы, техническое| состояние станка, состояние здоровья и т.д.

Функциональная зависимость всегда выражается формулами, что в большей степени присуще точным наукам (математике, физике) С одинаковой силой проявляется у всех единиц совокупности, является полной и точной, так как обычно известен перечень всех факторов и механизм их воздействия на переменную в виде уравнения.

Корреляционная зависимость включает в себя разнообразие факторов. Их взаимосвязи и противоречивые действия вызывают широкое варьирование переменной у. Корреляционная связь обнаруживается не в единичных случаях, а в массе и требует для своего исследования массовых наблюдений Связь между переменными x иу неполная и проявляется лишь в средних величинах

Корреляционная связь в зависимости от направления действия бывает прямая и обратная.

Ø Прямая корреляционная связь заключается в том, что сувеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака.

Ø Обратная корреляционная связь заключается в том, что с увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного признака

По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной).

Ø прямолинейнаязависимость: с возрастанием величины факторного признака происходит равномерное возрастание (или убывание) величин результативного признака (выражаются уравнением прямой линии).




Ø нелинейная (криволинейная) зависимость: с возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно (выражаются уравнениями кривых линий).

В зависимости от количества признаков, включенных в модель., корреляционные связи делят на однофакторные и многофакторные.

Ø Однофакторные (парные) - связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других)

Ø Многофакторные (множественные) - связь между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи).

Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа.

Наиболее разработанной в эконометрике является методология парной линейной корреляции, рассматривающая влияние вариации переменной х на переменную у и представляющая собой однофакторный корреляционныйирегрессионный анализ.

Корреляционный анализ - раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Применяется тогда, когда данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону

Корреляционный анализ заключается в количественном определении тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи)

Корреляция -статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Ø Парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными)

Ø Частная корреляция- зависимость между результативным и одним факторным признаками или двумя факторными признаками при фиксированном значении других факторных признаков.

Ø Множественная корреляция - зависимость между результативным признаком и двумя и более факторными признаками, включенными в исследование

Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаимозависимы и взаимообусловлены. В одних случаях связь (зависимость) между признаками оказывается очень тесной (например, часовая выработка и заработная плата), а в других случаях связь между признаками не обнаруживается или выражается очень слабо (например, пол студентов и их успеваемость). Чем теснее связь между признаками, тем точнее принимаемые решения и легче управление системами.

Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность причинности состоит в порождении одного явления другим. В любой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их изменение, другие — в качестве результатов действия этих факторов (одни представляют собой причину, другие — следствие). Признаки, характеризующие следствие, называются результативными (зависимыми, объясняемыми переменными у), признаки, характеризующие причины — факторными (независимыми, объясняющими переменными х).

Различают два типа зависимости между явлениями и их признаками: функциональную, или жестко детерминированную (например, зависимость выработки продукции на одного рабочего от объема выпущенной продукции и численности рабочих), и статистическую, или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции).

Функциональная зависимость -связь, при которой каждому значению независимой переменной х: соответствует точно определенное значение зависимой переменной у.

Статистическая зависимость-связь, при которой каждому значению независимой переменной х соответствует множество значений зависимой переменной у, причем неизвестно заранее, какое именно значение примет у

Частным случаем статистической зависимости является корреляционная зависимость - связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у.

Например: повышение квалификации работника ведет к росту производительности труда. Это положение подтверждается в массе явлений и не означает, что у двух или более рабочих одного разряда, занятых аналогичным процессом, будет одинаковая производительность труда. Уровни выработки будут различаться, так как у этих рабочих могут быть различными стаж работы, техническое| состояние станка, состояние здоровья и т.д.

Функциональная зависимость всегда выражается формулами, что в большей степени присуще точным наукам (математике, физике) С одинаковой силой проявляется у всех единиц совокупности, является полной и точной, так как обычно известен перечень всех факторов и механизм их воздействия на переменную в виде уравнения.

Корреляционная зависимость включает в себя разнообразие факторов. Их взаимосвязи и противоречивые действия вызывают широкое варьирование переменной у. Корреляционная связь обнаруживается не в единичных случаях, а в массе и требует для своего исследования массовых наблюдений Связь между переменными x иу неполная и проявляется лишь в средних величинах

Корреляционная связь в зависимости от направления действия бывает прямая и обратная.

Ø Прямая корреляционная связь заключается в том, что сувеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака.

Ø Обратная корреляционная связь заключается в том, что с увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного признака

По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной).

Ø прямолинейнаязависимость: с возрастанием величины факторного признака происходит равномерное возрастание (или убывание) величин результативного признака (выражаются уравнением прямой линии).

Ø нелинейная (криволинейная) зависимость: с возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно (выражаются уравнениями кривых линий).

В зависимости от количества признаков, включенных в модель., корреляционные связи делят на однофакторные и многофакторные.

Ø Однофакторные (парные) - связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других)

Ø Многофакторные (множественные) - связь между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи).

Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа.

Наиболее разработанной в эконометрике является методология парной линейной корреляции, рассматривающая влияние вариации переменной х на переменную у и представляющая собой однофакторный корреляционныйирегрессионный анализ.

Корреляционный анализ - раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Применяется тогда, когда данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону

Корреляционный анализ заключается в количественном определении тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи)

Корреляция -статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Ø Парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными)

Ø Частная корреляция- зависимость между результативным и одним факторным признаками или двумя факторными признаками при фиксированном значении других факторных признаков.

Ø Множественная корреляция - зависимость между результативным признаком и двумя и более факторными признаками, включенными в исследование

Функциональная зависимость (связь), когда каждому значению одной переменной соответствует вполне определенное значение другой.

Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными, так и между случайными величинами.

Статистическая (или стохастическая, вероятностная) зависимость - каждому значению одной переменной соответствует определенное (условное) распределение другой переменной.

Т.е. когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной.

Возникновение понятия статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками.


В силу неоднозначности статистической зависимости между Y и Х для исследователя, в частности, представляет интерес усредненная по х схема зависимости, т.е. закономерность в изменении среднего значения - условного математического ожидания (математического ожидания случайной переменнойY, вычисленного в предположении, что переменная Х приняла значение х) в зависимости от х.

Определение. Статистическая зависимость между 2мя переменными, при которой каждому значению 1 переменной соответствует определенное условное математическое ожидание (среднее значение) другой, называется корреляционной.

Иначе, корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Корреляционная зависимость м.б. представлена в виде:


(1)


(2)

Предполагается, что и, т.е. если при изменении х или у условные математические ожиданияине изменяются, то говорят, что корреляционная зависимость между переменными Х иY отсутствует.

Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимости однозначно изменяется определенное значение переменной Y, при корреляционной - определенное среднее значение (условное математическое ожидание) Y, а при статистической - определенное (условное) распределение переменной Y. Т.о., из рассмотренных зависимостей наиболее общей выступает статистическая зависимость. Каждая корреляционная зависимость является статистической, но не каждая статистическая зависимость является корреляционной. Функциональная зависимость представляет частный случай корреляционной.

Уравнения (1) и (1) называются модельными уравнениями регрессии (или просто уравнениями регрессии) соответственно Y по Х и Х по Y, функции и-модельными функциями регрессии (или функциями регрессии), а их графики - модельными линиями регрессии (или линиями регрессии).

Линейная парная регрессия. Система нормальных уравне­ний для определения параметров прямых регрессии. Выборочная ковариация. Формулы для расчета коэффициентов регрессии.

Данные о статистической зав-ти удобно задавать в виде корреляционной таблицы.


(В таблице через иобозначены середины соответствующих интервалов, аи- соответственно их частоты).

Изобразим полученную зав-ть графически точками координатной плоскости. Такое изображение статистической зав-ти наз-ся полем корреляции.



Для каждого значения (i = 1,2. l), т.е. для каждой строки корреляционной таблицы вычислим групповые средние


где - частоты пар (,) и;m - число интервалов по переменной Y.

Вычисленные групповые средние графически в виде ломаной, называемой эмпирической линией регрессии У по Х.


Аналогично для каждого значения (j = 1,2. m):


.


где ;l- число интервалов по переменной Х.

По виду ломаной можно предположить наличие линейной корреляционной зав-ти У по Х между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки n:


Поэтому уравнение регрессии будем искать в виде:


.

Применим метод наименьших квадратов, согласно которому неизвестные параметры ивыбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних, от значений, найденных по уравнению регрессии, был минимальной:

Система нормальных уравнений для определения параметров линейной регрессии:



.

где соответствующие средние определяются по формулам:

, ,.


.


Подставляя значение из первого уравнения системы в уравнение регрессии, получим:

, или .

Коэффициент в уравнении регрессии, называемыйвыборочным коэффициентом регрессии (или просто коэффициентом регрессии) Y по Х, будем обозначать символом . Теперьуравнение регрессии У по Х запишется так:


.

Коэффициент регрессии У по Х показывает, на сколько единиц в среднем изменяется переменная У при увеличении переменной Х на одну единицу.

Решая систему, найдем



где - выборочная дисперсия переменной Х:


μ - выборочный корреляционный момент или выборочная ковариация:


Рассуждая аналогично и полагая уравнение регрессии линейным, можно привести его к виду:


.


Где - выборочныйкоэффициент регрессии (или просто коэффициент регрессии) Х по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной У на одну единицу;


- выборочная дисперсия переменной У.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Большинство социально-экономических явлений и процессов, исследуемых статистикой, взаимосвязаны между собой. Поэтому одна из основных задач статистики состоит в установлении и измерении причинно-следственных связей между изучаемой случайной величиной Y и одной или несколькими случайными (или неслучайными) величинами Х1, Х 2 , …, Хn.

При изучении причинно-следственных связей выделяют факторные и результативные признаки. Результативные признаки Y выступают в роли функции, т. к. они изменяются под воздействием факторных признаков. Факторные признаки Х1, Х2, …, Хn выступают в роли аргументов функции, т. к. они влияют на изменение результативных признаков.

Различают два вида связей между случайными величинами – функциональную и корреляционную.

Функциональная зависимость характеризуется полным соответствием между зависимой (результативной) переменной Y и факторной переменной Х. Но в связи с тем что факторные и результативные переменные подвержены воздействию случайных факторов, как общих для обоих переменных, так и индивидуальных, то строгая функциональная зависимость на практике встречается редко.

Предположим, что результативная переменная /зависит от случайных факторов Т1, Т2, М1, М2, а факторная переменная Х зависит от случайных факторов Т1, Т2, К1, то Y и Х связаны статистической зависимостью, т. к. среди случайных факторов есть общие – Т1 и Т2.

Статистическая зависимость характеризуется изменением распределения одной величины под влиянием изменения другой.

Корреляционная зависимость характеризуется изменением средней величины одного из признаков под влиянием изменения значения другого признака.

Зависимости между факторной и результативной переменными могут быть прямыми или обратными:

1) при наличии между переменными прямой связи направление изменения результативной переменной совпадает с направлением изменения факторной переменной (с увеличением Х увеличивается и Y);

2) при наличии между переменными обратной связи направление изменения результативной переменной противоположно направлению изменения факторной переменной (с увеличением Х переменная Y уменьшается).

Корреляционные зависимости в зависимости от количества факторных переменных делятся на однофакторные (простые) и многофакторные (множественные):

1) однофакторные корреляционные связи – это связи между одной факторной переменной Х и одной результативной переменой Y;

2) многофакторные корреляционные связи – это связи между несколькими факторными Х1, Х2, …, Хn и одной результативной переменной Y.

Условным средним yx называется среднее арифметическое значений результативной переменной Y при условии, что Х = х. Тогда корреляционную зависимость результативной переменной Y от Х можно определить как функциональную зависимость условной средней yx от х:

Полученное равенство называется уравнением регрессии Y на Х, а функция f(x) называется регрессией Y на Х.

Регрессией называется функция, позволяющая по величине одной корреляционно связанной переменной рассчитать среднюю величину другой переменной.

Основные задачи , решаемые с помощью корреляционно-регрессионного анализа:

1) определение формы корреляционной зависимости, т. е. вида функции регрессии (линейной, степенной и др.);

2) оценка степени тесноты корреляционной связи между переменными либо на основе графика, либо на основе расчета специальных показателей тесноты связи.

Важнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.

Изучение разнообразных явлений сопровождается выяснением закономерностей, которым подчиняются характерные для данных явлений количественные соотношения или связи. Различают два типа связей: функциональную и статистическую.

Функциональной зависимостью некоторой величины Y от нескольких переменных х1, х2,…, хn называется связь, в соответствии с которой Y зависит только от перечисленных переменных х1, х2,…, хn и каждому значению переменных х1, х2,…, хn соответствует только одно значение Y.

Понятия функции недостаточно, чтобы описать всевозможные причинные связи, с которыми жизнь нас сталкивает повседневно. В реальном мире все явления и процессы связаны между собой, и нет такого конечного числа переменных х1, х2,…, хn, которые абсолютно полно определяли бы собою случайную величину Y, в силу чего функциональная зависимость является абстракцией, упрощающей действительность. Например, совершенно очевидно, что между ростом и весом человека существует зависимость, но мы знаем сколько угодно людей, у которых одинаковый рост, но разный вес. Следовательно, зависимость веса от роста не является функциональной.

Статистической зависимостью величины Y от нескольких переменных х1, х2,…, хn называется связь, в соответствии с которой при изменении значения факторных переменных х1, х2,…, хn результативная переменная Y может принимать любые значения с некоторыми вероятностями, но ее среднее значение или иные статистические характеристики изменяются по определенному закону. Статистическая связь между различными показателями предполагает, что каждый из них имеет случайную вариацию индивидуальных значений относительно средней величины.

В статистике явления, влияющие на другие, называются факториальными, а те, которые изменяются под воздействием факториальных явлений или зависят от них — результативными. Если бы эти термины были приемлемы в социологии права или криминологии, то показатели преступности следовало бы отнести к результативным явлениям, а ее причины и условия — к факториальным. Примером могут служить многочисленные данные, показывающие зависимость преступности от уровня воспитания, наличия в семье обоих родителей, пьянства, безработицы и т. п.

Корреляционной связьюдвух переменных X и Y называют частный случай статистической связи, состоящий в том, что разным значениям факторной переменной X соответствуют различные средние значения результативной переменной Y.

Корреляционная связь между признаками может возникать тремя путями. Во-первых, она может проявиться как причинная зависимость результативного признака (его вариации) от вариации факторного признака. Например, признак X - уровень безработицы, признак Y - уровень преступности.

Во-вторых, она может проявиться между двумя следствиями общей причины. Известен пример, приведенный А.А.Чупровым [6] : если в качестве признака X взять число пожарных команд в городе, а за признак Y - сумму убытков за год в городе от пожаров, то между признаками X и Y в совокупности городов России имеется прямая корреляция. В среднем, чем больше пожарников в городе, тем больше и убытков от пожаров! Данную корреляцию нельзя интерпретировать как связь причины и следствия; оба признака - следствия общей причины - размера города.

В-третьих, корреляция возникает при взаимосвязи признаков, каждый из которых может выступать и как причина, и как следствие. Такова, например, корреляция между уровнем производительности труда и уровнем оплаты одного часа труда (тарифной ставкой). С одной стороны, чем выше производительность труда, тем выше и оплата. Но с другой стороны, установленные тарифные ставки выступают в качестве стимулирующего фактора по отношению к производительности труда. В такой системе каждый признак может выступать и в роли независимой переменной X, и в качестве зависимой переменной Y.

Если рассматривается взаимосвязь двух переменных, в которой случайную вариацию имеет лишь один из признаков, а значения другого являются строго определенными, то говорят о регрессии, а не о статистической связи. Например, при анализе динамических рядов можно измерять регрессию уровня преступности на номера лет, но нельзя говорить о корреляции между ними и применять показатели корреляции с соответствующей им интерпретацией.

Читайте также: