Что такое диаграмма рассеивания кратко

Обновлено: 05.07.2024

При проведении анализа данных часто на практике необходимо оценить зависимости между парами соответствующих элементов, например, вариация размера отверстия в зависимости от скорости вращения сверла, скорость вращения токарного станка и размер детали. Для этого используют диаграммы рассеивания, позволяющие без математической обработки данных установить зависимости по графическому представлению. Таким образом, данный статистический инструмент может быть использован линейным персоналом и менеджментом.
Данная диаграмма позволяет установить зависимости для

  • двух различных характеристик качества
  • двух факторов, влияющих на одну и ту же характеристику качества
  • характеристик качества процесса и фактора, влияющего на ход процесса

Для понимания связи между выбранными параметрами необходимо построить диаграмму рассеивания и понять ситуацию в целом.

Построение диаграммы:

  1. Собрать парные данные x и y между которыми необходимо исследовать зависимость. Парных данных должно быть не меньше 35.
  2. Найти максимальное и минимальное значение для x и y. Выбрать шкалы на горизонтальной и вертикальной оси так, чтобы изменение факторов по осям приходилось на отрезки примерно одинаковой длины для удобства чтения диаграммы. При анализе влияния фактора на параметр качества по оси OX обычно располагают значения фактора, а по OY – параметра качества.
  3. Построить график и нанести на него данные. Если парные данные повторяются дважды, то рядом рисуются две точки, или кружок
  4. Нанести на диаграмму все необходимые обозначения:
    • интервала времени
    • число данных
    • название и единицы измерения
    • имя, должность, человека, строящего диаграмму и оператора, собиравшего данные для диаграммы.

r1

Пример:
При процессе выпуска литьевых поддонов багажника компания сталкивается с проблемой при литье под давлением. Было высказано предположение, что причина тонких стенок поддонов, приводящих для конечного клиента к быстрому истиранию и повреждению заключается в вариации давления сжатого воздуха, которое меняется каждый день.
Было принято решение провести анализ и установить наличие или отсутствие данной зависимости (Рис.1).
Собраны данные за один месяц. Технология литья непрерывная, без выходных

Рис.1

r2

Чтение диаграммы рассеивания
По диаграмме рассеивания можно судить о об общем распределении пар чисел. Для этого необходимо, во-первых, выяснить если ли далеко отстоящие точки – они являются выбросами. Если есть далеко отстоящие точки, то их надо исключить из корреляционного анализа, но пренебрегать ими нельзя. Стоит обратить на них внимание, так как причиной выброса могут не только неверно занесённые данные, но внутренние причины процесса, которые могут дать полезную информацию (Рис.2).

Рис.2

Для изучения связи между x и y необходимо вычислить коэффициент корреляции r.

fc1


Число n – число пар данных
S(xy) – ковариация – мера линейной зависимости двух случайных величин.
r ∈ [-1;1]

Диаграмма рассеяния (также точечная диаграмма, англ. scatter plot ) — математическая диаграмма, изображающая значения двух переменных в виде точек на декартовой плоскости. Могут использоваться и полярные координаты, особенно в случаях, когда одна из переменных представляет собой физическое направление или имеет циклический характер.

На диаграмме рассеяния каждому наблюдению (или элементарной единице набора данных) соответствует точка, координаты которой равны значениям двух каких-то параметров этого наблюдения. Если предполагается, что один из параметров зависит от другого, то обычно значения независимого параметра откладывается по горизонтальной оси, а значения зависимого — по вертикальной. Диаграммы рассеяния используются для демонстрации наличия или отсутствия корреляции между двумя переменными.

В физике под диаграммой рассеяния обычно понимают подобную диаграмму для случая физического рассеяния частиц, при этом независимая переменная (представленная обычно горизонтальной декартовой координатой или углом в полярных координатах) представляет собой физический угол рассеяния частицы (в этом случае нередко используются полярные координаты) или энергию падающих частиц, а зависимая координата (вертикальная в декартовых или радиальная в полярных) — эффективное сечение рассеяния — может быть представлено, в том числе на одной диаграмме, и теоретическое значение (тогда нередко это непрерывная кривая), и экспериментальные оценки (часто в виде точек, дополненных изображением доверительных интервалов).

Часто приходится выяснять, существует ли зависимость между двумя различными параметрами процесса. Например, зависят ли изменения в диаметре отверстия от изменений скорости вращения сверла.

Обычно предполагается, что исследуемые параметры отражают харак­теристики качества и влияющие на них факторы. Чтобы понять, есть ли ка­кая-либо связь между рассматриваемыми параметрами, используют диа­граммы рассеивания.

Диаграмма рассеивания- это графическое представление пар исследуемых данных в виде множества точек на координатной плоскости.

Диаграмма рассеивания даёт возможность выдвинуть гипотезу о нали­чии или отсутствии корреляционной связи между двумя случайными величинами. При этом изучаются обычно величины, описы­вающие:

· характеристику качества и влияющий на неё фактор;

· две различные характеристики качества;

· два фактора, влияющие на одну характеристику качества.

Пример диаграммы рассеивания представлен на рис. 4.17. и рис 4.18 а - 4.18 ж.

Рисунок 4.17. Диаграмма рассеивания (положительная корреляция)

Диаграмма разброса при зубофрезеровании цилиндрических шестерен; — погрешность направления зубьев, ЕT — биение опорного торца заготовки

Эмпирическую линию регрессии строят обычно на этапе обработки опытных данных, но даже само расположение точек диаграммы рассеяния в факторном пространстве (у — х) без построения этой линии позволяет предварительно оце­нить вид и тесноту взаимосвязи у = f(x).

Взаимосвязь двух факторов может быть линейной или нелиней­ной, прямой или обратной, тесной или слабой (лёгкой) или вообще отсутствовать.


Рисунок 4.18а.Прямая корреляция


Рисунок 4.18б.Лёгкая прямая корреляция


Рисунок 4.18в.Обратная (отрицательная) корреляция




Рисунок 4.18г.Лёгкая обратная корреляция

Рисунок 4.18д.Отсутствие корреляции


Рисунок 4.18е. Лёгкая криволинейная корреляция


Рисунок 4.18ж.Криволинейная корреляция

Диаграммы разброса представляют из себя графики, которые позволяют выявить корреляцию (статистическую зависимость) между различными факторами, влияющими на показатели качества. Диаграмма строится по двум координатным осям, по оси абсцисс откладывается значение изменяемого параметра, а на оси ординат откладывается получаемое значение исследуемого параметра, которое мы имеем в момент использование изменяемого параметра, на пересечении этих значений ставим точку. Собрав достаточно большое количество таких точек, мы можем делать анализ и вывод.

Приведём пример. На предприятии решили проводить занятия по основам менеджмента качества. Каждый месяц обучение проходило определенное количество рабочих. В январе обучение прошли 2 человека, в феврале 3 человека и т.д. В течение года количество обученных работников возрастало и к концу года достигло 40 человек. Руководство дало поручение службе качества отследить зависимость процента бездефектной продукции, предъявляемой с первого раза, количества поступающих на завод рекламаций на продукцию со стороны заказчиков и расхода электроэнергии в цеху от количества обученных рабочих. Была составлена таблица 4.5 данных по месяцам и построены диаграммы разброса (рис. 4.19, 4.20, 4.21).

Таблица 4.5 Зависимость процента бездефектной продукции, предъявляемой с первого раза, количества поступающих на завод рекламаций на продукцию и расхода электроэнергии в цеху от количества обученных рабочих

(Данные по месяцам)

Кол-во обученных рабочих % бездефектности Количество рекламаций Расход энергии, кВт
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
Декабрь


Количество обученных работников

Рисунок 4.19 Зависимость процента бездефектности от количества

работников, прослушавших курс по основам менеджмента качества.


Количество обученных работников

Рисунок 4.20 Зависимость числа рекламаций от количества работников, прослушавших курс по основам менеджмента качества.


Количество обученных работников

Рисунок 4.21 Зависимость расхода энергии от количества работников, прослушавших курс по основам менеджмента качества.




На рисунках 4.19, 4.20 и 4.21 хорошо видно, что процент бездефектности повышается, имеем прямую корреляционную зависимость, количество рекламаций уменьшается, имеем обратную корреляционную зависимость, причем на диаграммах хорошо видна чётко выраженная корреляционная зависимость, которая определяется по кучности точек и их приближении к какой либо точно очерченной траектории, в нашем случае это прямая линия. Количество расходуемой электроэнергии не имеет зависимости от количества обученных работников.

Для сравнения информации о текущем состоянии процесса, полученной по выборке, с контрольными границами, являющимися пределами собст­венного разброса, применяют контрольные карты.

Контрольная карта- это графическое представление характеристики процесса, состоящее из центральной линии, контрольных границ и кон­кретных значений, имеющихся статистических данных позволяющее оце­нить степень статистической управляемости процесса.

Существует много разных типов контрольных карт в зависимости от природы данных, вида статистической обработки данных и методов приня­тия решений.

В зависимости от сферы применения выделяют три основных вида контрольных карт (рис. 4.22):

· контрольные карты Шухарта и аналогичные им, позволяющие оценить, находится ли процесс в статистически управляемом состоянии;

· приёмочные контрольные карты, предназначенные для определе­ния критерия приёмки процесса;

· адаптивные контрольные карты, с помощью которых регулируют процесс посредством планирования его тренда (тенденции изменения про­цесса с течением времени) и проведения упреждающей корректировки на основании прогнозов.

Рисунок 4.22 Применение контрольных карт

Данные для контрольных карт разделяют на количественные и качественные.

Часто приходится выяснять, существует ли зависимость между двумя различными параметрами процесса. Например, зависят ли изменения в диаметре отверстия от изменений скорости вращения сверла.

Обычно предполагается, что исследуемые параметры отражают харак­теристики качества и влияющие на них факторы. Чтобы понять, есть ли ка­кая-либо связь между рассматриваемыми параметрами, используют диа­граммы рассеивания.

Диаграмма рассеивания- это графическое представление пар исследуемых данных в виде множества точек на координатной плоскости.

Диаграмма рассеивания даёт возможность выдвинуть гипотезу о нали­чии или отсутствии корреляционной связи между двумя случайными величинами. При этом изучаются обычно величины, описы­вающие:

· характеристику качества и влияющий на неё фактор;

· две различные характеристики качества;

· два фактора, влияющие на одну характеристику качества.

Пример диаграммы рассеивания представлен на рис. 4.17. и рис 4.18 а - 4.18 ж.

Рисунок 4.17. Диаграмма рассеивания (положительная корреляция)

Диаграмма разброса при зубофрезеровании цилиндрических шестерен; — погрешность направления зубьев, ЕT — биение опорного торца заготовки

Эмпирическую линию регрессии строят обычно на этапе обработки опытных данных, но даже само расположение точек диаграммы рассеяния в факторном пространстве (у — х) без построения этой линии позволяет предварительно оце­нить вид и тесноту взаимосвязи у = f(x).

Взаимосвязь двух факторов может быть линейной или нелиней­ной, прямой или обратной, тесной или слабой (лёгкой) или вообще отсутствовать.


Рисунок 4.18а.Прямая корреляция


Рисунок 4.18б.Лёгкая прямая корреляция


Рисунок 4.18в.Обратная (отрицательная) корреляция




Рисунок 4.18г.Лёгкая обратная корреляция

Рисунок 4.18д.Отсутствие корреляции


Рисунок 4.18е. Лёгкая криволинейная корреляция


Рисунок 4.18ж.Криволинейная корреляция

Диаграммы разброса представляют из себя графики, которые позволяют выявить корреляцию (статистическую зависимость) между различными факторами, влияющими на показатели качества. Диаграмма строится по двум координатным осям, по оси абсцисс откладывается значение изменяемого параметра, а на оси ординат откладывается получаемое значение исследуемого параметра, которое мы имеем в момент использование изменяемого параметра, на пересечении этих значений ставим точку. Собрав достаточно большое количество таких точек, мы можем делать анализ и вывод.

Приведём пример. На предприятии решили проводить занятия по основам менеджмента качества. Каждый месяц обучение проходило определенное количество рабочих. В январе обучение прошли 2 человека, в феврале 3 человека и т.д. В течение года количество обученных работников возрастало и к концу года достигло 40 человек. Руководство дало поручение службе качества отследить зависимость процента бездефектной продукции, предъявляемой с первого раза, количества поступающих на завод рекламаций на продукцию со стороны заказчиков и расхода электроэнергии в цеху от количества обученных рабочих. Была составлена таблица 4.5 данных по месяцам и построены диаграммы разброса (рис. 4.19, 4.20, 4.21).

Таблица 4.5 Зависимость процента бездефектной продукции, предъявляемой с первого раза, количества поступающих на завод рекламаций на продукцию и расхода электроэнергии в цеху от количества обученных рабочих

(Данные по месяцам)

Кол-во обученных рабочих % бездефектности Количество рекламаций Расход энергии, кВт
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
Декабрь


Количество обученных работников

Рисунок 4.19 Зависимость процента бездефектности от количества

работников, прослушавших курс по основам менеджмента качества.


Количество обученных работников

Рисунок 4.20 Зависимость числа рекламаций от количества работников, прослушавших курс по основам менеджмента качества.


Количество обученных работников

Рисунок 4.21 Зависимость расхода энергии от количества работников, прослушавших курс по основам менеджмента качества.

На рисунках 4.19, 4.20 и 4.21 хорошо видно, что процент бездефектности повышается, имеем прямую корреляционную зависимость, количество рекламаций уменьшается, имеем обратную корреляционную зависимость, причем на диаграммах хорошо видна чётко выраженная корреляционная зависимость, которая определяется по кучности точек и их приближении к какой либо точно очерченной траектории, в нашем случае это прямая линия. Количество расходуемой электроэнергии не имеет зависимости от количества обученных работников.

Для сравнения информации о текущем состоянии процесса, полученной по выборке, с контрольными границами, являющимися пределами собст­венного разброса, применяют контрольные карты.

Контрольная карта- это графическое представление характеристики процесса, состоящее из центральной линии, контрольных границ и кон­кретных значений, имеющихся статистических данных позволяющее оце­нить степень статистической управляемости процесса.

Существует много разных типов контрольных карт в зависимости от природы данных, вида статистической обработки данных и методов приня­тия решений.

В зависимости от сферы применения выделяют три основных вида контрольных карт (рис. 4.22):

· контрольные карты Шухарта и аналогичные им, позволяющие оценить, находится ли процесс в статистически управляемом состоянии;

· приёмочные контрольные карты, предназначенные для определе­ния критерия приёмки процесса;

· адаптивные контрольные карты, с помощью которых регулируют процесс посредством планирования его тренда (тенденции изменения про­цесса с течением времени) и проведения упреждающей корректировки на основании прогнозов.


Также известна как график рассеяния, точечный график, координатный график или скатерограмма.

На диаграммах рассеяния ряд точек, размещенных в декартовой системе координат, отображает значения по двум переменным. Присвоив каждой оси переменную, можно определить, существуют ли отношения или корреляция между этими двумя переменными.

Отображаемые на диаграммах рассеяния паттерны позволяют увидеть разные типы корреляции. Среди них: положительная (оба значения увеличиваются), отрицательная (одно значение увеличивается, в то время как второе уменьшается), нулевая (отсутствие корреляции), линейная, экспоненциальная и подковообразная. Сила корреляции определяется по тому, насколько близко расположены друг от друга точки на графике. Точки, которые значительно удалены от общего кластера точек, называются выбросами.

Диаграммы рассеяния идеально подходят в том случае, если у вас есть пара числовых данных, и вы хотите посмотреть, существует ли влияние одной переменной на другую. Однако не забывайте, что корреляция – это не причинная зависимость, поэтому на результаты может повлиять не принятая во внимание переменная.

Читайте также: