Что такое гистограмма реферат

Обновлено: 05.07.2024

Графические объекты Excel являются вспомогательными средствами, прежде всего они были созданы для простоты работы на компьютере, и для легкости нашего взаимодействия с ним. В понятие графические объекты входит: диаграммы, графики функции, различного рода рисунки, автофигуры и т.д.

Этот реферат о том, как человек может наиболее рационально использовать Microsoft Excel и его графические возможности. Поскольку Microsoft Excel является табличным редактором, то Графические объекты являются его несомненным преимуществом.

Гистограмма.

Гистограмма показывает изменение данных за определенный период времени и иллюстрирует соотношение отдельных значений данных. Категории располагаются по горизонтали, а значения по вертикали. Таким образом уделяется большее внимание изменениям во времени. Гистограмма с накоплением демонстрирует вклад отдельных элементов в общую сумму. В трехмерной гистограмме сравнение данных производится по двум осям. Показанная на рисунке трехмерная диаграмма позволяет сравнить объемы продаж в Европе за каждый квартал с объемами продаж в двух других регионах.

Линейная диаграмма.

Линейчатая диаграмма отражает соотношение отдельных компонентов. Категории расположены по горизонтали, а значения по вертикали. Таким образом, уделяется большее внимание сопоставлению значений и меньшее - изменениям во времени. Линейчатая диаграмма с накоплением показывает вклад отдельных элементов в общую сумму.

График отражает тенденции изменения данных за равные промежутки времени.

Круговая диаграмма.

Круговая диаграмма показывает как абсолютную величину каждого элемента ряда данных, так и его вклад в общую сумму. На круговой диаграмме может быть представлен только один ряд данных. Такую диаграмму рекомендуется использовать, когда необходимо подчеркнуть какой-либо значительный элемент. Для облегчения работы с маленькими долями диаграммы в основной диаграмме их можно объединить в один элемент, а затем разбить их в отдельную диаграмму рядом с основной.

Точечная диаграмма.

Точечная диаграмма отображает взаимосвязь между числовыми значениями в нескольких рядах и представляет две группы чисел в виде одного ряда точек в координатах xy. Эта диаграмма отображает нечетные интервалы (или кластеры) данных и часто используется для представления данных научного характера. При подготовке данных следует расположить в одной строке или столбце все значения переменной x, а соответствующие значения y - в смежных строках или столбцах.

Областная диаграмма.

Диаграмма с областями подчеркивает величину изменения в течение определенного периода времени, показывая сумму введенных значений. Она также отображает вклад отдельных значений в общую сумму. В данном примере диаграмма с областями показывает увеличение продаж в Бразилии, а также иллюстрирует вклад каждой страны в общий объем продаж.

Кольцевая диаграмма.

Как и круговая диаграмма, кольцевая диаграмма показывает вклад каждого элемента в общую сумму, но в отличие от круговой диаграммы она может содержать несколько рядов данных. Каждое кольцо в кольцевой диаграмме представляет отдельный ряд данных.

Лепестная диаграмма.

В лепестковой диаграмме каждая категория имеет собственную ось координат, исходящую из начала координат. Линиями соединяются все значения из определенной серии. Лепестковая диаграмма позволяет сравнить общие значения из нескольких наборов данных. На этой диаграмме ряд данных, охватывающий наибольшую часть площади (сорт A), представляет сорт с самым высоким содержанием витаминов.

Поверхностная диаграмма.

Поверхностная диаграмма используется для поиска наилучшего сочетания двух наборов данных. Как на топографической карте, области с одним значением выделяются одинаковым узором и цветом. Эта диаграмма показывает зависимость предела прочности на разрыв от времени и температуры.

Пузырьковая диаграмма.

Пузырьковая диаграмма является разновидностью точечной диаграммы. Размер маркера данных указывает значение третьей переменной. При подготовке данных следует расположить в одной строке или столбце все значения переменной x, а соответствующие значения y - в смежных строках или столбцах. В приведенном примере диаграмма показывает, что компания А выпускает наибольшее количество продукции и имеет наибольшую долю на рынке, но ее уровень продаж не является самым высоким.

Биржевая диаграмма.

Биржевая диаграмма часто используется для демонстрации цен на акции. Этот тип диаграммы также может быть использован для научных данных, например, для определения изменения температуры. Для построения этой и других биржевых диаграмм необходимо правильно организовать данные. Биржевая диаграмма для наборов из трех и пяти значений может иметь две оси: одна для столбцов, представляющих интервал колебаний, другая для цен на акции.

Коническая, Цилиндрическая и Пирамидальная диаграмма.

Маркеры данных в виде конуса, цилиндра и пирамиды могут придавать впечатляющий вид объемным гистограммам и объемным линейчатым диаграммам.

Создание диаграммы .

В Microsoft Excel имеется возможность графического представления данных в виде диаграммы. Диаграммы связаны с данными листа, на основе которых они были созданы, и изменяются каждый раз, когда изменяются данные на листе.

Диаграммы могут использовать данные несмежных ячеек. Диаграмма может также использовать данные сводной таблицы.

Cводная таблица.

Предназначенная для интерактивной работы таблица, обобщающая и анализирующая данные из существующих списков и таблиц. С помощью мастера сводной таблицы необходимо указать список или таблицу и затем указать способ расположения данных в сводной таблице. После создания сводной таблицы ее структуру можно изменить путем изменения расположения полей.

В документе MS EXCEL можно создать либо внедренную диаграмму, либо лист диаграммы, для чего необходимо проделать следующие пункты:

1. Выделите ячейки, содержащие данные, которые должны быть отражены на диаграмме. Если необходимо, чтобы в диаграмме были отражены и названия строк или столбцов, выделите также содержащие их ячейки.

3. Далее следуйте инструкциям мастера.

Если на листе присутствуют многоуровневые названия строк или столбцов, то их также можно отразить на диаграмме. При создании диаграммы выделите названия строк и столбцов для каждого уровня. Чтобы при добавлении данных в диаграмму была сохранена заданная иерархия, измените диапазон ячеек, использованных при создании диаграммы.

Создание диаграмм из несмежных диапазонов .

Для того, чтобы создать диаграмму из несмежных диапазонов нужно выделите первую группу ячеек, содержащих необходимые данные. Потом, удерживая клавишу CTRL, выделите необходимые дополнительные группы ячеек.

После чего нажмите кнопку "Мастер диаграмм" и следуйте инструкциям мастера.

Типом диаграммы, использующимся по умолчанию в Microsoft Excel, является гистограмма.

1. Для создания листа диаграммы, использующего стандартный тип диаграммы, выделите необходимые данные и нажмите клавишу F11.

2. Для создания внедренной диаграммы, использующей стандартный тип диаграммы, выделите необходимые данные, а затем нажмите кнопку "Создать диаграмму текущего типа". Если кнопка "Создать диаграмму текущего типа" отсутствует, добавьте ее на панель инструментов.

Лист диаграммы .

Лист книги, содержащий только диаграмму. Листы диаграммы связаны с данными таблиц и обновляются при изменений данных в таблице.

Для того, чтобы создать диаграмму для сводной таблицы нужно на панели инструментов "Сводные таблицы" выбрать команду "Выделить" в меню "Сводная таблица". При этом нужно проверить, что кнопка "Разрешить выделение" не нажата.

После этого удалите любые промежуточные итоги из сводной таблицы.

Выделите сводную таблицу целиком, в том числе поля столбцов и строк. Не выделяйте общие итоги или поля страниц. Чтобы выделить первую строку и столбец сводной таблицы, начните выделение с правого нижнего угла области данных.

1. При скрытии, отображении или упорядочении полей сводной таблицы соответствующим образом изменяется диаграмма. Кроме того, если в сводной таблице содержатся поля страниц, при выборе другой страницы диаграмма также изменится.

2. Чтобы сохранить и распечатать диаграммы для всех полей страниц сводной таблицы, нажмите кнопку "Показать страницы" на панели инструментов "Сводные таблицы". Каждая страница отобразится на отдельном листе. После этого для каждой страницы можно построить диаграмму.

3. Если в текущей сводной таблице используются внешние источники данных и с помощью Microsoft Query добавляются или удаляются поля внешних данных, следует обновить сводную таблицу; в противном случае диаграмма не изменится.


Microsoft Excel предоставляет возможность выбрать диапазон выводимых на экран значений на оси значений, а так же возможность изменять интервалы между значениями вдоль оси. В данном примере ось диаграммы начинается не с 0 (нуля), а выводит диапазон значений от 25 до 275. Также можно указать, должны ли на оси присутствовать отметки. Изменять цифровые ряды в диаграмме можно, так же как и на листе. Для применения наиболее часто используемых форматов рядов выберите метку оси или данных, содержащую числовой ряд, который необходимо изменить, а затем путем переключения кнопок на панели инструментов. Форматирование выберите требуемый формат (денежный, процентный или формат с разделителем групп разрядов).

Изменять цвета, границы и заливку в маркерах .

Microsoft Excel обеспечивает возможность изменять цвета, границы и заливку в маркерах данных, областях диаграмм, областях построения и в других элементах диаграммы.

Для использования заливки, например, текста или рисунка, выберите необходимый элемент диаграммы, затем стрелку рядом с командой Цвет заливки, а потом выполните команду Узор заливки. Далее необходимо выбрать параметры, которые должны использоваться во вкладках Градиент, Структура, Образец и Рисунок.

В различных типах диаграмм имеются особые строки, панели, маркеры данных и другие параметры. Например, для столбца и для гистограммы можно добиться эффекта наслоения путем изменения свойства перекрытия для рядов данных. Восновном примере за каждым маркером на графике, имеющем форму ромба, есть тень и используются плавные линии.

Линии связывают ряды данных в гистограммах.

Для форматирования рядов данных выделите необходимый ряд, затем в меню Формат выберите команду ряды данных, после чего во вкладках Узоры и Параметры укажите требуемые параметры.


Текст в диаграмме форматируется также как и любой другой текст. Выберите необходимый текст, а затем посредством переключения кнопок на панели инструментов Форматирование измените шрифт, размер, цвет.

Чтобы повернуть текст на 45 градусов вверх или вниз, выберите команду "Текст снизу вверх" или "Текст сверху вниз" на панели инструментов "Диаграммы".

Как быть, если нам необходимо построить графики нескольких функций? Например: Y1=2х-1, Y2=x+1, Y=10x(Y1/Y2). Для построения обыкновенных графиков функций у=f(x) используется тип диаграммы XY-точечная. Этот тип диаграммы требует два ряда значений: Х-значения должны быть расположены в левом столбце, а Y-значения - в правом. На одной диаграмме можно построить несколько графиков функций. Эта возможность используется для проведения сравнительного анализа значений У при одних и тех же значения вставить X, а также для графического решения систем уравнений с двумя переменными.

Воспользуемся таблицей, созданной на уроке N 22. На одной диаграмме построим три совмещенных графика: Y1=2х-1, Y2=2x+l, Y=10x(Y1/Y2). Для этого:

1. Загрузим файл Ex21.xls.

2. Снимем защиту с листа.

3. Переместим вспомогательную таблицу под основную, начиная с ячейки В27.

4. Щелкнем по кнопке Мастер диаграмм и выберем область для построения диаграммы Н2: К28. Рассмотрим построение диаграммы по шагам:

На 1-м шаге укажем ячейки В4: В24 (Х-значения) и D3:F24 (Y- значения и заголовки для легенды). Обратите внимание, что указываются 3 столбца (3 ряда Y-значений), так как мы хотим построить 3 совмещенных графика. Для построения одного графика необходим 1 столбец Y-значений.

На 2-м шаге укажем тип XY-точечная.

На З-м шаге выберем формат 6.

На 4-м шаге исправим неправильный образец диаграммы. Отведем один столбец для данных по оси X и одну строку для текста легенды.


Лекции


Лабораторные


Справочники


Эссе


Вопросы


Стандарты


Программы


Дипломные


Курсовые


Помогалки


Графические

Доступные файлы (1):

1.docx

1.История возникновения диаграмм стр 2

2.Основные типы диаграмм стр 3

3.Гистограмма стр 6

3.1 . История гистограмм стр 7

3.2. Обоснование гистограмм стр 9

Заключение стр 9

Диаграмма - (изображение, рисунок, чертёж) — графическое представление данных, позволяющее быстро оценить соотношение нескольких величин. Представляет собой геометрическое символьное изображение информации с применением различных приёмов техники визуализации.

Иногда для оформления диаграмм используется трёхмерная визуализация, спроецированная на плоскость, что придаёт диаграмме отличительные черты или позволяет иметь общее представление об области, в которой она применяется. Например: финансовая диаграмма, связанная с денежными суммами, может представлять собой количество купюр в пачке или монет в стопке; диаграмма сравнения количества подвижного состава — различную длину изображённых поездов и т. д. Благодаря своей наглядности и удобству использования, диаграммы часто используются не только в повседневной работе бухгалтеров, логистов и других служащих, но и при подготовке материалов презентаций для клиентов и менеджеров различных организаций.

В различных процессорах графопостроения (графических программах) и электронных таблицах при изменении данных, на основе которых построена диаграмма, она будет автоматически перестроена с учётом внесённых изменений в таблицу исходных данных. Это позволяет быстро сравнивать различные показатели, статистические данные и т. д. — можно вводить новые данные и сразу видеть изменения диаграммы [1].

1.История возникновения диаграмм.

Во всех диаграммах используется функциональная зависимость как минимум двух типов данных. Соответственно, первыми диаграммами были обыкновенные графики функций, в которых допустимые значения аргумента соответствуют значениям функций.

Идеи функциональной зависимости использовались в древности. Она обнаруживается уже в первых математически выраженных соотношениях между величинами, а также в первых правилах действий над числами, в первых формулах для нахождения площади и объёма геометрических фигур. Вавилонские учёные, таким образом, несознательно установили, что площадь круга является функцией от его радиуса 4—5 тыс. лет назад[11]. Астрономические таблицы вавилонян, древних греков и индийцев — яркий пример табличного задания функции, а таблицы, соответственно, являются хранилищем данных для диаграмм.

В XVII веке французские учёные Франсуа Виет и Рене Декарт заложили основы понятия функции и разработали единую буквенную математическую символику, которая вскоре получила всеобщее признание. Также геометрические работы Декарта и Пьера Ферма проявили отчётливое представление переменной величины и прямоугольной системы координат — вспомогательных элементов всех современных диаграмм.

2.Основные типы диаграмм

Диаграммы в основном состоят из геометрических объектов (точек, линий, фигур различной формы и цвета) и вспомогательных элементов (осей координат, условных обозначений, заголовков и т. п.). Также диаграммы делятся на плоскостные (двумерные) и пространственные (трёхмерные или объёмные). Сравнение и сопоставление геометрических объектов на диаграммах может происходить по различным измерениям: по площади фигуры или её высоте, по местонахождению точек, по их густоте, по интенсивности цвета и т. д. Кроме того, данные могут быть представлены в прямоугольной или полярной системе координат [2].

Диаграммы-линии или графики — это тип диаграмм, на которых полученные данные изображаются в виде точек, соединённых прямыми линиями. Точки могут быть как видимыми, так и невидимыми (ломаные линии). Также могут изображаться точки без линий (точечные диаграммы). Для построения диаграмм-линий применяют прямоугольную систему координат. Обычно по оси абсцисс откладывается время (годы, месяцы и т. д.), а по оси ординат — размеры изображаемых явлений или процессов. На осях наносят масштабы.

Диаграммы-линии целесообразно применять тогда, когда число размеров (уровней) в ряду велико. Кроме того, такие диаграммы удобно использовать, если требуется изобразить характер или общую тенденцию развития явления или явлений. Линии удобны и при изображении нескольких динамических рядов для их сравнения, когда требуется сравнение темпов роста. На одной диаграмме такого типа не рекомендуется помещать более трёх-четырёх кривых. Их большое количество может усложнить чертёж, и линейная диаграмма может потерять наглядность.

Диаграммы-области — это тип диаграмм, схожий с линейными диаграммами способом построения кривых линий. Отличается от них тем, что область под каждым графиком заполняется индивидуальным цветом или оттенком. Преимущество данного метода в том, что он позволяет оценивать вклад каждого элемента в рассматриваемый процесс. Недостаток это типа диаграмм также схож с недостатком обычных линейных диаграмм — искажение относительных изменений показателей динамики с равномерной шкалой ординат [2].

Круговые (секторные) диаграммы

Достаточно распространённым способом графического изображения структуры статистических совокупностей является секторная диаграмма, так как идея целого очень наглядно выражается кругом, который представляет всю совокупность. Относительная величина каждого значения изображается в виде сектора круга, площадь которого соответствует вкладу этого значения в сумму значений. Этот вид графиков удобно использовать, когда нужно показать долю каждой величины в общем объёме. Сектора могут изображаться как в общем круге, так и отдельно, расположенными на небольшом удалении друг от друга [2].

Круговая диаграмма сохраняет наглядность только в том случае, если количество частей совокупности диаграммы небольшое. Если частей диаграммы слишком много, её применение неэффективно по причине несущественного различия сравниваемых структур. Недостаток 

круговых диаграмм — малая ёмкость, невозможность отразить более широкий объём полезной информации [2].

Радиальные (сетчатые) диаграммы

В отличие от линейных диаграмм, в радиальных или сетчатых диаграммах более двух осей. По каждой из них производится отсчёт от начала координат, находящегося в центре. Для каждого типа полученных значений создаётся своя собственная ось, которая исходит из центра диаграммы. Радиальные диаграммы напоминают сетку или паутину, поэтому иногда их называют сетчатыми. Преимущество радиальных диаграмм в том, что они позволяют отображать одновременно несколько независимых величин, которые характеризуют общее состояние структуры статистических совокупностей. Если отсчёт производить не с центра круга, а с окружности, то такая диаграмма будет называться спиральной диаграммой [2].

Картодиаграммы — это сочетания диаграмм с географическими картами или схемами. В качестве изобразительных знаков в картодиаграммах используются обычные диаграммы (гистограммы, круговые, линейные), которые размещаются на контурах географических карт или на схемах каких-либо объектов. Картодиаграммы дают возможность географически отразить более сложные статистико-географические построения, чем обычные типы диаграмм.

Недостатком картодиаграмм могут служить сложности в рисовании контуров карт, а также значительная разница в размерах областей географических карт и размеров диаграмм на них [2].

Биржевые диаграммы отражают наборы данных из нескольких значений (например: цена открытия биржи, цена закрытия, максимальная и минимальная цена определённого временного интервала). Применяются для отображения биржевых данных: котировок акций или валют, данных спроса и предложения [2].

Пространственные (трёхмерные) диаграммы

Пространственные, или трёхмерные диаграммы являются объёмными аналогами пяти основных типов двухмерных диаграмм: линейных, диаграмм-областей, гистограмм (столбчатых и линейных), круговых. Изображение в объёмном виде упрощает понимание информации. Такие диаграммы выглядят убедительнее. Сложность в создании трёхмерных диаграмм заключается в правильности отображения согласно теме диаграммы [2].

Столбчатые и линейные диаграммы (гистограммы)

Классическими диаграммами являются столбчатые и линейные (полосовые) диаграммы. Также они называются гистограммами. Столбчатые диаграммы в основном используются для наглядного сравнения полученных статистических данных или для анализа их изменения за определённый промежуток времени. Построение столбчатой диаграммы заключается в изображении статистических данных в виде вертикальных прямоугольников или трёхмерных прямоугольных столбиков. Каждый столбик изображает величину уровня данного статистического ряда. Все сравниваемые показатели выражены одной единицей измерения, поэтому удаётся сравнить статистические показатели данного процесса.

Разновидностями столбчатых диаграмм являются линейные (полосовые) диаграммы. Они отличаются горизонтальным расположением столбиков. Столбчатые и линейные диаграммы взаимозаменяемы, рассматриваемые в них статистические показатели могут быть представлены как вертикальными, так и горизонтальными столбиками. В обоих случаях для изображения величины явления используется одно измерение каждого прямоугольника — высота или длина столбика. Поэтому и сфера применения этих двух диаграмм в основном одинакова.

Столбчатые диаграммы могут изображаться и группами (одновременно расположенными на одной горизонтальной оси с разной размерностью варьирующих признаков). Образующие поверхности столбчатых и линейных диаграмм могут представлять собой не только прямоугольники, но также квадраты, треугольники, трапеции и т. д.

Гистограмму используют для изображения интервальных рядов. Для построения гистограммы по данным вариационного ряда с равными интервалами, как и для построения полигона, на оси абсцисс откладывают значения аргумента, а на оси ординат - значения частот или относительных частот. Далее строят прямоугольники, основаниями которых служат отрезки оси абсцисс, длины которых равны длинам интервалов, а высотами - отрезки, длины которых пропорциональны частотам или относительным частотам соответствующих интервалов.

В результате получают ступенчатую фигуру в виде сдвинутых друг к другу прямоугольников, площади которых пропорциональны частотам (или относительным частотам).

Если интервалы неравные, то на оси ординат следует откладывать в произвольно выбранном масштабе значения плотности распределения (абсолютной или относительной). Таким образом, высоты прямоугольников, которые мы строим, должны равняться плотностям соответствующих интервалов.

При графическом изображении вариационного ряда с помощью гистограммы плотность изображается так, как если бы она оставалась постоянной внутри каждого интервала. На самом деле, как правило, это не так. Если построить распределение по частям интервалов, то можно убедиться в том, что плотность распределения на различных участках интервала не остается постоянной. Плотность, полученная ранее, предствляла лишь некоторую среднюю плотность. Итак, гистограмма изображает не фактическое изменение плотности распределения, а лишь средние плотности распределения на каждом интервале.

Если построена гистограмма интервального распределения, то полигон того же распределения можно получить, если соединить прямолинейными отрезками середины верхних оснований прямоугольников [3].

3.1 . История гистограмм

Слово 'гистограмма' происходит из Греции и состоит из слов 'isto-s' (ιστοs) (= 'столб', также это слово обозначает 'паутину', но это не существенно для нашего обсуждения) и 'gram-ma' (γραμμα) (= 'нечто записанное'). Следовательно, термин следует интерпретировать, как некую форму записи, состоящую из 'столбиков', т.е. продолговатых, вертикально расположенных фигур. Однако это слово изначально не использовалось в греческом языке.1 Термин 'гистограмма' был введен знаменитым статистиком Карлом Пирсоном (Karl Pearson)2 для обозначения "общей формы графического представления". В цитате Оксфордского словаря английского языка из "Philosophical Transactions of the Royal Society of London" Series A, Vol. CLXXXVI, (1895) p. 399" упоминается, что "[Слово 'гистограмма' было] введено автором лекций по статистике как термин для обозначения общей формы графического представления, т.е. путем маркировки столбцов как областей частотности в соответствии с масштабом их базиса". Стинглер отождествляет упомянутые лекции с изданными в 1892 г. лекциями по статистической геометрии .

Приведенная цитата говорит о том, что гистограммы использовались задолго до того, как получили свое имя, но их дата рождения неясна. Столбчатые диаграммы (bar chart), т.е. гистограммы, в которых с каждым столбцом ассоциируется отдельный 'базисный' элемент, скорее всего, предшествуют гистограммам, и это помогает нам установить нижнюю временную границу их первого появления. Наиболее древняя столбчатая диаграмма появилась в книге шотландского политического экономиста Уильяма Плейфейра (William Playfair)3 "The Commercial and Political Atlas" (London 1786), в которой демонстрируются показатели импорта и экспорта Шотландии в семнадцать стран в 1781 г. [74]. Хотя Плейфейр относился к своему изобретению скептически, в последующие годы оно было принято многими, включая Флоренса Найтингейла (Florence Nightingale), который использовал их в 1859 г. для сравнения смертности в армии в мирное время со смертностью гражданского населения, и путем этого убедил правительство улучшить гигиенические условия в армии.

Из всего сказанного ясно, что гистограммы задумывались как визуальная поддержка статистической аппроксимации. Даже сегодня этот смысл доминирует в общем восприятии гистограмм. В словаре Вебстера гистограмма определяется как "столбчатая диаграмма частотного распределения, в которой ширина столбцов пропорциональна классам, на которые была разделена переменная, а высота столбцов пропорциональная частотам этих классов". Однако гистограммы исключительно полезны, даже если отсоединить их от канонического графического представления и рассматривать как чисто математические объекты, сохраняющие приближения распределений данных. Именно так мы относимся к ним в этой статье.

В последние два десятилетия гистограммы использовались в нескольких областях информатики. Кроме области баз данных, гистограммы играют важную роль, главным образом, в областях обработки изображений и машинного зрения. При заданном изображении (или видео) и визуальном пиксельном параметре, гистограмма фиксирует для каждого возможного значения параметра ("класса" по Вебстеру) число пикселей, имеющихся у этого значения ("частота" по Вебстеру). Такая гистограмма является сводной характеристикой изображения и может быть очень полезна при решении нескольких задач: распознавании похожих изображений, сжатии изображений и т.д. В литературе наиболее распространены диаграммы цветов, например, в системе QBIC [21], но было предложено и несколько других параметров, например, плотность границ, текстурность, градиент яркости и т.д. [61]. Вообще говоря, гистограммы, используемые в областях обработки изображений и машинного зрения, являются точными. Например, в гистограмме цветов содержится раздельное и точное число пикселей для каждого возможного отдельного цвета изображения. Единственным элементом аппроксимации могло бы быть число бит, используемых для представления различных цветов: наличие меньшего числа бит означает, что несколько реальных цветов будет изображаться одним цветом, ассоциируемым с числом пикселей, которое имелось бы совместно у всех заменяемых таким образом цветов. Однако даже такая разновидность аппроксимации не является распространенной. В области баз данных гистограммы используются как механизм выровненного по краям сжатия и аппроксимации распределений данных. В литературе и системах они появились в 1980-х и впоследствии изучались с возрастающей интенсивностью. В этой статье мы концентрируемся на понятии гистограмм, принятом в области баз данных, обсуждаем наиболее важные разработки, относящиеся к этой теме, и кратко характеризуем несколько проблем, которые считаем интересными, и решение которых может еще более расширить применимость и полезность гистограмм [4].

3.2. Обоснование гистограмм

Преимущество диаграмм перед другими типами наглядной статистической информации заключается в том, что они позволяют быстро произвести логический вывод из большого количества полученных данных. Результаты расчётов, выполненных с помощью систем статистических вычислений, заносятся в таблицы. Они являются основой для последующего анализа или для подготовки статистического отчёта.

Сами по себе цифры в этих таблицах не являются достаточно наглядными, а если их много, они не производят достаточного впечатления. Кроме того, графическое изображение позволяет осуществить контроль достоверности полученных данных, так как на графике достаточно ярко проявляются возможные неточности, которые могут быть связаны с ошибками на каком-либо этапе проведения исследования. В основном, все статистические пакеты позволяют графически предоставить полученную числовую информацию в виде различных диаграмм, а затем, если это необходимо, перенести их в текстовый редактор для сборки окончательного варианта статистического отчёта [4].

[1] Райзберг Б.А., Лозовский Л.Ш., Стародубцева Е.Б.. Современный экономический словарь. — 2-е изд., испр. М.: ИНФРА-М, 1999. 479 с.. 1999.

[2] Крамер Г. Математические методы статистики.-М.:Мир, 1975.-648 с.

[3] Ланкин Г.Ф. Биометрия.-М.: Высш. шк.,1990.-352с.

[4] The History of Histograms (abridged), Proceedings of 29th International Conference on Very Large Data Bases, September 9-12, 2003, Berlin, Germany.

столбчатая диаграмма, один из видов графического изображения статистического распределении каких-либо величин по количественному признаку. Г. представляет собой совокупность смежных прямоугольников, построенных на прямой линии. Площадь каждого прямоугольника пропорциональна частоте нахождения данной величины в изучаемой совокупности. Пусть, например, измерение диаметров стволов 624 сосен дало следующие результаты:

На горизонтальной оси откладываются границы групп, на которые стволы разбиты по их диаметру, и на отрезке, соответствующем каждой группе, строится как на основании прямоугольник с площадью, пропорциональной числу стволов, попавших в данную группу (рис. 1).

В виде Г. часто изображают гранулометрический состав горных пород. В этом случае на вертикальной оси откладывают процентное содержание полученных групп частиц т. н. фракций, а на горизонтальной оси — логарифмы их граничных размеров (рис. 2). Использование логарифмов вызвано тем, что при гранулометрическом анализе частицы подразделяются на фракции, размеры которых убывают в геометрической прогрессии. Иногда Г. строятся на произвольно выбранных равных отрезках, независимо от разности граничных размеров фракций. Тогда высоты столбиков пропорциональны содержанию размеров фракций.

Большая советская энциклопедия. — М.: Советская энциклопедия . 1969—1978 .

Полезное

Смотреть что такое "Гистограмма" в других словарях:

гистограмма — гистограмма … Орфографический словарь-справочник

ГИСТОГРАММА — (histogram) Диаграмма, представляющая распределение переменной величины, в том случае если имеется информация об отдельных ее значениях. Площади на диаграмме пропорциональны числу соответствующих наблюдений в каждом интервале, например ежегодных… … Экономический словарь

Гистограмма — (histogram) График распределения частот, который строится при помощи прямоугольников, чья площадь пропорциональна частоте нахождения данной величины в интервале, на котором построен данный прямоугольник. Бизнес. Толковый словарь. М.: ИНФРА М ,… … Словарь бизнес-терминов

ГИСТОГРАММА — (от греч. histos здесь столб и . грамма) (столбчатая диаграмма), один из видов графического изображения статистических распределений какой либо величины по количественному признаку. Гистограмма представляет собой совокупность смежных… … Большой Энциклопедический словарь

Гистограмма — фигура, получающаяся на плоскости, где введены декартовы координаты и по оси абсцисс отложены группированные наблюдения, а по оси ординат число соответствующих наблюдений. Верхняя часть контура Г. есть статистический аналог плотности… … Геологическая энциклопедия

Гистограмма — в техническом анализе интервальный график, на котором каждому временному интервалу ставится в соответствие отрезок прямой (палочка), начало и конец которого есть высшая и низшая цены периода. При этом цены открытия и закрытия отмечаются на… … Финансовый словарь

гистограмма — – это способ графического представления распределения числовых (непрерывных) данных, часто используемый в разведочном анализе данных для иллюстрации основных характеристик распределения. Диапазон возможных значений переменной делится на отрезки,… … Словарь социологической статистики

ГИСТОГРАММА — ГИСТОГРАММА, столбчатовидная диаграмма, столбцы которой представляют собой частоту (в абсолютных величинах или процент от общего), с которой определенные величины (или диапазоны величин) встречаются в пределах некоторого набора данных. см. также… … Научно-технический энциклопедический словарь

гистограмма — сущ., кол во синонимов: 1 • диаграмма (9) Словарь синонимов ASIS. В.Н. Тришин. 2013 … Словарь синонимов

Анализ Парето получил свое название по имени итальянского экономиста Вилфредо Парето, который показал, большая часть капитала (80%) находится в руках незначительного количества людей (20%). Парето разработал логарифмические математические модели, описывающие это неоднородное распределение, а математик М.Оа. Лоренц представил графические иллюстрации. Анализ Парето как правило иллюстрируется… Читать ещё >

  • автоматическая сортировка информации и создание базы данных

Гистограмма. Автоматическая сортировка информации и создание базы данных ( реферат , курсовая , диплом , контрольная )

Гистограмма — вид столбцовой диаграммы. Служит для обобщения цифровых данных. Может быть использована как средство графического отображения данных контрольного листа. Демонстрирует разброс (частотное распределение характеристик продукции или процесса). Характер распределения полученных данных может обнаружить суть проблемы. Предназначена для коммуникации непосредственно с людьми, управляющими процессом. Пример гистограммы приведен ниже (см. Рис.8).

Гистограмма потребления топлива для 100 автомобилей.

Рис. 8. Гистограмма потребления топлива для 100 автомобилей.

Диаграмма Парето

Анализ Парето получил свое название по имени итальянского экономиста Вилфредо Парето, который показал, большая часть капитала (80%) находится в руках незначительного количества людей (20%). Парето разработал логарифмические математические модели, описывающие это неоднородное распределение, а математик М.Оа. Лоренц представил графические иллюстрации.

Анализ Парето как правило иллюстрируется диаграммой Парето на которой по оси абсцисс отложены причины возникновения проблем качества в порядке убывания вызванных ими проблем, а по оси ординат — в количественном выражении сами проблемы, причем как в численном, так и в накопленном (кумулятивном) процентном выражении.

Гистограмма представляет собой столбчатый график, построенный по полученным за определенный период (например, за неделю или за месяц) данным, которые разбиваются на несколько интервалов; число данных, попадающих в каждый из интервалов (частота), выражается высотой столбика (рис. 19).

Данные для построения гистограммы собирают в течение длительного периода - недели, месяца, года и т. д.

Систематизируя большое число данных, собранных за длительный срок, анализируют их распределение (среднее значение и разброс), комбинируя методы "семи инструментов контроля качества", и получают важную информацию для оценки проблемы и нахождения способов ее решения. Так, при контроле качества изделий используют следующие методы.

1. Для ежемесячного анализа условий изменения доли дефектных изделий используют график, представляемый ломаной линией (изменение во времени).

2. Долю дефектных изделий отдельно по видам брака исследуют с помощью диаграммы Парето и кругового графика.

3. Изменение факторов, влияющих на появление брака, по месяцам исследуют с помощью ленточного графика.

Рис. 19. Пример гистограммы:

1-частота; 2-толщина пластины, мм;

3-кривая распределения частоты;

4-нижнее предельное значение нормы;

5-верхнее предельное значение нормы (верхняя граница нормы).

5. Отношение между факторами, влияющими на появление дефектов (причинами) и самими дефектами (результатом), исследуются с помощью причинно-следственной диаграммы.

6. Показатели качества при высоком проценте дефектных изделий сравнивают со стандартами с помощью гистограммы.

Комбинация различных методов анализа позволяет исследовать проблему с самых разных точек зрения, что имеет большое значение для оценки положения, нахождения путей решения проблемы и проведения мероприятий по улучшению состояния процесса.

Насколько бы идентичными ни были условия производства, показатели качества всегда имеют определенный разброс. Автоматизация производства уменьшает разброс, но не устраняет его совсем. Однако при внимательном рассмотрении можно видеть, что разброс подчиняется определенным закономерностям. Обычно частота разброса оказывается максимальной в центре зоны разброса, а чем дальше от центра, тем частота меньше, т. е. чаще всего разброс подчиняется нормальному закону распределения. Следовательно, систематизируя показатели качества и анализируя построенную для них гистограмму, можно легко понять вид распределения, а определив среднее значение и стандартнее отклонение s , можно провести сравнение показателей качества с контрольными нормативами и таким образом получить информацию высокой точности.

Гистограмма применяется главным образом для анализа значений измеренных параметров, но может использоваться и для расчетных значений. Благодаря простоте построений и наглядности гистограммы нашли применение в самых разных областях:

- для анализа времени нахождения в банке, в больнице и т. д., времени реагирования группы обслуживания от момента получения заявки от клиента, времени обработки рекламации от момента ее получения и т. д.;

- для анализа сроков получения заказа (за контрольный норматив принимается срок поставки согласно договору);

- для анализа значений показателей качества, таких как размеры, масса, механические характеристики, химический состав, выход продукции и др. при контроле готовой продукции, при приемочном контроле, при контроле процесса в самых разных сферах деятельности;

- для анализа чистого времени операций, времени истирания режущей поверхности, и т.д.;

для анализа числа бракованных изделий, числа дефектов, числа поломок и т. д.

Значения границ участков определяют следующим образом. Вначале находят наименьшее граничное значение для первого участка из условия S - единица измерения/2.

В приведенном примере S =7,1 мм; единица измерения составляет 0,1 мм . Таким образом, наименьшее граничное значение для первого участка оказывается равным

7,1 мм - 0,1 мм/2 = 7,05 мм

Прибавляя к полученному значению ширину участка h= 0,5 мм, находим что первый участок занимает интервал на оси абсцисс от 7,05 мм до 7,55 мм . Аналогично, прибавляя 0,5 мм к 7,55 мм , получим интервал второго участка (7,55 мм- 8,05 мм ), и т. д.

В интервал последнего участка (11,55-12,05) входит наибольшее значение L.

Следующий шаг - определение центральных значений для участков. Центральное значение для участка определяют по формуле

Сумма граничных значений участка/2=нижнее граничное значение участка+верхнее граничное значение участка/2

В приведенном примере центральное значение для первого участка равно

Центральные значения последующих участков находятся прибавлением ширины участка h =0,5 мм к значению для предыдущего участка.

В размеченные описанным выше образом интервалы участков размещают данные измеренных значений толщины пластин в каждом интервале, которые составляют частоту f попадания этих данных в соответствующий интервал (табл. 9).

Интервал участка, мм

Центральное значение, мм

Сумма (f) 100

Последним шагом является построение графика гистограммы. По оси абсцисс откладывают значения параметров качества, по оси ординат - частоту. Для каждого участка строят прямоугольник (столбик) с основанием, равным ширине интервала участка; высота его соответствует частоте попадания данных в этот интервал (см. рис. 20). Если на гистограмме от руки провести кривую распределения данных по частоте, а также верхнее и нижнее предельные значения нормы, то легко можно понять вид распределения гистограммы и соотношение значений контрольных нормативов. Анализ гистограммы позволяет сделать заключение о состоянии процесса, однако если неясны условия контроля процесса или временные изменения, необходимо в комбинации с гистограммой использовать также контрольные карты и график, представляемый ломаной линией. Полученная в результате анализа гистограммы информация может быть легко использована для построения и исследования причинно-следственной диаграммы, что повысит обоснованность мер, намеченных для улучшения процесса.

Поскольку гистограмма выражает условия процесса за период, в течение которого были получены данные, важную информацию может дать форма распределения гистограммы в сравнении с контрольными нормативами.

Различают следующие модификации формы гистограммы.

1. Гистограмма с двусторонней симметрией (нормальное распределение). Гистограмма с таким распределением встречается чаще всего. Она указывает на стабильность процесса.

2. Гистограмма, вытянутая вправо. Такую форму с плавно вытянутым вправо основанием гистограмма принимает в случае, когда невозможно получить значения ниже определенного - например для процента содержания микросоставляющих, для диаметра деталей и т.д.

3. Гистограмма, вытянутая влево. Такую форму с плавно вытянутым влево основанием гистограмма принимает в случае, когда невозможно получить значения выше определенного - например, для процента содержания составляющих высокой чистоты.

4. Двугорбая гистограмма. Такая гистограмма содержит два возвышения (которые чаще всего имеют разную высоту) с провалом между ними и отражает случаи объединения двух распределений с разными средними значениями, например в случае наличия разницы между двумя станками, между двумя видами материалов (или комплектующих), между двумя операторами и т. д. В этом случае можно провести расслоение по двум видам фактора, исследовать причины различия и принять соответствующие меры для его устранения.

5. Гистограмма в форме обрыва, у которой как бы обрезан один край (или оба). Такая гистограмма представляет случаи, когда, например, отобраны и исключены из партии все изделия параметрами ниже контрольного норматива (или выше контрольного норматива, или и те и другие). После исследования причин отклонения значений параметров от нормы и стабилизации процесса можно прекратить отбор всех изделий с параметрами, отличающимися от нормальных.

6. Гистограмма с ненормально высоким краем (в форме обрыва). Такая гистограмма отражает случаи, когда, например, требуется исправление параметра, имеющего отклонение от нормы, или при искажении информации о данных и т. д. После стабилизации процесса операции по исправлению могут быть прекращены. При этом необходимо уделить внимание случаю грубого искажения данных при измерениях и принять меры к тому, чтобы такие случаи не повторялись.

7. Гистограмма с отделенным островком. Такой гистограммой выражаются случаи, когда была допущена ошибка при измерениях, когда наблюдались отклонения от нормы в ходе процесса и т. д. По результатам анализа гистограммы делают заключение о необходимости настройки измерительного прибора или срочного осуществления контроля параметров процесса и применяют соответствующие меры.

8. Гистограмма с прогалом (с "вырванным зубом"). Такая гистограмма получается, когда ширина интервала участка не кратна единице измерения (не выражается целым числом в выбранной единице измерения), когда оператор ошибается в считывании показаний шкалы и др.

9. Гистограмма, не имеющая высокой центральной части. Такая гистограмма получается в случаях, когда объединяются несколько распределений, в которых средние значения имеют небольшую разницу между собой. Анализ такой гистограммы целесообразно проводить, используя метод расслоения.

В тех случаях, когда известна норма, отмечают прямыми линиями верхнюю и нижнюю границу нормы (устанавливают контрольные нормативы) для сравнения с ними распределения, выраженного гистограммой. При взгляде на гистограмму в этом случае сразу ясно, попадает ли гистограмма в интервал между контрольными нормативами. Если норму определить нельзя, на график наносят точки, отображающие запланированные значения, и проводят через них линии для сравнения с ними гистограммы. При сравнении гистограммы с нормой или с запланированными значениями могут иметь место разные случаи.

1. Среднее значение распределения находится посередине между контрольными нормативами, разброс не выходит за пределы нормы. Наиболее желательно положение, когда ширина между контрольными нормативами примерно в 8 раз больше стандартного отклонения s .

2. Гистограмма полностью входит в интервал, ограниченный контрольными нормативами, но разброс значений велик, края гистограммы находятся почти на границах нормы (ширина нормы в 5-6 раз больше стандартного отклонения s). При этом существует возможность появления брака, поэтому необходимы меры для уменьшения разброса.

3. Среднее значение распределения находится посередине между контрольными нормативами, разброс также находится в пределах нормы, однако края гистограммы намного не доходят до контрольных нормативов (ширина распределения более чем 10 раз превышает стандартное отклонение s ) . Казалось бы, такое положение не должно вызывать беспокойства, поскольку налицо гарантия против появления брака. Но если сузить ширину нормы т. е. сделать несколько менее строгим стандарт на изделие, можно повысить мощность производства и эффективность с точки зрения сбыта. Если несколько увеличить разброс, т. е. сделать несколько менее строгими стандарты на технологические операции и нормы на сырье, материалы и комплектующие, можно повысь производительность и понизить стоимость исходных материалов комплектующих.

4. Разброс невелик по сравнению с шириной нормы, но из-за большого смещения среднего значения х в сторону нижней границы нормы появляется брак. Необходимы меры, способствующие перемещению среднего значения к средней точке между контрольными нормативами.

5. Среднее значение находится посередине между контрольными нормативами, но из-за большого разброса края гистограммы выходят за границы нормы, т. е. появляется брак. Необходимы меры по уменьшению разброса.

6. Среднее значение смещено относительно центра нормы, разброс велик, появляется брак. Необходимы меры по перемещению среднего значения к средней точке между контрольными нормативами и уменьшению разброса.

Таким образом, сравнение вида распределения гистограммы с нормой или запланированными значениями дает важную информацию для управления процессом. Поскольку при этом приходится оперировать средним значением х и стандартным отклонением s, надо уметь их вычислять. Сделаем это на практическом примере.

Допустим, собранные за месяц данные о размерах внешнего диаметра вала систематизированы, в таблицу частот (табл. 10) по которой построена гистограмма.

По значениям полученной при этом частоты f , среднему значению и стандартному отклонению s гистограммы можно вычислить показатель Ср мощности процесса. На построенной гистограмме проводят перпендикулярные оси абсцисс линии, соответствующие значениям и s, верхней и нижней границам нормы, а также линию, соответствующую тройному стандартному отклонению 3 s . Для вычисления и s составляют специальную таблицу (табл. 11), в которую вносят значения интервалов, средние значения и частоту f . Сумма частот совпадает с числом данных n .

Читайте также: