Многомерный статистический анализ доклад

Обновлено: 02.07.2024

Айвазян С.А., Мхитарян В.С., Зехин В.А. Практикум по многомерным статистическим методам

формат doc
размер 4.48 МБ
добавлен 17 декабря 2016 г.

2-е изд. — М.: Московский государственный университет экономики, статистики и информатики, 2012. — 77 с. Учебное пособие подготовлено для поддержки практических занятий по дисциплине "Многомерные статистические методы", читаемой в МЭСИ и на экономическом факультете МГУ им. М.В. Ломоносова. Пособие ориентировано на учебник С.А. Айвазян, В.С. Мхитарян "Прикладная статистика и основы эконометрики", М., ЮНИТИ, 1998; (2-е издание) 2001. Учебное пособ.

Алехин Е.И. Лекции по многомерному статистическому анализу

формат pdf
размер 298,16 КБ
добавлен 07 января 2011 г.

ГОУ ВПО ОГУ, Кафедра математики и информатики, 2007. Дисперсионный анализ. Основные понятия дисперсионного анализа. Однофакторный дисперсионный анализ. Многофакторный дисперсионный анализ. Компонентный и факторный анализ. Метод главных омпонент. Порядок вычисления главных компонент. Задача факторного анализа. Центроидный метод оценивания матрицы факторных нагрузок. Вращение факторов. Кластерный анализ. Задачи кластерного анализа. Расстояния между.

Гирко В.Л. Многомерный статистический анализ

формат djvu
размер 8.85 МБ
добавлен 26 октября 2010 г.

Киев: Вища школа, 1988. - 320 с. Рассмотрены основные утверждения многомерного статистического анализа, которые применены в теории оценивания параметров и состояний линейных систем, теории планирования экспериментов, и распознавании образов. Впервые в отечественной и зарубежной литературе изложены основные результаты разработанного автором G-анализа, которые дают возможность значительно уменьшить число наблюдений над случайными векторами при реше.

Глинский В.В., Ионин В.Г. Статистический анализ

формат pdf
размер 9,63 МБ
добавлен 20 октября 2011 г.

Учебное пособие. - 3-е изд., перераб. и доп. - М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002. - 241 с. ISBN 5-16-001293-1 ISBN 5-8479-0031-7 (Сибирское соглашение) В книге рассматриваются как элементарные статистические операции, основанные на использовании относительных величин, средних величин, их взаимосвязи, так и достаточно сложные: индексный анализ, анализ временных рядов, кластерный, дискриминантный, факторный и компонентный анализ.

Давнис В.В., Тинякова В.И., Мокшина С.И., Алексеева А.И. Компьютерные решения задач многомерной статистики

формат pdf
размер 575,53 КБ
добавлен 14 ноября 2010 г.

Дронов С.В. Многомерный статистический анализ

формат djvu
размер 726,39 КБ
добавлен 05 ноября 2014 г.

Барнаул: Изд-во Алтайского гос. университета, 2003, 213 с. Учебное пособие содержит материалы по дискриминантному, факторному, регрессионному анализу, анализу соответствия и теории временных рядов. Изложены подходы к задачам многомерного шкалирования и некоторым другим задачам многомерной статистики. Оглавление: Предварительные сведения. Анализ и алгебра. Теория вероятностей. Математическая статистика. Многомерные распределения. Случайные векторы.

Дронов С.В. Многомерный статистический анализ

формат pdf
размер 926,16 КБ
добавлен 31 июля 2011 г.

Барнаул: Изд-во Алтайского гос. университета, 2006. — 239 с. Учебное пособие содержит материалы по дискриминантному, факторному, регрессионному анализу, анализу соответствия и теории временных рядов. Изложены подходы к задачам многомерного шкалирования и некоторым другим задачам многомерной статистики. Предварительные сведения Анализ и алгебра Теория вероятностей Математическая статистика Многомерные распределения Случайные векторы Независимость.

Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы

формат djvu
размер 4.57 МБ
добавлен 25 сентября 2010 г.

Учебник. — М: Финансы и статистика, 2003. — 352 с. Рассматриваются многомерные генеральная и выборочная совокупности, корреляционный, регрессионный, компонентный, факторный анализ, канонические корреляции. Подробно изложены методы многомерной классификации, робастного оценивания. Учебник содержит математико-статистические таблицы, а также конкретные примеры и пояснения, необходимые для их выполнения, и упражнения с использованием ЭВМ, позволяющие.

Кластерный анализ

формат ppt
размер 331.24 КБ
добавлен 04 февраля 2011 г.

МАИ, 2009 Типологическая регрессия Временная информация Где применяется кластерный анализ Основные понятия Основная проблема в кластерном анализе Матрица расстояний Расстояния и меры близости Евклидово расстояние Хеммингово расстояние Расстояние между группами объектов и меры близости двух групп объектов Обобщенное расстояние Колмогорова Иерархические кластер-процедуры Дендрограмма Пример анализа

Кластерный анализ

формат doc
размер 184,75 КБ
добавлен 11 января 2011 г.

Содержание Исходные данные Многомерная классификация объектов (кластерный анализ, непараметрическая классификация) Многомерный корреляционный и регрессионный анализ Факторный анализ Компонентный анализ Дискриминантный анализ Литература

Кластерный анализ. Выявление кластеров

формат pdf
размер 295,67 КБ
добавлен 21 апреля 2014 г.

Леончик Е.Ю. Кластерный анализ: терминология, методы, задачи

формат doc
размер 1,18 МБ
добавлен 12 февраля 2017 г.

Изд. 2-е, исп. и доп. — Одесса: Одесский национальный университет имени И. И. Мечникова, 2011. — 68 с. Конспект содержит методические указания по кластерному анализу для лиц, применяющих статистические методы при решении практических задач. Данное пособие имеет своей целью сделать обзор литературы по этому интересному методу анализа данных, подать начальные знания, познакомить с используемой терминологией, как на русском, так и на английском язык.

Методы анализа и обработки первичных данных

формат doc
размер 92,72 КБ
добавлен 17 августа 2011 г.

Косолапова Н.А. (сост.). ЮФУ, Ростов-на-Дону, 2009. - 37стр. Учебно-методический комплекс подготовлен на кафедре Экономической кибернетики Южного Федерального Университета для студентов специальности "Математические методы в экономике". Методы организации экономических исследований и исследовательские стратегии. Первичная обработка данных. Выборочные данные в исследованиях. Анализ неколичественных переменных Анализ природы данных Список рекоменду.

Представление данных рядами Тейлора: векторно-матричный подход

формат doc
размер 71,64 КБ
добавлен 11 октября 2012 г.

БГУИР, Минск, 2011. - 6 с. Вариант 9-а Дисциплина - Анализ многомерных данных Содержание: Цель работы Задание Ход работы Результаты выполнения Вывод

Представление данных рядами Тейлора: классический подход

формат doc
размер 114,72 КБ
добавлен 20 октября 2012 г.

Представление данных рядами Тейлора: классический подход

формат doc
размер 72,42 КБ
добавлен 16 октября 2012 г.

БГУИР, Минск, 2012. - 7 с. Дисциплина - Анализ многомерных данных Содержание: Варианты задания для одной переменной Варианты задания для двух переменных Ход работы Результаты выполнения Вывод

Применение многомерных статистических методов для решения практических задач

формат doc
размер 1,89 МБ
добавлен 28 апреля 2013 г.

М.: РЭУ им. Г. В. Плеханова, 2011. — 106 с. Дисциплина — Многомерные статистические методы Группировка регионов Сибирского и Дальневосточного федеральных округов в 2003 – 2009 годах по социальным показателям уровня жизни населения Корреляционно-регрессионный анализ 53 предприятий по экономическим показателям Обработка анкетных данных

Сердобольский В.И. Дискриминантный анализ наблюдений большой размерности

формат djvu
размер 2,07 МБ
добавлен 05 марта 2012 г.

Москва, АН СССР, 1979. - 59 с. Исследование посвящено оценке вероятностей ошибок классификации по выборочным данным в случае, когда размерность наблюдения и число оцениваемых параметров велико и сравнимо с объёмом выборки. Получены результаты, позволяющие дать практические рекомендация по улучшению классификации путем взвешивания и отбора переменных в дискриминантной функции. Пособие может быть полезно исследователям в области биологии, медицины.

Симчера В.М. Методы многомерного анализа статистических данных

формат pdf
размер 29,41 МБ
добавлен 28 июня 2016 г.

Симчера В.М. Методы многомерного анализа статистических данных

формат djvu
размер 10,16 МБ
добавлен 04 марта 2011 г.

Москва: Финансы и статистика, 2008. - 400с. В данном пособии в отличие от аналогичных изданий процедуры применения сложных методов многомерного анализа рассматриваются по шагам на конкретных, а не на абстрактных примерах (их представлено в книге более 150). Каждая из пяти тем пособия включает вводные замечания, типологию решаемых задач, задачи для самостоятельных занятий, тесты и вопросы для самоконтроля. Примеры решения большеразмерных задач при.

Сошникова Л.А., Тамашевич В.Н., Уэбе Г., Шефер М. Многомерный статистический анализ в экономике

формат pdf
размер 20,51 МБ
добавлен 10 февраля 2012 г.

Учебное пособие для вузов. Под ред. проф. В.Н. Тамашевича. — М.: Юнити-Дана, 1999. — 598 с. Достаточно полно представлены теоретические основы и важнейшие методы многомерной статистики, открывающей для исследователя широкие возможности моделирования сложных реальных процессов, явлений и визуализации данных. Знание методов многомерной статистики сегодня необходимо не только для аналитической работы, но и для понимания новейших теорий по обработке.

Статистическое исследование дифференциации образовательной деятельности вузов России

формат doc
размер 223,11 КБ
добавлен 25 августа 2012 г.

Москва: МЭСИ, 2010. - 55 с. Архипова М.Ю. Дисциплина - Многомерные статистические методы (МСМ) Введение Подготовительный этап исследования Выбор объектов наблюдения Элементы корреляционного анализа Проверка на нормальный закон распределения Использование методов кластерного анализа для классификации высших учебных заведений Понятие и сущность кластерного анализа Измерение близости объектов Иерархические алгоритмы классификации Расстояния между к.

Тихомиров Н.П., Тихомирова Т.М., Ушмаев О.С. Методы эконометрики и многомерного статистического анализа

формат pdf
размер 52,30 МБ
добавлен 28 марта 2014 г.

Филатов А.Ю. Конспект лекций по многомерным статистическим методам

формат pdf
размер 634,25 КБ
добавлен 17 января 2011 г.

Чураков Е.П. Введение в многомерные статистические методы

формат pdf
размер 1,21 МБ
добавлен 1 апреля 2015 г.

Шаланов Н.В. Многомерный статистический анализ

формат doc
размер 840,12 КБ
добавлен 24 ноября 2011 г.

Учебник. Новосибирск. 2005. - 175 с Работа посвящена классическим и новаторским методам многомерного статистического анализа, а также прикладным задачам, решаемым в экономических исследованиях посредством инструментария многомерного статического анализа. Полезна для студентов, аспирантов, магистров, преподавателей и специалистов в области многомерного анализа. Оглавление Введение Общие принципы многомерного статистического анализа Статистическая.

Harrington D. Confirmatory Factor Analysis

формат pdf
размер 805,14 КБ
добавлен 11 июня 2013 г.

Oxford, Oxford University Press, 2008. — 136 p. Краткое пособие, изданное в серии "Pocket Guides to Social Work Research Methods", по подтверждающему (конфирматорному) факторному анализу, находящему применение в психологических, социальных и т.п. исследованиях. Математический уровень читателя предполагается минимальный. Для изучающих применение статистических методов в социальных науках. Contents Introduction Creating a CFA Model Requirements for.

МНОГОМЕ́РНЫЙ СТАТИСТИ́ЧЕСКИЙ АНА́ ЛИЗ, раздел математической статистики , посвящённый математич. методам построения оптимальных планов сбора, систематизации, обработки и интерпретации многомерных статистич. данных. Эти методы предназначены прежде всего для выявления характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и используются для получения теоретич. и практич. выводов. Под многомерным признаком понимается $p$ -мерный вектор $x=(x_1,x_2. x_p)$ показателей (переменных) $x_1,x_2. x_p$ , среди которых могут быть количественные, т. е. измеряющие в определённой шкале степень проявления изучаемого свойства объекта; порядковые (или ординальные), т. е. позволяющие упорядочивать анализируемые объекты по степени проявления в них изучаемого свойства; классификационные (или номинальные), т. е. позволяющие разбивать исследуемую совокупность объектов на однородные (по анализируемому свойству) классы. Результаты измерения этих показателей на каждом из анализируемых объектов исследуемой совокупности образуют последовательность многомерных наблюдений, или исходный массив многомерных данных, который используется для проведения М. с. а. В значит. части М. с. а. рассматриваются ситуации, в которых исследуемый многомерный признак интерпретируется как многомерная случайная величина и анализируемая последовательность многомерных наблюдений – как выборка из совокупности генеральной . В этом случае выбор методов обработки исходных статистич. данных и анализ их свойств производятся на основе тех или иных допущений относительно природы многомерного (совместного) закона распределения вероятностей.

Слайд 1

Слайд 2

Многомерный статистический анализ - раздел статистики математической, посвященный математическим методам, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и предназначенным для получения научных и практических выводов. Многомерный статистический анализ - раздел статистики математической, посвященный математическим методам, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и предназначенным для получения научных и практических выводов.

Слайд 3

Основные подразделы: Анализ многомерных распределений и их основных характеристик Анализ характера и структуры взаимосвязей компонент исследуемого многомерного признака: анализ регрессионный, анализ дисперсионный, анализ ковариационнй, анализ факторный, анализ латентно-структурный, анализ логлинейный, поиск взаимодействий Анализ геометрической структуры исследуемой совокупности многомерных наблюдений : анализ дискриминантный, анализ кластерный, шкалирование многомерное

Слайд 4

Прикладное значение многомерного статистического анализа: - проблемы статистического исследования зависимостей между рассматриваемыми показателями; - проблемы классификации элементов (объектов или признаков); - проблемы снижения размерности рассматриваемого признакового пространства и отбора наиболее информативных признаков.

Слайд 5

Слайд 6

Слайд 7

Слайд 8

Слайд 9

Слайд 10

Слайд 11

Слайд 12

Слайд 13

Слайд 14

- раздел математич. статистики, посвященный математич. методам построения оптимальных планов сбора, систематизации и обработки многомерных статистич. данных, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и предназначенным для получения научных и практич. выводов. Под многомерным признаком понимается р-мерный вектор показателей (признаков, переменных) среди к-рых могут быть: количественные, т. е. скалярно измеряющие в определенной шкале степень проявления изучаемого свойства объекта, п о-рядковые (или ординальные), т. е. позволяющие упорядочивать анализируемые объекты по степени проявления в них изучаемого свойства; и классификационные (или номинальные), т. е. позволяющие разбивать исследуемую совокупность объектов на не поддающиеся упорядочиванию однородные (по анализируемому свойству) классы. Результаты измерения этих показателей

на каждом из побъектов исследуемой совокупности образуют последовательность многомерных наблюдений, или исходный массив многомерных данных для проведения М. с. а. Значительная часть М. с. а. обслуживает ситуации, в к-рых исследуемый многомерный признак интерпретируется как многомерная случайная величина и соответственно последовательность многомерных наблюдений (1) - как выборка из генеральной совокупности. В этом случае выбор методов обработки исходных статистич. данных и анализ их свойств производится на основе тех или иных допущений относительно природы многомерного (совместного) закона распределения вероятностей

По содержанию М. с. а. может быть условно разбит на три основных подраздела: М. с. а. многомерных распределений и их основных характеристик; М. с. а. характера и структуры взаимосвязей между компонентами исследуемого многомерного признака; М. с. а. геометрич. структуры исследуемой совокупности многомерных наблюдений.

Многомерный статистический анализ многомерных распределений и их основных характеристик охватывает лишь ситуации, в к-рых обрабатываемые наблюдения (1) имеют вероятностную природу, т. е. интерпретируются как выборка из соответствующей генеральной совокупности. К основным задачам этого подраздела относятся: статистич. оценивание исследуемых многомерных распределений, их основных числовых характеристик и параметров; исследование свойств используемых статистич. оценок; исследование распределений вероятностей для ряда статистик, с помощью к-рых строятся статистич. критерии проверки различных гипотез о вероятностной природе анализируемых многомерных данных. Основные результаты относятся к частному случаю, когда исследуемый признак подчинен многомерному нормальному закону распределения функция плотности к-рого задается соотношением

где - вектор математич. ожиданий компонент случайной величины , т. е.- ковариационная матрица случайного вектора , т. е.- ковариации компонент вектора (рассматривается невырожденный случай, когда ранг ; в противном случае, т. е. при ранге , все результаты остаются справедливыми, но применительно к подпространству меньшей размерности , в к-рой оказывается сосредоточенным распределение вероятностей исследуемого случайного вектора ).

Так, если (1) - последовательность независимых наблюдений, образующих случайную выборку из то оценками максимального правдоподобия для параметров и , участвующих в (2), являются соответственно статистики (см. [1], [2])

причем случайный вектор подчиняется р-мерному нормальному закону и не зависит от , а совместное распределение элементов матрицы описывается т. н. распределением Уиша р-т а (см. [4]), плотность к-рого

В рамках этой же схемы исследованы распределения и моменты таких выборочных характеристик многомерной случайной величины, как коэффициенты парной, частной и множественной корреляции, обобщенная дисперсия (т. е. статистика ), обобщенная -статистике Хотеллинга (см. [5]). В частности (см. [1]), если определить в качестве выборочной ковариационной матрицы подправленную "на несмещенность" оценку , а именно:

то распределение случайной величины стремится к при , а случайные величины

подчиняются F-распределениям с числами степеней свободы соответственно (р, п-р) и (р, п ₁+п ₂ -р-1). В соотношении (7) п ₁ и n₂ - объемы двух независимых выборок вида (1), извлеченных из одной и той же генеральной совокупности - оценки вида (3) и (4)-(5), построенные по i-й выборке, а

- общая выборочная ковариационная матрица, построенная по оценкам и

Многомерный статистический анализ характера и структуры взаимосвязей компонент исследуемого многомерного признака объединяет в себе понятия и результаты, обслуживающие такие методы и модели М. с. а., как множественная регрессия, многомерный дисперсионный анализ и ковариационный анализ, факторный анализ и метод главных компонент, анализ канонич. корреляций. Результаты, составляющие содержание этого подраздела, могут быть условно разделены на два основных типа.

1) Построение наилучших (в определенном смысле) статистич. оценок для параметров упомянутых моделей и анализ их свойств (точности, а в вероятностной постановке - законов их распределения, доверительных: областей и т. д.). Так, пусть исследуемый многомерный признак интерпретируется как векторная случайная величина, подчиненная р-мерному нормальному распределению , и расчленен на два подвектора--столбца и размерности qи р-qсоответственно. Это определяет и соответствующее расчленение вектора математич. ожиданий , теоретической и выборочной ковариационных матриц , а именно:

Тогда (см. [1], [2]) условное распределение подвектора (при условии, что второй подвектор принял фиксированное значение ) будет также нормальным ). При этом оценками максимального правдоподобия . для матриц регрессионных коэффициентов и ковариацин этой классической многомерной модели множественной регрессии

будут взаимно независимые статистики соответственно

здесь распределение оценки подчинено нормальному закону , а оценки п - закону Уишарта с параметрами и (элементы ковариационной матрицы выражаются в терминах элементов матрицы ).

Основные результаты по построению оценок параметров и исследованию их свойств в моделях факторного' анализа, главных компонент и канонич. корреляций относятся к анализу вероятностно-статистич. свойств собственных (характеристических) значений и векторов различных выборочных ковариационных матриц.

В схемах, не укладывающихся в рамки классич. нормальной модели и тем более в рамки какой-либо вероятностной модели, основные результаты относятся к построению алгоритмов (и исследованию их свойств) вычисления оценок параметров, наилучших с точки зрения нек-poro экзогенно заданного функционала качества (пли адекватности) модели.

2) Построение статистич. критериев для проверки различных гипотез о структуре исследуемых взаимосвязей. В рамках многомерной нормальной модели (последовательности наблюдений вида (1) интерпретируются как случайные выборки из соответствующих многомерных нормальных генеральных совокупностей) построены, напр., статистич. критерии для проверки следующих гипотез.

I. Гипотезы о равенстве вектора математич. ожиданий исследуемых показателей заданному конкретному вектору ; проверяется с помощью -статистики Хотеллинга с подстановкой в формулу (6)

II. Гипотезы о равенстве векторов математич. ожиданий в двух генеральных совокупностях (с одинаковыми, но неизвестными ковариационными матрицами), представленных двумя выборками; проверяется с помощью статистики (см. [7]).

III. Гипотезы о равенстве векторов математич. ожиданий в нескольких генеральных совокупностях (с одинаковыми, но неизвестными ковариационными матрицами), представленных своими выборками; проверяется с помощью статистики

в к-рой есть i-е р-мерное наблюдение в выборке объема , представляющей j-ю генеральную совокупность, а и - оценки вида (3), построенные соответственно отдельно по каждой из выборок и по объединенной выборке объема

IV. Гипотезы об эквивалентности нескольких нормальных генеральных совокупностей, представленных своими выборками проверяется с помощью статистики

в к-рой - оценка вида (4), построенная отдельно по наблюдениям j- йвыборки, j=1, 2, . , k.

V. Гипотезы о взаимной независимости подвекторов-столбцов размерностей соответственно на к-рые расчленен исходный р-мерный вектор исследуемых показателей проверяется с помощью статистики

в к-рой и - выборочные ковариационные матрицы вида (4) для всего вектора и для его подвектора x (i) соответственно.

Многомерный статистический анализ геометрической структуры исследуемой совокупности многомерных наблюдений объединяет в себе понятия и результаты таких моделей и схем, как дискриминантный анализ, смеси вероятностных распределений, кластер-анализ и таксономия, многомерное шкалирование. Узловым во всех этих схемах является понятие расстояния (меры близости, меры сходства) между анализируемыми элементами. При этом анализируемыми могут быть как реальные объекты, на каждом из к-рых фиксируются значения показателей ,- тогда геометрич. образом i-го обследованного объекта будет точка в соответствующем р-мерном пространстве, так и сами показатели - тогда геометрич. образом l-го показателя будет точка в соответствующем n-мерном пространстве.

Методы и результаты дискриминантного анализа (см. [1], [2], [7]) направлены на решение следующей задачи. Известно о существовании определенного числа генеральных совокупностей и у исследователя имеется по одной выборке из каждой совокупности ("обучающие выборки"). Требуется построить основанное на имеющихся обучающих выборках наилучшее в определенном смысле классифицирующее правило, позволяющее приписать нек-рый новый элемент (наблюдение ) к своей генеральной совокупности в ситуации, когда исследователю заранее не известно, к какой из совокупностей этот элемент принадлежит. Обычно под классифицирующим правилом понимается последовательность действий: по вычислению скалярной функции от исследуемых показателей, по значениям к-рой принимается решение об отнесении элемента к одному из классов (построение дискриминантной функции); по упорядочению самих показателей по степени их информативности с точки зрения правильного отнесения элементов к классам; по вычислению соответствующих вероятностей ошибочной классификации.

Задача анализа смесей распределений вероятностей (см. [7]) чаще всего (но не всегда) возникает также в связи с исследованием "геометрической структуры" рассматриваемой совокупности. При этом понятие r-го однородного класса формализуется с помощью генеральной совокупности, описываемой нек-рым (как правило, унимодальным) законом распределения так что распределение общей генеральной совокупности, из к-рой извлечена выборка (1), описывается смесью распределений вида где p_r - априорная вероятность (удельный вес элементов) r-го класса в общей генеральной совокупности. Задача состоит в "хорошем" статистич. оценивании (по выборке ) неизвестных параметров а иногда и к. Это, в частности, позволяет свести задачу классификации элементов к схеме дискриминантного анализа, хотя в данном случае отсутствовали обучающие выборки.

Методы и результаты кластер-анализа (классификации, таксономии, распознавании образов "без учителя", см. [2], [6], [7]) направлены на решение следующей задачи. Геометрич. структура анализируемой совокупности элементов задана либо координатами соответствующих точек (т. е. матрицей . , п), либо набором геометрич. характеристик их взаимного расположения, напр, матрицей попарных расстояний . Требуется разбить исследуемую совокупность элементов на сравнительно небольшое (заранее известное или нет) число классов так, чтобы элементы одного класса находились на небольшом расстоянии друг от друга, в то время как разные классы были бы по возможности достаточно взаимоудалены один от другого и не разбивались бы на столь же удаленные друг от друга части.

Задача многомерного шкалирования (см. [6]) относится к ситуации, когда исследуемая совокупность элементов задана с помощью матрицы попарных расстояний и заключается в приписывании каждому из элементов заданного числа (р)координат таким образом, чтобы структура попарных взаимных расстояний между элементами, измеренных с помощью этих вспомогательных координат, в среднем наименее отличались бы от заданной. Следует заметить, что основные результаты и методы кластер-анализа и многомерного шкалирования развиваются обычно без каких-либо допущении о вероятностной природе исходных данных.

Прикладное назначение многомерного статистического анализа состоит в основном в обслуживании следующих трех проблем.

Проблема статистического исследования зависимостей между анализируемыми показателями. Предполагая, что исследуемый набор статистически регистрируемых показателей xразбит, исходя из содержательного смысла этих показателей и окончательных целей исследования, на q-мернын подвектор предсказываемых (зависимых) переменных и (р-q)-мерный подвектор предсказывающих (независимых) переменных, можно сказать, что проблема состоит в определении на основании выборки (1) такой q-мерной векторной функции из класса допустимых решений F, к-рая давала бы наилучшую, в определенном смысле, аппроксимацию поведения подвектора показателей . В зависимости от конкретного вида функционала качества аппроксимации и природы ,анализируемых показателей приходят к тем или иным схемам множественной регрессии, дисперсионного, ковариационного или конфлюентного анализа.

Проблема классификации элементов (объектов или показателей) в общей (нестрогой) постановке заключается в том, чтобы всю анализируемую совокупность элементов, статистически представленную в виде матрицы или матрицы разбить на сравнительно небольшое число однородных, в определенном смысле, групп [7]. В зависимости от природы априорной информации и конкретного вида функционала, задающего критерий качества классификации, приходят к тем или иным схемам дискриминантного анализа, кластер-анализа (таксономии, распознавания образов "без учителя"), расщепления смесей распределений.

Проблема снижения размерности исследуемого факторного пространства и отбора наиболее информативных показателей заключается в определении такого набора сравнительно небольшого числа показателен найденного в классе допустимых преобразований исходных показателей на к-ром достигается верхняя грань нек-рой экзогенно заданной меры информативности m-мерной системы признаков (см. [7]). Конкретизация функционала, задающего меру автоинформативности (т. е. нацеленное на максимальное сохранение информации, содержащейся в статистич. массиве (1) относительно самих исходных признаков), приводит, в частности, к различным схемам факторного анализа и главных компонент, к методам экстремальной группировки признаков. Функционалы, задающие меру внешней информативности, т. е. нацеленные на извлечение из (1) максимальной информации относительно нек-рых других, не содержащихся непосредственно в ж, показателен или явлений, приводят к различным методам отбора наиболее информативных показателей в схемах статистич. исследования зависимостей и дискриминантного анализа.

Основной математический инструментарий М. с. а. составляют специальные методы теории систем линейных уравнений и теории матриц (методы решения простой и обобщенной задачи о собственных значениях и векторах; простое обращение и псевдообращение матриц; процедуры диагонализации матриц и т. д.) и нек-рые оптимизационные алгоритмы (методы покоординатного спуска, сопряженных градиентов, ветвей и границ, различные версии случайного поиска и стохастич. аппроксимации и т. д.).

Лит.:[1] Андерсон Т., Введение в многомерный статистический анализ, пер. с англ., М., 1963; [2] Кендалл М. Дж. Стьюарт А., Многомерный статистический анализ и временные ряды, пер. с англ., М., 1976; [3] Большев Л. Н., "Bull. Int. Stat. Inst.", 1969, № 43, p. 425-41; [4] Wishаrt .J., "Biometrika", 1928, v. 20A, p. 32-52: [5] Hotelling H., "Ann. Math. Stat.", 1931, v. 2, p. 360-78; [в] Кruskal J. В., "Psychometrika", 1964, v. 29, p. 1-27; [7] Айвазян С. А., Бежаева 3. И., . Староверов О. В., Классификация многомерных наблюдений, М., 1974.

С. А. Айвазян.

Математическая энциклопедия. — М.: Советская энциклопедия . И. М. Виноградов . 1977—1985 .

Читайте также: