Реферат проверка адекватности модели

Обновлено: 04.07.2024

Проверка адекватности выбранных моделей реальному процессу ( в частности, адекватности полученной кривой роста) строится на анализе случайной компоненты. Случайная остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном ряду). Предположим, что исходный временной ряд описывает процесс, не подверженный сезонным колебаниям, т.е. примем гипотезу об аддитивной модели ряда вида:

Тогда ряд остатков будет получен как отклонения фактических уровней временного ряда (yt ) от выравненных, расчетных (ŷ t ):

При использовании кривых роста ŷt вычисляют, подставляя в уравнения выбранных кривых соответствующие последовательные значения времени.

Принято считать, что модель адекватна описываемому процессу, если значения остаточной компоненты удовлетворяют свойствам случайности, независимости, а также случайная компонента подчиняется нормальному закону распределения.

При правильном выборе вида тренда отклонения от него будут носить случайный характер. Это означает, что изменение остаточной случайной величины не связано с изменением времени. Таким образом, по выборке, полученной для всех моментов времени на изучаемом интервале, проверяется гипотеза о зависимости последовательности значений et от времени, или, что то же самое, о наличии тенденции в ее изменении. Поэтому для проверки данного свойства может быть использован один из критериев, рассматриваемых в разделе 1, например, критерий серий.

Если вид функции, описывающей систематическую составляющую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок.

В условиях автокорреляции оценки параметров модели, полученные по методу наименьших квадратов, будут обладать свойствами несмещенности и состоятельности (с этими свойствами знакомятся в курсе математической статистики). В то же время эффективность этих оценок будет снижаться, а, следовательно, доверительные интервалы будут иметь мало смысла в силу своей ненадежности.

Существует несколько приемов обнаружения авто корреляции. Наиболее распространенным является метод, предложенный Дарбиным и Уотсоном. Критерий Дарбина-Уотсона связан с гипотезой о существовании автокорреляции первого порядка, Т.е. автокорреляции между соседними остаточными членами ряда. Значение этого критерия определяется по формуле:

Можно показать, что величина d приближенно равна:

где r1 — коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреляции между двумя рядами е1, е2,…, еn-1 и е2, е3 ,…,en ).

Из последней формулы видно, что если в значениях et имеется сильная положительная авто корреляция ( r1 ≈1), то величина d=0, в случае сильной отрицательной автокорреляции (r1 ≈-1) d=4. При отсутствии автокорреляции (r≈0) d=2.

Для этого критерия найдены критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Авторами критерия границы определены для 1; 2,5; и 5% уровней значимости. Значения критерия Дарбина- Уотсона при 5% уровне значимости приведены в таблице. В этой таблице d1 и d2 – соответственно нижняя и верхняя доверительные границы критерия Дарбина- Уотсона; k1 – число переменных в модели; n- длина ряда.

Исследование влияния режимов резания на шероховатость обработанной поверхности вала. Решение задачи методом рототабельного униформ-планирования второго порядка. Составление математической модели, позволяющей прогнозировать влияние входных факторов.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 13.06.2014
Размер файла 94,7 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Министерство образования и науки Российской Федерации

Пензенский государственный университет

Кафедра "Технология машиностроения"

"Математическое моделирование процессов в машиностроении"

"Построение математической модели и проверка ее адекватности с использованием современных вычислительных средств"

Реферат

МОДЕЛЬ, МОДЕЛИРОВАНИЕ, ЭКСПЕРИМЕНТ, МНОГОФАКТОРНОЕ, ПЛАНИРОВАНИЕ, ДИСПЕРСИЯ, КРИТЕРИЙ ФИШЕРА, ТОКАРНАЯ ОБРАБОТКА.

В данной работе было проведено исследование влияния режимов резания на шероховатость обработанной поверхности вала. Задача решалась с помощью метода рототабельного униформ-планирования второго порядка, с числом фактором, равным трем.

В результате работы выявлены коэффициенты уравнения регрессии и составлена математическая модель, позволяющей прогнозировать влияние входных факторов (скорость вращения шпинделя, подача, глубина резания) на шероховатость поверхности.

резание шероховатость вал математический

Содержание

    1. Описание условий и методика проведения натурного эксперимента
    • 1.1 Технологическое оборудование
    • 1.2 Методика обработки результатов экспериментов

    1. Описание условий и методика проведения натурного эксперимента

    На качественные характеристики в исследуемом способе обработке оказывает влияние целый ряд технологических факторов. На основе анализа результатов ранее проведенных теоретических и экспериментальных исследований, технологию аналогичных способов обработки и предлагаемого способа, можно выделить следующие технологические факторы, определяющие эффективность обработки:

    Скорость вращения шпинделя станка V;

    Глубина резания t;

    Ни одна физическая модель не может полностью заменить реального эксперимента. К тому же учесть все факторы, влияющие на исследуемый процесс не возможно. Поэтому проведение экспериментальных исследований необходимо для оценки значимости, влияния технологических факторов на рассматриваемый процесс, а также для проверки адекватности разработанных математических моделей.

    1.1 Технологическое оборудование

    Для проведения экспериментальных исследований процесса точения вала на токарно-винторезном станке 1А625.

    Технические характеристики токарно-винторезного станка 1А625

    Наибольшая длинна обрабатываемой детали, мм…… 1000-2000

    Наибольший диаметр точения над станиной, мм ……500

    Наибольший диаметр точения над суппортом, мм ……290

    Наибольшая длинна обрабатываемого прутка, мм……54

    1.2 Методика обработки результатов экспериментов

    Для оценки влияния наиболее значимых факторов на эффективность обработки была использована методика многофакторного планирования эксперимента, позволяющая значительно сократить количество опытов и повысить их эффективность. Кроме того, был проведен ряд однофакторных экспериментов для получения дополнительной информации о процессе обработки.

    Количественная оценка результатов эксперимента определялась как среднее арифметическое параллельных измерений образцов одной партии:

    где - среднее арифметическое параллельных измерений,

    m -количество параллельных измерений,

    i-номер параллельного измерения.

    yi- значение отклика при i -м измерении.

    Отклик оценивался по критерию Стьюдента:

    где t(P,m)-критерий Стьюдента,

    P- доверительная вероятность,

    S - оценка стандартного отклонения погрешностей эксперимента:

    Если условие 1.2 выполняется отклик является значимым, в противном случае проводится повторный эксперимент для получения значимых результатов.

    2. Составление таблиц выходных данных и уровней варьирования факторов

    Многофакторные эксперименты проводились с использованием методик многофакторного регрессионного анализа на основе центрального композиционного ротатабельного униформ планирования. В качестве ядра плана использовалась матрица полного факторного эксперимента 2 k , где k -количество исследуемых факторов.

    Опыты проводились в случайной последовательности в соответствии с данными таблицы 1 равномерно распределенных случайных чисел.

    Для каждого фактора определяются уровни варьирования.

    Таблица 1 - Уровни и интервалы варьирования факторов

    Уровни варьирования факторов

    Таблица 2 - Значения опытных данных

    Среднее значение шероховатости поверхности рассчитывается и записывается ниже приведенную таблицу.

    Таблица 3 - средние значения шероховатостей из каждого опыта

    3. Составление матрицы ротатабельного планирования эксперимента

    С целью упрощения записи условий экспериментов и обработки экспериментальных данных, и получения нормализованной модели производилось кодирование факторов, которое осуществлялось для полиномиальной модели с помощью соотношения:

    для экспоненциальной модели:

    где Xi - кодированное значение i -го фактора;

    xi - действительное значение i -го фактора;

    xmax --максимальное действительное значение i -го фактора;

    xmin - минимальное действительное значение i -го фактора;

    На первом этапе проводились эксперименты в центре плана и проверялась гипотеза об адекватности либо полиномиальной нормализованной модели вида:

    либо экспоненциальной вида:

    которая после логарифмирования принимает линейный вид:

    Матрица рототабельного плана второго порядка для трех варьируемых параметров и значение параметров режимов резания.

    Таблица 4 - Матрица ротатабельного униформ-планирования для к=3

    4. Определение коэффициентов уравнения регрессии

    Определение параметров нормализованной полиномиальной линейной модели (3.7) производится по формулам

    Определение параметров логарифмированной модели производится по формулам

    Затем производилась оценка значимости коэффициентов, рассчитанных по зависимостям (3.10 - 3.13).

    После оценки значимости коэффициентов модель экспонируется для приведения ее к действительному виду.

    Затем производилась оценка значимости полученной модели.

    Вычисляются параметры этой полиномиальной модели по зависимостям:

    оценивается значимость коэффициентов модели и производится оценка ее адекватности.

    5. Определение дисперсии параметров оптимизации и дисперсии воспроизводимости

    Остаточная дисперсия (дисперсия адекватности) полученной модели определяется по формуле:

    где fu - значение функции отклика ( по данным эксперимента) вычисленной по полученной модели при уровнях факторов соответствующее опыту с номером u.

    Мерой качества модели является остаточная сумма квадратов или общая навязка модели, минимизацией которой и получают оценки параметров. При применении методов регрессии и авторегрессии надежным показателем качества является дисперсия адекватности моделей, определяемая из условий. Далее дисперсии можно сравнить по критерию Фишера для предварительно заданной доверительной вероятности, и таким образом выбрать лучшую модель или, по крайней мере, несколько статистически сравнимых по качеству моделей.

    Применение Критерия Фишера к дисперсиям адекватности, все данные приведены в таблице (жирным шрифтом обозначены расчетные значения критерия Фишера.) Только в двух случаях расчетные величины превысили соответствующие табличные значения (эти значения в таблице отмечены зеленым затенением): при сравнении модели авторегрессии второго порядка с линейной и экспоненциальной моделями, в остальных же парах не обнаружено решительного преимущества одной модели над другой. Судя по анализу остатков модель Хольта-Винтерса по крайней мере не хуже модели авторегрессии, но для нее нельзя использовать критерий однородности дисперсий, поскольку ничего невозможного сказать о ее числе степеней свободы, а значит и рассчитать дисперсию адекватности. Эта ситуация достаточно типична в прогнозировании, а потому нужны альтернативные способы.

    Полученные значения дисперсии оптимизации записываются в ниже приведенную таблицу.

    Таблица 5 - результаты дисперсии параметра оптимизации

    Дисперсия параметра оптимизации S 2 о

    6. Проверка адекватности модели

    Адекватность моделей определялась с помощью критерия Фишера F.

    Адекватность модели -- совпадение свойств (функций/параметров/характеристик и т.п.) модели и соответствующих свойств моделируемого объекта. Адекватностью называется совпадение модели моделируемой системы в отношении цели моделирования.

    Оценка адекватности модели - проверка соответствия модели реальной системе. Оценка адекватности модели реальному объекту оценивается по близости результатов расчетов экспериментальным данным.

    Два основных подхода к оценке адекватности:

    1) по средним значениям откликов модели и системы

    Проверяется гипотеза о близости средних значений каждой n-й компоненты откликов модели Yn известным средним значениям n-й компоненты откликов реальной систем.

    2) по дисперсиям отклонений откликов модели от среднего значения откликов систем

    Сравнение дисперсии проводят с помощью критерия F (проверяют гипотезы о согласованности), с помощью критерия согласия ?2 (при больших выборках, п>100), критерия Колмогорова- Смирнова (при малых выборках, известны средняя и дисперсия совокупности), Кохрена и др.

    Критерием Фишера (F-критерием, ц*-критерием) -- называют любой статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).

    Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на "степени свободы"). Чтобы статистика имела распределение Фишера необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.

    Тест проводится путем сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если , то . Кроме того, квантили распределения Фишера обладают свойством . Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе -- меньшая и сравнение осуществляется с "правой" квантилью распределения. Тем не менее тест может быть и двусторонним и односторонним. В первом случае при уровне значимости используется квантиль , а при одностороннем тесте [1] .

    Более удобный способ проверки гипотез -- с помощью p-значения -- вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если (для двустороннего теста -- )) меньше уровня значимости , то нулевая гипотеза отвергается, в противном случае принимается.

    Расчетный критерий Фишера:

    Расчетное значение критерия Фишера FN сравнивается с табличным FТ.

    Если расчетное значение критерия меньше критического то модель адекватна.

    Таблица 6 - проверка адекватности модели

    Анализ результатов эксперимента показал, что Fн>Fк, следовательно, модель не адекватна. Необходимо провести повторный эксперимент.

    В ОБЩЕМ СЛУЧАЕ МОДЕЛЬ БУДЕТ ИМЕТЬ ВИД:

    Y=2,65-0,4*V+0,359*t-0,047*S-0,102*V*t+0,042*V*S+0,052*t*S 0,199V 2 +0,078*t 2 -0,007*S 2

    Заключение

    Проведено исследование влияния режимов резания на шероховатость обработанной поверхности вала методом рототабельного униформ-планирования второго порядка, с числом фактором, равным трем.

    Используя данную методику, выявлены коэффициенты уравнения регрессии и составлена математическая модель, позволяющая прогнозировать влияние входных факторов (скорость вращения шпинделя, подача, глубина резания) на шероховатость поверхности.

    Проверка адекватности модели показала, что модель не адекватна. Требуется произвести повторный эксперимент.

    Список использованных источников

    1. Адлер Ю.П. Планирование эксперимента при поиске оптимальных условий [Текст]/ Ю.П. Адлер, Е.В. Маркова, Ю.В. Грановский.- М.: Наука, 1976.

    Подобные документы

    Построение математической модели. Выбор, обоснование и описание метода решений прямой задачи линейного программирования симплекс-методом, с использованием симплексной таблицы. Составление и решение двойственной задачи. Анализ модели на чувствительность.

    курсовая работа [100,0 K], добавлен 31.10.2014

    Графическое решение задач. Составление математической модели. Определение максимального значения целевой функции. Решение симплексным методом с искусственным базисом канонической задачи линейного программирования. Проверка оптимальности решения.

    контрольная работа [191,1 K], добавлен 05.04.2016

    Краткий обзор решения транспортных задач. Экономическая интерпретация поставленной задачи. Разработка и описание алгоритма решения задачи. Построение математической модели. Решение задачи вручную и с помощью ЭВМ. Анализ модели на чувствительность.

    курсовая работа [844,3 K], добавлен 16.06.2011

    Решение задачи линейного программирования симплекс-методом: постановка задачи, построение экономико-математической модели. Решение транспортной задачи методом потенциалов: построение исходного опорного плана, определение его оптимального значения.

    контрольная работа [118,5 K], добавлен 11.04.2012

    Построение математической модели корпуса судна. Изучение работы последней версии программы FastShip6. Построение теоретической поверхности корпуса теплохода, проходящего ремонт на судостроительном предприятии. Процесс построения поверхности по ординатам.

    дипломная работа [656,0 K], добавлен 24.03.2010

    Методы решения задач линейного программирования: планирования производства, составления рациона, задачи о раскрое материалов и транспортной. Разработка экономико-математической модели и решение задачи с использованием компьютерного моделирования.

    курсовая работа [607,2 K], добавлен 13.03.2015

    Создание математической модели бистабильной системы "нагреватель-охлаждающая жидкость". Решение задачи Коши для дифференциального уравнения второго порядка. Обзор особенностей компьютерного построения модели динамической системы развития двух популяций.

    Проверка адекватности сводится к сравнению погрешностей предсказания модели и погрешностей эксперимента. Если эти два вида погрешностей соизмеримы, то можно предполагать, что модель адекватна. Где N (n-l) = mB — число степеней свободы оценки дисперсии воспроизводимости; N — число опытов; п — число параллельных наблюдений в каждом опыте; уц — отклик при опыте; и наблюдении I; у; — среднее… Читать ещё >

    • статистическая обработка данных
    • планирование эксперимента и случайные процессы

    Проверка адекватности модели ( реферат , курсовая , диплом , контрольная )

    Проверка адекватности сводится к сравнению погрешностей предсказания модели и погрешностей эксперимента. Если эти два вида погрешностей соизмеримы, то можно предполагать, что модель адекватна.

    Погрешность предсказания характеризуется оценкой остаточной дисперсии а|:

    Проверка адекватности модели.

    где N — число экспериментальных точек; к — число коэффициентов регрессии; Nк = mR — число степеней свободы 6|.

    Погрешность эксперимента определяет дисперсия Gg, называемая дисперсией ошибок. Если она известна, то достаточно проверить гипотезу g| 2 Пирсона с числом степеней свободы т = N — к. Вычисленное значение сравнивают с критическим значением Ха, т• Если х 2 то модель адекватна.

    Однако, как правило, Gg неизвестна. Тогда необходимо оценить дисперсию воспроизводимости отклика G 2 :

    Проверка адекватности модели.

    где N (n-l) = mB — число степеней свободы оценки дисперсии воспроизводимости; N — число опытов; п — число параллельных наблюдений в каждом опыте; уц — отклик при опыте; и наблюдении I; у; — среднее.

    по наблюдениям в опыте;, у, — = — У у.

    Оценка дисперсия воспроизводимости с 2 , как и Oq, характеризует рассеяние результатов эксперимента.

    Модель адекватна, если отношение F = которое имеет распреде;

    ление Фишера, не превышает критического значения Fa> m :

    Проверка адекватности модели.

    Проверка значимости коэффициентов регрессии.

    Полученные в регрессионном анализе коэффициенты является функцией случайных результатов опыта, поэтому необходимо проверять их значимость. Если некоторый коэффициент bt значим, то можно утверждать, что фактор xt действительно влияет на отклику. Конечно, такое утверждение предполагает, что с вероятностью, равной уровню значимости а, возможна ошибка 1-го рода. Проверка значимости осуществляется посредством вычисления величины t по уравнению.

    Проверка адекватности модели.

    где a 2 (b () = -da — оценка дисперсии воспроизводимости коэффициента bjj di — диагональные элементы матрицы D (1.60); ?(— подчиняется распределению Стьюдента.

    Необходимо сравнить tt с критическим значением ta m, где т = N (n- — 1). Если tf > ta m, то коэффициент bt значим, поскольку отвергается гипотеза Н0: Ь, — = 0 [17, "https://referat.bookap.info"].

    Формула (1.66) относится к наиболее распространенному случаю, когда неизвестна дисперсия ошибок Oq и приходится вместо нее пользоваться оценкой дисперсии воспроизводимости о 2 .

    Проверка адекватности модели.

    Если же мы знаем то вместо критерия t следует пользоваться критерием

    имеющим нормальное распределение.

    Пример 1.8

    Пусть отклику линейно зависит от факторов хг и х2. Исходные данные для проведения регрессионного анализа приведены в табл. 1.7. Пусть, кроме того, известно, что o^j = 1.

    Значения переменных и отклики в 10 опытах.

    Проверка адекватности модели.

    Таким образом, имеем Вычисляем:

    Проверка адекватности модели.

    После этого находим.

    Проверка адекватности модели.

    Проверка адекватности модели.

    Таким образом, b0 = 9,39; Ьг = 0,13; Ъ2 = 0,61, и уравнение регрессии имеет вид Формула (1.63) позволяет теперь рассчитать оценку дисперсии ошибок 6|:

    Проверка адекватности модели.

    При расчете были использованы табл. 1.7 и уравнение регрессии (1.72). Теперь проверим адекватность модели (1.68), используя критерий % [1] :

    Проверка адекватности модели.

    Критическое значение Хо, о5-, 7 = 14,1.

    Поскольку х [1] то модель (1.68) является адекватной.

    Следующим шагом является проверка значимости коэффициентов регрессии. Ввиду того что значение известно, воспользуемся критерием (1.67): I Ь I.

    Uj = , [3] [4] [5] , где du — диагональные элементы матрицы D — берутся из матрицы.

    (1.69). Вычисления дают:

    Проверка адекватности модели.

    По таблицам нормального распределения находим иа для ос = 0,05: и о, 05 = !>9 [6] ;

    Мы видим, что значимым является только коэффициент b00 > иа). Повторное обращение к таблицам показывает, что коэффициент Ъ2 можно считать значимым только при, а = 0,1 (что соответствует доверительной вероятности 0,90). Коэффициент Ъг незначим при любых разумных значениях а. При малом числе экспериментальных точек незначимость коэффициентов регрессии является обычным делом. Поэтому для практических целей надо брать объем выборки не менее нескольких десятков.

    им. Н. Э. Баумана . Регрессионный подход обеспечивает возможность построения трактов обработки информации в реальном времени, обладающих свойствами робастности и непараметричности. Инвариантность к неинформативным параметрам сигналов допускает адаптацию этих систем к конкретным условиям применения. В дискретно-аналоговых регрессионных системах обнаружение и распознавание случайных процессов может проводиться при использовании нейросетевой технологии обработки интервалов между нулями входных реализаций. Те же системы, основываясь на обработке огибающих входных реализаций, могут обеспечивать распознавание случайных процессов по форме спектра. Регрессионные принципы лежат в основе построения различных, в том числе адаптивных систем обнаружения и распознавания радиосигналов, а также многоканальной пеленгации локализованных источников широкополосных и узкополосных излучений.

    Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

    Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

    При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).



    Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. За это иногда зависимую переменную называют откликом. Теория регрессионных уравнений со случайными независимыми переменными сложнее, но известно, что, при большом числе наблюдений, использование метода разработанного корректно. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейная регрессионная зависимость? Для проверки одновременного отличия всех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значений зависимой переменной относительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределение Фишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным, полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициента детерминации называется коэффициентом корреляции. Следует иметь в виду, что является смещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такой вывод.



    Теперь я рассчитаю t-критерий Стьюдента для моей модели регрессии.

    - это средние квадратические отклонения.




    Расчетные значения t-критерия Стьюдента:

    По таблице распределения Стьюдента я нахожу критическое значение t-критерия для ν= 32-2 = 30 . Вероятность α я принимаю 0,05. tтабл равно 2,042. Так как, оба значения ta0 и ta1 больше tтабл , то оба параметра а0 и а1 признаются значимыми и отклоняется гипотеза о том, что каждый из этих параметров в действительности равен 0 , и лишь в силу случайных обстоятельств оказался равным проверяемой величине.


    Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением ηэ , когда δ2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней:.

    Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения – теоретическое. Рассмотрим, что представляет собой эта значимость. Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменной. При этом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимости включения переменной используется статистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных, статистикой значимости исключения будет. Пошаговая процедура построения модели. Основным критерием отбора аргументов должно быть качественное представление о факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионной модели: на машину переложена значительная доля трудностей в решении этой задачи. Возможно построение последовательное построение модели добавлением и удалением блоков переменных. Но мы рассмотрим только работу с отдельными переменными. По умолчанию программа включает все заданные переменные.

    Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака δ, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака σ:


    ,

    где ; .


    Тогда . [2]

    Изменение значения η объясняется влиянием факторного признака. Метод включения и исключения переменных состоит в следующем. Из множества факторов, рассматриваемых исследователем как возможные аргументы регрессионного уравнения, отбирается один, который более всего связан корреляционной зависимостью. Далее проводится та же процедура при двух выбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнение не будут включены все аргументы, выделенные исследователем, удовлетворяющие критериям значимости включения. Замечание: во избежание зацикливания процесса включения исключения значимость включения устанавливается меньше значимости исключения. Переменные, порождаемые регрессионным уравнением. Сохранение переменных, порождаемых регрессией, производится подкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могут быть оценены прогнозные значения зависимой переменной, причем они могут быть вычислены и там, где значения определены, и там где они не определены.

    В основе расчёта корреляционного отношения лежит правило сложения дисперсий, то есть , где - отражает вариацию у за счёт всех остальных факторов, кроме х , то есть являются остаточной дисперсией:

    .

    Тогда формула теоретического корреляционного отношения примет вид:


    ,


    или .

    Подкоренное выражение корреляционного выражения представляет собой коэффициент детерминации (мера определенности, причинности).

    Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

    Теоретическое корреляционное выражение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.

    Как видно из вышеприведенных формул корреляционное отношение может находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.

    Теоретическое корреляционное отношение применительно к моему анализу я рассчитаю двумя способами:



    [5]

    Полученное значение теоретического корреляционного отношения свидетельствует о возможном наличии среднестатистической связи между рассматриваемыми признаками. Коэффициент детерминации равен 0,62. Отсюда я заключаю, что 62% общей вариации работающих активов изучаемых банков обусловлено вариацией фактора – капитала банков (а 38% общей вариации нельзя объяснить изменением размера капитала).

    Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи – линейный коэффициент корреляции:


    ,

    где n – число наблюдений.

    Для практических вычислений при малом числе наблюдений (n≤20÷30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:


    .

    Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1≤ r ≤ 1.

    Отрицательные значения указывают на обратную связь, положительные – на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, при r = ±1 – связь функциональная. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

    Используя данные таблицы 1 я рассчитала линейный коэффициент корреляции r. Но чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию результативного признака σy:



    Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, то есть 0 ≤ r2 ≤ 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции. Однако при небольшой взаимосвязи между переменными, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, то оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковых масштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументами в правой части уравнения могут происходить странные вещи. Надежность и значимость коэффициента регрессии. Здесь обозначен коэффициент детерминации, получаемый при построении уравнения регрессии, в котором в качестве зависимой переменной взята другая переменная. Из выражения видно, что величина коэффициента тем неустойчивее, чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость - вероятность случайно при нулевом регрессионном коэффициенте получить значение статистики, большее по абсолютной величине, чем выборочное. Значимость включения переменной в регрессию. При последовательном подборе переменных предусмотрена автоматизация, основанная на значимости включения и исключения переменных.

    Факт совпадений и несовпадений значений теоретического корреляционного отношения η и линейного коэффициента корреляции r используется для оценки формы связи. [4]

    Выше отмечалось, что посредством теоретического корреляционного отношения измеряется теснота связи любой формы, а с помощью линейного коэффициента корреляции – только прямолинейной. Следовательно, значения η и r совпадают только при наличии прямолинейной связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов η и r не превышает 0,1 , то гипотезу о прямолинейной форме связи можно считать подтвержденной. В моем случае наблюдается примерное совпадение линейного коэффициента детерминации и теоретического корреляционного отношения, что дает мне основание считать связь между капиталом банков и их работающими активами прямолинейной.

    При линейной однофакторной связи t-критерий можно рассчитать по формуле:


    ,

    где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

    Так, для коэффициента корреляции между капиталом и работающими активами получается:


    Если сравнить полученное tрасч с критическим значением из таблицы Стьюдента, где ν=30, а α=0,01 (tтабл=2,750), то полученное значение t-критерия будет больше табличного, что свидетельствует о значимости коэффициента корреляции и существенной связи между капиталом и работающими активами.

    Таким образом, построенная регрессионная модель ŷ=245,75+1,42x в целом адекватна, и выводы полученные по результатам малой выборки можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность. За это иногда зависимую переменную называют откликом. Теория регрессионных уравнений со случайными независимыми переменными сложнее, но известно, что, при большом числе наблюдений, использование метода разработанного корректно. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейная регрессионная зависимость? Для проверки одновременного отличия всех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значений зависимой переменной относительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределение Фишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным, полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициента детерминации называется коэффициентом корреляции. Следует иметь в виду, что является смещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такой вывод.

    Раздел: Математика
    Количество знаков с пробелами: 83374
    Количество таблиц: 2
    Количество изображений: 16

    При моделировании исследователя прежде всего интересует, насколько хорошо модель представляет моделируемую систему (объект моделирования). Модель, поведение которой слишком отличается от поведения моделируемой системы, практически бесполезна.

    Различают модели существующих и проектируемых систем.

    Если реальная система (или ее прототип) существует, дело обстоит достаточно просто. Поэтому для моделей существующих систем исследователь должен выполнить проверку адекватности имитационной модели объекту моделирования, т.е. проверить соответствие между поведением реальной системы и поведением модели.

    На реальную систему воздействуют переменные G*, которые можно измерять, но нельзя управлять, параметры Х*, которые исследователь может изменять в ходе натурных экспериментов. На выходе системы возможно измерение выходных характеристикY*.

    При этом существует некоторая неизвестная исследователю зависимость между ними Y*=f*(Х*, G*).

    Имитационную модель можно рассматривать как преобразователь входных переменных в выходные. В любой имитационной модели различают составляющие: компоненты, переменные, параметры, функциональные зависимости, ограничения, целевые функции. Модель системы определяется как совокупность компонент, объединенных для выполнения заданной функции Y = f(Х, G).Здесь Y, Х, G - векторы соответственно результата действия модели системы выходных переменных, параметров моделирования, входных переменных модели. Параметры модели Х исследователь выбирает произвольно, G -принимают только те значения, которые характерны для данных объекта моделирования.

    Очевидный подход в оценке адекватности состоит в сравнении выходов модели и реальной системы при одинаковых (если возможно) значениях входов. И те, и другие данные (данные, полученные на выходе имитационной модели и данные, полученные в результате эксперимента с реальной системой) — статистические. Поэтому применяют методы статистической теории оценивания и проверки гипотез.

    Используя соответствующий статистический критерий для двух выборок, мы можем проверить статистические гипотезы (Н0) о том, что выборки выходов системы и модели являются выборками из различных совокупностей или (Н1), что они "практически" принадлежат одной совокупности.

    Могут быть рекомендованы два основных подхода к оценке адекватности:

    1 способ: по средним значениям откликов модели и системы.

    Проверяется гипотеза о близости средних значений каждый n-й компоненты откликов модели Yn известным средним значениям n-й компоненты откликов реальной системы .

    Проводят N1 опытов на реальной системе и N2опытов на имитационной модели (обычно N2 > N1).

    Оценивают для реальной системы и имитационной модели математическое ожидание и дисперсию, и соответственно.

    Гипотезы о средних значениях проверяются с помощью критерия f-Стьюдента, можно использовать параметрический критерий Манны-Уитни и др.

    Например, продемонстрируем использование f-статистики. Основой проверки гипотез является En = (Yn -Y'n), оценка её дисперсии:

    Берут таблицу распределения t-статистики с числом степеней свободы:
    g = N1 + N2 - 2 (обычно с уровнем значимости a = 0,05). По таблицам находят критическое значение tкр. Если tn £ tкр, гипотеза о близости средних значений n-й компоненты откликов модели и системы принимается. И т.д. по всем n компонентам вектора откликов.

    2 способ: по дисперсиям отклонений откликов модели от среднего значения откликов систем.

    Сравнение дисперсии проводят с помощью критерия F (проверяют гипотезы о согласованности), с помощью критерия согласия ? 2 (при больших выборках, п>100), критерия Колмогорова- Смирнова (при малых выборках, известны средняя и дисперсия совокупности), Кохрена и др.

    Проверяется гипотеза о значимости различий оценок двух дисперсий: и .

    Составляется F-статистика: (задаются обычно уровнем значимости
    a = 0,05, при степенях свободы ), по таблицам Фишера для F-распределения находят Fкр. Если F > Fкр, гипотеза о значимости различий двух оценок дисперсий принимается, значит — отсутствует адекватность реальной системы и имитационной модели по n-ой компоненте вектора отклика.

    Процедура повторяется аналогичным образом по всем компонентам вектора отклика. Если хотя бы по одной компоненте адекватность отсутствует, то модель неадекватна. В последнем случае, если обнаружены незначительные отклонения в модели, может проводиться калибровка имитационной модели (вводятся поправочные, калибровочные коэффициенты в моделирующий алгоритм), с целью обеспечения адекватности.

    А если не существует реальной системы (что характерно для задач проектирования, прогнозирования)? Проверку адекватности выполнить в этом случае не удается, поскольку нет реального объекта. Для целей исследования модели иногда проводят специальные испытания (например, так поступают при военных исследованиях). Это позволяет убедиться в точности модели, полезности ее на практике, несмотря на сложность и дороговизну проводимых испытаний.

    Могут использоваться и другие подходы к проведению валидации имитационной модели [56], кроме статистических сравнений между откликами реальной системы и модели. В отдельных случаях полезна валидация внешнего представления, когда проверяется насколько модель выглядит адекватной с точки зрения специалистов, которые с ней будут работать, так называемый тест Тьюринга (установление экспертами различий между поведением модели и реальной системы). В процессе валидации требуется постоянный контакт с заказчиком модели, дискуссии с экспертами по системе. Рекомендуется также проводить эмпирическое тестирование допущений модели, в ходе которого может осуществляться графическое представление данных, проверка гипотез о распределениях, анализ чувствительности и др. Важным инструментом валидации имитационной модели является графическое представление промежуточных результатов и выходных данных, а также анимация процесса моделирования. Наиболее эффективными являются такие представления данных, как гистограммы, временные графики отдельных переменных за весь период моделирования, графики взаимозависимости, круговые и линейчатые диаграммы. Методика применения статистических технологий зависит от доступности данных по реальной системе.

    Читайте также: