Прогнозирование по регрессионной модели и его точность реферат

Обновлено: 05.07.2024

В экономических исследованиях часто изучаются связи между случайными и неслучайными величинами. Такие связи называют регрессионными, а метод их изучения - регрессионным анализом.

Математически задача формулируется следующим образом. Требуется найти аналитическое выражение зависимости экономического явления (например, производительности труда) от определяющих его факторов; т.е. ищется функция y=f(x1,x2. xn), отражающая зависимость, по которой можно найти приближенное значение зависимого показателя y. В качестве функции в регрессионном анализе принимается случайная переменная, а аргументами являются неслучайные переменные.

Примерами возможного применения регрессионного анализа в экономике являются исследование влияния на производительность труда и себестоимость таких факторов, как величина основных производственных фондов, заработная плата и др.; влияние безработицы на изменение заработной платы на рынках труда (кривые Филипса); зависимость структуры расходов от уровня доходов (кривые Энгеля); функции потребления и спроса и многие другие.

При выборе вида регрессионной зависимости руководствуются следующим: он должен согласовываться с профессионально-логическими соображениями относительно природы и характера исследуемых связей; по возможности используют простые зависимости, не требующие сложных расчетов, легко экономически интерпретируемые и практически применимые.

Практика регрессионного анализа говорит о том, что уравнение линейной регрессии часто достаточно хорошо выражает зависимость между показателями даже тогда, когда на самом деле они оказываются более сложными. Это объясняется тем, что в пределах исследуемых величин самые сложные зависимости могут носить приближенно линейный характер.

В общей форме прямолинейное уравнение регрессии имеет вид

где y - результативный признак, исследуемая переменная;

xi - обозначение фактора (независимая переменная);

m - общее число факторов;

a0 - постоянный (свободный) член уравнения;

bi - коэффициент регрессии при факторе.

Увеличение результативного признака y при изменении фактора xi на единицу равно коэффициенту регрессии bi (с положительным знаком); уменьшение - (с отрицательным знаком).

Уравнение регрессии можно изобразить графически (рис. 5.1).

Рисунок 5.1 - График простой парной линейной регрессии y=a0+bx

Очевидная экономическая интерпретация результатов линейной регрессии одна из основных причин ее применения в исследовании и прогнозировании экономических процессов. В зависимости от числа факторов, влияющих на результативный показатель, различают парную и множественную регрессии.

Кратко изложим основные положения по разработке и использованию в прогнозировании множественных линейных регрессионных моделей (парная регрессия может быть рассмотрена как частный случай множественной). Экономические явления определяются, как правило, большим числом совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной переменной Y от нескольких объясняющих переменных X12,…Хn. Эта задача решается с помощью множественного регрессионного анализа. Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, включающего отбор факторов и выбор вида уравнения регрессии. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: они должны быть количественно измеримы (качественным факторам необходимо придать количественную определенность); между факторами не должно быть высокой корреляционной, а тем более функциональной зависимости, т.е. наличия мультиколлинеарности.

- матрица объясняющих переменных;

- матрица – столбец (вектор) параметров размера m+1;

- матрица – столбец (вектор) остатков размера n.

Тогда в матричной форме модель множественной линейной регрессии запишется следующим образом:

При оценке параметров уравнения регрессии (вектора b) применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки.

1. В модели (5.2) ε – случайный вектор, Х - неслучайная (детерминированная) матрица.

2. Математическое ожидание величины остатков равно нулю. М(ε) = 0n.

3. Дисперсия остатков εi постоянна для любого i (условие гомоскедастичности), остатки εi и εj при i≠j не коррелированны: .

4. ε – нормально распределенный случайный вектор.

5. r(X)=m+1 2 , определяемый по формуле (5.4):

где yi – фактическое значение результирующего признака;

- значение результирующего признака, рассчитанное по полученной модели регрессии;

- среднее значение признака;

RSS – объясненная сумма квадратов;

TSS – общая сумма квадратов.

характеризует долю вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющих переменных. Чем ближе R 2 к единице, тем лучше построенная регрессионная модель описывает зависимость между объясняющими и зависимой переменной. В случае изучаемую связь можно трактовать как функциональную (а не статистическую), что требует дополнительных качественных и количественных сведений и изменений в процессе исследования.

Следует иметь в виду, что при включении в модель новой объясняющей переменной, коэффициент детерминации увеличивается, хотя это и не обязательно означает улучшение качества регрессионной модели. В этой связи лучше использовать скорректированный (поправленный) коэффициент детерминации R 2 , пересчитываемый по формуле:

где n – число наблюдений,

m – число параметров при переменных х.

Таким образом, скорректированный коэффициент детерминации может уменьшаться при добавлении в модель новой объясняющей переменной, не оказывающей существенного влияния на результативный признак.

Средняя относительная ошибка аппроксимации рассчитывается по формуле:

Большинство авторов рекомендуют считать модель регрессии адекватной, если средняя относительная ошибка аппроксимации не превышает 12%.

Для приведения дисперсий к сопоставимому виду, определяют дисперсии на одну степень свободы. Результаты вычислений заносят в специальную таблицу дисперсионного анализа (табл. 5.1). В данной таблице n – число наблюдений, m – число параметров при переменных х. Сравнивая полученные оценки объясненной и остаточной дисперсии на одну степень свободы, определяют значение F-критерия Фишера, используемого для оценки значимости уравнения регрессии:

С помощью F – критерия проверяется нулевая гипотеза о равенстве дисперсий H0: σR 2 =σx 2 . Если нулевая гипотеза справедлива, то объясненная и остаточная дисперсии не отличаются друг от друга.

Таблица 5.1 - Результаты дисперсионного анализа

Компоненты дисперсии Сумма квадратов Число степеней свободы Оценка дисперсии на одну степень свободы
Общая n-1
Объясненная n
Остаточная n-m-1

Для того, чтобы уравнение регрессии было значимо в целом (гипотеза Н0 была опровергнута) необходимо, чтобы объясненная дисперсия превышала остаточную в несколько раз. Критическое значение F – критерия определяется по таблице Фишера – Снедекора (приложение 1). Fтабл – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m, k2 = n–m–1 (для линейной регрессии m = 1) и уровне значимости α. Уровень значимости α вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина α принимается равной 0,05 или 0,01. Расчетное значение сравнивается с табличным: если оно превышает табличное (Fрасч>Fтабл), то гипотеза Н0 отвергается, и уравнение регрессии признается значимым. Если Fрасч 2 следующим соотношением:

где m –число параметров при переменных х;

n – число наблюдений.

Для оценки статистической значимости коэффициентов регрессии и коэффициента корреляции r (r= ) применяется t-критерий Стьюдента.

Оценка значимости коэффициентов регрессии сводится к проверке гипотезы о равенстве нулю коэффициента регрессии при соответствующем факторном признаке, т.е. гипотезы:

Проверка нулевой статистической гипотезы проводится с помощью t – критерия Стьюдента:

где bi – коэффициент регрессии при хi,

mbi – средняя квадратическая ошибка коэффициента регрессии bi.

Средняя квадратическая ошибка коэффициента регрессии может быть определена по формуле:

где - среднее квадратическое отклонение для признака у;

- среднее квадратическое отклонение для признака хi;

- коэффициент детерминации для уравнения множественной регрессии;

- коэффициент детерминации для зависимости фактора хi со всеми другими факторами уравнения множественной регрессии;

n-m-1 - число степеней свободы для остаточной суммы квадратов отклонений.

Использование формулы (5.12) для расчета средней квадратической ошибки коэффициента регрессии предполагает расчет по матрице межфакторной корреляции соответствующих коэффициентов детерминации. Поэтому иногда рекомендуется использовать для определения средней квадратической ошибки коэффициента регрессии mbiчастные критерии Фишера.

Расчетное значение критерия Стьюдента сравнивается с табличным tтабл при заданном уровне значимости (для экономических процессов и явлений) и числе степеней свободы, равном n-2. Если расчетное значение превышает табличное, то гипотезу о несущественности коэффициента регрессии bi можно отклонить.

В линейной модели множественной регрессии коэффициенты регрессии bi характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.

Значимость коэффициента корреляции r проверяется также на основе t-критерия Стьюдента (приложение 2). При этом выдвигается и проверяется гипотеза о равенстве коэффициента корреляции нулю (Н0: r = 0). При проверке этой гипотезы используется t-статистика:

При выполнении Н0 t-статистика имеет распределение Стьюдента с входными параметрами: α=0,05; k=n-2. Если расчетное значение больше табличного, то гипотеза Н0 отвергается.

На практике часто бывает необходимо сравнить влияние на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют стандартизованные коэффициенты регрессии βi и коэффициенты эластичности Эi (i=1,2,…,m).

Уравнение регрессии в стандартизованной форме обычно представляют в виде (5.14):

где - стандартизованные переменные.

Стандартизованные коэффициенты могут принимать значения от -1 до +1 и показывают, на сколько стандартных отклонений (сигм) изменится в среднем результат, если соответствующий фактор хi изменится на одно стандартное отклонение (одну сигму) при неизменном среднем уровне других факторов. Данные коэффициенты сохраняют свою величину при изменении масштаба шкалы. Сравнивая стандартизованные коэффициенты друг с другом, можно ранжировать факторы по силе их воздействия на результат.

В экономических исследованиях широкое применение находит такой показатель, как коэффициент эластичности, вычисляемый по формуле (5.16):

где - производная, характеризующая соотношение приростов результата и фактора для соответствующей формы связи.

Средние коэффициенты эластичности для линейной регрессии вычисляются по формуле (5.17):

Коэффициент эластичности показывает, на сколько процентов (от средней) изменится в среднем Y при увеличении только фактора Xi на 1%.

При эконометрическом моделировании реальных экономических процессов предпосылки МНК нередко оказываются нарушенными: дисперсии остатков модели не одинаковы (гетероскедастичность остатков), или наблюдается корреляция между остатками в разные моменты времени (автокоррелированные остатки).

Проверить модель на гетероскедастичность можно с помощью следующих тестов: ранговой корреляции Спирмена; Голдфельда-Квандта; Уайта; Глейзера. В случае выявления гетероскедастичности остатков для оценки параметров регрессии используется обобщенный метод наименьших квадратов (ОМНК). Технология ОМНК подробно описана во многих учебниках по эконометрике.

Влияние результатов предыдущих наблюдений на результаты последующих приводит к тому, что случайные величины (ошибки) εi в регрессионной модели становятся зависимыми. Такие модели называются моделями с наличием автокорреляции. Как правило, если автокорреляция присутствует, то наибольшее влияние на последующее наблюдение оказывает результат предыдущего наблюдения. Наличие автокорреляции между соседними уровнями ряда можно определить с помощью теста Дарбина-Уотсона. Расчетное значение критерия Дарбина-Уотсона определяется по следующей формуле:

Т.е. величина есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии.

Значения критерия находятся в интервале от 0 до 4. По таблицам критических точек распределения Дарбина-Уотсона для заданного уровня значимости , числа наблюдений (n) и количества объясняющих переменных (m) находят пороговые значения dн (нижняя граница) и dв (верхняя граница) (приложение 3).

Если расчетное значение (табл. 5.2):

, то гипотеза об отсутствии автокорреляции не отвергается (принимается);

или , то вопрос об отвержении или принятии гипотезы остается открытым (расчетное значение попадает в зону неопределенности);

, то принимается альтернативная гипотеза о наличии положительной автокорреляции;

, то принимается альтернативная гипотеза о наличии отрицательной автокорреляции.

Таблица 5.2 - Промежутки внутри интервала [0 - 4]

принимается альтернативная гипотеза о наличии положительнойавтокорреляции вопрос об отвержении или принятии гипотезы остается открытым (расчетное значение попадает в зону неопределенности) гипотеза об отсутствии автокорреляции не отвергается (принимается) вопрос об отвержении или принятии гипотезы остается открытым (расчетное значение попадает в зону неопределенности) принимается альтернативная гипотеза о наличии отрицательной автокорреляции

Недостаток теста Дарбина-Уотсона заключается прежде всего в том, что он содержит зоны неопределенности. Во-вторых, он позволяет выявить наличие автокорреляции только между соседними уровнями, тогда как автокорреляция может существовать и между более отдаленными наблюдениями. Поэтому наряду с тестом Дарбина-Уотсона для проверки наличия автокорреляции используются тест серий (Бреуша-Годфри), Q-тест Льюинга-Бокса и другие. Наиболее распространенным приемом устранения автокорреляции во временных рядах является построение авторегрессионных моделей.

В данном реферате в систематизированном виде изложены статистические методы анализа, классифицированные по учету прогнозного фона , а именно условные, безусловные прогнозы и прогнозирование при наличии авторегрессионных ошибок.

Содержание

ВВЕДЕНИЕ 4
1.ЭКОНОМИЧЕСКИЙ ПРОГНОЗ. КЛАССИФИКАЦИЯ ЭКОНОМИЧЕСКИХ ПРОГНОЗОВ 5
1.1 Проблемы прогнозирования. Моделирование 11
2.БЕЗУСЛОВНОЕ ПРОГНОЗИРОВАНИЕ И УСЛОВНОЕ ПРОГНОЗИРОВАНИЕ 13
3.ПРОГНОЗИРОВАНИЕ ПРИ НАЛИЧИИ АВТОРЕГРЕССИИ ОШИБОК 17
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 24

Вложенные файлы: 1 файл

эргонометрика.docx

Регрессионные модели являются наиболее употребительными на практике среди различных моделей прогнозирования. Они позволяют расширить термин “прогнозирование”. Дело в том, что ряды наблюдений не обязательно имеют временную структуру, а задача оценки значения исследуемого показателя для некоторого набора значений объясняющих переменных, которых нет в выборке, вполне может быть реальной. Именно в этом смысле и следует понимать прогнозирование в эконометрике.

Проблема прогнозирования имеет много различных аспектов. Экстраполяция выявленных тенденций (продление на прогнозируемый период) позволяет получить точечный прогноз. Однако вероятность точного попадания в эту точку практически равна нулю. Отсюда следует необходимость вычисления оценок в виде “вилки” через интервальный прогноз, в котором истинное значение переменной находится с заданным уровнем надежности (доверия). Различают также безусловное прогнозирование (его иногда называют предсказанием) и условное прогнозирование (или просто прогноз) в зависимости от того известны ли значения объясняющих переменных в прогнозируемый период точно или приближенно. Прогнозы менее точны, чем предсказания, поскольку они подвержены воздействию дополнительного источника ошибки – предсказания значений объясняющих переменных. Эту дополнительную ошибку необходимо минимизировать, моделируя поведение объясняющих переменных.

При эконометрическом прогнозировании на основании данных временных рядов следует учитывать особенности фактора времени, которые заключаются в следующем:

  • последовательные по времени уровни временных рядов, как правило, являются взаимозависимыми, что приводит к авто-корреляции, и тем самым не будет выполняться третье условие Гаусса-Маркова;
  • поскольку объясняющие переменные зависят от времени, то они будут коррелировать и между собой. Следовательно, в модели будет присутствовать мультиколлинеарность;
  • в зависимости от момента времени наблюдения обладают разной информативностью: по мере удаления от текущего момента времени информационная ценность наблюдений уменьшается. При прогнозировании возможно следует придать больший вес последним наблюдениям;
  • с увеличением длины временного ряда точность статистических характеристик не обязательно будет повышаться, а при появлении новых закономерностей развития она может даже снижаться;
  • текущее значение исследуемого показателя может зависеть не только от текущих значений объясняющих переменных, а и от предыдущих значений объясняющих и даже объясняемой переменных. Как следствие, при анализе временных рядов возникает необходимость в построении лаговых структур.

Таким образом, учет фактора времени в регрессионном анализе и прогнозировании по данным временных рядов является непременным условием, а его игнорирование может привести к неправильным оценкам и принятию ошибочных решений.(1,с.44)

2.БЕЗУСЛОВНОЕ ПРОГНОЗИРОВАНИЕ И УСЛОВНОЕ ПРОГНОЗИРОВАНИЕ

Безусловным называют прогноз, в котором будущее состояние объекта прогнозируют без учета возможных будущих состояний прогнозного фона. Полученный таким образом прогноз основан либо на сложившейся в прошлом динамике объекта, либо на выявленных в прошлом взаимосвязях. Чем выше степень неопределенности и изменчивости прогнозного фона, тем менее достоверным становится прогноз.

Таким образом, термин безусловное прогнозирование означает, что вектор независимых переменных n+i известен точно.

Предположим, что мы знаем значения параметров /3 и сг2. Тогда естественно в качестве оценки yn = у величины уп+1 взять E(yn+i) = х'п+1(3) Среднеквадратичная ошибка такого прогноза есть E(yn+i — у)2 = Е(е2+1) = сг2. Если дополнительно предположить, что en+i имеет нормальное распределение.

Предположим теперь, что параметры /3 и сг2 неизвестны, что, как правило, и бывает на практике. Обозначим /3 и s2 их МНК- оценки на основании модели (1.1): /3 = (X'X)~lХ'у, s2 = е'е/ Возьмем в качестве оценки yn\ величину

Нетрудно проверить, что поскольку Е/3 = /3, то Еу = Ey„+i, т. е. оценка у является несмещенной. Оказывается, в классе линейных (по у) несмещенных оценок она обладает наименьшей среднеквадратичной ошибкой.

Теорема. Пусть у = dy — оценка величины yn+i где с = (сі. Сп)' — некоторый вектор, и пусть оценка у несмещенная,

Еу = Ey„+i = yn+i. (1.4)

E(y-y’i)2^E(y-yn+1)2. Доказательство. Так как в силу (1.4)

Еу = dXj3 = х'n+1(3 при любом f3), то

Е(у - yn+і)2 = Е(у - у + у – y’+i)2 = Е(у - у)2

+ Е(у - yn+1)2 + 2Е((у - у)(у – y’+i)). (1.6)

Е((у — у)(у — Уn+і)) = 0- (7-7)

Е((у - у)(У ' yn+i)) = E(dyx'n+l0) - E(x'n+l0x'n+lp)

= c'Xp(3'xn+i (в силу (1.5)) = х'п+1/3=n+1.

E(^n+l3(^n+l/3 + Єn+l)) = х'n+yn'хn+х. (Мы постоянно пользуемся тем, что для векторов хну одинаковой размерности х'у = у'х.)

Таким образом, выполнено (1.7), и теорема доказана.

Нетрудно проверить, что среднеквадратичная ошибка прогноза есть

Zу~ J/n+i)2 = *2(1 + x^^X'XJ-^n+x). (1.8) Заменим а2 на ее оценку s2 и обозначим

8 = y/s2(l + x'n+1(X'X)->xn+l).

Можно показать, что в случае парной регрессии, т.е. когда система (1.1) имеет вид:

yt = P i+foxt + ?t, t=l. n,

формула (1.8) выглядит так:

где х = і Из (1.9) следует, что среднеквадратичная ошибка прогноза минимальна при xn+i =х, и чем дальше хn+і от х, тем шире соответствующий доверительный интервал.(3,с.95)

Условное прогнозирование учитывает возможные состояния прогнозного фона и поэтому разрабатывается в нескольких вариантах. Состояние объекта прогнозирования ставится в зависимость от состояния прогнозного фона. В предыдущих рассуждениях предполагалось, что независимая переменная xn+i известна точно. Однако на практике встречаются ситуации, когда в xn+i содержатся ошибки.

Так, при прогнозировании временных рядов часто приходится прогнозировать значения независимых переменных, что неизбежно приводит к отклонениям от истинных значений. Поэтому рассмотрим теперь заг дачу условного прогнозирования. Пусть выполнены соотношения (1.1) и (1.2), но вектор xn+i наблюдается с ошибкой

Пусть е = у — уп+і — ошибка прогнозирования.

Тогда Ее = Е(z'3) - x'n+1/3 = E((xn+i + и)'Р) - х'п+ф = Е(х^+13) + Е(и% - х'п+10 = 0,

так как и и z’3 независимы и Би = 0. Иными словами, оценка (1.11) является несмещенной. Можно проверить (мы оставляем это читателю в виде упражнения), что

Ее2 = a2(l+x;+1(X,X)-1xn+1+tT2tr((X, X)-1))+a2/3,/3. (1.12)

Таким образом, при наличии ошибок в независимой переменной к ошибке прогнозирования (1.8) добавляются два новых положительных слагаемых, пропорциональных дисперсии а.(4,с.56)

В случае условного прогнозирования нельзя так же просто, как при безусловном прогнозировании, построить доверительный интервал для уп+ь Это связано с тем, что при нормально распределенных ошибках (e,en+i,tt) оценка у есть скалярное произведение двух независимых нормальных векторов. Поэтому доверительный интервал нельзя найти аналитически, однако существуют численные процедуры, позволяющие строить его приближенно.

3.ПРОГНОЗИРОВАНИЕ ПРИ НАЛИЧИИ АВТОРЕГРЕССИИ ОШИБОК

Авторегрессия (аutoregression) – это статистический метод определения потенциальной потери капитала или его дохода. В данном способе для предположения последующих значений используются предыдущие значения временных рядов.

Прогнозы, сделанные по методам авторегрессии, считаются одними из наиболее точных статистических прогнозов, именно поэтому они нашли широкое распространение, включая рынок Форекс. Это объясняется тем, что моделями авторегрессии великолепно описывается большое количество самых разных экономических показателей. Прогнозирование с использованием модели авторегрессии опирается на предыдущие значения продаж. Слово авторегрессия означает зависимость последующего значения продажи от предыдущих продаж.

Метод авторегрессии работает четко, однако трейдер должен учитывать некоторые тонкости. Одна из них указывает на то, что любая модель прогнозирования обладает высокими шансами на точный прогноз лишь в случае совпадения распределения исходного ряда с распределением прогнозного ряда. На таком принципе строятся самые эффективные подходы к осуществлению идентификации модели. Однако на практике распределение исходного ряда значительно отличается от распределения ВР.(3,с.112)

где сигма - это случайная величина, Х - вектор имеющихся отсчётов первых разностей прогнозируемого ВР, а Y(i)- коэффициенты авторегрессии, на вид которых имеются ограничения. Для вычисления коэффициентов авторегрессии необходимо решить систему линейных удобрений энного порядка, состоящую из значений автокорреляционной функции для ряда первых разностей. После нахождения разности Х(i+1) не сложно составить прогноз для исходного ВР, а именно: Y(i+1)=Y(i)+X(i+1).

Прогнозирование процессов авторегрессии

Рассмотримпроцесс порядка (p,d,0)

Эвентуальная прогнозирующая функция в этом случае есть решение уравнения . Она применима ко всем упреждениям и проходит через последние известных значений ряда. Например, модель ряда цен акций IBM (ряда ) очень близка к

Лучший прогноз на будущее оказывается очень близким к текущему значению цены. Весовая функция для сосредоточена в точке , и не происходит никакого осреднения по прошлому.

Стационарные модели авторегрессии. Процесс порядка , где — стационарный оператор и с , будет в общем случае иметь прогнозирующую функцию, являющуюся совокупностью экспонент и затухающих синусоид.

В частности, при = 1 модель порядка (1, 0, 0)

имеет прогнозирующую функцию, которая при любых является решением уравнения , Отсюда

Кроме того, , так что

Следовательно, прогноз с минимальной среднеквадратичной ошибкой предсказывает, что текущее отклонение от среднего должно экспоненциально спадать до нуля. На рис. 3.1, а показан временной ряд, генерируемый процессом , с его прогнозирующей функцией для момента . Поведение этой функции целиком определяется только отклонением . Аналогично минимальная среднеквадратичная ошибка прогноза для процесса авторегрессии второго порядка такова, что текущее отклонение от среднего убывает до нуля как затухающая

синусоида или сумма двух экспонент. На рис. 3.1 показан временной ряд, генерируемый процессом , и его прогноз для момента . Поведение прогнозирующей функции для момента целиком определяется последними двумя отклонениями и .

Рис. 3.1-. Прогнозирующие функции процессов авторегрессии первого и второго порядка:

а — выборка из процесса авторегрессии первого порядка и прогнозирующая функция для момента = 14. б — выборка из процесса авгорегрессии второго порядка и прогнозирующая функция на момент =14. 1 — ход прогноза, определяемый только по текущему отклонению, 2 — ход прогноза, определяемый по текущему и предпоследнему отклонениям.

Функция дисперсии для прогноза процесса (1,0,0). Чтобы полнее проиллюстрировать использование , выведем функцию дисперсии для процесса авторегрессии первого порядка. Так как модель в момент может быть представлена в виде

то из (5.4.15) следует, что

Мы видим, что для этого стационарного процесса при стремлении к бесконечности дисперсия растет до постоянного значения , равного среднеквадратичному отклонению процесса относительно окончательного прогноза . Это поведение существенно иное, чем у нестационарных моделей, у которых функция дисперсии прогноза при больших упреждениях неограниченно растет.(9, с.500)

Для исследования стохастических связей широко используется метод сопоставления двух параллельных рядов, метод аналитических группировок, корреляционный анализ, регрессионный анализ и некоторые непараметрические методы. В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения применяют методы корреляционного и регрессионного анализа.

1.1. Уравнение регрессии: сущность и типы функций

Регрессия (лат. regressio- обратное движение, переход от более сложных форм развития к менее сложным) - одно из основных понятий в теории вероятности и математической статистике, выражающее зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин. Это понятие введено Фрэнсисом Гальтоном в 1886. [9]

Теоретическая линия регрессии - это та линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи. [2, с.256]

y=f(x) - уравнение регрессии - это формула статистической связи между переменными.

Прямая линия на плоскости (в пространстве двух измерений) задается уравнением y=a+b*х. Более подробно: переменная y может быть выражена через константу (a) и угловой коэффициент (b), умноженный на переменную x. Константу иногда называют также свободным членом, а угловой коэффициент - регрессионным или B-коэффициентом. [8]

Важным этапом регрессионного анализа является определение типа функции, с помощью которой характеризуется зависимость между признаками. Главным основанием должен служить содержательный анализ природы изучаемой зависимости, ее механизма. Вместе с тем теоретически обосновать форму связи каждого из факторов с результативным показателем можно далеко не всегда, поскольку исследуемые социально-экономические явления очень сложны и факторы, формирующие их уровень, тесно переплетаются и взаимодействуют друг с другом. Поэтому на основе теоретического анализа нередко могут быть сделаны самые общие выводы относительно направления связи, возможности его изменения в исследуемой совокупности, правомерности использования линейной зависимости, возможного наличия экстремальных значений и т.п. Необходимым дополнением такого рода предположений должен быть анализ конкретных фактических данных.

Приблизительно представление о линии связи можно получить на основе эмпирической линии регрессии. Эмпирическая линия регрессии обычно является ломанной линией, имеет более или менее значительный излом. Объясняется это тем, что влияние прочих неучтенных факторов, оказывающих воздействие на вариацию результативного признака, в средних погашается неполностью, в силу недостаточно большого количества наблюдений, поэтому эмпирической линией связи для выбора и обоснования типа теоретической кривой можно воспользоваться при условии, что число наблюдений будет достаточно велико. [2, с.257]

Одним из элементов конкретных исследований является сопоставление различных уравнений зависимости, основанное на использовании критериев качества аппроксимации эмпирических данных конкурирующими вариантами моделей Наиболее часто для характеристики связей экономических показателей используют следующие типы функций:

7. Логистическая: [2, c.258]

Модель с одной объясняющей и одной объясняемой переменными – модель парной регрессии. Если объясняющих (факторных) переменных используется две или более, то говорят об использовании модели множественной регрессии. При этом, в качестве вариантов могут быть выбраны линейная, экспоненциальная, гиперболическая, показательная и другие виды функций, связывающие эти переменные.

Для нахождения параметров а и b уравнения регрессии используют метод наименьших квадратов. При применении метода наименьших квадратов для нахождения такой функции, которая наилучшим образом соответствует эмпирическим данным, считается, что сумка квадратов отклонений эмпирических точек от теоретической линии регрессии должна быть величиной минимальной.

Критерий метода наименьших квадратов можно записать таким образом:

Следовательно, применение метода наименьших квадратов для определения параметров a и b прямой, наиболее соответствующей эмпирическим данным, сводится к задаче на экстремум. [2, c.258]

Относительно оценок можно сделать следующие выводы:

1. Оценки метода наименьших квадратов являются функциями выборки, что позволяет их легко рассчитывать.

2. Оценки метода наименьших квадратов являются точечными оценками теоретических коэффициентов регрессии.

3. Эмпирическая прямая регрессии обязательно проходит через точку x, y.

4. Эмпирическое уравнение регрессии построено таким образом, что сумма отклонений .

Графическое изображение эмпирической и теоретической линии связи представлено на рисунке 1.


неизвестных параметров хорошо развита именно в случае линейного регрессионного анализа. Если же линейности нет и нельзя перейти к линейной задаче, то, как правило, хороших свойств от оценок ожидать не приходится. Продемонстрируем подходы в случае зависимостей различного вида. Если зависимость имеет вид многочлена (полинома). Если расчёт корреляции характеризует силу связи между двумя переменными, то регрессионный анализ служит для определения вида этой связи и дает возможность для прогнозирования значения одной (зависимой) переменной отталкиваясь от значения другой (независимой) переменной. Для проведения линейного регрессионного анализа зависимая переменная должна иметь интервальную (или порядковую) шкалу. В то же время, бинарная логистическая регрессия выявляет зависимость дихотомической переменной от некой другой переменной, относящейся к любой шкале. Те же условия применения справедливы и для пробит-анализа. Если зависимая переменная является категориальной, но имеет более двух категорий, то здесь подходящим методом будет мультиномиальная логистическая регрессия можно анализировать и нелинейные связи между переменными, которые относятся к интервальной шкале. Для этого предназначен метод нелинейной регрессии. [10]

Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических процессов:

1. модели временных рядов,

2. регрессионные модели с одним уравнением,

3. системы одновременных уравнений.

Модель с одной объясняющей и одной объясняемой переменными – модель парной регрессии. Если объясняющих (факторных) переменных используется две или более, то говорят об использовании модели множественной регрессии. При этом, в качестве вариантов могут быть выбраны линейная, экспоненциальная, гиперболическая, показательная и другие виды функций, связывающие эти переменные.

Линейная регрессия представляет собой линейную функцию между условным математическим ожиданием зависимой переменной Y и одной объясняющей переменной X:

где - значения независимой переменной в i-ом наблюбдении, i=1,2,…,n. Принципиальной является линейность уравнения по параметрам , . Так как каждое индивидуальное значение отклоняется от соответствующего условного математического ожидания, тогда вданную формулу необходимо ввести случайное слагаемое , тогда получим:

Данное соотношение называется теоретической линейной регрессионной моделью, а и - теоретическими параметрами (теоретическими коэффициентами) регрессии, - случайным отклонением. Следовательно, индивидуальные значения представляются в виде суммы двух компонент – систематической и случайной [12]

Для определения значений теоретических коэффициентов регрессии необходимо знать и использовать все значения переменных Xи Y генеральной совокупности, что невозможно. задачи регрессионного линейного анализа состоят в том, чтобы по имеющимся статистическим данным (), i=1,…,nдля переменных Xи Y:

1. получить наилучшие оценки неизвестных параметров и ;

2. проверить статистические гипотезы о параметрах модели;

3. проверить, достаточно ли хорошо модель согласуется со статистическими данными.

где r - коэффициент линейной корреляции Пирсона для переменных x и y; sx и sy - стандартные отклонения для переменных x и y; x,y - средние арифметические для переменных x и y.

Прогнозирование в регрессионных моделях ( реферат , курсовая , диплом , контрольная )

Прогнозирование в регрессионных моделях

Введение

Глава 1. Сущность прогнозирования

1.1 Понятие прогнозирования и его особенности

1.2 Точечное и интервальное прогнозирование

1.3 Условное и безусловное прогнозирование

1.4 Прогнозирование при наличии авторегрессии ошибок Глава 2. Пример построения прогноза по эконометрической модели

2.1 Точечное и интервальное прогнозирование, основанное на модели линейной регрессии Заключение Библиографический список

Процесс прогнозирования достаточно актуален в настоящее время. Широка сфера его применения. Прогнозирование широко используется в экономике. Прогнозирование позволяют управлять массовыми экономическими явлениями и процессами и предвидеть их развитие.

В современном быстро меняющемся мире, когда рыночная конкуренция становится все более жесткой, основной проблемой для предприятий является проблема выживания и обеспечения развития. В наши дни ни одно предприятие не может обойтись без прогнозирования и планирования своей дальнейшей деятельности. В условиях ожесточенной конкурентной борьбы, особенно на мировом рынке, уже недостаточно только поддержания высокого качества реализуемой продукции. Необходимы тщательный учет специфики требований потребителей в различных странах, анализ деятельности основных фирм-конкурентов, широкая рекламная компания, выбор оптимальных форм и методов сбыта, т. е. деятельность предприятия необходимо планировать и прогнозировать.

Современные условия рыночного хозяйствования предъявляют к методам прогнозирования очень высокие требования, в виду все возрастающей важности правильного прогноза для судьбы предприятия, да и экономики страны в целом.

Прогнозирование следует рассматривать как важнейшую функцию управления любой экономической системой, в том числе экономикой рыночного типа, поскольку формирование рыночных отношений связано с предпринимательской деятельностью, стратегического менеджмента и систем прогнозирования.

Прогнозирование является важным связующим звеном между теорией и практикой во всех областях жизни общества.

Общественные явления находятся не только во взаимной связи, но и в непрерывном движении, изменении, развитии — именно это обусловливает необходимость прогнозирования.

Предметом прогнозирования в сфере является система, воспроизводящая объект исследования так, что на ее основе могут быть изучены структура и размещение социально-экономических явлений, их изменения во времени, связи зависимости.

Объектом прогнозирования является модель, интересующая исследователя.

Целью курсовой является выявление перспектив ближайшего будущего в области потребления домохозяйством в зависимости от располагаемого дохода и установление основных тенденций развития.

Для достижения поставленной цели представляется необходимым в рамках данной работы решение следующих задач:

2. Рассмотреть точечное и интервальное, условное и безусловное прогнозирование.

3. Проанализировать прогнозирование при наличии авторегрессии ошибок.

4. Провести точечное и интервальное прогнозирование, основанное на модели линейной регрессии.

Глава 1. Сущность прогнозирования

1.1 Понятие прогнозирования и его особенности

Прогнозирование — это вид познавательной деятельности человека, направленной на формирование прогнозов развития объектов, на основе анализа тенденций и закономерностей его развития.

Прогнозирование — это научное, основанное на системе установленных причинно-следственных связей и закономерностей, выявление состояния и вероятностных путей развития явлений и процессов.

Оно предопределяет оценку показателей и дает характеристику явлений и процессов в будущем. Прогнозирование распространяется на такие процессы управления, которые в момент выработки прогнозов можно определить в весьма малом диапазоне, либо совсем невозможно, либо возможно, но требует учета действия таких факторов, влияние которых не может быть полностью или однозначно определено. 5]

Прогнозирование определяет реальность и благоприятность для хозяйственной структуры поставленных перед ней целей. Разумеется, что некоторые приемы и средства прогнозирования применяются и в процессе определения целей, особенно долгосрочных, но при выборе целей и определении степени их достижения главную роль играют субъективные факторы, в то время когда прогноз опирается на объективные процессы и явления.

Прогноз носит вероятностный характер, но обладает определенной достоверностью. Прогноз на практике — это предплановый документ, фиксирующий вероятную степень достижения поставленной цели в зависимости от масштаба и способа будущих действий Задачи прогнозирования связаны с тем, что прогноз, помимо анализа возможностей, является основой для разработки стратегии, планирования и управления предприятием.

Прогноз должен определять:

— основные технические и организационно-экономические проблемы и сроки их решения;

— материалы, технологические процессы и оборудование, предназначенные для изготовления новой перспективной и традиционной продукции;

— ожидаемые объемы производства продукции у конкурентов и потребность в ней на рынках;

— ожидаемую себестоимость разработки и производства этой продукции;

— мощность предприятия, необходимую для разработки и изготовления новой продукции;

— потребность в трудовых ресурсах с учетом изменения их структуры, квалификации и ожидаемого роста производительности труда. Прогноз должен включать:

— краткий анализ развития прогнозируемого направления производства и характеристику его современного состояния;

— выявление перспективных технических и экономических проблем, уже решенных, но не получивших практического применения;

— оценку важности проводящихся исследований, требующих внимания и затрат для решения будущих проблем. 4]

Прогнозы можно подразделять в зависимости от целей, задач, объектов, времени упреждения, методов организации прогнозирования, источников информации и т. д. Большое количество таких признаков и отсутствие их строго определенных характеристик затрудняют создание единой классификации. [1]

Выбор методов прогнозирования осуществляется в соответствии с характером объекта, требований, предъявляемых к информационному обеспечению, а также на основе сравнения эффективности и оптимальности решения аналогичных задач. Отличительной чертой социально-экономических явлений и процессов является инерционность, проявляющаяся, с одной стороны в сохранении взаимосвязей прогнозируемого явления с другими явлениями, а с другой — в сохранении тенденции во времени. 5]

Проблема прогнозирования имеет много различных аспектов. Можно различать точечное и интервальное прогнозирование. В первом случае оценка — это конкретное число, во второминтервал, в котором истинное значение переменной находится с заданным уровнем доверия. Выделяют также безусловное и условное прогнозирование в зависимости от того, известны ли интересующие нас объясняющие переменные точно или приближенно. Кроме того, для временных рядов при нахождении прогноза существенно наличие или отсутствие корреляции по времени между ошибками.

1.2Точечное и интервальное прогнозирование

В прогнозных расчетах по уравнению регрессии определяется предсказываемое (уp) значение как точечный прогноз при хpk, т. е. путем подстановки в уравнение регрессии соответствующего значения х. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки, т. е. и соответственно интервальной оценкой прогнозного значения (у*)

Из теории выборки известно, что. Используя в качестве оценки у 2 остаточную дисперсию на одну степень свободы S 2 , получим формулу расчета ошибки среднего значения переменной у:

Ошибка коэффициента регрессии, как уже было показано, определяется формулой

Считая, что прогнозное значение фактора хpk, получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, т. е.

Соответственно имеет выражение:

Фактические значения у варьируют около среднего значения Индивидуальные значения у могут отклоняться от на величину случайной ошибки е, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S 2 . Поэтому ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку, но и случайную ошибку S.

Рис. 1 Доверительный интервал линии регрессии: а — верхняя доверительная граница; б — линия регрессии; в — доверительный интервал для при хк; г — нижняя доверительная граница Средняя ошибка прогнозируемого индивидуального значения у составит:

При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза значения фактора х. Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации, а также из анализа динамики данного фактора. Рассмотренная формула средней ошибки индивидуального значения признака у () может быть использована также для оценки существенности различия предсказываемого значения исходя из регрессионной модели. 6]

1.3 Условное и безусловное прогнозирование

Термин безусловное прогнозирование означает, что вектор независимых переменных xn+i известен точно.

Пусть есть еще один набор xn+1 = (хn+1,1,…, xn+1,k)' объясняющих переменных и известно, что соответствующая зависимая переменная удовлетворяет модели у=Хв+е, т. е.

где, Eеn+1= 0, V (еn+1) = у 2 , и случайная величина еn+1 не коррелирована с е. Требуется по (у, Х, xn+1) оценить yn+1. Подчеркнем, что в данном случае надо построить оценку не параметра, а случайной величины.

Предположим, что мы знаем значения параметров в и у 2 . Тогда естественно в качестве оценки y n+1= y величины yn+1 взять Е (yn+1) = x'n+1в. Среднеквадратичная ошибка такого прогноза есть E (yn+1y) 2 = Е (е 2 n+1) = у 2 .

Пусть параметры в и у 2 неизвестны, что, как правило, и бывает на практике. Обозначим и s 2 их МНК-оценки на основании модели у=Хв+е: = (Х'Х) -1 Х’у, s 2 = е’е/(n — к). Возьмем в качестве оценки уn+1 величину

Нетрудно проверить, что поскольку Е = в, то Е y = Еуn+1, т. е. оценка y является несмещенной. Оказывается, в классе линейных (по у) несмещенных оценок она обладает наименьшей среднеквадратичной ошибкой. 3]

Нетрудно проверить, что среднеквадратичная ошибка прогноза есть Е (yn+1) 2 = у 2 (1+ x'n+1 (Х'X) - l xn+1). (2.2)

Можно показать, что в случае парной регрессии, т. е. когда система у=Хв+е имеет вид

формула (2.2) выглядит так:

где x=1/n ?xt. Из (2.3) следует, что среднеквадратичная ошибка прогноза минимальна при xn+1=, и чем дальше xn+1 от, тем шире соответствующий доверительный интервал (см. рис. 2).

Рис. 2 доверительный интервал

В предыдущих рассуждениях мы предполагали, что независимая переменная xn+1 известна точно. Однако на практике встречаются ситуации, когда в xn+1 содержатся ошибки. Так, при прогнозировании временных рядов часто приходится прогнозировать значения независимых переменных, что неизбежно приводит к отклонениям от истинных значений. Поэтому рассмотрим задачу условного прогнозирования. Пусть выполнены соотношения у=Хв+е и (2.0), но вектор xn+1 наблюдается с ошибкой

Прогноз (2.1) заменяется теперь на

так как и u и в независимы и Еu = 0. Иными словами, оценка (2.5) является несмещенной. Из этого следует, что Ее 2 = у 2 [l + x'n+1 (X'X) - l xn+1+ у 2 u tr ((X'X) - l )]+ у 2 uв' в. (2.6)

Таким образом, при наличии ошибок в независимой переменной к ошибке прогнозирования (2.2) добавляются два новых положительных слагаемых, пропорциональных дисперсии у 2 u.

В случае условного прогнозирования нельзя так же просто, как при безусловном прогнозировании, построить доверительный интервал для yn+1. Это связано с тем, что при нормально распределенных ошибках (е,еn+1, u) оценка у есть скалярное произведение двух независимых нормальных векторов. Поэтому доверительный интервал нельзя найти аналитически, однако существуют численные процедуры, позволяющие строить его приближенно. 3]

1.4 Прогнозирование при наличии авторегрессии ошибок

Остановимся на задаче прогнозирования, когда ошибки в исходной модели у=Хв+е, (2.0) коррелированы по времени, а именно, образуют авторегрессионный процесс первого порядка:

где t, t = 1,…, n, n + 1> — последовательность независимых нормально распределенных случайных величин с нулевым средним и постоянной дисперсией у 2 , |р| 2 = у 2 v=(1-p 2 ) у 2 е (2.9)

Таким образом, удается уменьшить ошибку прогноза по сравнению со случаем некоррелированных ошибок. 3]

Реально параметры регрессии неизвестны, поэтому при прогнозировании величины yn+1 в формуле (2.8) значения в и р заменяют их оценками:

Мы не можем дать аналитическое выражение для среднеквадратичной ошибки прогноза. На практике используют формулу (2.9) с заменой величины у 2 v на ее оценку, получаемую из регрессии, при t=1.

Глава2. Пример построения прогноза по эконометрической модели

2.1 Точечное и интервальное прогнозирование, основанное на модели линейной регрессии

Проведем регрессионный анализ зависимости объема потребления (руб.) домохозяйства от располагаемого дохода (руб), отобрана выборка n=12 (помесячно в течение года).

Читайте также: