Elettracompany.com

Компьютерный справочник
67 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Модель arima пример в excel

Модель arima пример в excel

Перед тем, как применять модель необходимо позаботиться о стационарности динамического ряда.

Ряд приводят к стационарности взятием последовательных разностей (вместо исходных 3,5,5,4,8 получится 2,0,-1,4) или преобразованием Бокса-Кокса. Стабилизировать дисперсию помогает логарифмирование.

Критерий Льюнга-Бокса — критерий для выявления автокоррелированности временных рядов.
Критерий KPSS (KPSS test) — критерий для проверки на стационарность (Hо = ряд стационарен).
Критерий Дики-Фулера — критерий для проверки на стационарность (Но = ряд нестационарен).

Лучшая модель подбирается с помощью AIC. Модель с самым низким значением информационного критерия Акаике (не несет абсолютную оценку, используется только для сравнения моделей между собой) нужно проверить на адекватность путем анализа остатков (разницы между фактическими и прогнозными значениями).

Нужно убедиться, что остатки:

  • имеют низкое абсолютное значение, в них отсутствует тренд и циклы;
  • распределены нормально со средним

0;

  • отсутствует автокорреляция (смотрим коррелограмму и тесты «Box-Pierce» «Ljung-Box»).
  • Если хотя бы что-то не так — значит модель описала не всю структуру и качество можно улучшать. Возвращаемся назад для подбора лучших параметров или преобразования исходных данных.

    1. Построить график. Удалить выбросы, заменить пропущенные значения, декомпозировать ряд.

    2. Обратить внимание на дисперсию, сезонность и тренд. В случае необходимости применить логарифмирование для стабилизации дисперсии или преобразование Бокса-Кокса / последовательные разности для приведения к стационарности.

    3. Убедиться в стационарности ряда при помощи критерия Дики-Фуллера или теста KPSS.

    4. Отобразить ACF и PACF функции, сделать предположение о модели и порядке параметров.

    5. Использовать информационный критерий AIC выбора лучшей модели.
    Или просто воспользоваться автотюнингом: язык программирования R > library(forecast) > auto.arima()

    6. Построить ACF график остатков лучшей модели, убедиться в отсутствии корреляции остатков (тест Бокса-Кокса).

    7. Если остатки выглядят как белый шум и это подтверждено тестом, то можно приступать к прогнозированию.

    8. Оценить точность кросс-валидацией или прогнозом по укороченному ряду.

    Некоторые динамические ряды не имеют устойчивой структуры и сильно зависят от влияния внешних факторов (например: погода, рекламный бюджет). В таких случаях целесообразно применить математическое моделирование. Подойдет простая регрессия, нейронные сеточки, случайные леса, ближайшие соседи, SVM или ансамбль из всех перечисленных (зависит от типа, распределения и объема исходных данных).

    Алгоритмы будут сопоставлять весь массив входных данных (предикторов) и соответствующих значений целевой переменной (т.е. уровня продаж). Такой процесс называется «обучением». Методы машинного обучения как бы обобщают полученный опыт для ответов на новые вопросы. Гиперпараметры подгоняются так, чтобы ошибка прогнозов была минимальной.

    Выбор алгоритмов их их параметров оказывают большое влияние на точность прогнозов, но определяющую роль играет набор признаков, т.е. состав переменных на которых будет будет обучаться алгоритм. При выборе признаков руководствуются физическими ограничениями, так как не все получается оцифровать и измерить (или сделать это за приемлемую цену).

    Специалист из предметной области определяет набор данных, которые необходимо получить и использовать для моделирования. Если таких данных много в уже оцифрованном виде, то применяются математические методы селекции: корреляция (correlation), хи-квадрат (chi-square), мера энтропии (Informaition gain), индекс Джини (GINI index), расчет уменьшения предсказательной способности при исключении переменной, рекурсивное разбиение (Recursive partitioning), сети векторного квантования (Learning Vector Quantization) и др.

    Перечислим полезные лайфхаки:

    • Цикличность можно закодировать категориальным фактором (день недели или месяца) или числовой переменной, которая отражает средний уровень целевой переменной за этот период.
    • Погоду, курсы валют и ставки ЦБ можно получать напрямую через API или скрапингом. Благодаря этому ваша модель будет работать без ручного обогащения новыми данными.
    • Результаты прогноза по ARIMA-моделям могут быть поданы на вход другим алгоритмам для дальнейшего сокращения остатков.

    Планирование денежных потоков по модели AR. Пример расчета в Excel

    Рассмотрим планирование продаж и денежных потоков помощью авторегрессионной модели. Оценка будущих денежных поступлений важна как для собственника компании, так и инвесторам для определения ее эффективности в перспективе.

    Планирование продаж и денежных потоков предприятия

    Прогнозирование продаж и денежных потоков является важной задачей компании. Оценка будущих поступлений от реализации продукции позволяет планировать денежные потоки, которые могут быть направлены на повышение эффективности, производительности и стоимости предприятия для инвесторов.

    Цель оценки объема продаж – оценка результативности и эффективности предприятия, точки безубыточности и финансового запаса прочности в перспективе.

    Цель оценки денежных потоков – оценка потенциала компании для развития инноваций и реализации инвестиционных проектов.

    Продажи компании и денежные потоки тесно взаимосвязаны между собой следующей формулой:

    Методы планирования продаж и денежных потоков

    Существует множество различных методов прогнозирования объема продаж (денежных потоков): модель скользящего среднего (MA, Moving Average), модель авторегрессии (AR, AutoRegressive), модель авторегрессии скользящего среднего (Autoregressive Moving Average model, ARMA), модель Бокса-Дженкинса и др. В данной статье мы более подробно разберем прогнозирование с помощью модели авторегрессии.

    Авторегрессионные модели (англ. AR, AutoRegressive model) используются для описания устойчивых (стационарных) процессов в экономике, когда на будущие значения прогнозируемой величины влияют предыдущие значения. Авторегрессионные модели (AR) используются в прогнозировании как макроэкономических показателей (ВВП, инфляция и др.), так и для оценки микроэкономических показателей: объем будущих продаж, чистой прибыли, размера денежных потоков т.д.

    Модель прогнозирования продаж и денежных потоков

    Авторегрессионная модель планирования объема продаж и денежных потоков имеет следующий аналитический вид:

    где:

    Yi – прогноз денежного потока или объема продаж;

    Yi-1 – значение денежного потока и продаж в предыдущем периоде;

    α, β – коэффициенты в модели авторегрессии;

    ξ – случайная величина (белый шум).

    Пример планирования продаж и денежных потоков предприятия ОАО «МТС» в Excel

    Разберем практический пример планирования продаж (выручки) и объема денежных потоков предприятия ОАО «МТС». Данное предприятие было выбрано для анализа, потому что имеет устойчивую сеть дистрибьюторов и постоянный спрос на продукцию, что позволяет адекватно сделать оценку. На рисунке ниже представлена выручка и денежный поток компании за 10 лет. Данные были взяты из официальной отчетности предприятия. Денежные потоки представляли собой сумму чистой прибыли предприятия и амортизации (Форма №5 стр. 640 + Форма №2 стр. 190).

    Объем продаж и денежный поток для ОАО “МТС”

    Графически изменение объема продажи и денежного потока имеет следующий вид:

    Как мы видим из рисунка, денежный поток компании резко изменился в 2009 году из-за большого размера начисленной амортизации, что сильно искажает динамику изменения денежного потока. Сделаем прогноз на два года вперед объема продаж и денежного потока предприятия по модели AR.

    Первоначально для построения модели необходимо определить тесноту связи между ближайшими значениями продаж (денежного потока). Для этого необходимо произвести оценку регрессии со сдвигом ряда объема продаж. Был взят лаг в один год, потому что максимальное влияние на будущие значения оказывают именно предыдущие продажи.

    Расчет авторегрессии для объема продаж и денежного потока в Excel

    На следующем этапе необходимо рассчитать значения коэффициентов регрессии между рядами и рядами с лагами в один год. Воспользуемся надстройкой: Главное меню Excel → «Данные» → «Анализ данных» → «Регрессия». Рассчитаем параметры отдельно для прогнозирования выручки и денежного потока. Пример оценки объема продаж представлен на рисунке ниже.

    Мы получили базовые значения в модели регрессии для выручки (объема продаж). Так коэффициент альфа (α) в модели регрессии равен 16851967162, а коэффициент бета (β) 1,04. Полученная статистика по регрессионной модели имеет следующие важные показатели оценки ее адекватности и точности прогнозирования. Первое на что следует обратить внимание это показатель R-квадрат (коэффициент детерминации), который показывает качество модели в шкале от 0 до 1. В нашем примере качество модели высокое и составляет 0,97. Показатель модели критерий-F близок к 0, что показывает устойчивость модели. Статистический показатель P-значение отражает адекватность значений данных коэффициент (альфа, бета) для полученной модели он меньше 15% для обоих коэффициентов, что удовлетворяет нормативам.

    Показатели оценки качества регрессионной модели в Excel

    Аналогично строится модель планирования денежных потоков предприятия. В результате полученные модели прогнозирования объема продаж и денежных потоков описываются с помощью следующих уравнений:

    Сделаем прогноз на основе полученных моделей значений объема продажи и денежного потока на два года вперед. С помощью формул в Excel сделаем прогноз по модели.

    Прогноз продаж по модели AR =$B$19+B6*$B$20

    Планирование продаж и денежных потоков предприятия по модели авторегрессии в Excel

    Визуально планирование продаж будет иметь следующий вид. Наблюдается повышающийся тренд на два года вперед.

    График прогноза объема продаж (выручки) предприятия

    Графически прогноз денежного потока на два года вперед сильно не изменится.

    Прогнозирование денежного потока предприятия по модели авторегрессии (AR)

    Использование методов прогнозирования денежных потоков позволяет оценить показатели эффективности инвестиционных проектов, более подробно про методы оценки проектов читайте в моей статье: “6 методов оценки эффективности инвестиций в Excel. Пример расчета NPV, PP, DPP, IRR, ARR, PI“. Существуют также другие методы планирования объемов продаж компании: XYZ-анализ, ABC-анализ, которые тоже зарекомендовали себя на практике. Так метод ABC анализа на практическом примере разобран в статье: “ABC анализ продаж. Пример расчета в Excel“.

    Мастер-класс: “Как рассчитать план продаж”

    Резюме

    Использование методов авторегресси (AR) для планирования будущих объемов продаж (денежного потока) обосновано, если предприятие имеет устойчивую сеть дистрибьюторов и покупателей на свою продукцию. Достоинством использования данного метода оценки является возможность учета влияния предыдущего объема продаж (денежного потока) на будущие значения. В ситуациях экономического кризиса и нестабильности оценка может сильно изменяться под воздействием макроэкономических факторов и глобальных трендов.

    Автор: к.э.н. Жданов Иван Юрьевич

    Модель ARIMA

    Модель ARIMA в определенной степени является расширенной версией модели ARMA. Символ I (Integrated) отвечает за порядок оператора последовательной разности. Дело в том, что далеко не все ряды являются стационарными, но некоторые из них могут быть приведены к стационарным путем взятия последовательной разности. Если, например, временной ряд у, стал стационарным после взятия последовательной разности порядка s и для описания уже стационарного ряда может быть использована модель ARMA (р, q), то процессу, называется интегрированным процессом авторегрессии и скользящей средней (ARIMA (р, s, q)).

    При этом для оценки модели можно пользоваться несколько модифицированным подходом Бокса – Дженкинса. Непосредственно перед первым этапом необходимо будет привести исследуемый ряд к стационарному путем взятия последовательных разностей. Остальные этапы подхода не изменятся, после этого стационарный ряд нужно будет идентифицировать, оценить, диагностировать и использовать.

    Примеры взятия последовательной разности

    Рассмотрим примеры простейших нестационарных временных рядов, которые могут быть приведены к стационарным путем взятия последовательной разности.

    1. Уравнение с трендом

    Временной ряд с трендом имеет вид

    где a + βt – временной тренд; ut – белый шум.

    Таким образом, временной тренд состоит из детерминированной составляющей линейного тренда и случайной составляющей белого шума (рис. 8.7). Найдем математическое ожидание временного тренда:

    Рис. 8.7. Тренд (модельный пример)

    Как очевидно, математическое ожидание зависит от времени, следовательно, ряд не является стационарным.

    Для того чтобы привести ряд с линейный трендом к стационарному, нужно взять первую разность:

    Возможен временной ряд с квадратичным временным трендом и временными трендами высших порядков. Для приведения их к стационарному ряду необходимо взятие последовательной разности тех же порядков. Так, например, чтобы привести к стационарному временной квадратичный тренд, нужно дважды взять последовательную разность:

    где вторая последовательная разность – стационарный ряд.

    2. Случайное блуждание

    Модель случайного блуждания уже описывалась ранее. Уравнение модели имеет вид

    где иt – белый шум.

    Случайное блуждание – классический пример нестационарного ряда. Однако, чтобы привести его к стационарному, нужно просто взять первую разность:

    Первая разность случайного блуждания равняется белому шуму, следовательно, стационарна по определению.

    3. Временной ряд с сезонностью•

    Сезонность часто встречается в статистических данных.

    В различных процессах сезонная составляющая может встречаться практически с любой частотой: месячная сезонная компонента, квартальная сезонная компонента, полугодовая сезонная компонента:

    где

    где

    Рис. 8.8. Сезонность (модельный пример)

    Для того чтобы привести с сезонность к стационарному ряду, необходимо взять сезонную последовательную разность. Так, например, для квартальной сезонной компоненты

    При этом сезонная последовательная разность Δ4у, будет стационарным временным рядом (рис. 8.8).

    Пример построения модели ARIMA

    В качестве иллюстрирующего примера используем модель ARIMA для ряда значений индекса DAX со 2 апреля 1998 г. по 23 октября 2007 г. (рис. 8.9).

    Первым шагом необходимо определить, является ли рассматриваемый ряд стационарным. Визуально анализ графика ряда не говорит о стационарности ряда. Необходимо провести дополнительный анализ.

    Вторым шагом должно быть построение диаграммы выборочных автокорреляционной и частной автокорреляционной функций.

    Рис. 8.9. Индекс DAX со 2 апреля 1998 г. по 23 октября 2007 г.

    Таблица 8.13. Диаграмма автокорреляционных функций по лагам для DAX

    Документация

    Спецификации модели ARIMA

    Модель ARIMA по умолчанию

    В этом примере показано, как использовать краткий arima(p,D,q) синтаксис, чтобы задать ARIMA по умолчанию ( p , D , q ) модель,

    Δ D y t = c + ϕ 1 Δ D y t — 1 + … + ϕ p Δ D y t — p + ε t + θ 1 ε t — 1 + … + θ q ε t — q ,

    где Δ D y t isa D t h временные ряды differenced. Можно написать эту модель в сжатой форме с помощью обозначения оператора задержки:

    ϕ ( L ) ( 1 — L ) D y t = c + θ ( L ) ε t .

    По умолчанию все параметры в созданном объекте модели имеют неизвестные значения, и инновационное распределение является Гауссовым с постоянным отклонением.

    Задайте модель ARIMA (1,1,1) по умолчанию:

    Выход показывает что созданный объект модели, model , имеет NaN значения для всех параметров модели: постоянный термин, AR и коэффициенты MA и отклонение. Можно изменить созданную модель с помощью записи через точку или ввести его (наряду с данными) к estimate .

    Свойство P имеет значение 2 ( p + D ). Это — количество преддемонстрационных наблюдений, должен был инициализировать модель AR.

    Модель ARIMA с известными значениями параметров

    В этом примере показано, как задать ARIMA ( p , D , q ) модель с известными значениями параметров. Можно использовать такую полностью заданную модель в качестве входа к simulate или forecast .

    Задайте модель ARIMA (2,1,1)

    Δ y t = 0 . 4 + 0 . 8 Δ y t — 1 — 0 . 3 Δ y t — 2 + ε t + 0 . 5 ε t — 1 ,

    где инновационное распределение является t Студента с 10 степенями свободы и постоянным отклонением 0.15.

    Аргумент пары «имя-значение» D задает степень несезонного интегрирования (D) .

    Поскольку все значения параметров заданы, созданный объект модели не имеет никакого NaN значения. Функции simulate и forecast не принимайте входные модели с NaN значения.

    Задайте модель ARIMA Используя приложение Econometric Modeler

    В приложении Econometric Modeler можно задать структуру задержки, присутствие константы, и инновационное распределение ARIMA (p, D, q) модель путем выполнения этих шагов. Все заданные коэффициенты являются неизвестными но допускающими оценку параметрами.

    В командной строке откройте приложение Econometric Modeler.

    В качестве альтернативы откройте приложение из галереи приложений (см. Econometric Modeler).

    В Data Browser выберите ряд времени отклика, к которому модель будет подходящей.

    На вкладке Econometric Modeler, в разделе Models, нажимают ARIMA. Чтобы создать модели ARIMAX, см. Спецификации Модели ARIMAX.

    Диалоговое окно ARIMA Model Parameters появляется.

    Задайте структуру задержки. Чтобы задать ARIMA (p, D, q), модель, которая включает все задержки AR от 1 до p и всех задержек MA от 1 до q, использует вкладку Lag Order. Для гибкости, чтобы задать включение особых задержек, используйте вкладку Lag Vector. Для получения дополнительной информации смотрите Полиномы Оператора Задержки Определения В интерактивном режиме. Независимо от вкладки вы используете, можно проверить форму модели путем осмотра уравнения в разделе Model Equation .

    Задавать модель ARIMA (3,1,2), которая включает константу, включает весь последовательный AR и задержки MA от 1 до их соответствующих порядков, и имеет Гауссово инновационное распределение:

    Установите Degree of Integration на 1 .

    Установите Autoregressive Order на 3 .

    Установите Moving Average Order на 2 .

    Задавать модель ARIMA (3,1,2), которая включает весь AR и задержки MA от 1 до их соответствующих порядков, имеет Распределение Гаусса, но не включает константу:

    Установите Degree of Integration на 1 .

    Установите Autoregressive Order на 3 .

    Установите Moving Average Order на 2 .

    Снимите флажок Include Constant Term.

    Задавать модель ARIMA (8,1,4), содержащую непоследовательные задержки

    ( 1 − ϕ 1 L − ϕ 4 L 4 − ϕ 8 L 8 ) ( 1 − L ) y t = ( 1 + θ 1 L 1 + θ 4 L 4 ) ε t ,

    где εt является серией Гауссовых инноваций IID:

    Кликните по вкладке Lag Vector.

    Установите Degree of Integration на 1 .

    Установите Autoregressive Lags на 1 4 8 .

    Установите Moving Average Lags на 1 4 .

    Снимите флажок Include Constant Term.

    Чтобы задать модель ARIMA (3,1,2), которая включает весь последовательный AR и задержки MA через их соответствующие порядки и постоянный термин, и имеет t — инновации распределения:

    Установите Degree of Integration на 1 .

    Установите Autoregressive Order на 3 .

    Установите Moving Average Order на 2 .

    Нажмите кнопку Innovation Distribution, затем выберите t .

    Параметр степеней свободы распределения t является неизвестным, но допускающим оценку параметром.

    После того, как вы зададите модель, нажмите Estimate, чтобы оценить все неизвестные параметры в модели.

    Смотрите также

    Приложения

    Объекты

    Функции

    Связанные примеры

    Больше о

    Открытый пример

    У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?

    Документация Econometrics Toolbox
    Поддержка

    © 1994-2019 The MathWorks, Inc.

    1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

    2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

    3. Сохраняйте структуру оригинального текста — например, не разбивайте одно предложение на два.

    4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

    5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

    ARIMA

    ARIMA models describe phenomena that evolve through time and predict future values. Run them in Excel using the XLSTAT add-on statistical software.

    XLSTAT offers a wide selection of ARIMA models such as ARMA (Autoregressive Moving Average), ARIMA (Autoregressive Integrated Moving Average) or SARIMA (Seasonal Autoregressive Integrated Moving Average).

    What are ARIMA models

    The models of the ARIMA family allow to represent in a synthetic way phenomena that vary with time, and to predict future values with a confidence interval around the predictions.

    The mathematical writing of the ARIMA models differs from one author to the other. The differences concern most of the time the sign of the coefficients. XLSTAT is using the most commonly found writing, used by most software. If we define by Xt a series with mean µ, then if the series is supposed to follow an ARIMA(p,d,q)(P,D,Q)s model, we can write:

    [ Yt = (1 – B)d (1 – Bs)D Xt — µ ; Φ(B)Ø(Bs))Yt = θ(B) Θ(Bs) Zt, Zt∞N(0,σ2) ]

    [ Φ(z) = 1 – Σpi=1 Φi zi, Ø(z)= 1 – Σpi=1 Øi zi ; θ(z) = 1 + Σqi=1 θi zi, Θ(z) = 1 + Σqi=1 Θi zi ]

    p is the order of the autoregressive part of the model. q is the order of the moving average part of the model. d is the differencing order of the model. D is the differencing order of the seasonal part of the model. s is the period of the model (for example 12 if the data are monthly data, and if one noticed a yearly periodicity in the data). P is the order of the autoregressive seasonal part of the model. Q is the order of the moving average seasonal part of the model.

    • Remark 1: the Yt process is causal if and only if for any z such that |z|≤1, f(z)≠0 and q(z)≠0.
    • Remark 2: if D=0, the model is an ARIMA(p,d,q) model. In that case, P, Q and s are considered as null.
    • Remark 3: if d=0 and D=0, the model simplifies to an ARMA(p,q) model.
    • Remark 4: if d=0, D=0 and q=0, the model simplifies to an AR(p) model.
    • Remark 5: if d=0, D=0 and p=0, the model simplifies to an MA(q) model.

    Explanatory variables

    XLSTAT allows you to take into account explanatory variables through a linear model. Three different approaches are possible:

    1. OLS: A linear regression model is fitted using the classical linear regression approach, then the residuals are modeled using an (S)ARIMA model.
    2. CO-LS: If d or D and s are not zero, the data (including the explanatory variables) are differenced, then the corresponding ARMA model is fitted at the same time as the linear model coefficients using the Cochrane and Orcutt (1949) approach.
    3. GLS: A linear regression model is fitted, then the residuals are modeled using an (S)ARIMA model, then we loop back to the regression step, in order to improve the likelihood of the model by changing the regression coefficients using a Newton-Raphson approach.

    Note: if no differencing is requested (d=0 and D=0), and if there are no explanatory variables in the model, the constant of the model is estimated using CO-LS.

    Читать еще:  Формула енд в excel
    Ссылка на основную публикацию
    Adblock
    detector