Авторегрессионная интегрированная скользящая средняя (ARIMA)

Что такое авторегрессионная интегрированная скользящая средняя (ARIMA)?

Авторегрессионная интегрированная скользящая средняя или ARIMA — это модель статистического анализа, которая использует данные временных рядов для лучшего понимания набора данных или для прогнозирования будущих тенденций.

Статистическая модель является авторегрессионной, если она предсказывает будущие значения на основе прошлых значений. Например, модель ARIMA может стремиться предсказать будущие цены акции на основе ее прошлых результатов или спрогнозировать прибыль компании на основе прошлых периодов.

Ключевые выводы

  • Модели авторегрессионного интегрированного скользящего среднего (ARIMA) предсказывают будущие значения на основе прошлых значений.
  • ARIMA использует запаздывающие скользящие средние для сглаживания данных временных рядов.
  • Они широко используются в техническом анализе для прогнозирования будущих цен на ценные бумаги.
  • Модели авторегрессии неявно предполагают, что будущее будет напоминать прошлое.
  • Следовательно, они могут оказаться неточными в определенных рыночных условиях, таких как финансовые кризисы или периоды быстрых технологических изменений.

Общие сведения об авторегрессионной интегрированной скользящей средней (ARIMA)

Модель авторегрессионного интегрированного скользящего среднего — это форма регрессионного анализа, который измеряет силу одной зависимой переменной по сравнению с другими изменяющимися переменными. Целью модели является прогнозирование будущих движений ценных бумаг или финансового рынка путем изучения различий между значениями ряда, а не фактическими значениями.

Модель ARIMA можно понять, выделив каждый из ее компонентов следующим образом:

  • Авторегрессия (AR): относится к модели, которая показывает изменяющуюся переменную, которая регрессирует сама по себе запаздывающим или предыдущим значениям.
  • Интегрированный (I): представляет собой разность необработанных наблюдений, чтобы временные ряды стали стационарными (т. е. значения данных заменяются разницей между значениями данных и предыдущими значениями).
  • Скользящее среднее (MA): включает зависимость между наблюдением и остаточной ошибкой из модели скользящего среднего, применяемой к запаздывающим наблюдениям.

Параметры ARIMA

Каждый компонент в ARIMA функционирует как параметр со стандартным обозначением. Для моделей ARIMA стандартным обозначением будет ARIMA с p, d и q, где целочисленные значения заменяют параметры, чтобы указать тип используемой модели ARIMA. Параметры можно определить как:

  • п: количество запаздывающих наблюдений в модели; также известный как порядок задержки.
  • d: количество раз, когда необработанные наблюдения различаются; также известна как степень различия.
  • q: размер окна скользящего среднего; также известен как порядок скользящей средней.

Например, в модели линейной регрессии учитываются количество и тип терминов. Значение 0, которое можно использовать в качестве параметра, будет означать, что этот конкретный компонент не должен использоваться в модели. Таким образом, модель ARIMA может быть построена для выполнения функции модели ARMA или даже простых моделей AR, I или MA.

Поскольку модели ARIMA сложны и лучше всего работают с очень большими наборами данных, для их вычисления используются компьютерные алгоритмы и методы машинного обучения.

Авторегрессионное интегрированное скользящее среднее (ARIMA) и стационарность

В модели авторегрессионного интегрированного скользящего среднего данные различаются, чтобы сделать их стационарными. Модель, показывающая стационарность, — это модель, которая показывает постоянство данных во времени. Большинство экономических и рыночных данных показывают тенденции, поэтому цель дифференцирования — удалить любые тенденции или сезонные структуры.

Сезонность, или когда данные показывают регулярные и предсказуемые закономерности, повторяющиеся в течение календарного года, может отрицательно повлиять на регрессионную модель. Если тенденция появляется, а стационарность не очевидна, многие вычисления на протяжении всего процесса не могут быть выполнены с большой эффективностью.

Одноразовый шок будет бесконечно влиять на последующие значения модели ARIMA в будущем. Таким образом, наследие финансового кризиса продолжает жить в современных моделях авторегрессии.

Особые соображения

Модели ARIMA основаны на предположении, что прошлые значения имеют некоторый остаточный эффект на текущие или будущие значения. Например, инвестор, использующий модель ARIMA для прогнозирования цен на акции, будет предполагать, что новые покупатели и продавцы этих акций находятся под влиянием недавних рыночных транзакций при принятии решения о том, сколько предложить или принять за ценную бумагу.

Хотя это предположение верно при многих обстоятельствах, это не всегда так. Например, в годы, предшествовавшие финансовому кризису 2008 года, большинство инвесторов не знали о рисках, связанных с большими портфелями ценных бумаг с ипотечным покрытием (MBS), которыми владеют многие финансовые компании.

В то время инвестор, использующий модель авторегрессии для прогнозирования динамики финансовых акций США, имел бы веские основания для прогнозирования продолжающейся тенденции стабильных или растущих цен на акции в этом секторе. Однако, как только стало известно, что многие финансовые учреждения находятся под угрозой неминуемого краха, инвесторы внезапно стали меньше беспокоиться о недавних ценах на эти акции и гораздо больше беспокоиться о лежащих в их основе рисках. Таким образом, рынок быстро переоценил финансовые акции до гораздо более низкого уровня, что полностью сбило бы с толку авторегрессионную модель.

Часто задаваемые вопросы

Для чего используется ARIMA?

ARIMA — это метод прогнозирования будущих результатов на основе исторических временных рядов. Он основан на статистической концепции последовательной корреляции, когда прошлые данные влияют на будущие точки данных.

В чем разница между моделями авторегрессии и скользящего среднего?

ARIMA сочетает в себе функции авторегрессии с функциями скользящих средних. Например, авторегрессионный процесс AR (1) — это процесс, в котором текущее значение основано на непосредственно предшествующем значении, а процесс AR (2) — это процесс, в котором текущее значение основано на двух предыдущих значениях. Скользящее среднее — это расчет, используемый для анализа точек данных путем создания серии средних значений различных подмножеств полного набора данных, чтобы сгладить влияние выбросов. В результате такой комбинации методов модели ARIMA могут учитывать тенденции, циклы, сезонность и другие нестатические типы данных при составлении прогнозов.

Как работает прогнозирование ARIMA?

Прогнозирование ARIMA достигается путем включения данных временных рядов для интересующей переменной. Статистическое программное обеспечение определит соответствующее количество запаздываний или величину разности, которая будет применяться к данным, и проверит их на стационарность. Затем он выдаст результаты, которые часто интерпретируются аналогично модели множественной линейной регрессии.

Поделитесь с друзьями

Address
304 North Cardinal St.
Dorchester Center, MA 02124

Work Hours
Monday to Friday: 7AM - 7PM
Weekend: 10AM - 5PM