Как рассчитать доверительный интервал в Excel. Правило трех сигм +применение на практике.

Автор: Алексей Батурин.

Из данной статьи вы узнаете:график с границами прогноза

  • Что такое доверительный интервал?

  • Как его самостоятельно рассчитать в Excel? Инструкция с пошаговым описанием и файл с примером!

  • В чем суть правила 3-х сигм?

  • Как можно применить эти знания на практике?

В наше время из-за переизбытка информации, связанного с большим ассортиментом товаров, направлений продаж, сотрудников, направлений деятельности и т.д., бывает трудно выделить главное, на что, в первую очередь, стоит обратить внимание и приложить усилия для управления. Определение доверительного интервала и анализ выхода за его границы фактических значений — методика, которая поможет вам выделить ситуации, влияющие на изменение тенденций. Вы сможете развивать позитивные факторы и снизить влияние негативных. Данная технология применяется во многих известных мировых компаниях.

Существуют так называемые "оповещения", которые информируют руководителей о том, что очередное значение в определенном направлении вышло за доверительный интервал. Что это означает? Это сигнал, что произошло какое-то нестандартное событие, которое, возможно, изменит существующую тенденцию в данном направлении. Это сигнал к тому, чтобы разобраться в ситуации и понять, что на неё повлияло.

Например, рассмотрим несколько ситуаций. Мы рассчитали прогноз продаж с границами прогноза по 100 товарным позициям на 2011 год по месяцам и в марте фактические продажи:

  1. По «Подсолнечному маслу» пробили верхнюю границу прогноза и не попали в доверительный интервал.
  2. По «Сухим дрожжам» вышли за нижнюю границу прогноза.
  3. По «Овсяным Кашам» пробили верхнюю границу.

По остальным товарам фактические продажи оказались в рамках заданных границ прогноза. Т.е. их продажи оказались в рамках ожиданий. Итак, мы выделили 3 товара, которые вышли за границы, и начали разбираться, что же повлияло на выход за границы:

  1. По «Подсолнечному маслу» мы вошли в новую торговую сеть, которая дала нам дополнительный объем продаж, что привело к выходу за верхнюю границу. Для этого товара стоит пересчитать прогноз до конца года с учетом прогноза продаж в данную сеть.
  2. По «Сухим дрожжам» машина застряла на таможне, и образовался дефицит в рамках 5 дней, что повлияло на снижение продаж и выход за нижнюю границу. Возможно, стоит разобраться, что послужило причиной и постараться не повторять данную ситуацию.
  3. По «Овсяным Кашам» было запущено мероприятие по стимулированию сбыта, которое дало значительный прирост продаж и привело к выходу за границы прогноза.

Мы выделили 3 фактора, которые повлияли на выход за границы прогноза. В жизни их может быть гораздо больше.Для повышения точности прогнозирования и планирования факторы, которые приводят к тому, что фактические продажи могут выйти за границы прогноза, стоит выделить и строить прогнозы и планы по ним отдельно. А затем учитывать их влияние на основной прогноз продаж. Также можно регулярно оценивать влияние данных факторов и менять ситуацию к лучшему за счет уменьшения влияния негативных и увеличения влияния позитивных факторов.

С помощью доверительного интервала мы можем:

  1. Выделить направления, на которые стоит обратить внимание, т.к. в этих направлениях произошли события, которые могут повлиять на изменение тенденции.
  2. Определить факторы, которые реально влияют на изменение ситуации.
  3. Принять взвешенное решение (например, о закупках, при планировании и т.д.).

Теперь рассмотрим, что такое доверительный интервал и как его рассчитать в Excel на примере.

Что такое доверительный интервал?

Доверительный интервал – это границы прогноза (верхняя и нижняя), в рамки которых с заданной вероятностью (сигма) попадут фактические значения.

Т.е. мы рассчитываем прогноз — это наш основной ориентир, но мы понимаем, что фактические значения вряд ли на 100% будут равны нашему прогнозу. И возникает вопрос, в какие границы могут попасть фактические значения, если существующая тенденция сохранится? И на этот вопрос нам поможет ответить расчет доверительного интервала, т.е. - верхней и нижней границы прогноза.

Что такое заданная вероятность сигма?

При расчете доверительного интервала мы можем задать вероятность попадания фактических значений в заданные границы прогноза. Как это сделать? Для этого мы задаем значение сигма и, если сигма будет равна:

  • 3 сигма — то, вероятность попадания очередного фактического значения в доверительный интервал составят 99,7%, или 300 к 1, или существует 0,3% вероятности выхода за границы.

  • 2 сигма — то, вероятность попадания очередного значения в границы составляет ≈ 95,5 %, т.е. шансы примерно 20 к 1, или существует 4,5% вероятности выхода за границы.

  • 1 сигма — то, вероятность ≈ 68,3%, т.е. шансы примерно 2 к 1, или существует 31,7% вероятность того, что очередное значение выйдет за пределы доверительного интервала.

Мы сформулировали правило 3 сигм, которое гласит, что вероятность попадания очередного случайного значения в доверительный интервал с заданным значением три сигма составляет 99.7%.

Великим русским математиком Чебышевым была доказана теорема о том, что существует 10% вероятность выхода за границы прогноза с заданным значением три сигма. Т.е. вероятность попадания в доверительный интервал 3 сигма составит минимум 90%, в то время как попытка рассчитать прогноз и его границы «на глазок» чревата куда более существенными ошибками.

Как самостоятельно рассчитать доверительный интервал в Excel?

Расчет доверительного интервала в Excel (т.е. верхней и нижней границы прогноза) рассмотрим на примере. У нас есть временной ряд — продажи по месяцам за 5 лет. См. Вложенный файл.

Для расчета границ прогноза рассчитаем:

  1. Прогноз продаж (см. статью «Как самостоятельно рассчитать прогноз продаж с учетом роста и сезонностью»).
  2. Сигма - среднеквадратическое отклонение модели прогноза от фактических значений.
  3. Три сигма.
  4. Доверительный интервал.

1. Прогноз продаж.

О том, «как рассчитать прогноз продаж с учетом роста и с сезонностью» подробно описано в данной статье. Поэтому для тех, кто еще не изучал данный материал и не знает, как самостоятельно рассчитать прогноз продаж по месяцам с учетом роста и сезонности, рекомендуем для понимания последующих действий изучить данную статью, а затем перейти к дальнейшему изучению данного материала.

2. Для определения сигма рассчитаем среднеквадратическое отклонение модели прогноза от фактических значений.

Для расчета сигма рассчитаем среднеквадратическое отклонение для каждого месяца.

1. Для этого на 7-м шаге во вложенном файле рассчитаем значения прогнозной модели, в нашем случае это прогноз с линейным трендом и сезонностью.

Значение модели = Значение тренда умножим на коэффициент сезонности соответствующего месяца.

В Excel введем формулу:

=RC[-11] (ссылка на тренд)*ВПР(RC[-1];R8C9:R19C10;2;0)(формула ВПР со ссылкой на коэффициент сезонности соответствующего месяца)

расчет модели прогноза

2. Рассчитаем квадрат разницы фактических значений и прогнозной модели (Xi-Ximod)^2 (8 этап во вложенном файле)

=(RC[-14](данные во временном ряду) — RC[-1](значение модели))^2(в квадрате)

среднеквадратическое отклонение расчет сигма

 

3. Просуммируем для каждого месяца значения отклонений из 8 этапа Сумма((Xi-Ximod)^2), т.е. просуммируем январи, феврали... для каждого года.

Для этого воспользуемся формулой =СУММЕСЛИ()

=СУММЕСЛИ(массив с номерами периодов внутри цикла (для месяцев от 1 до 12);ссылка на номер периода в цикле; ссылка на массив с квадратами разницы исходных данных и значений периодов)

(9 этап во вложенном файле)

среднеквадратическое отклонение сигма

 

4. Рассчитаем среднеквадратическое отклонение для каждого периода в цикле от 1 до 12 (10 этап во вложенном файле).

Для этого из значения рассчитанного на 9 этапе мы извлекаем корень и делим на количество периодов в этом цикле минус 1 = КОРЕНЬ((Сумма(Xi-Ximod)^2/(n-1))

Воспользуемся формулами в Excel =КОРЕНЬ(R8 (ссылка на (Сумма(Xi-Ximod)^2)/(СЧЁТЕСЛИ($O$8:$O$67 (ссылка на массив с номерами цикла); O8 (ссылка на конкретный номер цикла, которые считаем в массиве))-1))

С помощью формулы Excel = СЧЁТЕСЛИ мы считаем количество n

сигма среднеквадратическое отклонение

Рассчитав среднеквадратическое отклонение фактических данных от модели прогноза, мы получили значение сигма для каждого месяца — этап 10 во вложенном файле.

3. Рассчитаем 3 сигма.

На 11 этапе задаем количество сигм — в нашем примере «3» (11 этап во вложенном файле):

три сигма

 

Также удобные для практики значения сигма:

1,64 сигма — 10% вероятность выхода за предел (1 шанс из 10);

1,96 сигма — 5% вероятность выхода за пределы (1 шанс из 20);

2,6 сигма — 1% вероятность выхода за пределы (1 шанс из 100).

 

5) Рассчитываем три сигма, для этого мы значения «сигма» для каждого месяца умножаем на «3».

расчет три сигма

3.Определяем доверительный интервал.

  1. Верхняя граница прогноза — прогноз продаж с учетом роста и сезонности + (плюс) 3 сигма;
  2. Нижняя граница прогноза — прогноз продаж с учетом роста и сезонности – (минус) 3 сигма;

Для удобства расчета доверительного интервала на длительный период (см. вложенный файл) воспользуемся формулой Excel =Y8+ВПР(W8;$U$8:$V$19;2;0), где

Y8 — прогноз продаж;

W8 — номер месяца, для которого будем брать значение 3-х сигма;

$U$8:$V$19 — таблица, из которой с помощью функции =ВПР извлекаем значение 3-х сигма, соответствующее данному месяцу, фиксируем ссылку на таблицу с помощью F4, подробнее в статье "Как зафиксировать ссылку в Excel".

Т.е. Верхняя граница прогноза = «прогноз продаж» + «3 сигма» (в примере, ВПР(номер месяца; таблица со значениями 3-х сигма; столбец, из которого извлекаем значение сигма равное номеру месяца в соответствующей строке;0)).

расчет границ прогноза 3 сигма

Нижняя граница прогноза = «прогноз продаж» минус «3 сигма».

Итак, мы рассчитали доверительный интервал в Excel.

Теперь у нас есть прогноз и диапазон с границами в пределах, которого с заданной вероятностью сигма попадут фактические значения.

границы прогноза 3 сигма

В данной статье мы рассмотрели, что такое сигма и правило трёх сигм, как определить доверительный интервал и для чего вы можете использовать данную методику на практике.

Вы можете скачать файл с примером расчета 3-х сигма и границ прогноза

Точных вам прогнозов и успехов!

Чем Forecast4AC PRO может вам помочь при расчете доверительного интервала?:

  • Forecast4AC PRO автоматически рассчитает верхнюю или нижнюю границы прогноза для более чем 1000 временных рядов одновременно;

  • Возможность анализа границ прогноза в сравнении с прогнозом, трендом и фактическими продажами на графике одним нажатием клавиши;

+ В программе Forcast4AC PRO есть возможность задать значение сигма от 1 до 3.

Присоединяйтесь к нам!

Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа:

Novo Forecast - прогноз в Excel - точно, легко и быстро!

  • Novo Forecast Lite - автоматический расчет прогноза в Excel.
  • 4analytics - ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition - BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

  • Novo Forecast PRO - прогнозирование в Excel для больших массивов данных.

Получите 10 рекомендаций по повышению точности прогнозов до 90% и выше.

Зарегистрируйтесь и скачайте решения

Статья полезная? Поделитесь с друзьями

 

Комментарии   

#14 +1 KAMOLIDIN ZIEEV 15.06.2016 08:18
Цитирую ольга:
Считаю доверительные интервал и по январю у меня нижняя граница прогноза получается с минусом...Такого ведь не может быть.


В этом случае, подразумевается , что значение равно 0.
Цитировать
#13 Алексей Батурин 15.06.2016 07:43
Цитирую ольга:
Считаю доверительные интервал и по январю у меня нижняя граница прогноза получается с минусом...Такого ведь не может быть.

Ольга, добрый день.

Может, это ж математика, она не знает, что отрицательного значения в вашем случае не может быть. :-)
Цитировать
#12 +1 ольга 15.06.2016 05:08
Считаю доверительные интервал и по январю у меня нижняя граница прогноза получается с минусом...Таког о ведь не может быть.
Цитировать
#11 Алексей Батурин 08.12.2015 15:25
Цитирую Stimulus:

Извиняюсь за свою тупость, но я все равно не могу понять, почему мы делим на n-1. Какая разница в данном случае, то ли это генеральная совокупность то ли выборка...


Данный вопрос относится числу степеней свободы. Тема большая, могу порекомендовать изучать вот этот курс по статистике, в нем как раз подробно этот вопрос разбирается
https://stepic.org/course/%D0%9E%D1%81%D0%BD%D0%BE%D0%B2%D1%8B-%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B8-76
Цитировать
#10 Алексей Батурин 19.11.2015 11:58
Цитирую Камол:
А почему вы делите на (n-1) при расчете стандартного отклонения, если по формуле делить нужно на n?

Для генеральной совокупности n
Для выборки n-1
Цитировать
#9 Алексей Батурин 04.05.2015 07:27
Цитирую Руби:
Здравствуйте!
Для этого метода прогнозирования вроде как понятно на примере. Когда же начала сама считать на основании вашего примера для метода Хольта запуталась и конечно же ничего не вышло! :o Хотя в программе все отлично посчитано!
Но все таки хотелось бы разобраться! :sigh:

Руби, здравствуйте.
Выложите расчеты на форум, посмотрю, подскажу! 8)
Цитировать
#8 Руби 03.05.2015 20:19
Здравствуйте!
Для этого метода прогнозирования вроде как понятно на примере. Когда же начала сама считать на основании вашего примера для метода Хольта запуталась и конечно же ничего не вышло! :o Хотя в программе все отлично посчитано!
Но все таки хотелось бы разобраться! :sigh:
Цитировать
#7 Алексей Батурин 06.11.2014 11:14
Цитирую Максим:
Цитирую Алексей Батурин:
Артур. Цитирую Артур:
Возможно ли использовать Вашу программу для расчёта прогноза по продажам для 50000 товарных позиций,на предстоящие три месяца, по 30000 имеется статистика продаж за три последних года? Спасибо.

Можно, Артур. Попробуйте.

С тестовой версии это можно сделать?

Можно, у вас не получается?
Цитировать
#6 Максим 06.11.2014 10:52
Цитирую Алексей Батурин:
Артур. Цитирую Артур:
Возможно ли использовать Вашу программу для расчёта прогноза по продажам для 50000 товарных позиций,на предстоящие три месяца, по 30000 имеется статистика продаж за три последних года? Спасибо.

Можно, Артур. Попробуйте.

С тестовой версии это можно сделать?
Цитировать
#5 Алексей Батурин 24.11.2013 17:19
Павел, корректировки в расчет границ внесены + статья переписана, спасибо!
Цитировать

Добавить комментарий