Как использовать математику в трейдинге, если вы вообще не математик

Время на чтение: 11 минут

Стандартное отклонение и нормальное распределение

На простом языке разберем, как незамысловатые элементы статистики и математики могут сильно помочь на финансовых рынках.

Где встречается нормальное распределение, что за шапка жандарма такая, откуда берутся 1, 2 или 3 сигмы, как определить математическое ожидание стратегии — после прочтения статьи вам будет все понятно.

Содержание

Видео

Что такое нормальное распределение и где оно встречается

Многое, что нас окружает, имеет нормальное распределение. Средняя, нормальная скорость, с которой передвигаются машины в городе, средние зарплаты, средняя продолжительность фильма, среднее время, проведенное в инстаграмме и т.д. Среднее и нормальное движение цен финансовых инструментов — не исключение (о них — чуть позже).

Скорее всего, вы видели колоколообразную кривую нормального распределения. Разберем ее на примере среднего роста человека.

Нормальное распределение
Нормальное распределение среднего роста взрослого человека.

Допустим, у нас есть данные о всех взрослых людях планеты и их росте за последние 1000 лет. Нам не составит труда узнать средний рост такого человека — он равняется 165 см. Самый низкий рост человека — 54,6 см, а самый высокий — 272 см. Выше на графике ось X показывает как раз значения роста взрослого человека, ось Y — вероятность встречи человека с определенным ростом. И если перевести график на простой язык, будет звучать примерно так:

С большей вероятностью мы будем встречать людей с ростом от 150 до 180 см. А вот взрослых людей с ростом ниже 100 см и выше 200 см мы будем встречать крайне редко.

Кстати да, иногда математики нормальное распределение называют «шлемом жандарма». И вот почему:

Стандартное отклонение и нормальное распределение
Жандарм и его "нормальный" шлем :)

Ок, теперь разберем, что такое стандартное отклонение.

Что такое стандартное отклонение и откуда оно берется

В статистике дается следующее определение:

Стандартное отклонение (отображается как греческая буква σ — сигма) — мера, которая показывает разброс величин от среднего значения.

Формула стандартного отклонения выглядит так:

Корень из суммы квадратов разниц между элементами выборки, деленной на количество элементов в выборке минус 1. Если что, это все автоматически можно вычислить в Excel по формуле «СТАНДОТКЛОН».

Правило 3-х сигм — 3-х стандартных отклонений

Получив значение стандартного отклонения, мы можем узнать, где и с какой вероятностью окажутся наши исследуемые данные, используя правило 3-х сигм. Для этого обратимся к рисунку ниже.

Стандартное отклонение и нормальное распределение
1, 2 и 3 сигмы (σ) — те самые отклонения от среднего.

Если в нуле у нас то самое среднее значение (которое также называется математическим ожиданием и обозначается буквой мю — μ. О мат. ожидании скоро поговорим чуть подробней), то 1, 2 и 3 сигмы — отклонения от среднего значения. На одно, два и три значения соответственно.

Правило 3-х сигм говорит вот о чем:

  • с вероятностью 99,7% наши исследуемые данные окажутся именно в этой выборке — от -3 до +3 стандартных отклонений. ((34,1% + 13,6 + 2,1%) * 2 = 99,7%)
  • c вероятностью 68,2% наши данные окажутся в пределах от -1 до +1 стандартных отклонений. (34,1% + 34,1% = 68,2%)
  • вероятность того, что наши данные выйдут из 3 стандартных отклонений — крайне мала, а именно — около 0,3%

Стандартное отклонение еще называют среднеквадратичным отклонением, потому что является квадратным корнем дисперсии — меры, которая показывает разброс значений от среднего (от того самого нуля, или μ). Нет необходимости погружаться в формулы, так как дисперсия тоже автоматически считается в том же Excel (по формуле «ДИСП»). Но если все же хотите разобраться с дисперсией подробней, вот ссылка на статью Википедии.

Ок, с матчастью разобрались, теперь к примерам из финансовых рынков.

За 1 час поможем разобраться с факторами успеха и причинами неудач на финансовых рынках. Бесплатно

Нормальное распределение и стандартное отклонение на финансовых рынках

Теперь мы знаем, что нормальное распределение должно встречаться и в разных сферах финансовых рынков — от доходностей торговых стратегий до движения котировок внутри дня. Давайте исследуем эту гипотезу экспериментально.

Нормальное распределение в доходностях торговых стратегий

В статье Ценность стоп-лосса, выявленная из 2 365 алгоритмов мы уже приводили результативность стратегий и их среднюю доходность. Вот какая выборка данных была:

  • количество бэктестов: 109 912
  • количество сделок: 44 214 423
  • среднее историческое окно: 5.25 лет
  • среднее количество сделок в каждом бэктесте: 402
  • бэктестов с доходностью выше нуля: 25 706, или 23%
  • бэктестов, подходящих для лайв-трейдинга (коэффициент восстановления > 0.5 и количество сделок > 30): всего 2 365 или 2.15%

Угадайте, что получили? Да, шлем жандарма.

Ценность стоп-лосса
Нормальное распределение доходностей среди 2 365 алгоритмов.

По оси X — соотношение прибыльных сделок в исследуемых стратегиях. В нашем случае —  от 20% до 75%. По оси Y — количество алгоритмов, которые попали в определенную доходность (всего их во всех гистограммах — 2 365 штук). Чем выше гистограмма, тем больше алгоритмов туда попало, — значит, выше вероятность такого события. Опять же, давайте переведем все на человеческий язык, как на примере со средним ростом человека. Вот как сформулируем:

Вероятней всего, в среднем у стратегий будет от 35% до 45% прибыльных сделок. Шанс того, что среднее количество сделок будет 55% и выше — крайне мал.

И небольшое отступление. Распределение не всегда бывает нормальным. Слово «нормальное» в нашем термине подразумевает зеркальные значения что слева от среднего, что справа. Идеальная зеркальность нам и не нужна.

А вообще, вот какие типы распределений бывают:

Стандартное отклонение и нормальное распределение
Виды кривых распределений.

Есть теорема (центральная предельная теорема — ЦПТ), которая приводит ненормальное распределение к нормальному. Это все, что нам нужно знать в рамках этой статьи.

С этим разобрались. Это была средняя доходность. А что, если посмотреть на среднюю просадку?

Нормальное распределение в просадках торговых стратегий

И в средних просадках должно все повторяться. Давайте проверим это с помощью метода Монте-Карло. Подробнее о методе вы можете прочесть в статье Как определить вероятностный результат торговой стратегии, используя метод Монте-Карло. Сейчас же просто посмотрим на распределения.

Ок, допустим, у нас есть некая стратегия, которая в среднем дает 50% прибыльных сделок, а соотношение стоп-лосса к тейк-профиту составляет 1 к 1. Вот как будет выглядеть среднее распределение по просадке:

Стандартное отклонение и нормальное распределение
Практически нормальное распределение по просадке.

MDD — Maximum Drowdown — максимальная просадка. И здесь тоже видим уже знакомую нам кривую почти нормального распределения. Как показывает эта кривая, средняя просадка, вероятнее всего, будет в районе 3,8%.

И еще один пример для закрепления.

Стандартное отклонение и нормальное распределение
Нормальное распределение, где средняя просадка уже 26,6%.

В нашем Telegram-канале есть то, чего не публикуем на сайте 👇

"Толстые хвосты" нормального распределения

Об этом любит писать в своих книгах и публикациях Нассим Талеб. Что за «толстые хвосты» такие? Сейчас расшифруем.

По правилам 3-х отклонений, (тех самых 3-х сигм) все, что выходит за их рамки — крайне редкие события, которые можно вообще и не встретить в жизни (мы уже знаем, что шанс встретиться с таким событием — примерно 0,3%). Но парадокс в том, что редкие события на финансовых рынках, они же «черные лебеди», встречаются значительно чаще, чем об этом говорит статистика.

Нормальное распределение
Те самые "хвосты" распределения.

«Хвосты» — те самые края нормального распределения. И если у синего распределения они тонкие (то есть вероятность события действительно низка), то у красного распределения они шире.

Мы помним, что по оси Y у нас вероятность встречи события, а по оси X — его значение. Так и получается, что чем «толще» хвосты, тем выше вероятность реализоваться крайне неожиданному и экстремальному событию.

Финансовые пузыри, падения котировок и другие форс-мажоры — все это происходит чаще, чем должно было бы быть в теории. Подробнее об этом мы рассказываем в наших курсах и в статье 4 урока для трейдинга из 4-х книг Нассима Талеба.

Индикаторы с использованием стандартного отклонения

Вот несколько индикаторов, в основе которых лежит логика нормального распределения и стандартного отклонения.

Классический индикатор стандартного отклонения — Standard Deviation

Задача индикатора Standard Deviation — показывать всплески волатильности от средних значений. По классической настройке индикатор включается с периодом 20, то есть берет 20 последних свечей и вычисляет от них то самое среднее значение.

Стандартное отклонение и нормальное распределение
График валютной пары NZD/JPY H1 и индикатор стандартного отклонения с периодом 20.

Рост индикатора — рост ценовой активности, снижение индикатора — снижение активности.

Так как этот индикатор показывает лишь всплески волатильности, в отдельности он практически не используется. Волатильность достаточно легко определить на глаз, без каких-либо приборов.

Полосы Боллинджера

Этот индикатор популярней, так как автоматически помогает с определением тренда, волатильности и стандартного отклонения. Не будем подробно описывать здесь принципы его работы, так как уже сделали это в прошлой статье: Трендовая стратегия на индикаторах SMA и полосах Боллинджера (Bollinger Bands). Просто покажем, как выглядят линии на графике:

Стратегия на индикаторах SMA и линиях Боллинджера
Линии Боллинджера и уже знакомые вам отклонения (сигмы).

Линия посередине — то самое среднее значение. Линии выше и ниже — +2 сигмы и -2 сигмы, то есть вероятностное движение цены как в рост, так и в падение.

Вот видео о том, как мы создавали и тестировали стратегию на основе полос Боллинджера:

Математическое ожидание торговых стратегий

Последнее, о чем поговорим, и расходимся.

Скорее всего, вы слышали что-то вроде «О, эта стратегия с положительным мат. ожиданием», или «Эта стратегия не годится. Ее мат. ожидание отрицательное». Да, положительное математическое ожидание — хорошо, отрицательное — плохо. А берется оно, как мы уже разобрались, из тех же значений нормального распределения — из среднего. Сформулировать мат. ожидание можно так:

Математическое ожидание — это наиболее ожидаемое значение, которое мы можем получить при многократном повторении испытания.

Снова обратимся за помощью к методу Монте-Карло и распределениям, чтобы проверить все на практике.

Отрицательное математическое ожидание

Стандартное отклонение и нормальное распределение
Распределения с помощью Монте-Карло.

Выше мы провели 10 000 случайных симуляций стратегии (на самом деле портфеля стратегий, но сейчас это не важно) и получили данные по распределениям. Нам интересна правая нижняя диаграмма — «Распределение ФинРез» — финансовый результат.

Еще раз пройдемся по определению, но уже для торговой стратегии.

Математическое ожидание торговой стратегии, это среднее значение ее доходности при многократном повторении испытания.

Если среднее значение отрицательное (оно же мат. ожидание), как на примере выше (-11,5%), значит эта стратегия не заслуживает право на существование. Любые прибыли в такой стратегии — это лишь случайность и простое везение.

Теперь посмотрим на потенциально прибыльную стратегию.

Положительное математическое ожидание

Стандартное отклонение и нормальное распределение
Распределения с помощью Монте-Карло.

Здесь финансовый результат уже положительный. Среднее значение доходности — +29,1%, что говорит нам о положительном математическом ожидании. Стратегия заслуживает право на существование.

Как создавать торговые стратегии на основе статистики и данных, способных работать 24/5

Не упустите возможность получить прибыльные торговые стратегии.

Заключение

Давайте еще раз тезисно по всему пробежимся:

  • Под нормальное распределение попадает практически все, что нас окружает в жизни. Нормальное распределение в разных сферах финансовых рынков — не исключение.
  • Вычислить вероятность максимальной просадки или среднюю доходность стратегии не составит труда, если у вас есть данные. Чтобы получать данные, вы должны уметь тестировать торговые стратегии. Наш проект практики алготрейдинга поможет вам с этим.
  • Многие трейдеры даже не подозревают, что используют стратегии с отрицательным мат. ожиданием. Получать системную прибыль с такими стратегиями невозможно статистически. Это все-равно что подкидывать монетку, ожидая, что «решка» будет выпадать чаще «орла». Любые прибыли у таких стратегий будут носить случайный и кратковременный характер, а трейдер будет лишь одурачиваться случайностью.

В этой статье мы постарались показать, что для простейших вычислений вам не нужно быть математиком — все уже создано, можно брать и пользоваться. Самое важное, это умение тестировать стратегии и правильно работать с их данными. С таким подходом вы будете на голову выше других частных (как минимум) трейдеров.

Принципы нормального распределения вы можете применять к любым показателям, которые вас заинтересуют. Это могут быть и средние движения криптовалют, и средняя ожидаемая доходность инвестиционного портфеля, и все, что вы сами захотите исследовать. Ограничения всегда лишь в вашей голове.

Работа с данными, тестирования, рациональное мышление и опора на статистику — вот что ценится среди профессионалов и отделяет их от любителей.

И да, не забывайте, что финансовые рынки иногда проявляют «толстые хвосты» ;)

Успехов!

Материалы

Поделиться статьей

С радостью ответим на ваши комментарии

Читайте также

Поп-ап

В поиске прибыльных торговых стратегий на финансовых рынках?

Тогда вам по одной из кнопок ниже

До 60% скидок на все курсы. Только для тех, кто прошел вступительный материал до конца

  1. Ваша выгода составит от 2 409 ₽ до 31 482 .
  2. Стоимость любого курса можно разделить на 4 части. Без переплат, комиссий или кредитных договоров.
  3. Если курсы вам не подойдут — вернем деньги без вопросов.

До 60% скидок на все курсы. Только для тех, кто прошел вступительный материал до конца

  1. Ваша выгода составит от 2 409 ₽ до 31 482 .
  2. Стоимость любого курса можно разделить на 4 части. Без переплат, комиссий или кредитных договоров.
  3. Если курсы вам не подойдут — вернем деньги без вопросов.