

На пальцах покажем, как базовые приёмы статистики уберегут вас от убытков.
Для продуктивного старта:
Многое, что нас окружает, имеет нормальное распределение. Средняя, нормальная скорость, с которой передвигаются машины в городе, средние зарплаты, средняя продолжительность фильма и т.д. Среднее и нормальное движение цен финансовых инструментов — не исключение (о них — чуть позже).
Скорее всего, вы видели колоколообразную кривую нормального распределения. Разберем ее на примере среднего роста человека.
Допустим, у нас есть данные о всех взрослых людях планеты и их росте за последние 1000 лет. Нам не составит труда узнать средний рост такого человека — он равняется 165 см. Самый низкий рост человека — 54,6 см, а самый высокий — 272 см. Выше на графике ось X показывает как раз значения роста взрослого человека, ось Y — вероятность встречи человека с определенным ростом. И если перевести график на простой язык, будет звучать примерно так:
С большей вероятностью мы будем встречать людей с ростом от 150 до 180 см. А вот взрослых людей с ростом ниже 100 см и выше 200 см мы будем встречать крайне редко.
Кстати да, иногда математики нормальное распределение называют “шлемом жандарма”. И вот почему:
Ок, теперь разберем, что такое стандартное отклонение.
В статистике дается следующее определение:
Стандартное отклонение (отображается как греческая буква σ — сигма) — мера, которая показывает разброс величин от среднего значения.
Формула стандартного отклонения выглядит так:
Корень из суммы квадратов разниц между элементами выборки, деленной на количество элементов в выборке минус 1. Если что, это все автоматически можно вычислить в Excel по формуле “СТАНДОТКЛОН”.
Получив значение стандартного отклонения, мы можем узнать, где и с какой вероятностью окажутся наши исследуемые данные, используя правило 3-х сигм. Для этого обратимся к рисунку ниже.
Если в нуле у нас то самое среднее значение (которое также называется математическим ожиданием и обозначается буквой мю — μ. О мат. ожидании скоро поговорим чуть подробней), то 1, 2 и 3 сигмы — отклонения от среднего значения. На одно, два и три значения соответственно.
Правило 3-х сигм говорит вот о чем:
Стандартное отклонение еще называют среднеквадратичным отклонением, потому что является квадратным корнем дисперсии — меры, которая показывает разброс значений от среднего (от того самого нуля, или μ). Нет необходимости погружаться в формулы, так как дисперсия тоже автоматически считается в том же Excel (по формуле “ДИСП”). Но если все же хотите разобраться с дисперсией подробней, вот ссылка на статью Википедии.
Ок, с матчастью разобрались, теперь к примерам из финансовых рынков.
Теперь мы знаем, что нормальное распределение должно встречаться и в разных сферах финансовых рынков — от доходностей торговых стратегий до движения котировок внутри дня. Давайте исследуем эту гипотезу экспериментально.
В статье Ценность стоп-лосса, выявленная из 2 365 алгоритмов мы уже приводили результативность стратегий и их среднюю доходность. Вот какая выборка данных была:
Угадайте, что получили? Да, шлем жандарма.
По оси X — соотношение прибыльных сделок в исследуемых стратегиях. В нашем случае — от 20% до 75%. По оси Y — количество алгоритмов, которые попали в определенную доходность (всего их во всех гистограммах — 2 365 штук). Чем выше гистограмма, тем больше алгоритмов туда попало, — значит, выше вероятность такого события. Опять же, давайте переведем все на человеческий язык, как на примере со средним ростом человека. Вот как сформулируем:
Вероятней всего, в среднем у стратегий будет от 35% до 45% прибыльных сделок. Шанс того, что среднее количество сделок будет 55% и выше — крайне мал.
И важное отступление: распределение не всегда бывает нормальным. Слово “нормальное” в нашем термине подразумевает зеркальные значения что слева от среднего, что справа.
Вот какие типы распределений бывают:
Есть теорема (центральная предельная теорема — ЦПТ), которая приводит ненормальное распределение к нормальному. Это все, что нам нужно знать в рамках этой статьи.
С этим разобрались. Это была средняя доходность. А что, если посмотреть на среднюю просадку?
И в средних просадках должно все повторяться. Давайте проверим это с помощью метода Монте-Карло. Подробнее о методе вы можете прочесть в статье Как определить вероятностный результат торговой стратегии, используя метод Монте-Карло или в видео ниже:
Сейчас же просто посмотрим на распределения.
Ок, допустим, у нас есть некая стратегия, которая в среднем дает 50% прибыльных сделок, а соотношение стоп-лосса к тейк-профиту составляет 1 к 1. Вот как будет выглядеть среднее распределение по просадке:
MDD — Maximum Drowdown — максимальная просадка. И здесь видим уже знакомую нам кривую распределения. Как показывает эта кривая, средняя просадка, вероятнее всего, будет в районе 3,8%.
Важно заметить, что у нас есть смещение вправо — то есть “толстый хвост” (о них — далее). Такие распределения называют positive skewness — положительный сдвиг или положительное смещение. В случае с примером выше это говорит о том, что могут быть редкие сценарии и форс-мажоры, которые сильно увеличат максимальную просадку.
Ок, еще один пример для закрепления.
Здесь же распределение нормальное, без сдвигов влево или вправо.
Об этом любит писать в своих книгах и публикациях Нассим Талеб. Что за “толстые хвосты” такие? Сейчас расшифруем.
По правилам 3-х отклонений, (тех самых 3-х сигм) все, что выходит за их рамки — крайне редкие события, которые можно вообще и не встретить в жизни (мы уже знаем, что шанс встретиться с таким событием — примерно 0,3%). Но парадокс в том, что редкие события на финансовых рынках, они же “черные лебеди”, встречаются значительно чаще, чем об этом говорит статистика.
“Хвосты” — те самые края распределения. И если у синего распределения они тонкие (то есть вероятность события действительно низка), то у красного распределения они шире.
Мы помним, что по оси Y у нас вероятность встречи события, а по оси X — его значение. Так и получается, что чем “толще” хвосты, тем выше вероятность реализоваться крайне неожиданному и экстремальному событию.
Финансовые пузыри, падения котировок и другие форс-мажоры — все это происходит чаще, чем должно было бы быть в теории. И все это нельзя отнести к нормальному распределению. Подробнее об этом мы рассказываем в наших курсах и в статье 4 урока для трейдинга из 4-х книг Нассима Талеба.
Или же можно посмотреть видео ниже:
Исходя из нормального распределения, выходы за пределы 3-х сигм были бы с теми вероятностями, что ниже в таблице.
Теперь же посмотрим, какие события были за последние 10 лет, которые вышли за рамки нормального.
То есть, если опираться на законы нормального распределения, многие из этих событий должны были бы происходить 1 раз в миллионы или даже миллиарды лет. На практике же они происходят несколько раз в десятилетие.
Хоть и нормальное распределение — далеко не самая точная модель описания цены (как мы выяснили выше), но для частного трейдера с нее можно начинать, а дальше уже переходить к более сложным моделям, которые учитывают “толстые хвосты”.
Вот несколько индикаторов, в основе которых лежит логика нормального распределения и стандартного отклонения.
Задача индикатора Standard Deviation — показывать всплески волатильности от средних значений. По классической настройке индикатор включается с периодом 20, то есть берет 20 последних свечей и вычисляет от них то самое среднее значение.
Рост индикатора — рост ценовой активности, снижение индикатора — снижение активности.
Так как этот индикатор показывает лишь всплески волатильности, в отдельности он практически не используется. Волатильность достаточно легко определить на глаз, без каких-либо приборов.
Этот индикатор популярней, так как автоматически помогает с определением тренда, волатильности и стандартного отклонения. Не будем подробно описывать здесь принципы его работы, так как уже сделали это в прошлой статье: Трендовая стратегия на индикаторах SMA и полосах Боллинджера (Bollinger Bands). Просто покажем, как выглядят линии на графике:
Линия посередине — то самое среднее значение. Линии выше и ниже — +2 сигмы и -2 сигмы, то есть вероятностное движение цены как в рост, так и в падение.
Вот видео о том, как мы создавали и тестировали стратегию на основе полос Боллинджера:
Линейная регрессия в трейдинге используется для определения основной динамики цен на рынке и отклонений от нее. Строится из 3-х линий:
Линейную регрессию можно использовать как в боковых движения, так и в трендовых.
Линейная регрессия может быть хорошим помощником в сложных фазах рынка — волатильных консолидациях. На примере выше — именно такая фаза. Покупки от нижней линии отклонения (-2 сигмы) и продажи от верхней линии (+2 сигмы) могут быть неплохой контртрендовой стратегией.
Теперь посмотрим трендовые методы.
В трендовых движениях регрессия аналогично помогает с точками входа и упрощает визуальный анализ.
Последнее, о чем поговорим, и расходимся.
Скорее всего, вы слышали что-то вроде “О, эта стратегия с положительным мат. ожиданием”, или “Эта стратегия не годится. Ее мат. ожидание отрицательное”. Да, положительное математическое ожидание — хорошо, отрицательное — плохо. А берется оно, как мы уже разобрались, из тех же значений нормального распределения — из среднего. Сформулировать мат. ожидание можно так:
Математическое ожидание — это наиболее ожидаемое значение, которое мы можем получить при многократном повторении испытания.
Снова обратимся за помощью к методу Монте-Карло и распределениям, чтобы проверить все на практике.
Выше мы провели 10 000 случайных симуляций стратегии (на самом деле портфеля стратегий, но сейчас это не важно) и получили данные по распределениям. Нам интересна правая нижняя диаграмма — “Распределение ФинРез” — финансовый результат.
Еще раз пройдемся по определению, но уже для торговой стратегии.
Математическое ожидание торговой стратегии, это среднее значение ее доходности при многократном повторении испытания.
Если среднее значение отрицательное (оно же мат. ожидание), как на примере выше (-11,5%), значит эта стратегия не заслуживает право на существование. Любые прибыли в такой стратегии — это лишь случайность и простое везение.
Теперь посмотрим на потенциально прибыльную стратегию.
Здесь финансовый результат уже положительный. Среднее значение доходности — +29,1%, что говорит нам о положительном математическом ожидании. Стратегия заслуживает право на существование.
Давайте еще раз тезисно по всему пробежимся:
В этой статье мы постарались показать, что для простейших вычислений вам не нужно быть математиком — все уже создано, можно брать и пользоваться. Самое важное, это умение тестировать стратегии и правильно работать с их данными. С таким подходом вы будете на голову выше других частных (как минимум) трейдеров.
Принципы распределения вы можете применять к любым показателям, которые вас заинтересуют. Это могут быть и средние движения криптовалют, и средняя ожидаемая доходность инвестиционного портфеля, и все, что вы сами захотите исследовать. Ограничения всегда лишь в вашей голове.
Работа с данными, тестирования, рациональное мышление и опора на статистику — вот что ценится среди профессионалов и отделяет их от любителей.
И да, не забывайте, что финансовые рынки иногда проявляют “толстые хвосты” ;)
Успехов!
empirix.ru © 2012-2025
ИП Овсянников Павел Андреевич, ИНН 771387871944, ОГРНИП 320774600169552.
Empirix.ru не осуществляет брокерскую деятельность и не оказывает услуги Форекс-дилинга. Материалы сайта представлены в обучающих целях и не являются инвестиционными рекомендациями. Трейдинг на финансовых рынках имеет рискованный характер, возможность получения прибыли неразрывно связана с риском получения убытков.