Читать книгу «Математика управления капиталом: Методы анализа риска для трейдеров и портфельных менеджеров» онлайн полностью📖 — Ральфа Винса — MyBook.
image

Основные концепции

Вероятность задается числом от 0 и 1, которое определяет, насколько вероятен результат, где 0 – это полное отсутствие вероятности происхождения определенного события, а 1 означает, что рассматриваемое событие определенно произойдет. Процесс независимых испытаний (отбор с замещением) – это последовательность результатов, где значение вероятности постоянно от одного события к другому. Бросок монеты является примером такого процесса. Каждый бросок имеет вероятность 50/50 независимо от результата предыдущего броска. Даже если последние 5 раз выпадал орел, вероятность того, что при следующем броске выпадет орел, все равно не изменится и составит 0,5.

Другой тип случайного процесса характеризуется тем, что результат предыдущих событий влияет на значение вероятности, и, таким образом, значение вероятности непостоянно от одного события к другому. Эти виды событий называются процессами зависимых испытаний (отбор без замещения). Игра «21 очко» является примером такого процесса. После того как вытаскивают карту, состав колоды изменяется. Допустим, что новая колода перемешивается и одна карта удалена, скажем бубновый туз. До удаления этой карты вероятность вытянуть туза была 4/52, или 0,07692307692. Теперь, когда туза вытащили из колоды и не вернули обратно, вероятность вытянуть туза при следующем ходе составляет 3/51, или 0,05882352941.

Различие между независимыми и зависимыми испытаниями состоит в том, что вероятность или фиксирована (независимые попытки), или меняется (зависимые попытки) от одного события к другому в зависимости от предыдущих результатов. Фактически это и есть единственное различие.

Серийный тест

Когда в случае с колодой карт мы проводим отбор без замещения, можно путем проверки определить, существует ли зависимость. Для определенных событий (таких как поток прибыли и убытков по сделкам), где зависимость не может быть определена путем проверки, мы будем использовать серийный тест. Серийный тест подскажет нам, имеет ли наша система больше (или меньше) периодов последовательных выигрышей и проигрышей, чем случайное распределение.

Цель серийного теста – найти счет Z для периодов выигрышей и проигрышей в системной торговле. Счет Z означает, на сколько стандартных отклонений вы удалены от среднего значения распределения. Таким образом, счет Z = 2,00 означает, что вы на 2 стандартных отклонения удалились от среднего значения (ожидание случайного распределения периодов выигрышей и проигрышей).

Счет Z – это просто число стандартных отклонений, на которое данные отстоят от среднего значения нормального распределения вероятности. Например, счет Z = 1,00 означает, что данные, которые вы тестируете, отклонены на 1 стандартное отклонение от среднего значения.

Счет Z затем переводится в доверительную границу, которая иногда также называется степенью достоверности. Площадь под кривой нормального распределения вероятности шириной в 1 стандартное отклонение с каждой стороны от среднего значения равна 68 % всей площади под этой кривой. Преобразуем счет Z в доверительную границу. Связь счета Z и доверительной границы следующая: счет Z является числом стандартных отклонений от среднего значения, а доверительная граница – долей площади под кривой, заполненной при таком числе стандартных отклонений.


При минимальном количестве 30 закрытых сделок мы можем рассчитать счет Z. Попытаемся узнать, сколько периодов выигрышей (проигрышей) можно ожидать от данной системы? Соответствуют ли периоды выигрыша (проигрыша) тестируемой системы ожидаемым? Если нет, существует ли достаточно высокая доверительная граница, чтобы допустить, что между сделками существует зависимость, т. е. зависит ли результат текущей сделки от результата предыдущих сделок?

Ниже приведено уравнение серийного теста. Счет Z для торговой системы равен:


Z = (N * (R – 0,5) – X) / ((X * (X – N)) / (N – 1)) ^ (1/2), (1.1)


где N – общее число сделок в последовательности;

R – общее число серий выигрышных или проигрышных сделок;

X = 2 * W * L;

W – общее число выигрышных сделок в последовательности;

L – общее число проигрышных сделок в последовательности.

Этот расчет можно провести следующим образом.

1. Возьмите данные по вашим сделкам.

а) Общее число сделок, т. е. N.

б) Общее число выигрышных сделок и общее число проигрышных сделок.

Теперь рассчитайте Х:

Х = 2 * (Общее число выигрышей) * (Общее число проигрышей).

в) Общее число серий в последовательности, т. е. R.

2. Предположим, что произошли следующие сделки:


– 3, +2, +7, –4, +1, –1, +1, +6, –1, 0, –2, +1.


Чистая прибыль составляет +7. Общее число сделок 12, поэтому N = 12. Теперь нас интересует не то, насколько велики выигрыши и проигрыши, а то, сколько было выигрышей и проигрышей, а также серий. Поэтому мы можем перевести наш ряд сделок в простую последовательность плюсов и минусов. Отметьте, что сделка с нулевой прибылью считается проигрышем. Таким образом:


Как видим, последовательность состоит из 6 прибылей и 6 убытков, поэтому Х = 2 * 6 * 6 = 72. В последовательности есть 8 серий, поэтому R = 8. Мы называем серией каждое изменение символа, которое встречается при чтении последовательности слева направо (т. е. хронологически).

1. Последовательность будет выглядеть следующим образом:



2. Вычислите значение выражения:

N * (R – 0,5) – X.


Для нашего примера:

= 12 * (8–0,5) – 72 = 12 * 7,5 – 72 = 90–72 = 18.

3. Вычислите значение выражения:

(X * (X – N)) / (N – 1).


Для нашего примера:

= (72 * (72–12)) / (12 – 1) = (72 * 60) / 11 = 4320 / 11 = 392,727272.


4. Возьмите квадратный корень числа, полученного в п. 3. В нашем примере:


392,727272 ^ (1/2) = 19,81734777.


5. Разделите ответ из п. 2 на ответ из п. 4. Это и есть счет Z. В нашем примере:


18 / 19,81734777 = 0,9082951063.


6. Теперь преобразуйте счет Z в доверительную границу. Распределение периодов является биномиальным. Однако, когда рассматриваются 30 или больше сделок, мы можем использовать нормальное распределение как близкое к биномиальному. Таким образом, если вы используете 30 или более сделок, вы просто можете преобразовать ваш счет Z в доверительную границу, основываясь на уравнении (3.22) для нормального распределения.


Серийный тест подскажет вам, содержит ли ваша последовательность выигрышей и проигрышей больше или меньше полос (серий выигрышей или проигрышей), чем можно было бы ожидать от действительно случайной последовательности, в которой нет зависимости между испытаниями. Так как в нашем случае мы находимся на уровне относительно низкой доверительной границы, то можно допустить, что между сделками в этой последовательности нет зависимости.

Если счет Z имеет отрицательное значение, то при расчете доверительной границы просто возьмите его абсолютное значение. Отрицательный счет Z говорит о положительной зависимости, т. е. полос меньше, чем при нормальном распределении вероятности, и, следовательно, выигрыши порождают выигрыши, а проигрыши порождают проигрыши. Положительный счет Z говорит об отрицательной зависимости, т. е. полос больше, чем при нормальном распределении вероятности, и, следовательно, выигрыши порождают проигрыши, а проигрыши порождают выигрыши.

Какой уровень доверительной границы считать приемлемым? Статистики, как правило, рекомендуют доверительную границу не менее 90 %. Некоторые рекомендуют доверительную границу свыше 99 %, чтобы быть уверенным, что зависимость существует, другие рекомендуют менее строгий минимум 95,45 % (2 стандартных отклонения).

Очень редко система демонстрирует доверительную границу выше 95,45 %, чаще всего она менее 90 %. Даже если вы найдете систему с доверительной границей от 90 до 95,45, это не будет золотым самородком. Чтобы убедиться в зависимости, на которой можно хорошо заработать, вам нужно как минимум 95,45 %.

Пока зависимость находится на приемлемой доверительной границе, вы можете изменить систему, чтобы улучшить торговые решения, даже если не понимаете основной причины зависимости. Если вы узнаете причину, то сможете оценить, когда зависимость действовала, а когда нет и когда можно ожидать изменения степени зависимости.

До настоящего момента мы смотрели на зависимость только с точки зрения того, была ли последняя сделка выигрышем или проигрышем. Теперь мы попытаемся определить, есть ли в последовательности выигрышей и проигрышей зависимость или нет. Серийный тест на наличие зависимости автоматически принимает в расчет процент выигрышей и проигрышей. Однако серийный тест по периодам выигрышей и проигрышей учитывает последовательность выигрышей и проигрышей, но не их размер. Для того чтобы получить истинную независимость, не только сама последовательность выигрышей и проигрышей должна быть независимой, но и размеры выигрышей и проигрышей в последовательности также должны быть независимыми. Выигрыши и проигрыши могут быть независимыми, однако их размеры могут зависеть от результатов предыдущей сделки (или наоборот). Возможным решением является проведение серийного теста только с выигрышными сделками. При этом полосы выигрышей следует разделить на длинные (по сравнению со средним значением распределения вероятности) и менее длинные, и только затем искать зависимость между размером выигрышных сделок. Потом необходимо провести ту же процедуру с проигрышными сделками.

Корреляция

Есть другой и, может быть, лучший способ определения зависимости между размерами выигрышей и проигрышей. Этот метод позволяет рассмотреть размеры выигрышей и проигрышей с совершенно другой стороны, и, когда он используется вместе с серийным тестом, взаимосвязь сделок измеряется с большей глубиной. Для количественной оценки зависимости или независимости данный метод использует коэффициент линейной корреляции r, который иногда называют пирсоновским r.

Посмотрите на рис. 1.2. На нем изображены две абсолютно коррелированные последовательности. Мы называем это положительной корреляцией.


Рис. 1.2. Положительная корреляция (r = +1,00)



Рис. 1.3. Отрицательная корреляция (r = –1,00)


Теперь посмотрите на рис. 1.3. Он показывает две последовательности, которые находятся точно в противофазе. Когда одна линия идет вверх, другая следует вниз (и наоборот). Мы называем это отрицательной корреляцией.

Формула для коэффициента линейной корреляции r двух последовательностей Х и Y такова (черта над переменной обозначает среднее арифметическое значение):



Расчет следует производить следующим образом.

1. Вычислите среднее Х и Y (т. е.  и ).


2. Для каждого периода найдите разность между Х и , а также Y и .


3. Теперь рассчитайте числитель. С этой целью для каждого периода перемножьте ответы из шага 2, другими словами, для каждого периода умножьте разность между Х и  на разность между Y и .


4. Сложите результаты, полученные в шаге 3, за все периоды. Это и есть числитель.


5. Теперь найдите знаменатель. Для этого возьмите результаты шага 2 для каждого периода как для разностей Х, так и для разностей Y и возведите их в квадрат (теперь они будут положительными значениями).


6. Сложите возведенные в квадрат разности Х за все периоды. Проделайте ту же операцию с возведенными в квадрат разностями Y.


7. Извлеките квадратный корень из суммы возведенных в квадрат разностей Х, которые найдены в шаге 6. Теперь проделайте то же с Y, взяв квадратный корень суммы возведенных в квадрат разностей Y.


8. Умножьте два результата, которые вы нашли в шаге 7, т. е. умножьте квадратный корень суммы возведенных в квадрат разностей Х на квадратный корень суммы возведенных в квадрат разностей Y. Это и есть знаменатель.


9. Разделите числитель, который вы нашли в шаге 4, на знаменатель, который вы нашли в шаге 8. Это и будет коэффициент линейной корреляции r.


Значение r всегда будет между +1,00 и –1,00. Значение 0 указывает, что корреляции нет.

Теперь посмотрите на рис. 1.4. Он представляет следующую последовательность из 21 сделки:


1, 2, 1, –1, 3, 2, –1, –2, –3, 1, –2, 3, 1, 1, 2, 3, 3, –1, 2, –1, 3.


Чтобы понять, есть ли какая-либо зависимость между предыдущей и текущей сделкой, мы можем использовать коэффициент линейной корреляции. Для значений Х в формуле для r возьмем P&L по каждой сделке. Для значений Y в формуле для r возьмем ту же самую последовательность P&L, только смещенную на одну сделку. Другими словами, значение Y – это предыдущее значение Х (рис. 1.5).



Рис. 1.4. Отдельные результаты 21 сделки



Рис. 1.5. Отдельные результаты 21 сделки, сдвинутые на 1 сделку


Средние значения различаются, потому что вы усредняете только те X и Y, которые частично перекрывают друг друга, поэтому последнее значение Y (3) не вносит вклад в , а первое значение Х (1) не вносит вклад в .

Числитель является суммой всех значений из столбца Е (0,8). Чтобы найти знаменатель, мы извлечем квадратный корень из итогового значения столбца F и получим 8,555699, потом извлечем квадратный корень из итогового значения столбца G и получим 8,258329, затем перемножим их, что даст в результате 70,65578. Теперь разделим числитель 0,8 на знаменатель 70,65578 и получим 0,011322. Это наш коэффициент линейной корреляции r. В данном случае коэффициент линейной корреляции 0,011322 едва ли о чем-то говорит, но для многих торговых систем он может достигать бóльших значений. Высокая положительная корреляция (по крайней мере 0,25) говорит о том, что большие выигрыши редко сменяются большими проигрышами, и наоборот. Отрицательные значения коэффициента корреляции (между –0,25 и –0,30) подразумевают, что после больших проигрышей следуют большие выигрыши, и наоборот. Для заданного количества сделок с помощью метода, известного как преобразование Z Фишера, коэффициент корреляции можно преобразовать в доверительный уровень. Эта тема рассматривается в приложении C. Отрицательную корреляцию так же, как и положительную, можно использовать в своих интересах. Например, если обнаружена отрицательная корреляция и система показала большой проигрыш, то в следующей сделке можно ожидать большого выигрыша и, таким образом, открыть больше контрактов, чем обычно. Если и эта сделка принесет убыток, то он не должен быть очень большим (из-за отрицательной корреляции).

Наконец, при определении зависимости вы должны провести тесты по разным сегментам данных. Для этого разбейте ваши данные на две или более частей. Если вы увидите зависимость в первой части, тогда посмотрите, существует ли эта зависимость во второй части и т. д. Это поможет исключить случаи, где появляется кажущаяся зависимость, но фактически ее нет.

1
...