Ознакомительная версия.
Если мы хотим определить приведенное параметрическое оптимальное f, нам придется преобразовать эти торговые прибыли и убытки в процентные повышения и понижения (основываясь на уравнениях с (2.10а) по (2.10в)). Затем мы преобразуем эти процентные прибыли и убытки, умножив их на текущую цену базового инструмента. Например, P&L № 1 составляет 0,18. Допустим, что цена входа в эту сделку была 100,50. Таким образом, процентное повышение по этой сделке будет 0,18/100,50 = 0,001791044776. Теперь предположим, что текущая цена базового инструмента составляет 112,00. Умножив 0,001791044776 на 112,00, мы получаем приведенное P&L = 0,2005970149. Чтобы получить полные приведенные данные, необходимо проделать эту процедуру для всех 232 торговых прибылей и убытков.
Независимо от того, будем мы проводить расчеты, используя приведенные данные, или нет (в этой главе мы не будем использовать приведенные данные), мы все равно должны рассчитать среднее (арифметическое) и стандартное отклонение совокупности этих 232 торговых прибылей и убытков. В нашем случае это 0,330129 и 1,743232 соответственно (если бы мы проводили операции на приведенной основе, нам бы понадобилось определять среднее и стандартное отклонение по приведенным торговым P&L). Теперь мы можем использовать уравнение (3.16), чтобы преобразовать каждую отдельную торговую прибыль и убыток в стандартные единицы.
(3.16) Z=(X-U)/S,
где U = среднее значение данных;
S = стандартное отклонение данных;
Х = наблюдаемая точка данных.
Для сделки № 1 преобразуем прибыль 0,18 в стандартные единицы:
Z= (0,18-0,330129)/1,743232 =-0,150129/1,743232 =-0,08612106708
Таким же образом следующие три сделки -1,11; 0,42 и -0,83 преобразовываются в -0,8261258398; 0,05155423948 и -0,6655046488 стандартных единицы. После того, как мы преобразуем все торговые прибыли и убытки в стандартные единицы, можно собрать в ячейки теперь уже нормированные данные. Вспомните, что при наличии ячеек теряется часть информации о распределении (в нашем случае о распределении отдельных сделок), но характер распределения остается тем же. Допустим, мы помещаем эти 232 сделки в 10 ячеек. Количество ячеек выбрано произвольно — мы могли бы выбрать 9 или 50 ячеек.
Рисунок 3-16 232 сделки в 10 ячейках от -2 до +2 сигмы и нормальное распределение
Когда мы размещаем данные в ячейки, то должны выбрать интервал значений, в котором расположены ячейки. Мы выберем интервал от -2 до +2 сигмы. Это означает, что у нас будет 10 одинаковых ячеек между -2 стандартными единицами и +2 стандартными единицами. Так как между -2 и +2 4 стандартных единицы и мы делим этот диапазон на 10 равных частей, то получаем 4 / 10 = 0,4 стандартных единицы в качестве размера или «ширины» каждой ячейки. Поэтому наша первая ячейка будет содержать те сделки, которые были в диапазоне от -2 до -1,6 стандартных единиц, следующая ячейка будет содержать сделки от-1,6 до-1,2, затем от -1,2 до -0,8, и так далее, пока последняя ячейка не вместит сделки между 1,6 и 2 стандартными единицами. В нашем случае те сделки, которые менее –2 стандартных единиц или больше +2 стандартных единиц, не будут размещены в ячейки, и мы их проигнорируем. Если бы мы пожелали, то включили бы их в крайние ячейки, разместив точки данных менее -2 в ячейку от -2 до -1,6, и таким же образом поступили бы в отношении тех точек данных, которые больше 2. Конечно, мы могли бы выбрать более широкий диапазон, но эти сделки находятся за пределами выбранных ячеек, и мы их не учитываем. Другими словами, мы не рассматриваем сделки, P&L в которых меньше, чем 0,330129 - (1,743232 * 2) = = -3,1563, или больше, чем 0,330129 + (1,743232 * 2) = 3,816593. Мы сейчас создали распределение торговых P&L системы. Распределение содержит 10 точек данных, так как мы решили работать с 10 ячейками. Каждая точка данных отражает число сделок, которые попадают в эту ячейку Каждая сделка не может попасть более чем в 1 ячейку и если сделка находится за пределами 2 стандартных единиц с любой стороны среднего (P&L < -3,156335 или > 3,816593), тогда она не будет представлена в этом распределении. Рисунок 3-16 показывает распределение, которое мы только что рассчитали. Может показаться, что распределение P&L торговой системы должно всегда быть смещено вправо за счет больших выигрышей. Наше распределение 232 торговых P&L представляет систему, которая в основном приносит небольшие прибыли. Многие трейдеры имеют ошибочное мнение, что распределение P&L должно быть смещено вправо для всех торговых систем. Это не всегда верно, что и подтверждает рисунок 3-16. Разные рыночные системы имеют различные распределения, и вам не следует ожидать, что все они будут одинаковыми. Также на рисунке 3-16 показано нормальное распределение для 232 торговых P&L, если бы они были нормально распределены. Это было сделано для того, чтобы вы могли графически сравнить торговые P&L для полученного и нормального распределения. Сначала нормальное распределение рассчитывается для границ каждой ячейки. Для самой левой ячейки это Z =-2 и Z=-1,6. Теперь подставим полученные значения Z в уравнение (3.21), чтобы рассчитать вероятность. В нашем примере это соответствует 0,02275 для Z = -2 и 0,05479932 для Z = -1,6. Затем возьмем абсолютное значение разности этих двух значений, которое в нашем примере будет ABS(0,02275 - 0,05479932) = = 0,03204932. Затем умножим полученный ответ на количество точек данных, то есть на 232 (мы все еще должны использовать 232 сделки, хотя некоторые исключаются, так как находятся вне диапазона выбранных ячеек). Таким образом, если бы данные были нормально распределены и размещены в 10 ячеек равной ширины между -2 и +2 сигма, тогда самая левая ячейка содержала бы 0,03204932 * 232 = 7,43544224 элемента. Если сделать расчет для каждой из 10 ячеек, мы получим нормальную кривую, показанную на рисунке 3-16.
Поиск оптимального f пo нормальному распределению
Сейчас мы разработаем метод поиска оптимального f по нормально распределенным данным. Как и формула Келли, это способ относится к параметрическим методам. Однако он намного мощнее, так как формула Келли отражает только два возможных результата события, а этот метод позволяет получить полный спектр результатов (при условии, что результаты нормально распределены). Удобство нормально распределенных результатов (кроме того факта, что в реальности они часто являются пределом многих других распределений) состоит в том, что их можно описать двумя параметрами. Формулы Келли дадут вам оптимальное f для бернуллиевых результатов, если известны два параметра: отношение выигрыша к проигрышу и вероятность выигрыша. Метод расчета оптимального f, о котором мы сейчас расскажем, также требует только два параметра — среднее значение и стандартное отклонение результатов. Вспомним, что нормальное распределение является непрерывным распределением. Для того, чтобы использовать этот метод, необходимо дискретное распределение. Далее вспомним, что нормальное распределение является неограниченным распределением. Первые два шага, которые мы должны сделать для нахождения оптимального f по нормально распределенным данным, — это определить, (1) на сколько сигма от среднего значения мы усекаем распределение и (2) на сколько равноотстоящих точек данных мы разделим интервал между двумя крайними точками, найденными в (1). Например, мы знаем, что 99,73% всех точек данных находятся между плюс и минус 3 сигма от среднего, поэтому можно использовать 3 сигма в качестве параметра для (1). Другими словами, мы рассматриваем нормальное распределение только между минус 3 сигма и плюс 3 сигма от среднего значения. Таким образом, мы охватываем 99,73% всей активности в пределах нормального распределения. Вообще, для этого параметра лучше использовать значение от 3 до 5 сигма. Что касается числа равноотстоящих точек данных (шаг 2), мы будем использовать число, как минимум, в десять раз большее количества стандартных отклонений, которое используется в (1). Если мы выберем 3 сигма для (1), тогда возьмем, по крайней мере, 30 равноотстоящих точек данных для (2). Это означает, что на горизонтальной оси следует отметить отрезок от минус 3 сигма до плюс 3 сигма и нанести на нем 30 равноотстоящих точек. Так как между минус 3 сигма и плюс 3 сигма находится 6 сигма и нам надо разместить на этом отрезке 30 равноотстоящих точек, мы должны разделить 6 на 30 - 1, или 29. Это даст нам 0,2068965517. Первой точкой данных будет минус 3. Затем мы будем добавлять 0,2068965517 к каждой предыдущей точке, пока не достигнем плюс 3. И так нанесем 30 равноотстоящих точек данных между минус 3 и плюс 3. Нашей второй точкой данных будет -3 + 0,2068965517 =-2,793103448, третьей точкой данных будет 2,79310344 + 0,2068965517 = -2,586206896, и так далее. Таким образом, мы зададим 30 точек на горизонтальной оси. Чем больше точек данных вы используете, тем лучше будет разрешение нормальной кривой. Использование количества точек в десять раз больше числа стандартных отклонений не является строгим правилом определения минимального числа точек данных. Нормальное распределение является непрерывным распределением. Однако мы должны сделать его дискретным, чтобы по нему найти оптимальное f. Чем большее число равноотстоящих точек данных мы используем, тем ближе наша дискретная модель будет к реальному непрерывному распределению. Почему не следует использовать слишком большое число точек данных? Чем больше точек данных вы будете использовать в нормальной кривой, тем больше времени понадобится для поиска оптимального f. Даже если вы будете использовать компьютер для поиска оптимального f, при большом количестве точек данных расчет займет достаточно много времени. Более того, каждая дополнительная точка данных увеличивает разрешение в меньшей степени, чем предыдущая точка. Мы будем называть описанные выше два вводных параметра ограничивающими параметрами (bounding parameters). Третий и четвертый шаги позволят определить среднюю арифметическую сделку и стандартное отклонение для рыночной системы, с которой вы работаете. Если у вас нет механической системы, можно получить эти числа из брокерских отчетов. Один из реальных плюсов рассматриваемого метода состоит в том, что для его использования не обязательно работать по механической системе, вам даже не нужны брокерские отчеты или торговые результаты в бумажной форме. Метод можно использовать, рассчитав два вводных параметра: среднюю арифметическую сделку (в пунктах или долларах) и стандартное отклонение сделок (в пунктах или долларах, в зависимости от того, что вы используете для средней арифметической сделки). Если стандартное отклонение сложно рассчитать, тогда просто попытайтесь понять, насколько, в среднем, сделка будет отличаться от средней сделки. Рассчитав среднее абсолютное отклонение, вы можете использовать уравнение (3.18) для преобразования оценочного среднего абсолютного отклонения в оценочное стандартное отклонение:
Ознакомительная версия.