Кластерный анализ в портфельном инвестировании

В свете вышесказанного, перед инвесторами возникают следующие проблемы:

1) Определение с максимальной степенью точности существенных факторов и их влияние на курс ценных бумаг;

2) Составление научно-обоснованного прогноза динамики поведения этих ценных бумаг, основываясь на изучении данных факторов;

3) Составление на основе полученных сведений о фондовом рынке оптимального инвестиционного портфеля, позволяющего максимизировать прибыль от вложений при заданной степени риска.

Рис.1 Группировка ценных бумаг со сходными тенденциями

Как теоретики, так и практики, занимающиеся оптимизацией портфеля ценных бумаг, регулярно сталкиваются с трудностями, когда перед ними возникает практически неизбежная задача разбиения множества существующих ценных бумаг на различные группы с относительно однородной структурой. Краеугольным камнем проблемы является вопрос подбора и согласования выбранных факторов так, чтобы их представление в многомерной системе координат достаточно точно производило разбиение на кластеры, характеризующиеся максимально схожими тенденциями. При этом нужно учитывать, что даже если бы и удалось подобрать точные коэффициенты для существующих количественных факторов, всегда найдутся не менее важные качественные показатели, выразить которые в количественной форме практически невозможно. В связи с этим принято группирование ценных бумаг на основе существующих индустриальных и прочих классификаций, а также отталкиваясь от априорной доходности (ex ante).

Разбиение множества ценных бумаг на отдельные кластеры в зависимости от динамики доходности осуществляется следующим образом: данные по доходности ценных бумаг на протяжении базы прогноза компонуются в общую матрицу вида:

[1,стр.143]

где Rkm – доходность по k-й ценной бумаге за m-й период,

Далее, разбиение на кластеры происходит через вычисление евклидова расстояния между ценными бумагами p и q по формуле

[1,стр.144]

где m – номер периода,

sRm – среднеквадратическое отклонение доходности за период m.

Критическая величина разбиения предполагается равной квадратному корню из количества периодов T, то есть средней величине евклидового расстояния:

[1,стр.144]

Преимущество данной методики заключается, во-первых, в том, что она позволяет с крайне высокой степенью точности группировать ценные бумаги со сходными тенденциями в изменении доходности на протяжении всего периода, определяющего базу прогноза, что дает основания рассчитывать на сохранение подобной тенденции и в дальнейшем.

Вторым ее преимуществом является возможность полной автоматизации, что значительно облегчает работу, позволяя использовать современные вычислительные средства, а также обрабатывать однородную информацию, получаемую из электронных баз данных. Поэтому она может быть без особых затруднений внедрена не только в компьютерных системах отдельных фирм, занимающихся инвестированием, но также и на соответствующих ресурсах сети интернет.

Пожалуй, наиболее острой проблемой, возникающей перед специалистами по факторному анализу, является подбор четких и ясных критериев, позволяющих отсеять малозначимые факторы, повышающие размерность модели без увеличения ее точности, и при этом правильно определить вес для остальных факторов. Доказательством важности этого вопроса, а также отсутствия однозначно оптимальных решений, является изобилие всевозможных критериев отбора значимых компонент. Достаточно назвать такие известные методы, как расчет варимакс-критерия, n-критерий, отбор при помощи t-критерия Стьюдента и т.п.

Очевидно, что вводить в модель очередной фактор целесообразно только в том случае, если он в достаточной степени понижает уровень энтропии, а, следовательно, увеличивает значение R-квадрат. Каким образом численно выразить прирост данной величины в зависимости от количества вводимых факторов? Рассмотрим эту проблему в свете коэффициентов последовательной детерминации.

Пусть имеются N факторов X1 .XN, предположительно влияющих на доходность инвестиционного портфеля. При вводе в уравнение регрессии фактора Xi показатель R-квадрат принимает некоторое определенное значение. Выберем фактор, при котором оно будет наибольшим:

[1,стр.145]

где P12 - коэффициент последовательной детерминации для данного фактора,

ryx1 - парный коэффициент корреляции между доходностью и этим фактором.

Теперь вводится в полученное уравнение регрессии второй фактор таким образом, чтобы значение R-квадрат снова оказалось максимально возможным, и затем рассчитываем второй коэффициент последовательной детерминации:

[1,стр.147]

Аналогичным образом рассчитываем следующие коэффициенты:

и т.д. [1,стр.147]

Базовый отбор факторов продолжается до тех пор, пока величина получаемых коэффициентов последовательной детерминации не станет меньше некоторого критического значения. Учитывая, что в механизм расчета скорректированной величины R-квадрат входит поправка на возрастание энтропии при вводе новых факторов, ее прирост на каждой итерации алгоритма должен быть положительным и, следовательно, критическое значение p должно быть больше нуля.

Данный метод позволяет отобрать из всех имеющихся факторов именно те, которые оказывают наибольшее влияние на доходность рассматриваемых ценных бумаг. Это позволяет существенно понизить размерность модели, создаваемой на основе методики, ускорить вычисления и при этом отбросить данные, не имеющие большого влияния на интересующие нас показатели. Как правило, от выявленных главных компонент зависит не менее 85% общей дисперсии, что лишний раз показывает эффективность выбранного метода анализа.

Теперь, когда определены методы отбора факторов и технология разбиения множества ценных бумаг на отдельные кластеры, можно приступать непосредственно к построению методики оптимизации инвестиционного портфеля. Учитывая, что в настоящее время внедрение любой экономической методики немыслимо без автоматизации, существует алгоритм, по которому надлежит производить операции для получения искомого результата: оптимизированного набора ценных бумаг, позволяющих получить максимальную прибыль при заданном уровне риска.

На первом этапе определяются исходные массивы данных, которые подлежат математической обработке.

В начале имеются следующими исходными данными: S1, S2, ., SN – рассматриваемое множество ценных бумаг;

[1,стр.149]

матрица доходности ценных бумаг S1-SN за периоды [0 ; T],

Страница:

Последние рефераты