<<
>>

15.2. Пример приложения для анализа кредитных рисков по странам

В гл. 3 мы уже обсуждали черты сходства и различия между инвестициями взаимных фондов в зарубежные рынки. В гл. 6 нами были рассмотрены, в частности, инвестиционные возможности, возникающие на развивающихся рынках.
В настоящем разделе мы остановимся на рисках, связанных с инвестированием в различные фондовые рынки мира. Мы используем СОК для анализа и выявления групп стран, имеющих сходную структуру рисков.

Наш анализ основывается на данных, приводимых в статье «Глобальные инвестиции — рискованная игра», опубликованной Грегом Ипом (Greg Ір) в Wall Street Journal от 26 июня 1997 г. В данной работе Грег Ип предпринял классификацию 52 стран мира по производительности экономики, политическим, экономическим и рыночным рискам, объему и ликвидности фондового рынка, а также по степени его регулируемости и эффективности. В результате данного анализа были сформированы пять групп: (і) рынки, наиболее сходные с рынком США; (и) рынки других развитых стран; (iii) сформированные и развивающиеся рынки; (iv) новые развивающиеся рынки и (v) переходные рынки. Состав каждой из групп приводится ниже.

Группа 1 включает в себя страны, условия в которых более всего напоминают ситуацию, характерную для США: сами Соединенные Штаты, Австралию, Канаду, Данию, Францию, Германию, Ирландию, Нидерланды, Новую Зеландию, Швецию, Швейцарию и Великобританию.

Группа 2 состоит из других развитых стран, включая Австрию, Бельгию, Финляндию, Гонконг, Италию, Японию, Норвегию, Сингапур и Испанию.

Группа 3, образованная странами со сформированными и развивающимися рынками, включает в себя Аргентину, Бразилию, Чили, Грецию, Корею, Малайзию, Мексику, Филиппины, Португалию, Южную Африку и Таиланд.

Группа 4, охватывающая страны с новыми развивающимися рынками, состоит из Китая, Колумбии, Чешской Республики, Венгрии, Индии, Индонезии, Израиля, Польши, Шри-Ланки, Тайваня и Венесуэлы.

В Группу 5 вошли страны с переходными рынками: Египет, Иордания, Марокко, Нигерия, Пакистан, Перу, Россия, Турция и Зимбабве.

Отметим, что в своем анализе Грег Ип использовал США в качестве основного эталона для классификации; в полученной им классификации страны разделены на пять примерно одинаковых по численности групп.

Отметим также, что используемые Ипом критерии принадлежности стран к той или иной группе в явном виде не сформулированы; более того, для стран с так называемым переходным рынком значения многих параметров отсутствуют (данные по всем показателям имеются только по трем из них).

Анализируя данные, приведенные в статье Грега Ипа, при помощи СОК, мы придерживались описанной выше последовательной процедуры визуализации и кластеризации рисков. Для облегчения этой задачи нами использовался программный пакет Viscovery SOMine, разработанный компанией Eudaptics GmbH. Обладая удобным, интуитивно понятным интерфейсом, данный пакет позволяет анализировать данные в интерактивном режиме.

Этап 1

Определите цель анализа

Целью нашего анализа является проверка аналитических выводов в отношении кредитных рисков по различным странам, опубликованных в Wall Street Journal от 26 июня 1997 г., а также более глубокая интерпретация группировки и визуального представления соответствующих данных. Наша дополнительная цель состоит в получении обобщающих данных по каждой группе (которые отсутствуют в статье Ипа), а также в демонстрации возможности нахождения отсутствующих значений некоторых показателей, в частности для стран с так называемой переходной экономикой.

Этап 2

Выберите источник данных и определите свои требования к ним

Анализ, проведенный Грэгом Ипом, основывается на данных по различным странам, публикуемых в Wall Street Journal, использующем, в свою очередь, данные Dow Jones, Morgan Stanley, Standard & Poor, Moody's Investment Services, а также Международной Финансовой Корпорации, Мирового Банка и Международного Валютного Фонда. Все упомянутые источники имеют стабильную репутацию, и можно без всякого риска утверждать, что предоставляемые ими данные являются весьма надежными (с точки зрения отсутствия ошибок при копировании и опубликовании).

Этап 3

Определитесь в отношении объема данных и используемых переменных

Таблицы, представленные в Wall Street Journal, содержат следующие показатели для 52 стран:

совокупный годовой доход за 3 года (по состоянию на 31 марта 1997 г., долл.

США);

показатель доходности акций (Р/Е — доход на одну акцию от 17 апреля 1997 г. с использованием данных за 1996 финансовый год в качестве базы);

доходность по форвардным сделкам (Р/Е, по состоянию на 5 января 1997 г.);

исторический прирост доходности (пятилетний среднегодовой процент прироста по состоянию на 17 апреля 1997 г.);

прогнозируемая доходность (среднегодовой процент прироста отношения цены к доходу (Р/Е) в течение последующих пяти лет по состоянию на 17 апреля 1997 г.);

отношение рыночной цены к дивидендам (по состоянию на 17 апреля 1997 г.);

ВНП на душу населения за 1995 г. (в долларах США);

реальный прирост ВВП (среднее за 1990-1995 г.,%);

прогнозируемый прирост ВВП в 1997 г.;

прогнозируемый уровень роста инфляции в 1997 г.;

процентная ставка по краткосрочным займам (май-июнь 1997 г.);

капитализация рынка (по состоянию на 31 декабря 1996 г., млн. долл. США);

оборачиваемость капитала (объем торгов в 1996 г. в процентах от капитализации рынка по состоянию на 31 декабря 1996 г.,%);

общее число официально котируемых компаний (по состоянию на 31 декабря 1996 г.);

изменчивость (волатильность, стандартное отклонение на интервале продолжительностью в год. среднее за 5 лет по состоянию на март 1997 г.);

корреляция с рынком США (пятилетнее среднее);

эффективность расчетов (объем торгов, число несостоявшихся сделок из 100 возможных по состоянию на I квартал 1997 г.);

эффективность номинального держания акций (сбор дивидендов, права акционеров по состоянию на 1 квартал 1997 г.);

операционные расходы при биржевых операциях (среднегодовое значение в базисных пунктах по данным за 1993-1996 гг.);

возраст рынка (1997 минус год начала торгов на соответствующих биржах).

В процессе анализа мы не использовали показатели, измеряемые в местной валюте, равно как и показатели кредитного рейтинга агентства Standard & Poor, определяемые по шкале от AAA до В. Для первой СОК мы ограничились данными по показателям экономической эффективности — ВНП на душу населения, прирост ВНП, прогнозируемый прирост ВНП, скорость инфляции и процент по краткосрочным кредитам. Впоследствии мы расширили круг используемых данных, добавив ряд рыночных показателей, в том числе капитализацию рынка, число компаний-участников, доходность (Р/Е). оборачиваемость капитала, волатильность и т.д.

Прежде всего мы выбрали источник данных. Программа Viscovery обрабатывала информацию об источниках, содержащуюся в текстовых файлах или электронных таблицах Excel. Эти входные данные были представлены в виде строк и столбцов, причем строки содержали данные по странам, а столбцы — по перечисленным выше показателям. В первой строке таблицы входных данных содержалось также сокращенное обозначение показателя, а в последнем столбце — метки или сокращенные названия стран.

Если название показателя не определено, компоненты именуются следующим образом: «Компонента 1», «Компонента 2» и т.д. Пропущенные данные отмечались знаками «..» или «х».

Чтобы получить нашу первую карту, мы выбираем пункт «New Мар» (Новая карта) в меню «File». В результате появляется так называемый «мастер» создания новой карты, последовательно проводящий пользователя по всем этапам процесса ввода информации, необходимой для создания карты.

Появляется диалоговое меню «Select the Data File» (Выбор файла данных), в котором мы выбираем файл формата .xls или .txt, где хранятся исходные данные (рис. 15.1). Последовательно щелкнув по кнопкам «ОК» и «Next», мы переходим к следующему окну.

В следующем окне под названием «Components» (Компоненты) производится выбор переменных для анализа (переменные, показатели и компоненты будут ниже использоваться как синонимы для обозначения столбцов в файлах данных). Таким образом, один файл можно использовать для проведения целого ряда аналитических процедур с использованием различных подмножеств данных, т.е. создавать отдельные файлы для каждой разновидности анализа не требуется (как, например, в программе SOM_ РАК). В окне «Components» показаны также максимальное и

Рисунок 15.1. Диалоговое окно для выбора файла.

Components Component Minimum Maximum Sc. g Priori^ * CcmpROF 3i*tU -22 56 Var ance 1 0 * PEvs1996E 8.G 54 Variance 1.0 ^ PE Forward 53 31 Variance 1 ft v Hist Earn.Growth 5.Є 1.1E+002 Variance 1.0 •s Pro j Earn Growth 42 24 Variance 1 0 Z Did Yld 0.9 68 Variance 1.0 _ GNP/capita 1995 2.6E+002 41E+004 Vanance 1.t I GDP Growth 90-95 -9.6 13 Variance 1.0 Proj GDP Growth... 0.7 95 Variance 1.0 ._ Proj Inflation 1 75 Variance 1.0 Short Interest rate 0 62 72 Variance 1 0 | «¦ 1 к Details

[ P-eprocessing J

Выбор переменных для анализа в диалоговом окне «Components»минимальное значения каждой из компонент

Рисунок 15.2.

Выбор переменных для анализа в диалоговом окне «Components»

минимальное значения каждой из компонент

(см. рис. 15.2). После того как переменные для анализа выбраны, можно приступить к предобработке данных, перейдя к следующему окну при помоши кнопки «Preprocessing» или «Next».

Этап 4

Решите, каким образом будет осуществляться предобработка переменных

При нажатии кнопки «Preprocessing» (Предобработка) появляется окно «Data Modification» (Модификация данных) (см. рис. 15.3). В этом окне предлагаются различные варианты предобработки. Основными из них являются: (і) нормирование (масштабирование) данных, (іі) определение приоритетов переменных, (iii) модификация данных и (iv) преобразование данных.

Data Modification

Componer ts

PEFoward Hist Earn Growth PtorE-ain.Giwth Did Yld

GNP/capfe 1395 GDP Giowth 90 95 Pio|GDPGiowth97 Pro, Inflation Short Inteiest rale MartetCaptml)

6 roissng values

Histogram -if PEvslQSCE

ге 52 за ia

Modfcahon

54 4

- V

T lanslcrmation

® None Г Sigmoid Г Logarlhmic

gradient

from, j 8.6 Jo

AnpWy 1 Suppress by

Окно «Data Modification» для выбора масштаба, а также формы изменения и преобразования данных.

Рисунок 15.3.

Окно «Data Modification» для выбора масштаба, а также формы изменения и преобразования данных.

flffsel:

В процессе создания карты всегда используется внутреннее представление данных. Это внутреннее представление определяет топологию распределения данных и, таким образом, структуру карты, получаемой на выходе. Пакет Viscovery дает пользователю возможность задать некоторые параметры внутреннего представления. После задания этих параметров определять больше ничего не требуется. Программа Viscovery производит расчет всех масштабных факторов, приоритетов и преобразований сама, обшаясь с пользователем на языке исходных единиц измерения данных. Ход процесса отображается в окне «Components» и в окне «Pro-perties».

Нормирование данных

Для определения параметров нормирования компонент имеются четыре опции.

« Нормирование на основе дисперсии соответствует пункіу меню «Variance». При этом производится деление компоненты на ее стандартное отклонение.

Нормирование на основе диапазона соответствует пункту меню «Range». При этом выделенная компонента делится на диапазон изменения ее ве-личины. Если программа предлагает нормирование по дисперсии (Variance), а пользователь вручную выбирает нормирование по диапазону (Range), то таким образом устанавливается более высокий приоритет соответствующей переменной. Относительное влияние этой переменной на процесс формирования карты, как правило, возрастает.

Нормирование на основе привязки к другим переменным (пункт меню «Linking») означает, что, если две компоненты измеряются в одних и тех же единицах, например метрах, и обе имеют один и тот же диапазон из-менения, их может быть удобно нормировать с помощью одного фактора. Программа предлагает простой способ связывания нормировки разных переменных.

Нормирование по умолчанию означает, что компонента нормируется по ее стандартному отклонению, если диапазон ее изменения не превышает восьми стандартных отклонений. В противном случае нормирование производится по диапазону ее изменения. Данное число выбрано исходя из эвристических соображений, поскольку, как показывает практика, это приводит к более или менее естественному нормированию. В большинстве случаев лучше позволить программе произвести нормирование переменных в соответствии с параметрами, предлагаемыми по умолчанию.

Приоритет переменных

Приоритет переменной придает ей дополнительный вес путем умножения данного фактора на ее внутренний масштаб. Если установленный приоритет превышает еди-ницу, внутреннее представление соответствующей переменной будет охватывать более широкий диапазон, в результате чего кластеры, расположенные вдоль соот-ветствующей оси, станут более протяженными. Напротив, если установленный при оритет не превышает единицы, соответствуюшая компонента будет сжата и ее влияние на результирующую карту снизится. В частности, если фактору приоритета при- своено очень малое значение, например от 0 до 0,1, то влияние соответствующей компоненты становится абсолютно несущественным. Этот эффект можно исполь-зовать при связывании того или иного параметра с остальными данными в целях устранения его влияния на процесс упорядочивания карты. Например, если при анализе рисков по странам мы хотим, чтобы решающую роль в визуальном представлении играла волатильность, мы можем определить приоритет соответствую-щего параметра большим единицы. Аналогично, если мы считаем, что параметр воз-раста рынка не должен иметь большого значения, мы можем установить для него более низкий приоритет. Очевидно, что распределение приоритетов может приводить к значительным изменениям вида результирующих карт.

Модификация данных

Выбирая диапазон изменения переменной на гистограмме и устанавливая величину коэффициента увеличения, можно добавлять либо удалять записи в той или иной области пространства данных. Выбор диапазона увеличения — тонкая процедура, и пользоваться ею следует с осторожностью. Менее критичным является подавление части данных, которое может оказаться полезным при исключении выбросов или выборе диапазона для построения гистограмм. Если пользователя интересуют конкретные участки диапазона изменения данных, увеличение диапазона может послужить эф-фективным средством для того, чтобы сосредоточить процесс создания карты в соответствующей области. Любая модификация множества данных отражается на гистограмме не только выбранной, но и других компонент, поскольку при этом происходит добавление или удаление не только отдельных компонент, но записей данных в целом.

Преобразование данных

Применяя преобразование данных, вы можете изменить характеристики распределения данных. Двумя основными типами преобразования являются логарифмическое и сигмоидное. Для удобства пользователя программа предлагает уста-новленные по умолчанию значения этих параметров, предлагающие достаточно правдоподобный выбор градиентов и смещения.

При преобразовании данных переопределяется внутреннее представление переменной с помощью выбранной функции. Поскольку при этом изменяются расстояния между записями, данная процедура оказывает влияние на внутренние отношения соседства во множестве данных. Поэтому пользоваться этим средством следует с осторожностью.

Предположим, что записи конкретной переменной сконцентрированы главным образом в левой части ее гистограммы и меньшее число записей имеет большие значения. В этом случае можно начать формирование карты с более равномерного распределения плотности данных. Применение логарифмического преобра-зования привело бы к выравниванию распределения, поскольку логарифмическая функция обладает большим «разрешением» в области малых значений на гистограмме. Поэтому меньшие значения оказали бы при этом большее влияние на кла-стеризацию данных. Напротив, сигмоидная функция может создать более сбалан-сированное распределение путем растяжения центра гистограммы и сдвига ее концов. Преобразования с помощью сигмоидной функции позволяют обрабатывать выбросы, не исключая их из рассмотрения.

Поскольку при анализе рисков по странам капитализация рынков небольшого числа развитых стран значительно выше, чем у остальных, для данного парамет-ра равно как и для количества компаний, присутствующих на рынке, мы используем логарифмическое преобразование, что может заметно улучшить визуальное представление данных и кластеризацию стран.

В нашем простом примере мы выбрали способ нормирования данных, предла-гаемый по умолчанию (во всех случаях это нормировка по дисперсии), не применяя каких-либо модификаций или преобразований. Более того, всем переменным были присвоены одинаковые приоритеты. Окно «Data Modification» (Модификация данных), показанное на рис. 15.3, было, таким образом, оставлено в предлагаемом по умолчанию виде.

Этап 5

Выберите метод(ы) кластеризации и визуализации; рассмотрите возможность применения гибридных методов

Поскольку целью этого анализа является проверка справедливости конкретной группировки стран, основанной на показателях риска, наряду с демонстрацией возможностей программы визуализации данных с помощью СОК мы не исполь-зовали никаких других статистических методов или иных комбинаций СОК с другими подходами. Тем не менее совмещение алгоритма СОК с другими методами, такими как, например, генетические алгоритмы, нечеткая логика или анализ глав-ных компонент, представляется крайне перспективным и желательным.

Этап 6

Определите желаемый размер изображения, отношение высоты к ширине и степень детализации

После того как окно предобработки данных закрыто, воспользуемся кнопкой «Next» в окне «Components» для перехода к окну «Target Мар» (Целевая карта) (см. рис. 15.4). В этом окне происходит определение основных параметров карты.

Target Map

Tension Adaption accuracy

Number of rode?

Map rat о С ^UOridtic С Square ff Fato: 100:

500

m

Thorough

NeH

Help

< Е-ЗСІ

Cancel

» размер карты — формат карты, число столбцов и строк, а также общее число узлов;

» режим адаптации — размерность промежуточных карт определяется в процессе адаптации исходя из заданных значений формата, натяжения и точности.

Оценив все перечисленные параметры, мы нажимаем кнопку «ОК», и формирование карты начинается. На экране появляется окно «Adaptation Process» (Ход процесса адаптации) (см. рис. 15.6), отражающее процесс формирования новой карты и значения двух важных параметров ошибки, связанных с процессом обучения. По завершении процесса появляется окно под заглавием «Cluster» (Кластеры), в котором мы видим карту, созданную по входным данным (см. рис. 15.7).

Этап 7

Для обучения карты используйте примеры данных

В данном примере анализа рисков по странам использовались 52 записи. Напомним, что в шести из них имеется множество пропущенных значений. Одна из за-мечательных особенностей алгоритма СОК состоит в том, что он позволяет обрабатывать входные векторы с пропущенными значениями. Таким образом, отсутствие нескольких значений в шести записях по так называемым переходным рынкам не означает, что записи эти должны быть удалены. Если количество про-пущенных данных значительно, скажем, более 50%, соответствующие векторы могут быть исключены по завершении процесса обучения.

Этап 8

Настройте карту на оптимальную кластеризацию и визуализацию

После того как вы создали новую карту, ее можно исследовать несколькими способами:

» вывести отдельные аспекты (компонентные плоскости) данной карты в новых окнах;

рассмотреть карту в каждом из окон по частям;

исследовать значения отдельных узлов и кластеров;

идентифицировать метки отдельных узлов и кластеров либо задать их «вручную».

Просмотр различных аспектов карты

Меню программы Viscovery предлагает ряд команд для открытия отдельных окон, именуемых «Map Windows» (Окнами карты). Каждое из них представляет отдельный аспект основной карты.

Piouerties

Summaiy ] Components] Modified tins | Description J

TICS\FM dataXCounttyRisk\WS J daiaVCRT' R4.XLS

Data source File:

Components Principal pfane ratio

6

100-89 Map izs Format 1C0:75 Columns. 24 Rows. 21 Nodes 4S3 Data records jsed 52 Data records react. 52

Growth 21 к 19 22x19 23x21 1 24x21 24x21 * Adaptor

Cycles: 15

Tension 0.1

Accuracy |T'icroijgh 1 Cancel j Help

Рисунок 15.5. Сводное представление параметров, выбранных для формирования новой карты.

В окне «Adaptation Process» представлена информация о ходе процесса адаптации.

Adaption cycle 6 of 6..

Рисунок 15.6.

В окне «Adaptation Process» представлена информация о ходе процесса адаптации.

Clusters CRTY R~1

клея jiso Contours | Ne#rtxxhood| OudetfiKhoW ynroum скиїв «ге

yffT' фф

1.2 234 346 45 S 5*

• •J1

ф

ф

iL&t* *

) І Ьи»

: у

sn » •

нижней части карты позволяет соотнести используемые цвета с численными значениями.

« Команда «Quantization Error» (Ошибка квантования) меню «Analyze» открывает окно, озаглавленное «Quantization Error». Ошибка квантования представляет собой меру соответствия векторов исходного множества данных тому или иному конкретному узлу. Среднее значение этих величин по всем узлам представляет собой ошибку квантования для карты в целом. Ошибка квантования для узлов, которым не соответствует никаких данных (т.е. частота равна нулю), изображена белым цветом. Ненулевые значения ошибки квантования показаны различными оттенками зеленого. Цветная шкала в нижней части карты позволяет соотнести используемые цвета с численными значениями.

Команда «Curvature» (Искривление) из меню «Analyze» открывает окно «Curvature». Так как карта представляет собой двумерную поверхность, аппроксимирующую распределение данных исходного множества (имеющего обычно большую размерность), она не может быть плоской, но должна искривляться в пространстве данных, образуя, таким образом, кривые, «впадины» и т.д. Окно «Curvature» показывает степень искривления карты в каждом из узлов. Цветная шкала в нижней части карты позволяет соотнести используемые цвета с численными значениями.

Возможность отображения различных частей карты

В каждом окне независимо друг от друга пользователь может вывести или скрыть различные аспекты карты, используя для этого команды меню либо различные комбинации клавиш:

показать или скрыть метки — команда «Labels»;

показать или скрыть разграничители — команда «Separators»;

показать или скрыть изолинии — команда «Iso-Contours»;

показать или скрыть ближайшее окружение — команда «Neighborhood».

Этап 9

Проинтерпретируйте результаты,

обращая внимание на значения отдельных узлов и кластеров

Программа Viscovery предоставляет несколько возможностей для изучения количественных характеристик карты. С помощью окна «Values» (Значения) можно проверить значения компонент в отдельных узлах, а также значения, рассчитанные для набора узлов в определенных участках карты. Окно «Values» появляется в результате выбора пункта «Values» из меню «Analyze».

Если в поле «Range» (Диапазон) введено значение «Node» (Узел), то численные значения, соответствующие данному узлу, будут отображены в окне «Values» пос- ле щелчка по нему (узлу) мышью. Если в поле «Range» введено значение «Cluster» (Кластер), то в результате тех же действий в окне «Values» отразятся численные значения для всего кластера. Данная функция позволяет идентифицировать кластеры по характерным значениям компонент в интерактивном режиме.

В окне «Values» показываются среднее значение, стандартное отклонение, минимальное и максимальное значения, а также сумма значений для одного или нескольких узлов. Узел может быть выбран вручную щелчком мыши в любом из окон карты. Если в это время происходит процесс мониторинга (и он не приостановлен), значения для данного узла будут соответствовать текущей точке мониторинга.

На рис. 15.8 приведен пример окна «Values». В верхней части рисунка мы видим информацию, связанную с узлом на карте кредитных рисков, включающей в себя США, в нижней части рисунка представлены данные об узле карты, включающей некоторые из стран АСЕАН. Различие между этими двумя кластерами очевидно. Для последнего кластера характерны более низкие значения доходности (Р/Е) и прогнозируемого роста доходов, значительно более низкая капитализация и меньшее число действующих компаний. С другой стороны, данные рынки отличает более высокая волатильность по сравнению с рынками США.

Предоставляемая Viscovery возможность проверки значений в отдельных узлах и кластерах дает эффективное средство исследования результатов конкретного визуального представления, а также настройки карты путем изменения порога или минимального размера кластеров.

Этап 10

Определите или расставьте на карте соответствующие метки

Каждый узел может иметь метки, состоящие из одной или нескольких строк. Метки можно нанести на карту, выбирая их из исходного файла данных (т.е. его последнего столбца), либо по отдельности, выбирая нужную область карты и вводя название вручную. Метки сохраняются вместе с картой и могут быть отредактированы.

На рис. 15.9 показана итоговая карта кредитных рисков с нанесенными на нее метками. Отметим, что в данном случае каждая метка состоит из двух строк, содержащих исходные идентификационные номера и сокращенные названия стран.

В то время как нанесение на карту соответствующих меток может внести ясность в разбиение данных по группам и кластерам, полученным с помощью СОК, обнаруживать нелинейные связи и зависимости между различными показателя-ми удобнее всего с помощью окон отдельных компонент. Расположив эти окна рядом с основной картой (см. рис. 15.10), вы можете непосредственно исследо-вать зависимости между компонентами. Например, нарис. 15.10 показаны теку-щие значения доходности (Р/Е), форвардные значения доходности (Р/Е), норма дивидендов, капитализация рынка, число компаний и волатильность. Цветная шкала в нижней части каждого окна отражает диапазон изменения соответству-ющей компоненты. Сравнительно малым значениям каждой компоненты соот-ветствует голубой цвет, большим значениям — красный, промежуточным значе-ниям соответствуют цвета, изменяющиеся по спектру от светло-голубого до оранжевого.

Values-CRTY R~t

0 s

Y Я2

Nodes 8

Range: Cluster

Mean Standard de.

0 077

19

Component

F'E vs1996E . ... PE Forward Hist Earn. Growth Pro|.Earn.Growth Did Yld

Market Cap(m $) Turnover X No Companies Volatility

1G 26 14 2

8 5E+006

93

8.5E+003 1A

0.051 0.048 0.059 0.0019 7 9E+004 0.052 6

023

Minimum

1 .--.- ¦

19

16 26 14

2

8.2E+006 93

8.5E+003 73

Maximum

0 0

0 071

0.33 6 5E-020 0 37

1

2E-019 1.1

0.13 2 4E-020

0.ЄЄ

Frequency Quantization s/nv Сыуэк/re

Values-CRTY R~1

Range: (Cluster ~[±] X: [fT~ Y: (б Nodes: |309 Component Mean Standard de. Minimum Maximum PEvs1996E 17 34 91 27 РЕ Forward 14 2.5 6.7 19 Hist.Earn.Growth 18 11 0.6 41 Pro|. Earn. Growth 14 3.2 8.4 24 Did Yld 2.3 0.64 1 41 Market Cap(m $) 2.1 E+005 2.8E+005 1.8E+003 1.7E+006 Turnover % 51 29 7 1.3E+002 No Companies 4 7E+002 4.7E+002 64 2 4E+003 Volatility 21 7.9 10 36 F/eqt/ency Qitanfization srrof Cisrvdhjre 0.097 7.9E-01G 0 58 0.3 1 2E-014 02 0 0

0 0089 1

2E-013 1.2

Рисунок 15.8 a, b. Численные значения показателей двух кластеров, расположенных на карте кредитных рисков по странам.

СОК кредитных рисков по странам с соответствующими метками, полу-ченная на основании данных, опубликованных в Wall Street Journal 26 июня 1997 г. (Этот рисунок приводится также на цветной вклейке.)

Рисунок 15.9.

СОК кредитных рисков по странам с соответствующими метками, полу-ченная на основании данных, опубликованных в Wall Street Journal 26 июня 1997 г. (Этот рисунок приводится также на цветной вклейке.)

Сравнивая значения компонент в выбранных областях, пользователь может выявить нелинейные зависимости и, таким образом, визуально определить смысл кластеризации. Например, можно заметить, что для рынков в правом верхнем углу карты характерна наибольшая волатильность (Турция и Польша), в то время как рынки в левом верхнем углу карты имеют наименьшие значения данного показателя (США). Значения прогнозируемого роста доходов являются наиболее низкими для Израиля, Колумбии и Греции и наиболее высокими для Венгрии и Таиланда. Больше всего компаний насчитывается в США и Индии.

Одной из целей нашего анализа было получение возможности просмотра численных значений. Прогрессивной особенностью пакета Viscovery является возможность связывания величин с записями данных. Ранее мы уже описывали один из способов установления подобных связей, согласно которому в процессе обучения отдельной компоненте следует приписать приоритет, равный нулю. То же самое можно проделать и в явном виде после обучения карты.

Например, мы могли бы «отключить» приоритет волатильности, определив его равным нулю. Это означало бы, что данный показатель не будет приниматься в расчет в процессе формирования карты, будучи, таким образом, связанной величиной. Окно, соответствующее показателю волатильности, можно было бы затем сравнить с другими окнами, чтобы выявить, например, величины, определяющие высокий уровень волатильности. Рис. 15.10 ясно показывает, что для связанного параметра волатильности имеются четко выделенные области высоких и низких значений. Это означает, что данный параметр может быть определен по остальным величинам с достаточно высокой достоверностью. Если бы высокие и низкие значения распределялись хаотично по всей карте, можно было бы сделать вывод об отсутствии связи между волатильностью и другими переменными, использованными для анализа кредитных рисков.

Если связать какую-либо величину с записями, представляющими собой временные ряды, можно получить прогноз ее изменения. Таким образом, пакет Vis-covery может быть использован еще и для предсказания рыночной волатильности, отношения цены к доходу, уровня инфляции и/или показателей эффективности фондового рынка.

Этапы 11 и 12

Кратко сформулируйте полученные результаты, подчеркнув различия между кластерами

Карта кредитных рисков, созданная с помощью алгоритма СОК, дает результаты, значительно отличающиеся от приведенных в Wall Street Journal.

Если сформировать пять кластеров искусственно, как это сделано в статье из Wall Street Journal, получится карта с иным распределением стран по группам, которую мы здесь не приводим, а именно: • Группа 1 -США; • Группа 2 — Индия; • Группа 3 — Япония; • Группа 4 — Турция и Польша; • Группа 5 — все остальные страны.

На карте, для которой искусственно введено ограничение по числу кластеров. США, Индия и Япония попадают в отдельные кластеры. Как для США, так и для Японии характерны высокая капитализация рынка. Индия отличается большим количеством действующих на рынке компаний (одним из самых больших после США). Отдельную группу образуют Турция и Польша, все же остальные страны в перечисленные группы не вошли. Ясно, что искусственное ограничение числа кла-стеров не дает никакой новой информации.

Устранив это искусственное ограничение, мы получим совершенно иное распределение стран по группам в соответствии с уровнем кредитных рисков. Нарис. 15.9и 15.10 мы видим следующие кластеры, которые мы перечисляем в произвольном порядке:

Кластер 1 — Австралия, Новая Зеландия, Канада и большая часть Европы;

Кластер 8 — большая часть Латинской Америки и Восточная Европа;

Кластер 6 — Мексика, Филиппины, Южная Африка и Чешская Республика;

Кластер 3 — Корея, Малайзия, Таиланд и Индонезия;

Кластер 2 — Сингапур и Гонконг;

і g § ?

to а

-S

к:

з; ^

S to

Ц

ar s

8 <»

§. s C- a

Є s

8 S ій Й a a v§

в

а С

I °

a a

? S

I ® 1 I

® a

Si S

^ s

О Л

S в

s a:

а:

є

є

8 t

8 N

a

* а

С з

s S

І

І 3

к

о н

S

<=[

о

Е О. С У. о

§ §

s: З

11

ь §

§! в

Р с

S

? И&

,ц а

«о о в

О о.

* н

«J О

а р

s

5 у

о. ^

чГ S

5

л rv

? t^

S Оч

а Оч

ТІ) •—і

* 1

^ а

в 3

а -о

В Гч)

I § I

? S

а; S

В в а

й 1

Кластер 4 — Венгрия и Венесуэла;

Кластер 7 — Бразилия;

Кластер 5 — Польша;

Кластер 9 — Индия и Пакистан.

В кластере 1 сгруппирована большая часть развитых фондовых рынков. Кластер 2 объединяет два азиатских рынка, которые крупнее и активнее всех остальных; в кластере 3 собрана большая часть рынков стран АСЕАН; кластеры 4 и 5 объединяют рынки с высокой волатильностью наряду с наиболее передовыми развивающимися рынками. Вне перечисленных кластеров оказались США, Япония, Китай, Тайвань, Шри-Ланка и Финляндия.

Для упрощения сравнения мы постарались сделать число полученных кластеров близким к их количеству на первой СОК. Вследствие этого, кластеры 1 и 5 оказались очень близки к первым пяти кластерам предыдущей карты; фондовые рынки стран, вошедших в кластеры с 6 по 9, образовали отдельные кластеры. Таким образом, мы обнаружили, что кластер 6 включает Мексику, Филиппины, Южную Африку и Чешскую Республику, кластер 7 — только Бразилию, а кластер 8 — большую часть Латинской Америки, за исключением Мексики, Бразилии, а также стран Восточной Европы. В кластере 9 оказались Индия и Пакистан.

Наиболее ценным наблюдением здесь является то, что если мы возьмем всю совокупность данных, выполним соответствующие преобразования и позволим им самоорганизоваться, то страны сгруппируются совершенно иначе, чем в случае с искусственными ограничениями, требующими разбиения на пять примерно одинаковых по размеру групп и использования США в качестве эталона. Полученная нами таким образом СОК не соответствует результатам анализа кредитных рисков по странам, опубликованным в Wall Street Journal. С точки зрения эксперта-финансиста, сильным доводом является также и то, что результаты группировки стран, полученные при помощи СОК, гораздо более логичны.

Данный пример подтверждает следующее.

пертная оценка данных является существенным элементом анализа при помощи СОК и всегда должна играть в нем важнейшую роль.

15.3. Выводы

В этой главе описана процедура выявления закономерностей в структуре данных при помощи самоорганизующихся карт. Мы продемонстрировали эту процедуру на примере анализа кредитных рисков по странам. На практическом примере мы проиллюстрировали применение методики, описанной в разд. 15.1, раскрыв преимущества использования общедоступного пользовательского пакета для формирования самоорганизующихся карт. Как неоднократно отмечалось на протяжении всей книги, в деле применения алгоритма СОК в области финансов, экономики и маркетинга сделать предстоит еще очень много. Мы искренне надеемся, что данное введение в круг связанных с этим вопросов привлечет внимание читателя к проблемам визуального исследования данных с помощью самоорганизующихся карт.

<< | >>
Источник: Дебок Г., Кохонен Т.. Анализ финансовых данных с помощью самоорганизующихся карт / Пер. с англ.-М.: Издательский Дом «АЛЬПИНА»,2001. — 317 с.. 2001

Еще по теме 15.2. Пример приложения для анализа кредитных рисков по странам:

  1. 3.2.1. Управление ипотечным кредитным риском
  2. Приложение 3 Пример структуры факторов кредитного риска банка при кредитовании юридических лиц
  3. 2.1. Организация банковского контроля в процессе диагностики кредитного риска клиента и кредитного портфеля банка.
  4. 1. ПОНЯТИЕ КРЕДИТНОГО РИСКА, ПРЕДПОСЫЛКИ И ФАКТОРЫ ЕГО ОПРЕДЕЛЯЮЩИЕ
  5. 3. ТРЕБОВАНИЯ ОРГАНОВ БАНКОВСКОГО НАДЗОРА ПО ОГРАНИЧЕНИЮ ВЛИЯНИЯ КРЕДИТНОГО РИСКА
  6. Кредитный риск
  7. 4.2. Принципы управления кредитным риском
  8. 4.3. Зарубежная практика управления кредитным риском
  9. 4.4. Регулирование кредитного риска
  10. 5.2. Анализ кредитного портфеля банковской системы
  11. Костюченко Наталья Сергеевна. Анализ кредитных рисков / Н.С. Костюченко. - СПб.: ИТД «Скифия»,2010.- 440 с., 2010
  12. Глава 2. Анализ кредитных рисков
  13. Глава 3. Особенности анализа кредитного риска отдельных видов ссуд и при кредитовании особых категорий заемщиков
  14. Глава 5. Примеры анализа кредитных рисков
  15. Примеры анализа кредитных рисков
  16. 6.2.2. Усовершенствование системы управления кредитным риском
  17. Управление кредитным риском как система.
  18. 15.2. Пример приложения для анализа кредитных рисков по странам
  19. Анализ кредитных отношений, обеспеченных ипотекой жилья, и борьба с ростовщичеством Постатейный анализ кредитного договора для покупки жилья в эксплуатируемом многоквартирном доме. Выявление ростовщичества и лихвы
  20. Примеры применения опционов для страховки от риска