Информационная система анализа политических и экономических событий

 

 

Е.А. Шумков, Д.Н. Карлов

 

ГОУ ВПО Кубанский Государственный Технологический Университет

г. Краснодар, ул. Красная 135

 

(Опубликовано в тезисах XXV Международной научно – технической конференции /летняя сессия/. Пенза 2010. с. 29-31)

 

 

В связи с развитием информационных технологий и сети Интернет, одной из интересных задач системного анализа видится создание информационной системы автоматического анализа политических и экономических событий (экономическое и политическое поля рассматриваются вместе, так как они тесно взаимосвязаны). События, происходящие в мире сразу же опубликовываются в ресурсах сети Интернет и задача состоит в том, что бы за заданное время обнаружить новое сообщение, автоматически рейтингировать его и оценить возможные последствия. С другой стороны необходимо на исторических данных исследовать корреляцию событий и их влияние на экономико – политическое поле. При этом данная задача сложна, так как данные в ней неструктурированны и их огромное количество [1].

В связи свыше написанной постановкой задачи, разделим решаемую задачу на две подзадачи:

а) на ретроспективной выборке оценить уже произошедшие события и классифицировать их;

б) автоматически классифицировать вновь произошедшие события и спрогнозировать их последствия.

Для решения данных задач необходимо создать информационный ресурс, который бы искал события и сохранял их. Также, для классификации необходима мера, по которой определялась бы «сила» события. В качестве меры можно использовать финансовые временные ряды, как валютного, так и фондового рынках, а также ряды макроэкономических показателей.

В качестве поставщика событий для «настольных» систем анализа целесообразно использовать RSS – каналы. Информационный ресурс в минимальном составе состоит из БД, скрипта загрузки данных и скриптов (макросов) обработки данных.

Табличный состав БД следующий (главные таблицы):

·  Страны (Имя, Регион, Население, Площадь, ВВП и т.д.);

·  Корпорации (Название, Страна, выручка, доход и т.д.);

·  События (Страна1, Страна2, Корпорация, Персона, текст и т.д.);

·  Контракты;

·  Макроэкономические показатели и индексы;

Использование RSS – каналов выгодно тем, что при использовании адекватного канала можно получить «полный» срез новостей в режиме реального времени по определенной тематике. Но здесь проблема в нахождении адекватных RSS – каналов и в дублировании одного события несколькими каналами. Приведем простой вариант анализа события (новости) при определении к каким полям таблиц БД оно относится. Пословно читается заголовок RSS – сообщения; затем последовательно делается запрос к разным таблицам в БД, к полям с ключевыми словами записей и в случае совпадения новость идентифицируется найденной записью в таблице. Параллельно ведется поиск численной информации. Данный способ не исключает последующего ручного способа обработки информации, но сводит его к минимуму.

Для исследования влияния событий, как уже указывалось выше, можно использовать временные ряды финансовых рынков и макроэкономических показателей, при этом есть еще одна задача – исследование влияния макроэкономических показателей на финансовые временные ряды. А также есть обратная задача – влияние финансовых рядов на макроэкономические показатели. В качестве источников временных рядов можно использовать торговые терминалы Metatrader (по валютам) и Quik (по российскому фондовому рынку) от соответствующих дистрибьюторских центров, при этом данные терминалы обладают встроенными языками программирования и богатыми возможностями для экспорта и импорта информации. Макроэкономические показатели в ретроспективе необходимо собирать, что называется «по крупицам», но текущий срез можно найти в одном источнике, например на ресурсе http://www.dailyfx.com/calendar/ .

Следующая задача в этапе обработки - это собственно исследование влияния новостей на временные ряды и последующее их рейтингирование. Данную задачу можно решать множеством методов, например рассматривать как повел себя финансовый ряд в момент выхода новости и после него, то есть насколько количественно изменился курс. Наиболее удобны для исследования – это макроэкономические показатели, которые обычно выходят в строго определенное время и в строго определенные дни, например «Индекс промышленного производства США». Крайне неудобными являются высказывания политических и экономических лидеров, так как их много (есть большой «шум») и время этих высказываний недетерминировано. Также часто бывает сложно сопоставить резкое изменение на временном ряде с каким – либо определенным событием, ведь резкое изменение временного ряда может быть вызвано действиями маркетмейкеров или быть следствием накопившейся критической массой стоп – заявок.

Таким образом, мы показали простой способ создания системы сбора и анализа экономико – политических событий в мире. Система использует распространенные программные продукты. Показан способ быстрой обработки новостей с последующей классификацией. В то же время, в силу своей сложности, проблема последующего анализа событий остается открытой.

Литература

1.     Иванилов Е.Л. Компьютерные технологии поддержки принятия решений в информационно – аналитической деятельности. Дисс. доктр. техн. наук. ИПУ им. Трапезникова. М.: 2009.




; ; ; ;


Контактная информация

КубГТУ
Краснодар
ул. Красная 135
Телефон: (861) 255 15 09
Fax: -
E-mail: sneveld@rambler.ru