Алескеров Фуад Тагиевич – доктор технических наук, руководитель департамента математики, факультет экономики, Национальный исследовательский университет «Высшая школа экономики»; заведующий лабораторией, Институт проблем управления имени В.А.Трапезникова РАН. Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: alesk@hse.ru
Белоусова Вероника Юрьевна – кандидат экономических наук, заведующий отделом методологии бюджетного планирования, Институт статистических исследований и экономики знаний; доцент кафедры банковского дела, департамент финансов, факультет экономики; с.н.с. Банковского института, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: vbelousova@hse.ru
Егорова Людмила Геннадьевна – преподаватель департамента математики, факультет экономики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: legorova@hse.ru
Миркин Борис Григорьевич – доктор технических наук, профессор кафедры анализа данных и искусственного интеллекта, отделение прикладной математики и информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: bmirkin@hse.ru
Под «паттерном» в данной работе понимается такая комбинация определённых, с точностью до погрешности, значений некоторого подмножества признаков, что объекты с этими значениями достаточно сильно отличаются от других объектов. Хотя отдельные работы, связанные с поиском и использованием паттернов, публиковались в литературе, в данной статье паттерны – в статике и динамике – вводятся и рассматриваются как отдельный подход в анализе данных, по-видимому, впервые.
Понятие «паттерн» описывается в статье с помощью трех эквивалентных математических способов представления – образного, логического и геометрического, соответствующих трем когнитивным подсистемам человека. Первый способ опирается на представление объектов в системе параллельных координат, второй способ использует конъюнктивные интервальные предикаты, задающие совокупность классификаторов для разделения паттернов, а третий способ представляет паттерны как декартовы произведения соответствующих интервалов.
В работе предлагается двухэтапный метод для автоматизации формирования паттернов. На первом этапе происходит формирование кластеров с использованием обычного кластер-анализа, на втором – осуществляется поиск паттернов, достаточно полно представляющих полученные кластеры. Когда данные характеризуют динамику функционирования социально-экономических объектов, к этому добавляется третий этап – анализ устойчивости их поведения во времени. Объекты, устойчивые по моделям поведения и не меняющие паттерна с течением времени, представляют особый интерес, поскольку могут представлять те объекты, которые относительно приспособились к среде и определились со стратегией своего развития, представляемой с помощью присущего им паттерна.
Приводится обзор литературы по каждому из трех этапов: 1) классификация методов кластер-анализа по типу используемых структур и краткое описание этих методов; 2) примеры использования понятия «паттерн» в различных предметных областях науки как некоторой шаблонной структуры данных; 3) динамика многомерных объектов на примере нескольких научных теоретических и практических работ, «близких по духу» к динамическому анализу паттернов.