@ARTICLE{26583204_90628738_2013, author = {Ю. Г. Сметанин and М. В. Ульянов}, keywords = {, кластеризация, временные ряды, символические описания, сложность по Колмогорову, бикритериальный метод, гистограммысжатие данных}, title = {Подход к определению характеристик колмогоровской сложности временных рядов на основе символьных описаний}, journal = {Бизнес-информатика}, year = {2013}, number = {2(24)}, pages = {49-54}, url = {https://bijournal.hse.ru/2013--2(24)/90628738.html}, publisher = {}, abstract = {Сметанин Юрий Геннадиевич - доктор физико-математических наук, главный научный сотрудник, Вычислительный центр им. А.А.Дородницына РАН. Адрес: 119333, Москва, ул. Вавилова, 40.E-mail: smetanin.iury2011@yandex.ruУльянов Михаил Васильевич - доктор технических наук, профессор кафедры управления разработкой программного обеспечения, отделение программной инженерии, Национальный исследовательский университет «Высшая школа экономики».Адрес: 101000, Москва, Мясницкая ул., 20.E-mail: muljanov@mail.ruОсновные задачи исследования как одномерных, так и многомерных временных рядов преследуют, прежде всего, цель повышения точности прогнозирования их поведения и адекватности соответствующих прогностических математических моделей. В этом аспекте исследуются структуры временных рядов, вводятся различные классификации, отражающие особенности порождающих эти ряды процессов, предлагаются разнообразные методы прогнозирования и математические аппараты. Тем не менее, предлагаемые классификации временных рядов, как правило, являются классификациями по одному признаку, причем, в основном, с качественным, а не количественным классификатором.В статье предложен подход к исследованию особенностей временных рядов, основанный на определении сложности по Колмогорову строк символов, являющихся представлением временных рядов в пространстве слов некоторого выбранного алфавита. Предлагаемое разбиение размах варьирования значений на полусегменты для символьного кодирования основано на бикритериальном методе построения гистограмм. Полученные оценки относительной сложности временного ряда по Колмогорову служат базой для вычисления меры сложности временного ряда, являющейся одной из осей кластерного пространства временных рядов, при символическом кодировании значений. В статье также описан переход от символьного кодирования по значениям к символьному кодированию по тенденциям, позволяющему ввести еще одну координату пространства кластеризации временных рядов.Предполагаемое дальнейшее исследование особенностей методов прогнозирования по отношению к кластерам временных рядов позволит указать наиболее рациональные методы для выделенных кластерных групп. Очевидно, что наиболее интересной и научно значимой задачей является построение разнообразия координатных осей самого пространства кластеризации, равно как и введение функции расстояния для определения в этом координатном пространстве структуры метрического пространства. }, annote = {Сметанин Юрий Геннадиевич - доктор физико-математических наук, главный научный сотрудник, Вычислительный центр им. А.А.Дородницына РАН. Адрес: 119333, Москва, ул. Вавилова, 40.E-mail: smetanin.iury2011@yandex.ruУльянов Михаил Васильевич - доктор технических наук, профессор кафедры управления разработкой программного обеспечения, отделение программной инженерии, Национальный исследовательский университет «Высшая школа экономики».Адрес: 101000, Москва, Мясницкая ул., 20.E-mail: muljanov@mail.ruОсновные задачи исследования как одномерных, так и многомерных временных рядов преследуют, прежде всего, цель повышения точности прогнозирования их поведения и адекватности соответствующих прогностических математических моделей. В этом аспекте исследуются структуры временных рядов, вводятся различные классификации, отражающие особенности порождающих эти ряды процессов, предлагаются разнообразные методы прогнозирования и математические аппараты. Тем не менее, предлагаемые классификации временных рядов, как правило, являются классификациями по одному признаку, причем, в основном, с качественным, а не количественным классификатором.В статье предложен подход к исследованию особенностей временных рядов, основанный на определении сложности по Колмогорову строк символов, являющихся представлением временных рядов в пространстве слов некоторого выбранного алфавита. Предлагаемое разбиение размах варьирования значений на полусегменты для символьного кодирования основано на бикритериальном методе построения гистограмм. Полученные оценки относительной сложности временного ряда по Колмогорову служат базой для вычисления меры сложности временного ряда, являющейся одной из осей кластерного пространства временных рядов, при символическом кодировании значений. В статье также описан переход от символьного кодирования по значениям к символьному кодированию по тенденциям, позволяющему ввести еще одну координату пространства кластеризации временных рядов.Предполагаемое дальнейшее исследование особенностей методов прогнозирования по отношению к кластерам временных рядов позволит указать наиболее рациональные методы для выделенных кластерных групп. Очевидно, что наиболее интересной и научно значимой задачей является построение разнообразия координатных осей самого пространства кластеризации, равно как и введение функции расстояния для определения в этом координатном пространстве структуры метрического пространства. } }