|
2013. №3(25)
|
Анализ данных и интеллектуальные системы
|
3–18
|
Алескеров Фуад Тагиевич – доктор технических наук, руководитель департамента математики, факультет экономики, Национальный исследовательский университет «Высшая школа экономики»; заведующий лабораторией, Институт проблем управления имени В.А.Трапезникова РАН. Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: alesk@hse.ru
Белоусова Вероника Юрьевна – кандидат экономических наук, заведующий отделом методологии бюджетного планирования, Институт статистических исследований и экономики знаний; доцент кафедры банковского дела, департамент финансов, факультет экономики; с.н.с. Банковского института, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: vbelousova@hse.ru
Егорова Людмила Геннадьевна – преподаватель департамента математики, факультет экономики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: legorova@hse.ru
Миркин Борис Григорьевич – доктор технических наук, профессор кафедры анализа данных и искусственного интеллекта, отделение прикладной математики и информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: bmirkin@hse.ru
Под «паттерном» в данной работе понимается такая комбинация определённых, с точностью до погрешности, значений некоторого подмножества признаков, что объекты с этими значениями достаточно сильно отличаются от других объектов. Хотя отдельные работы, связанные с поиском и использованием паттернов, публиковались в литературе, в данной статье паттерны – в статике и динамике – вводятся и рассматриваются как отдельный подход в анализе данных, по-видимому, впервые.
Понятие «паттерн» описывается в статье с помощью трех эквивалентных математических способов представления – образного, логического и геометрического, соответствующих трем когнитивным подсистемам человека. Первый способ опирается на представление объектов в системе параллельных координат, второй способ использует конъюнктивные интервальные предикаты, задающие совокупность классификаторов для разделения паттернов, а третий способ представляет паттерны как декартовы произведения соответствующих интервалов.
В работе предлагается двухэтапный метод для автоматизации формирования паттернов. На первом этапе происходит формирование кластеров с использованием обычного кластер-анализа, на втором – осуществляется поиск паттернов, достаточно полно представляющих полученные кластеры. Когда данные характеризуют динамику функционирования социально-экономических объектов, к этому добавляется третий этап – анализ устойчивости их поведения во времени. Объекты, устойчивые по моделям поведения и не меняющие паттерна с течением времени, представляют особый интерес, поскольку могут представлять те объекты, которые относительно приспособились к среде и определились со стратегией своего развития, представляемой с помощью присущего им паттерна.
Приводится обзор литературы по каждому из трех этапов: 1) классификация методов кластер-анализа по типу используемых структур и краткое описание этих методов; 2) примеры использования понятия «паттерн» в различных предметных областях науки как некоторой шаблонной структуры данных; 3) динамика многомерных объектов на примере нескольких научных теоретических и практических работ, «близких по духу» к динамическому анализу паттернов. |
|
19–26
|
Большаков Игорь Алексеевич – доктор технических наук, профессор, независимый исследователь, Почетный профессор Национального политехнического института Мексики. Адрес: 127055, Москва, ул. Лесная, 45. E-mail: iabolshakov@gmail.com
За последнюю четверть века русский язык претерпел существенные изменения. Накопившиеся в обществе разговорные слова и жаргонизмы выплеснулись на страницы изданий, в рекламу, на телеэкран, в Интернет. Появилось множество новых заимствований, многие слова приобрели новый смысл. Соответственно, изменился и пополнился состав словосочетаний, используемых в русском языке. Поэтому создание словарей, отражающих допустимые и недопустимые связи между словами, стало крайне актуальным.
В работе обсуждаются вопросы разработки сетевой структуры и кросслексических принципов для словаря, по размерам и структуре не имеющего аналогов. Принципы сетевой структуры заключаются в том, что любой элемент словника всегда сопровождается своими связями. Контент кросслексического массива основан на бумажных словарях, новостях и аналитике Интернета, а также различной рекламе, журналах по персоналиям, модам, туризму и автомобилям. Тематика охватывает экономику, бизнес, социально-политическую сферу, технологии, точные, естественные и гуманитарные науки, медицину, спорт, бытовой язык.
Элементы массива (вокабулы) относятся к четырем главным частям речи: существительным, глаголам, прилагательным (вместе с причастиями) и наречиям (вместе с деепричастиями). Структура кросслексики представляет собой матрицу с ячейками, описывающими конкретные связи. Наиболее многочисленными словосочетаниями оказались «прилагательное – существительное» и «глагол – его дополнение-существительное». Наиболее многочисленными смысловыми связями, помогающими понять смысл вокабул, обладают синонимы и смысловые производные. Кросслексический массив содержит почти триста тысяч вокабул и более восьми миллионов связей между ними.
Проведенный анализ и тесты разработки свидетельствуют, что кросслексика помогает редактировать тексты и изучать русский язык. Кроме того, приложения кросслексики могут поднять на новый, более высокий уровень автоматическую обработку текстов. |
|
27–33
|
Таратухина Юлия Валерьевна – кандидат экономических наук, доцент кафедры инноваций и бизнеса в сфере информационных технологий, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: jtaratuhina@hse.ru
Алдунин Дмитрий Александрович – студент факультета бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: daaldunin@edu.hse.ru
В настоящее время происходит активное внедрение информационных технологий в процесс обучения. Это могут быть как электронные учебные пособия, учебные среды, так и сайты, сетевые сообщества. Очень часто ресурсы подобного рода подразумевают интернациональную пользовательскую аудиторию. Однако в разных культурах существуют дифференцированные подходы к созданию эргономичного дизайна пользовательских интерфейсов.
Работа посвящена анализу дифференциации подходов и выработке рекомендаций по совершенствованию эргономичного дизайна электронных материалов, рассчитанных на поликультурную аудиторию, а также выработке перечня рекомендаций по улучшению эргономического дизайна пользовательского интерфейса электронных ресурсов для многонациональной аудитории.
Данное исследование является первым в последующей серии работ, посвященных анализу соответствия культурной специфики целевой аудитории и конструктивных особенностей, необходимых для обеспечения максимального комфорта и удобства пользовательского веб-интерфейса, разработанного для той или иной аудитории. Конечным результатом цикла работ будет разработка программной среды, которая способствует развитию чувствительных к культуре интерфейсов. |
Математические методы и алгоритмы бизнес-информатики
|
34–40
|
Хивинцев Максим Андреевич – аспирант кафедры бизнес-аналитики, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: mkhivintsev@hse.ru
Акопов Андраник Сумбатович – доктор технических наук, профессор кафедры бизнес-аналитики, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: aakopov@hse.ru
Одна из проблем решения оптимизационных задач заключается в том, что оптимизация сразу по множеству критериев требует значительных временных и вычислительных ресурсов. При этом, поскольку целевые функции многих (более 10) переменных порождают многомерное пространство поиска решений, вычислительная сложность оптимизационной задачи, как правило, становится преградой к ее решению за допустимое время. Аналитическое описание и строгое решение такой задачи на практике, как правило, не осуществимо.
Целью исследования является разработка распределенной эволюционной сети, предназначенной для решения многокритериальных оптимизационных задач большой размерности. Представлен новый подход к построению комплексного программного решения по интеграции распределенной эволюционной сети с системой имитационного моделирования AnyLogic.
В статье представлен новый подход к решению многокритериальных оптимизационных задач большой размерности, реализуемых, в частности, в системах имитационного моделирования класса AnyLogic с помощью распределенных вычислений. Предложена новая концепция построения распределенной эволюционной сети, основанная на разбиении пространства искомых переменных на кластеры и присвоения каждому вычислительному элементу сети своего кластера, по которому осуществляется поиск промежуточных результатов с помощью взаимодействующих генетических алгоритмов. Предложенный подход основан на использовании распределенной эволюционной сети, в которой эффект от распараллеливания вычислительных процессов выше, чем при классической островной модели. Это достигается благодаря способности алгоритма к разбиению всего пространства решений на кластеры, каждый из которых передается на свой вычислительный процесс, исполняя генетический алгоритм на локальном уровне. В этом случае для генетического алгоритма, работающего с целевыми функциями из меньшего числа переменных, для качественных решений требуется меньший размер популяции. В результате происходит сокращение числа вызовов функций приспособленности, что ведет к значительному снижению времени схождения алгоритма к конечному решению.
На основе данного подхода разработан платформенно-независимый программный комплекс на языке программирования Java, позволяющий интегрировать распределенную эволюционную сеть и имитационные модели, разработанные в системе имитационного моделирования AnyLogic. |
|
41–48
|
Подиновский Владислав Владимирович – доктор технических наук, профессор кафедры высшей математики на факультете экономики, Национальный исследовательский университет «Высшая школа экономики» Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: podinovski@mail.ru
Потапов Михаил Андреевич – кандидат физико-математических наук, ведущий научный сотрудник, Институт автоматизации проектирования РАН. Адрес: 123056, Москва, 2-ая Брестcкая ул, д.19/18. E-mail: potapov@icad.org.ru
В подавляющем большинстве случаев задачи принятия решений оказываются многокритериальными: варианты решения оцениваются при помощи частных критериев. Поскольку, как правило, каждый из критериев выделяет «свой» наилучший вариант (т.е. не бывает варианта, который одновременно является лучшим по каждому из критериев), то многокритериальные задачи принципиально сложнее однокритериальных и требуют для своего решения специальных методов и подходов. Самым распространенным, давно известным и до сих пор чаще других используемым является метод, основанный на свертывании всех критериев в один-единственный обобщенный критерий, представляющий собой сумму критериев, взвешенных коэффициентами их относительной важности (весами). Этот метод называется методом взвешенной суммы критериев (МВСК), на английском языке – weighted sum method (WSM).
Метод взвешенной суммы критериев (МВСК) является привлекательным эвристическим методом, которому, однако, присущ целый ряд неустранимых недостатков принципиального характера. Цель статьи – представить всесторонний обзор результатов критического анализа МВСК, которые «рассыпаны» по целому ряду научных публикаций.
В частности, к недостаткам МВСК относятся: оперирование значениями, лишенными содержательного («физического») смысла; использование постоянных весов критериев; игнорирование проверки условия взаимонезависимости критериев по предпочтению; необоснованное рассмотрение шкалы критериев как количественной; необоснованное принятие допущения о равномерности общей шкалы критериев; необоснованное удаление некоторых вариантов из рассмотрения; необоснованное рассмотрение коэффициентов важности как количественных оценок важности критериев; «интеллектуальная ошибка», вызванная независимостью процедур нормализации критериев и назначения их весов; необоснованность выбора функций для нормализации критериев; нарушение аксиомы независимости от посторонних альтернатив. |
|
49–55
|
Никулин Владимир Николаевич – кандидат физико-математических наук, доцент кафедры математических методов в экономике, Вятский государственный университет. Адрес: 610000, г. Киров, ул. Московская, 36. E-mail: vnikulin.uq@gmail.com
Палешева Светлана Анатольевна – студент кафедры математических методов в экономике, Вятский государственный университет. Адрес: 610000, г. Киров, ул. Московская, 36. E-mail: s.palesheva@gmail.com
Зубарева Дарья Сергеевна – студент кафедры математических методов в экономике, Вятский государственный университет. Адрес: 610000, г. Киров, ул. Московская, 36. E-mail: ZubarevaDasha@yandex.ru
Актуальность проблемы обусловлена необходимостью определения подходящего направления для студентов (слушателей учебных курсов), которые «живут» в сети Интернет, принимая во внимание существование большого числа доступных исследовательских и образовательных ресурсов. В статье представлен алгоритм, который тестировался в режиме реального времени в ходе международного соревнования по анализу данных VideoLectures.Net ECML/PKDD 2011 (Track 2) на платформе TunedIT. VideoLectures.Net – это открытый и общедоступный мультимедийный ресурс видео-лекций, в основном исследовательского и образовательного характера. Открытые социально-образовательные системы предоставляют новые возможности для миллионов заинтересованных студентов, для того чтобы последние могли пользоваться высококачественными дидактическими материалами в режиме реального времени. Лекции предлагаются выдающимися учеными и исследователями в рамках самых значимых и известных событий, таких как конференции, летние школы, семинары, а также научно-популярные мероприятия в различных отраслях науки. Целями Интернет-ресурса являются продвижение научных идей, а также стимулирование обмена знаниями, которые достигаются посредством предоставления высококачественных учебных материалов не только научной общественности, но и более широкой аудитории. Все лекции, включая документы, информацию и ссылки, систематизированы и сгруппированы редакторами с учетом комментариев пользователей.
Мы предлагаем использовать две лекции (взятые из тройки данных лекций), для того, чтобы определить направление прогноза, который включает набор предсказанных лекций, дополненных соответствующими частотами или эмпирическими вероятностями. Соответствие всего предсказанного набора вычисляется согласно оставшейся третьей лекции. Дальнейшие улучшения были достигнуты посредством применения однородных ансамблей, основанных на случайных подмножествах (такой подход известен как бэггинг). |
Информационные системы и технологии в бизнесе
|
56–62
|
Ена Олег Валерьевич – директор центра информационно-аналитических систем, Институт статистических исследований и экономики знаний, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: ovena@hse.ru
Нагаев Константин Владимирович – старший научный сотрудник центра информационно-аналитических систем, Институт статистических исследований и экономики знаний, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: knagaev@hse.ru
Дорожная карта в мировой практике является одним из наиболее эффективных инструментов долгосрочного стратегического планирования и может использоваться на всех уровнях принятия решений: в рамках формирования и реализации стратегий корпоративного уровня, конкурентных и функциональных стратегий. Наиболее сложным видом дорожных карт является технологическая дорожная карта (ТДК). ТДК позволяет оценить влияние на развитие предметной области большого количества разнообразных факторов, таких как глобальные вызовы, перспективы коммерциализации ключевых инновационных технологий, желаемая конфигурация продуктов и рынков и т.д.
Целью исследования является определение способов расчета частных и интегральных показателей применимости элементов технологической дорожной карты и их атрибутов для применения автоматизированных средств для решения задач, связанных с форсайтными исследованиями, долгосрочным научно-техническим прогнозированием и определением инновационных траекторий развития предметных областей. Для этого в статье рассматриваются подходы к решению задач унификации интегральных показателей, характеризующих элементы ТДК и их атрибуты, и расчета основной технологической траектории ТДК. Представлен подход и алгоритмическая реализация способа расчета частных и интегральных показателей применимости элементов технологической дорожной карты и их атрибутов. Для оценки элементов ТДК предлагается использовать многомерные функции применимости. Для формирования интегрального показателя применимости элемента применена многокритериальная теория полезности MAUT, при этом агрегирующая функция представлена в виде аддитивной свертки. В качестве дополнительного средства повышения точности интегральных показателей применимости предложена перебалансировка показателей с переносом применимости по установленным связям между элементами. Научно-технологические решения, представленные в настоящей статье, реализованы в составе программного комплекса «Интерактивная дорожная карта с обратной связью». |
|
63–71
|
Кравченко Татьяна Константиновна – доктор экономических наук, профессор, заведующий кафедрой бизнес-аналитики, факультет бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики». Адрес: 101000, Москва, Мясницкая ул., 20. E-mail: tkravchenko@hse.ru
Процесс управления требованиями является одной из ведущих функций бизнес-аналитика при внедрении информационных систем. Для достижения целей проекта стратегически важно правильно построить процесс управления требованиями между членами проектной команды, согласовать с клиентом рамки релевантности поступающих требований и процедуру отслеживания выполненных работ.
В статье предлагается подход к моделированию процесса управления требованиями при реализации информационно-технологических проектов. Модель управления требованиями реализуется в три этапа. На первом этапе отбираются бизнес-требования, которые фиксируются в проектном решении и являются рамками проекта. На втором этапе строится модель, связанная с принятием, отклонением, уточнением или отнесением к дополнительным работам каждого поступающего требования пользователей. На третьем этапе для принятых требований пользователей формируются приоритеты системных требований, на основе которых далее составляются планы работ по проекту. При построении моделей принятия решений используются методы анализа иерархий и аналитических сетей Т.Л.Саати (T.L.Saaty), а также система поддержки принятия решений SuperDecisions.
Предлагаемый подход апробирован на примере реализации функционального блока «Депозит на расчетном счете» при внедрении модуля «Казначейство» системы SAP. Полученные приоритеты системных требований можно использовать при составлении плана работ по реализации в системе данного финансового инструмента, выделять ресурсы и определять сроки завершения доработок. Если таким же образом рассматривать все требования, полученные при реализации различных функциональных блоков проекта, то полученную информацию можно использовать для составления плана работ по проекту в целом. |
|
72–78
|
Славин Борис Борисович – кандидат физико-математических наук, руководитель Центра ИТ экспертизы Союза ИТ-директоров России, директор по исследованиям и инновациям компании АйТи. Адрес: 115280, Москва, ул. Ленинская Слобода, 19, стр. 6. E-mail: bbslavin@gmail.com
Ямалов Ильдар Уралович – доктор технических наук, руководитель Агентства по информационным технологиям Республики Башкортостан. Адрес: 450000, г. Уфа, ул. Кирова, 45 E-mail: yamalov.i@minsvyazrb.ru
В статье изложены результаты исследования и моделирования роста индустрии информационных технологий (ИТ) в российском регионе (на примере Республики Башкортостан) за счет дополнительных инвестиций в электронное образование. Поскольку электронное образование требует разработки электронного контента, инвестиции в образование становятся инвестициями в бизнес, создающий электронные ресурсы. В статье на основе инвестиционной модели развития региона показывается, каким образом можно усилить развитие отрасли ИТ.
При построении модели в статье рассматривались три канала инвестиций: финансирование программы электронного образования населения и служащих, реализация которой подтолкнет бизнес и учреждения образования к расширению услуг; финансирование фондов поддержки ИТ-индустрии, которые призваны привлекать внешние инвестиции в ИТ-отрасль; финансирование инфраструктурных и медиа-проектов, которые дают преимущества ИТ-компаниям, чьи разработчики проживают в регионе. При моделировании предполагалось соблюдение принципа софинансирования со стороны бизнеса и государства. Паритет финансирования соблюдался в целом, для различных же каналов государственные инвестиции могли превышать частные и наоборот.
Принцип софинансирования предполагает не просто паритет, а меры со стороны государства, стимулирующие частные инвестиции. Такое условие приводит к тому, что все каналы инвестирования оказываются связанными между собой. Финансирование долгосрочной программы электронного обучения способствует росту ИТ-отрасли. Частно-государственные инвестиционные фонды снижают риск того, что по завершении поддержки ИТ-отрасли ее развитие пойдет на убыль. Поддержка инфраструктурных проектов, медийной и научной деятельности в области информационных технологий позволяет инвестициям остаться в регионе. На основе построенной модели показано, что инвестиции в электронное образование формируют инфраструктуру, характерную для СМАРТ-региона. |
|
|