Бизнес-информатика, 2021 (1 Vol.15) http://bijournal.hse.ru ru-ru Copyright 2021 Thu, 25 Mar 2021 14:40:46 +0300 Использование вневыборочных остатков Кокса–Снелл при прогнозировании наступления событий https://bijournal.hse.ru/2021--1 Vol.15/454917884.html       В статье рассматривается задача оценивания прогнозной силы модели наступления события по вневыборочным данным. Данные о времени наступления событий, как правило, цензурированны справа: ожидаемое событие часто не уступает произойти за время наблюдения, из-за чего фиксируется только минимальное возможное значение прогнозируемой величины. В результате стандартные меры точности прогноза, такие как средняя абсолютная или средняя квадратическая ошибка, оказываются неприменимыми, а для измерения качества применяются коэффициенты ранговой корреляции:C-индекс Харрелла, коэффициенты Уно и Сомерса. Эти меры не отражают близости прогнозов к действительным значениям, а характеризуют только согласованность ранжировок – способность модели отличать наблюдения, в которых ожидаемое событие происходит относительно быстро, от тех наблюдений, в которых время ожидания относительно велико, из-за чего коэффициенты ранговой корреляции могут принимать высокие значения даже при сколь угодно большой систематической ошибке прогноза. Кроме того, сведение качества прогноза к корреляции или даже близости прогнозируемого и действительного значений малоудовлетворительно: время наступления редко удается оценить с определенностью, и при прогнозировании интерес представляет не только точечная оценка момента наступления, но и оценка закона распределения объясняемой величины целиком. В настоящей статье при выборе прогнозной модели предлагается дополнять сравнение коэффициентов ранговой корреляции анализом остатков Кокса–Снелл, рассчитанных для вневыборочных данных (контрольных или валидационных). Для визуального анализа предлагается применять график оценки интегрального риска остатков, а в качестве численной характеристики согласованности модели с вневыборочными данными – расстояние Колмогорова между наблюдаемым распределением остатков и экспоненциальным распределением с единичным средним, которое соответствует идеально специфицированной модели. Предлагаемый подход иллюстрируется примером выбора прогнозной модели для времени досрочного погашения договоров ипотечного кредитования. Оценка эффективности информационных систем с учетом рисков https://bijournal.hse.ru/2021--1 Vol.15/454920312.html      Внедрение информационных систем направлено на повышение финансовых показателей компании, создание прозрачной системы отчетности и улучшение многих других конкурентно значимых факторов. Однако получение данных преимуществ не отрицает сложность принятия решения о реализации или об отказе от реализации конкретного ИТ-проекта. Общая стоимость владения информационной системой на протяжении всего жизненного цикла, как правило, не рассматривается в сопоставлении с предполагаемыми выгодами от использования системы, в связи с неопределенностью таких выгод. Относительная определенность подходов и методов присутствует только в части затрат, как для априорной (плановой), так и апостериорной (фактической) оценки. Возможно достаточно точное определение как капитальных, так и операционных затрат. Косвенное определение положительного влияния информационной системы на деятельность организации также представляется возможным. Однако общепринятых методов анализа предполагаемого положительного эффекта от реализации ИТ-проекта в настоящее время не существует. При этом крупные компании, в соответствии с требованиями соответствующих регуляторов и/или в связи с внутренними управленческими соображениями выстраивают систему управления рисками для определения уровня возможностей, потерь и предотвращения наступления неблагоприятных событий. В данном исследовании рассматривается возможность применения подхода к анализу эффективности внедряемой информационной системы на основе снижения рисков компании, ведущих к уменьшению экономических выгод. При этом принимаются во внимание внутренние риски информационной системы, возникающие при установке системы, ее эксплуатации и при завершении работы с системой. Динамика исследований в области интеллектуального анализа данных: тематический анализ публикаций за 20 лет https://bijournal.hse.ru/2021--1 Vol.15/454920579.html Цель работы состоит в выявлении тенденций развития интеллектуального анализа данных (data mining) как научной дисциплины. На основе метода латентного размещения Дирихле (latent Dirichlet allocation, LDA) построена тематическая модель трудов Международной конференции по интеллектуальному анализу данных (International Conference on Data Mining, ICDM) за 2001–2019 годы и выделено девять основных направлений (тем) исследований. Для каждой темы исследованы динамика ее популярности (количество публикаций) и влияния (количество цитирований). Центральная тема, которая объединяет все прочие направления, – это общие вопросы обучения (general learning), включающее алгоритмы машинного обучения. За рассматриваемый период 20% усилий научного сообщества было потрачено на развитие именно этого направления, однако в последнее время его влияние снижается. Также снижается внимание к таким темам, как обнаружение ассоциаций (pattern mining) и разделение объектов (segmentation), включая кластеризацию. В то же время растет популярность исследований, связанных с рекомендательными системами (recommender systems), анализ сетей различной природы, в том числе социальных (network analysis) и анализ поведения человека, в частности поведения потребителей (human behavior analysis), что, скорее всего, связано с увеличением доступности данных и практической ориентацией этих тем. Направление исследований, связанных с приложениями интеллектуального анализа данных (applications), также имеет тенденцию к росту. Две последние темы – анализ текстовой информации (text mining) и прогнозирование потоков данных (data streams) привлекают относительно постоянный интерес исследователей. Полученные результаты проливают свет на структуру и динамику интеллектуального анализа данных как научной дисциплины за последние двадцать лет. Они также свидетельствуют, что за последние пять лет сформировалась новая повестка, характеризующаяся сдвигом интереса от алгоритмов к практическим приложениям, влияющим на все аспекты человеческой деятельности. Статистическая устойчивость цифровой организации https://bijournal.hse.ru/2021--1 Vol.15/454921347.html Важным свойством цифровой организации является ее способность к быстрым изменениям. Для того чтобы организация сохраняла способность к быстрым изменениям, она должна находиться на грани устойчивости, поскольку устойчивая организация всегда сопротивляется изменениям. В статье рассматривается пограничное состояние организации, находящееся на грани ее устойчивости и неустойчивости. В этом состоянии организация начинает терять предсказуемость в деталях поведения, но еще сохраняет предсказуемость в целом. Такое пограничное состояние авторы назвали статистической устойчивостью организации. Явление статистической устойчивости организации очень похоже на свойство стабильности частотности массовых событий и средних величин, описываемых в математической статистике аналогичным термином. Для анализа природы статистической устойчивости организации авторы использовали идеи странных аттракторов и режимов с обострением из теории сложных систем. Странный аттрактор – это такая область поведения организации, которая вне этой области для организации является областью устойчивости, а внутри – областью полной непредсказуемости. Теория сложных систем показала, что именно в областях странных аттракторов создаются условия изменчивости систем, а теория режимов с обострением показывает условия, при которых эта изменчивость может привести к самоорганизации, то есть спонтанному появлению новых структур. В статье показано, что систематическая цифровизация объективно приводит к формированию статистической устойчивости организации и создает предпосылки для поддержания способности организации к быстрым изменениям. В традиционном менеджменте статистическая устойчивость организации рассматривается как угроза и источник рисков. Поэтому в условиях систематической цифровизации традиционные подходы к менеджменту должны быть существенно уточнены. Имитационное моделирование развития отдельных отраслей тяжелой промышленности https://bijournal.hse.ru/2021--1 Vol.15/454923845.html       В настоящее время повышается актуальность задачи обеспечения устойчивого развития отраслей тяжелой промышленности. Однако для этого одних лишь теоретических и аналитических исследований недостаточно, и экономическая наука нуждается в разработке принципиально новых подходов к исследованию развития промышленных отраслей. Статья посвящена разработке и апробации имитационной модели развития отдельных отраслей экономики. В качестве объекта исследования выступает металлургическая отрасль, а также такие смежные отрасли, как добыча руд, машиностроение и производство готовых металлических изделий. Теоретическую основу исследования составляет системный подход, объединивший в себе теорию отраслевых рынков, экономического роста, экономики промышленности, системной динамики и математической экономики. В качестве основных методов исследования применены системный анализ, статистический анализ (для выявления тенденций изменения основных экономических показателей), эконометрическое моделирование (для построения производственных функций), а также математическое моделирование макроэкономических систем. В результате предложена имитационная модель, разработанная в нотации системной динамики с использованием программного продукта AnyLogic, позволяющая оценить развитие отдельных отраслей промышленности с учетом различных изменений. Данная модель построена на базе трехсекторной модели национальной экономики, где в качестве структурных элементов выделены отдельные отрасли, связанные динамическими петлями обратной связи. В работе подробно отражена структура имитационной модели, базирующейся на динамических уравнениях первого порядка, балансовых уравнениях и нелинейных производственных функциях. Имитационная модель позволила спрогнозировать ряд сценариев развития отраслей металлургии с учетом изменения трудовых ресурсов и инвестирования в основные производственные фонды. Результаты работы могут использоваться для формирования предложений по промышленной политике, а также мониторинга состояния и эффективности деятельности отдельных отраслей промышленности. Анализ больших данных в управлении цепями поставок на основе интернета вещей в отраслях FMCG https://bijournal.hse.ru/2021--1 Vol.15/455021096.html Цепи поставок являются одним из наиболее существенных элементов производственных систем и промышленных компаний, и их «умные» характеристики помогают бизнесу стать интеллектуальным. Поэтому использование инновационных технологий, направленных на повышение бизнес-интеллекта, представляет собой актуальную задачу. «Умная» цепь поставок использует инновационные инструменты для повышения качества, увеличения производительности и облегчения процесса принятия решений. Интернет вещей (internet of things, IoT) является одним из ключевых элементов ИТ-инфраструктуры для развития интеллектуальных цепей поставок, обладающих высоким потенциалом для обеспечения устойчивости производственных систем. Кроме того, интернет вещей является одним из важнейших источников больших данных. Большие данные и стратегии анализа данных, предоставляющие широкие возможности для оптимизации решений и повышения производительности, в настоящее время быстро развиваются. В связи с этим в данной статье предпринята попытка рассмотреть информативные стратегии развития цепей поставок (на основе частного случая – цепей поставок в отраслях FMCG), а также разработать аналитический подход к построению устойчивых «умных» цепей поставок с использованием анализа больших данных на основе интернета вещей. Предлагаемый подход основан на методологии внедрения интернета вещей, с акцентом на использование исходных больших данных и экспертных оценок. Учитывая характер индустрии FMCG, это может привести к существенным улучшениям в области производственных решений.