Сравнительный анализ методов прогнозирования банкротств российских строительных компаний
Аннотация
Работа посвящена сравнению способности различных моделей предсказывать банкротство компаний строительной отрасли на горизонте в один год. Рассмотрены такие алгоритмы, как логит- и пробит-модели, деревья классификации, случайные леса, искусственные нейронные сети. Особое внимание уделено особенностям построения моделей машинного обучения, влиянию несбалансированности данных на предиктивную способность моделей, анализу способов борьбы с несбалансированностью данных, анализу влияния нефинансовых факторов на предиктивную способность моделей. В работе использованы нефинансовые и финансовые показатели, рассчитанные на основе публичной финансовой отчетности строительных компаний за период с 2011 по 2017 годы. Сделан вывод, что рассмотренные алгоритмы показывают приемлемое качество для использования в задачах прогнозирования банкротств. В качестве метрики качества моделей использовался коэффициент Джини или AUC (площадь под ROC-кривой). Выявлено, что искусственные нейронные сети превосходят другие методы, в то время как модели логистической регрессии в сочетании с дискретизацией вплотную следуют за ними. Обнаружено, что эффективность способа преодоления несбалансированности данных зависит от типа используемых моделей. В то же время значимого влияния несбалансированности обучающего множества на предиктивную способность модели не выявлено. Существенное влияние нефинансовых показателей на вероятность банкротства также не подтвердилось.
Скачивания
Copyright (c) 2019 Национальный исследовательский университет «Высшая школа экономики»

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.








