Разработка и апробация системы поиска дубликатов в текстах проектной документации

  • D. Ignatov
  • S. Kuznetsov
  • V. Lopatnikova
  • I. Selitskiy

Abstract

В статье рассмотрена система поиска (почти) дубликатов в текстах проектной документации. Описаны ее архитектура, математические модели и алгоритмы поиска документов-дубликатов, а также их реализация. Предложены методики подбора оптимальных параметров методов и тестирования системы. Обозначены актуальные для подобных систем исследовательские задачи.

Downloads

Download data is not yet available.
Published
2008-01-20
How to Cite
IgnatovD., KuznetsovS., LopatnikovaV., & SelitskiyI. (2008). Разработка и апробация системы поиска дубликатов в текстах проектной документации. Business Informatics, 2(4), 21-28. Retrieved from https://bijournal.hse.ru/article/view/26380
Section
Data analysis and intelligence systems